Cursos de LLM de capacitación y etiquetado de datos programáticos en Snorkel.ai

Published: April 22, 2026

Diseñado para la velocidad: ~ 10 ms de latencia, incluso bajo carga

¡Una forma increíblemente rápida de crear, rastrear e implementar sus modelos!

Gestiona más de 350 RPS en solo 1 vCPU, sin necesidad de ajustes
Listo para la producción con soporte empresarial completo

Empieza con Truefoundry ahora Hable con el experto

Introducción

En el último episodio de TrueML Talks, Nikunj, cofundador de True Foundry, profundiza en una conversación esclarecedora con Vincent, una figura fundamental de Snorkel AI. Como empresa que se encuentra en el centro del cambiante panorama de la IA, la trayectoria de Snorkel AI desde el mundo académico hasta convertirse en líder del desarrollo de la IA centrada en los datos ofrece una visión profunda. Vincent comparte sus experiencias desde sus inicios en el laboratorio de IA de Stanford hasta la dirección de productos y diseño en Snorkel AI, y arroja luz sobre las complejidades del aprendizaje automático (ML), los grandes modelos lingüísticos (LLM) y el impacto de la IA generativa en la industria. Hemos abordado los siguientes temas:

- La evolución de la IA de Snorkel
- Desarrollo de IA centrado en los datos
- Transición al liderazgo de productos
- IA generativa y modelos abiertos
- Asesoramiento profesional para entusiastas de la IA

Comienzos de Snorkel AI

Vincent habla sobre las raíces de Snorkel AI como un proyecto académico centrado en la supervisión débil y el etiquetado programático. Este enfoque sentó las bases para lo que Snorkel AI se ha convertido hoy en día para las empresas de desarrollo de aplicaciones de inteligencia artificial. El viaje de Vincent de estudiante de posgrado a líder en Snorkel AI nos muestra cómo una sólida investigación académica se convierte en una empresa emergente y qué es el snorkel en la actualidad. En Stanford, colaboraron con médicos y crearon conjuntos de datos personalizados para ellos, lo que les ayudó a obtener un caso práctico real para sus investigaciones.
También relata sus días en Y-Combinator y comparte sus primeros días y su hambre de crecimiento y aprendizaje en el campo de la tecnología.

El núcleo de la IA de Snorkel: desarrollo de IA centrado en los datos

Vincent cuenta que, al principio, la creación de bases de datos consistía en compartir hojas de datos de gran tamaño entre los equipos y que esto ha cambiado como una tarea desorganizada. Vincent explica con más detalle el enfoque de la empresa en facilitar a los equipos empresariales la gestión, la selección y el etiquetado de los datos a escala, lo que supone cambiar las tareas de limpieza propias del desarrollo de la IA. Este enfoque centrado en los datos permite a las empresas alinear estrechamente la IA con sus objetivos y conjuntos de datos únicos, haciendo hincapié en el papel fundamental de los datos en la programación de los sistemas de IA. También menciona que, para sectores como la banca y la atención médica, no hay ninguna probabilidad de que los datos sean precisos, ya que un error por parte de un LLM puede ser fatal para las operaciones.

Desarrollo programático de datos: Introducción de un enfoque escalable, adaptable y eficiente para el etiquetado de datos, alejándose de los métodos manuales tradicionales.
Impacto en las empresas: Demostrar cómo el enfoque de Snorkel AI ha revolucionado el manejo de datos para las empresas, haciendo que el desarrollo de la IA sea más ágil y receptivo a los cambios.
Adaptabilidad y escalabilidad: La capacidad de las empresas de adaptar rápidamente sus procesos de etiquetado de datos sin empezar de cero, lo que muestra un futuro en el que el desarrollo de la IA es significativamente más dinámico.

Pase de la ingeniería de aprendizaje automático al liderazgo de productos

Con experiencia en aprendizaje automático, Vincent explica cómo el puesto de jefe de producto (AI/ML) y diseño le ayuda a hablar directamente con los científicos de datos y los ingenieros de aprendizaje automático. Esto le ayuda a entender sus casos de uso y sus puntos débiles, que puede incorporar directamente al producto. Gracias a su participación multidimensional en diferentes ámbitos de Snorkel, puede utilizar el producto de acuerdo con las necesidades de los clientes.

El impacto de la IA generativa y los modelos abiertos

La era de la IA generativa y la proliferación de modelos abiertos han influido significativamente en el panorama de la IA. Vincent explica que los LLM son la incorporación más reciente en la generación de conjuntos de datos con fines de capacitación, pero, por otro lado, a menudo tienen dificultades para lograr la precisión de los conjuntos de datos producidos. Como mencionamos anteriormente, los datos generados por un LLM pueden ser adecuados para casos de uso generalizados y tareas de nivel de demostración, pero esto no se aplica a los casos de uso en los que la precisión desempeña un papel importante en ámbitos como la banca, las finanzas, los seguros y la atención médica.

Panorama posterior al chat: Reflexiones sobre el surgimiento de la IA generativa y su impacto en la comunidad de IA y las aplicaciones empresariales.
Importancia de los datos de código abierto: El llamamiento a favor del código abierto no solo de los modelos de IA, sino también de los conjuntos de datos y los procesos de desarrollo para fomentar la innovación y garantizar la seguridad y la fiabilidad de la IA.
Datos especializados para aplicaciones empresariales: La necesidad continua de datos especializados de alta calidad para entrenar modelos de IA generativa para necesidades empresariales específicas.

Una visión candente del panorama actual de la IA

La opinión de Vincent sobre el estado actual del desarrollo de la IA hace hincapié en el cambio fundamental hacia los modelos y datos de código abierto, y propone un enfoque más holístico para compartir las innovaciones de la IA. Sostiene que la verdadera esencia del código abierto en el ámbito de la IA debería ir más allá de la mera divulgación de las ponderaciones de los modelos; debería incluir hacer accesibles los conjuntos de datos, los procesos de desarrollo y las razones que sustentan la formación basada en modelos. Este enfoque fomenta un ecosistema colaborativo que acelera la innovación, garantiza la reproducibilidad y crea sistemas de IA más seguros. Al abogar por el movimiento de datos abiertos, Vincent destaca la importancia de la transparencia en el desarrollo de la IA, ya que permite que una comunidad más amplia contribuya a los avances en este campo y se beneficie de ellos. Esta perspectiva no solo desafía las prácticas convencionales de compartir la IA, sino que también exige una estrategia integral que pueda democratizar el desarrollo de la IA, garantizando que los beneficios de las tecnologías de IA se distribuyan ampliamente y sean accesibles.

Acelera la innovación: Los conjuntos de datos de código abierto y los procesos de desarrollo alientan a la comunidad a innovar, basándose en el trabajo existente en lugar de empezar desde cero.
Garantiza la reproducibilidad: La transparencia en los procesos de desarrollo de la IA permite la verificación de los resultados y las metodologías, lo cual es crucial para el progreso científico y la confianza en las aplicaciones de la IA.
Construye sistemas más seguros: El acceso a los conjuntos de datos y la lógica utilizados en los modelos de entrenamiento ayuda a identificar sesgos y errores, lo que contribuye al desarrollo de soluciones de IA más confiables y éticas.
Democratiza el desarrollo de la IA: Poner recursos integrales de IA a disposición de un público más amplio nivela las condiciones, lo que permite a las personas y organizaciones con diversos recursos contribuir a los avances de la IA y beneficiarse de ellos.
Desafía las prácticas convencionales: La opinión de Vincent invita a la comunidad de IA a repensar cómo se comparten y desarrollan las tecnologías de IA, abogando por un enfoque más inclusivo y colaborativo.

Consejos para aspirantes a profesionales de la IA

Vincent menciona que el nivel de hackathon no es suficiente, tendrás que ensuciarte las manos y probar algo que utilices que te ayude a obtener resultados y a destacar. Al reflexionar sobre su viaje, Vincent ofrece consejos a quienes se embarcan en sus carreras de IA. Hace hincapié en el valor de la experiencia práctica y alienta a las personas a desarrollar y repetir proyectos de IA que aborden los desafíos del mundo real. Este aprendizaje experiencial, junto con la colaboración y la pasión por la exploración, es fundamental para navegar por el dominio de la IA, que evoluciona rápidamente.

‍

TrueFoundry AI Gateway ofrece una latencia de entre 3 y 4 ms, gestiona más de 350 RPS en una vCPU, se escala horizontalmente con facilidad y está listo para la producción, mientras que LitellM presenta una latencia alta, tiene dificultades para superar un RPS moderado, carece de escalado integrado y es ideal para cargas de trabajo ligeras o de prototipos.

Diseñado para la velocidad: ~ 10 ms de latencia, incluso bajo carga

Programe su demostración ahora