AfterQuery, que recaudó 30 millones de dólares hace varios meses, compite con empresas de etiquetado de datos como Mercor para vender datos de entrenamiento sobre codificación y finanzas a laboratorios de IA como OpenAI y Anthropic.

Cuando se acercaba la fecha límite de invierno de 2025 para la prestigiosa incubadora de startups Y Combinator, Spencer Mateega y Carlos Georgescu, ambos estudiantes universitarios, prepararon su solicitud en 48 horas. No tenían un producto, pero sí un destino: San Francisco. Su plan era subirse a la ola de la IA, literalmente, y decidir qué construir una vez allí.

Se conocían desde el instituto, cuando coincidieron en un programa de verano de informática de Google y forjaron una gran amistad gracias a sus primeros proyectos de ingeniería. Mantuvieron una estrecha relación durante la universidad, haciendo prácticas juntos en Meta antes de dedicarse por separado a las finanzas y la tecnología.

Para cuando Mateega, ahora con 23 años, terminaba sus estudios en la Universidad de Pensilvania y Georgescu, ahora con 22, estudiaba informática en la Universidad de Columbia Británica, ya estaban acostumbrados a trabajar codo con codo.

Fueron aceptados, y Mateega terminó su último trimestre de universidad mientras participaba en el exigente programa de Y Combinator.

“El 1% de mi tiempo lo dedicaba a prepararme para los exámenes parciales y finales, en los que no me fue bien”, recuerda. Georgescu, que aún tenía un año más de estudios, abandonó la universidad.

Su primer intento, crear agentes de IA para finanzas, fracasó. Descubrieron que los modelos de IA tenían dificultades con los flujos de trabajo reales de los profesionales, no porque no pudieran razonar, sino porque no habían sido entrenados para comprender cómo trabajan realmente los profesionales.

Esta conclusión los llevó a un cambio de rumbo. En lugar de crear aplicaciones, se centrarían en generar los datos subyacentes a partir de cómo se realiza el trabajo real: las decisiones, las transiciones complicadas y las revisiones.

Un año después, la startup de San Francisco, con 30 empleados, afirma haber superado los 100 millones de dólares en ingresos anuales, impulsada por la demanda de laboratorios de IA líderes como Anthropic y OpenAI.

La compañía también afirma que hace varios meses recaudó 30 millones de dólares en una ronda de financiación Serie A, con una valoración de 300 millones, liderada por Altos Ventures y con la participación de The Raine Group, Y Combinator y BoxGroup.

Mateega indicó que investigadores de Anthropic, OpenAI, Google DeepMind, Meta’s Superintelligence Labs y la división de IA de Microsoft participaron en la ronda.

Actualmente, el etiquetado de datos parece una vía rápida para que jóvenes con conocimientos técnicos y una visión precoz (en su mayoría hombres) se conviertan en multimillonarios.

Está el pionero del etiquetado de datos, Alexandr Wang de Scale AI, quien fue el multimillonario más joven del mundo hecho a sí mismo hasta octubre. También están los fundadores de Mercor, que se convirtieron en los tres multimillonarios más jóvenes del mundo hechos a sí mismos en octubre. Y está la prometedora micro1, cuyo fundador, Ali Ansari, ha recibido ofertas de inversión con una valoración de 2,500 millones de dólares.

Pero en el competitivo mundo de los datos humanos, el dinero puede ser efímero. Los laboratorios de IA tienen un enorme apetito y presupuesto para datos, pero los proveedores pueden perder popularidad y dar paso a otros nuevos. Por ejemplo, Mercor, que recientemente sufrió una filtración de datos, al parecer ha perdido a Meta como cliente, y su situación con otros laboratorios es incierta.

Mateega, actual CEO, afirma que el enfoque de AfterQuery difiere del de Mercor porque, en lugar de depender de grandes grupos de contratistas y flujos de trabajo manuales, y promocionar sus capacidades de “entrevistador de IA”, la clave del éxito de AfterQuery reside en el desarrollo de sistemas de software personalizados para validar los datos de entrenamiento.

Una vez que los expertos de AfterQuery generan los datos, estos se someten a una serie de comprobaciones para garantizar que se encuentren dentro de un rango óptimo: lo suficientemente exigente como para poner a prueba a los sistemas más avanzados, pero no imposible. El objetivo es producir datos de los que los modelos puedan aprender realmente.

La empresa también publica sus propias investigaciones para demostrar la alta calidad de sus datos, una preocupación fundamental para los laboratorios de IA. En lugar de entregar los datos a los laboratorios de IA para que los evalúen, AfterQuery reproduce el proceso que seguiría un investigador: entrenar un modelo con los datos y medir cómo cambia el rendimiento en las pruebas de referencia.

“Esto es algo que nuestros competidores no hacen: nuestros investigadores crean internamente un proceso posterior al entrenamiento”, afirmó Mateega. “Demostramos objetivamente a los laboratorios, incluso antes de que analicen nuestros datos, que estos son de alta calidad”.

Este artículo fue publicado originalmente en Forbes US