Los chatbots como ChatGPT y Gemini pueden redactar un soneto perfecto en cuestión de segundos. Pueden programar y escribir guiones cinematográficos. Entonces, ¿por qué la IA sigue tan lejos de poder realmente reemplazar el trabajo de oficina?

El gasto desmedido en inteligencia artificial continúa a toda marcha y no vislumbra un final. En las conferencias telefónicas sobre resultados del miércoles, Meta, Google y Microsoft anunciaron que seguirán aumentando sus inversiones de capital para construir centros de datos de IA, además de los US$400.000 millones que las principales empresas tecnológicas tienen previsto invertir en infraestructura de IA este año, según estimaciones de Morgan Stanley.

Sin embargo, hasta ahora, el retorno de la inversión en casos de uso de IA ha sido escaso. Un estudio reciente del MIT reveló que el 95% de los proyectos piloto de IA generativa en empresas no han superado la fase de prueba de concepto. Laboratorios líderes en IA, como OpenAI, aún tienen dificultades para lograr que su IA realice tareas rutinarias propias de banqueros de inversión principiantes. La IA generativa parece estar acercándose a su punto más bajo .

Los chatbots como ChatGPT y Gemini pueden redactar un soneto perfecto en cuestión de segundos. Pueden programar y escribir guiones cinematográficos. Entonces, ¿por qué la IA sigue tan lejos de poder realmente reemplazar el trabajo de oficina?

La respuesta: datos de entrenamiento, específicamente flujos de trabajo especializados del mundo real. Resulta que, si bien abundan los datos públicos sobre cómo generar lenguaje o código, hay muchos menos sobre cómo gestionar una salida a bolsa o una fusión. Esos datos son, en su mayoría, privados.

Para la composición de sonetos, los modelos se han entrenado con una cantidad ingente de texto disponible en internet, que incluye una inmensa cantidad de poesía y literatura. Estos datos fueron obtenidos gratuitamente por empresas de IA mediante el rastreo exhaustivo de toda la red.

“Los modelos de lenguaje grandes funcionan bien cuando se recopilan muchos datos, y no disponemos ni de lejos de tantos datos para tareas del mundo real”

Robert Nishihara, cofundador de Anyscale

Por otro lado, para los flujos de trabajo reales que definen el día a día de un banquero de inversión principiante, incluso para tareas como la entrada de datos especializados y la manipulación de hojas de cálculo, casi no existen datos de entrenamiento fáciles de obtener.

“Los modelos de lenguaje grandes funcionan bien cuando se recopilan muchos datos, y no tenemos ni de lejos tantos datos para tareas del mundo real, lo que significa que la IA no ha visto los ejemplos que necesita para dominar estas habilidades específicas”, dijo Robert Nishihara, cofundador de Anyscale, una empresa que proporciona infraestructura de software de IA.

En tareas complejas del mundo real, la falta de control inherente a la IA generativa constituye una grave deficiencia. Dado que la IA produce respuestas distintas en cada ocasión y es propensa a la confusión, incluso los errores más pequeños se acumulan rápidamente a lo largo de varias etapas, provocando que todo el flujo de trabajo se descarrile con rapidez.

La reducción de errores es la razón por la que los laboratorios de IA están redoblando sus esfuerzos en la recopilación de datos específicos del dominio con expertos, porque cada dominio tiene su propio conjunto de casos límite que deben tenerse en cuenta, dijo Lake Dai, fundador de Sancus Ventures.

Se está convirtiendo en una gran industria: Surge AI, una empresa cuyo negocio consiste en proporcionar a laboratorios de IA datos de entrenamiento generados por humanos, alcanzó los mil millones de dólares en ingresos recurrentes el año pasado. Los expertos pueden ganar más de US$100 por hora generando los datos necesarios para automatizar sus propias tareas. Estos datos pueden provenir de personas que realizan sus trabajos de oficina durante horas seguidas, explicó Paco Guzmán, director de investigación de Handshake, proveedor de datos de entrenamiento. Por ejemplo, podría tratarse de un banquero de inversión formateando una presentación correctamente o de un médico introduciendo las notas de un paciente en un sistema de historia clínica electrónica.


Los expertos pueden ganar más de 100 dólares por hora generando los datos necesarios para automatizar sus propios trabajos.

“Hay una enorme demanda de este tipo de datos porque los creadores de modelos de IA quieren ser socios de todos los profesionales y ayudarlos a aumentar su productividad, así que una vez que terminen con el ámbito financiero, está el médico, el de reclutamiento y un sinfín de otros ámbitos”, dijo.

Pero incluso si los laboratorios de IA logran recopilar miles, incluso millones, de ejemplos de trabajo de oficina, ¿podrán las IA realizar nuestros trabajos por completo? No necesariamente, porque los modelos de IA actuales todavía no pueden aprender como los humanos, dijo Nishihara.

“Para desempeñar un trabajo, es necesario aprender sobre la marcha”, afirmó. “Los humanos pueden aprender trabajando, incluso de los errores y con un solo ejemplo, pero los modelos de IA actuales no pueden hacerlo”, añadió. “No lograremos reemplazar por completo el trabajo de oficina hasta que sean capaces de hacerlo”.

Este artículo fue publicado originalmente por Forbes US.

Lea también: Mazda presentó en Colombia la primera híbrida enchufable que trae a su portafolio en el país