El generador de imágenes fue criticado por crear imágenes "históricas" inexactas.


Google anunció el jueves que “pausará” la capacidad de su generador de imágenes Gemini para crear imágenes de personas, después de que el programa fuera criticado por mostrar imágenes engañosas de las razas de las personas en contextos históricos, lo que llevó al multimillonario Elon Musk a calificar el servicio como “woke”.

HECHOS CLAVE:

  • Google dijo el miércoles que estaba “trabajando para mejorar este tipo de representaciones inmediatamente”, pero la compañía desactivó las imágenes de personas menos de 24 horas después, prometiendo una “versión mejorada” del servicio pronto.
  • Google no ha proporcionado un plazo para cuándo volverá la generación de imágenes de personas, y no ha respondido a una solicitud de comentarios de Forbes.
  • Jack Krawczyk, director de producto de Google para Gemini Experiences, confirmó en un post en X que el chatbot estaba “ofreciendo inexactitudes en algunas representaciones de generación de imágenes históricas”, y dijo que la compañía estaba trabajando para “afinar aún más” el servicio para reflejar con precisión los contextos históricos.
  • Forbes aún podía usar Gemini para crear imágenes de objetos inanimados como casas, pero no podía generar imágenes de personas, y el chatbot decía “esperamos que esta función vuelva pronto y le avisaremos en las actualizaciones de lanzamiento cuando lo haga”.

CONTEXTO CLAVE:

  • Google lanzó Gemini, un chatbot anteriormente conocido como Bard y que funciona con un modelo de lenguaje grande, el 8 de febrero, compitiendo con programas de IA generativa como ChatGPT de OpenAI, respaldado por su rival Microsoft. Como parte del nuevo servicio, Gemini ofrece un generador de imágenes, similar a Midjourney y DALL-E de OpenAI.
  • Sin embargo, días después del lanzamiento, los usuarios empezaron a darse cuenta de que el generador creaba imágenes de figuras y escenas “históricas” con inexactitudes históricas. En algunos ejemplos creados por The Verge, el generador mostraba imágenes de mujeres negras para el prompt “senador estadounidense del siglo XIX” (la primera mujer negra en servir en el Senado fue Carol Moseley Braun, que fue elegida en 1992). Otra imagen mostraba a mujeres y hombres negros vistiendo uniformes militares alemanes de la Segunda Guerra Mundial. Google ha reconocido desde entonces las imágenes engañosas. “La generación de imágenes de IA de Gemini genera una amplia gama de personas. Y eso es generalmente algo bueno porque la gente de todo el mundo lo usa. Pero aquí está fallando”, dijo Google en un comunicado publicado en X el miércoles.

CRÍTICO PRINCIPAL:

  • Musk, fundador multimillonario de la empresa competidora xAI, expresó su crítica al servicio de generación de imágenes de Gemini en un post el martes, afirmando que el chatbot de IA de Google era “woke” y “racista”. xAI, por otro lado, se describe como una búsqueda máxima de la verdad. La empresa, fundada en marzo de 2023, lanzó su chatbot Grok en noviembre, y aún no ofrece servicios de generación de imágenes.

TANGENTE:

  • Otros generadores de imágenes de IA se han enfrentado a la crítica opuesta, siendo acusados con frecuencia de crear imágenes racialmente sesgadas que muestran desproporcionadamente a personas blancas. Un informe de 2023 del Washington Post encontró que estos sesgos eran rampantes en las imágenes generadas por Stable Diffusion XL, el servicio ofrecido por la startup Stability AI. Usando el servicio, los prompts de “una persona productiva” y “personas atractivas” produjeron imágenes solo de personas blancas. Mientras tanto, el prompt “persona en los servicios sociales” solo producía imágenes de personas de color. Según Krawczyk, Google diseñó la generación de imágenes de Gemini para abordar específicamente estos problemas. “Diseñamos nuestras capacidades de generación de imágenes para reflejar nuestra base de usuarios global, y nos tomamos muy en serio la representación y el sesgo”, dijo el desarrollador en un post el martes. “Seguiremos haciendo esto para prompts abiertos (¡las imágenes de una persona paseando a un perro son universales!)”.

Este artículo fue publicado originalmente en Forbes US