El nuevo modelo de Anthropic Claude 2.0 es mejor en programación, matemáticas y razonamiento, según afirmó el CEO Dario Amodei. A diferencia de su predecesor, está disponible para uso general por parte de los consumidores.

La startup de IA Anthropic ha lanzado su próximo modelo principal, y esta vez puedes ver por ti mismo cómo se compara con otros destacados de IA, como el ChatGPT de OpenAI o el Pi de Inflection.

Anthropic anunció el martes que ha lanzado Claude 2, un modelo de lenguaje grande que, según la compañía, ha mostrado mejoras en varios puntos clave que incluyen habilidades de programación, matemáticas y razonamiento, al tiempo que produce menos respuestas perjudiciales.

Claude 2 está más ampliamente disponible en su segunda iteración principal. Anthropic lanzó un nuevo sitio web de prueba beta para que los usuarios generales se registren en los Estados Unidos y el Reino Unido: claude.ai, al tiempo que pone el nuevo modelo a disposición de las empresas a través de una API al mismo precio que pagaron por el modelo anterior en funcionamiento de Anthropic, Claude 1.3.

Siga la información de tecnología en nuestra sección especializada

En una entrevista, el cofundador y CEO de Anthropic, Dario Amodei, le dijo a Forbes que el nuevo modelo representa más un “salto más grande” que un “salto gigantesco” respecto a su predecesor. “Es realmente un progreso evolutivo”, dijo Amodei. “Uno tiene que delimitar las cosas en algún punto, y sentimos que esta era una mejora lo suficientemente sustancial, incluso si es parte de una progresión general”.

En las pruebas, Claude 2.0 superó a su predecesor en varias medidas. Obtuvo un 71,2% en una prueba de programación en Python, frente al 56%; aumentó su calificación en un cuestionario de matemáticas de secundaria al 88% desde el 85,2%; y mejoró su puntuación en el examen de abogacía a un 76,5% desde el 73%. Y mientras que la versión anterior ya podía analizar una indicación de hasta aproximadamente 75,000 palabras, aproximadamente la longitud del primer libro de Harry Potter, Claude 2.0 puede manejar el doble de eso, aproximadamente la longitud de una novela épica como “Cien años de soledad” de Gabriel García Márquez. (Amodei le dijo a Forbes que Anthropic está posponiendo la ampliación del límite de tamaño de la indicación para una fecha posterior).

El anuncio del nuevo modelo principal de Anthropic llega menos de dos meses después de que la compañía revelara una financiación nueva de US$450 millones liderada por Spark Capital, con una valoración reportada de más de US$4.000 millones. Según lo revelado por la compañía, miles de empresas ya han estado trabajando con la API de Claude. Anthropic también está trabajando con varios clientes más grandes, que según Amodei incluyen a Zoom, Notion y el generador de imágenes de IA Midjourney, en la construcción de modelos personalizados. Se negó a proporcionar más detalles.

“Quizás deberíamos estar preguntándonos cómo podemos medir y establecer reglas sobre el problema con modelos, en lugar de detenernos durante un período de tiempo fijo”,

Dario Amodei, CEO de Anthropics.

Para una startup que se separó famosamente de OpenAI en 2021, supuestamente debido a diferencias existenciales en torno a la comercialización, el lanzamiento de Claude 2.0 parece representar en cierta medida un cambio de rumbo. Pero Amodei dijo que la comercialización de esa manera siempre fue parte del “plan básico” de Anthropic. “¿Ajustamos un poco en una dirección u otra dependiendo de lo que descubramos en el campo? Por supuesto”, agregó.

Siga aquí todas las noticias sobre inteligencia artificial

Parte de ese ajuste, según Amodei, se produjo porque Anthropic determinó que los usuarios comerciales podrían proporcionar un “terreno de prueba de seguridad” más amplio para examinar los posibles peligros del modelo. A la luz de las mejoras adicionales en Claude 2.0, la compañía decidió abrirlo aún más ampliamente, dijo. Por ahora, la versión para consumidores es gratuita, aunque Amodei dijo que la compañía podría eventualmente monetizarla. “Consideramos esto como un experimento”, dijo.

Al igual que los modelos anteriores de Claude, la nueva versión se entrenó utilizando “IA Constitucional”, un marco para entrenar modelos mediante el cual la supervisión de IA mejora los resultados de la IA sin intervención humana. Aun así, Amodei dijo que se utilizó cierta retroalimentación y supervisión humana junto con ese enfoque en Claude 2.0. Como resultado, Anthropic afirma que Claude 2.0 es el doble de efectivo para limitar las salidas perjudiciales que su predecesor.

“Es casi seguro que alguien va a descubrir alguna forma de violar el modelo, alguien va a encontrar alguna alucinación negativa. Hay demasiadas cosas que puedes decirle al modelo y demasiadas cosas que el modelo puede responder”, reconoció Amodei. “Estas cosas nunca van a ser perfectas”.

El lanzamiento del modelo de Anthropic también se produce menos de dos meses después de que Amodei se uniera al CEO de OpenAI, Sam Altman, al CEO de Google DeepMind, Demis Hassabis, y a más de 300 personas más en firmar una carta advirtiendo del “riesgo de extinción por la IA”. Obviamente, Anthropic cree que puede trabajar para mitigar ese escenario apocalíptico mientras continúa lanzando nuevos modelos, a diferencia de algunos líderes tecnológicos prominentes que han pedido una congelación temporal en su lanzamiento.

En lugar de un embargo de la industria en el lanzamiento de modelos, Amodei propuso que los lanzamientos importantes de modelos, o incluso el entrenamiento de nuevos modelos, requieran demostrar que los modelos hayan superado ciertas verificaciones de seguridad. “Quizás deberíamos estar preguntándonos cómo podemos medir y establecer reglas sobre el problema con los modelos, en lugar de detenernos durante un período de tiempo fijo”, dijo.

Nota publicada originalmente en Forbes US