Nuevo chatbot de OpenAI

El pasado 30 de noviembre OpenAI presentó ChatGPT, un modelo de inteligencia artificial de lenguaje natural que interactúa de forma conversacional. Se trata de los más recientes desarrollos de la compañía que ha sorprendido a los expertos y a la comunidad tecnológica por su elevada usabilidad y eficacia, así como su capacidad para responder preguntas, admitir errores, cuestionar premisas incorrectas o rechazar solicitudes inapropiadas. En tan solo unos días ha superado el millón de usuarios y parece llamado a revolucionar el terreno de las inteligencias artificiales generadoras de texto. 

 

Tal y como explican desde OpenAI, ChatGPT es un modelo hermano de InstructGPT, capacitado para seguir una instrucción y brindar una respuesta detallada. El sistema se ha entrenado apoyándose en el modelo de lenguaje GPT-3.5 -entrenado en una infraestructura de supercomputación de Azure IA a partir de miles de millones de palabras- y usando Aprendizaje por refuerzo a partir de retroalimentación humana (Reinforcement Learning from Human Feedback, RLHF).

 

«Entrenamos un modelo inicial mediante un ajuste fino supervisado: los entrenadores humanos de IA proporcionaron conversaciones en las que jugaron en ambos lados: el usuario y un asistente de IA. Les dimos a los capacitadores acceso a sugerencias escritas en modelos para ayudarlos a redactar sus respuestas», apuntan desde la compañía en el blog corporativo. 

 

En este sentido, ChatGPT es capaz de crear contenido personalizado sobre una variedad de temas: desde poemas y recetas hasta código informático y artículos periodísticos. La herramienta es capaz de “autocensurarse” y darse cuenta cuando se le hace una pregunta imposible, o incluso, de rechazar la respuesta a preguntas.

 

En un ejemplo compartido por la compañía, cuando se le solicitó que describiera lo sucedido cuando Colón llegó a Estados Unidos en 2015, reconoció la falsedad del hecho y advirtió que su respuesta sería ficticia. Esto contrasta con las posibles respuestas brindadas por modelos antiguos, que habría ofrecido relatos completamente ficticios sin aviso ninguno. Este refinamiento es, quizá, una de las cuestiones que ha atraído a miles de usuarios a nivel global en cuestión de días.

 

ChatGPT ha captado la atención de la comunidad tecnológica, y de otros muchos usuarios que han puesto a prueba las diferentes aplicaciones de la herramienta. Sin ir más lejos, en el contexto de la reciente eliminación de la Selección Española del Mundial de Catar, un usuario le solicitaba al sistema que generara las declaraciones del entrenador en rueda de prensa.

 

Otros usuarios han retado a ChatGPT a ofrecerles recetas culinarias, detallando los ingredientes y el valor nutricional de cada uno de ellos.

 

Otra internauta ha empleado la solución para generar un contrato tipo de arrendamiento. «Juristas, vienen buenas curvas para el sector» ha comentado, haciendo alusión a las disruptivas transformaciones que puede albergar la aplicación de ChatGPT a las distintas esferas económicas.

 

Pese a la eficiencia que ha demostrado en tan solo unos días, desde OpenAI han advertido de las limitaciones del modelo. Así, señalan que a veces escribe respuestas que suenan plausibles, pero que son incorrectas o pueden no tener sentido. “Resolver este problema es un desafío, ya que: (1) durante el entrenamiento de RL, actualmente no hay una fuente de verdad; (2) entrenar al modelo para que sea más cauteloso hace que rechace preguntas que puede responder correctamente; y (3) el entrenamiento supervisado engaña al modelo porque la respuesta ideal depende de lo que sabe el modelo, en lugar de lo que sabe el demostrador humano”, señalan en el blog.

 

Además, destacan que el sistema es sensible a los ajustes en la redacción de las instrucciones o a intentar el mismo aviso varias veces. En este sentido, dada una frase de una pregunta, el modelo puede afirmar que no sabe la respuesta, pero dada una ligera reformulación, puede responder correctamente. Por otro lado, apuntan que el modelo es excesivamente detallado y usa en exceso ciertas frases, como reafirmar que es un modelo de lenguaje entrenado por OpenAI. Problemas que, según la compañía, surgen de sesgos en los datos de entrenamiento y de la sobreoptimización.

 

Asimismo, desde OpenAI advierten que, idealmente, el modelo haría preguntas aclaratorias cuando el usuario proporcionara una consulta ambigua, pero que actualmente suele adivinar lo que pretende el usuario. Y en relación a la moderación, la compañía apunta que se ha reforzado el sistema para que rechace solicitudes inapropiadas, aunque a veces responderá a instrucciones dañinas o exhibirá un comportamiento sesgado. 

 

Sabemos que quedan muchas limitaciones, y planeamos realizar actualizaciones periódicas del modelo para mejorar en dichas áreas. Pero también esperamos que al proporcionar una interfaz accesible para ChatGPT, obtengamos valiosos comentarios de los usuarios sobre problemas de los que aún no somos conscientes”, comentan desde OpenAI. “Estamos particularmente interesados en recibir comentarios sobre resultados dañinos que podrían ocurrir en condiciones no adversas del mundo real, así como comentarios que nos ayuden a descubrir y comprender riesgos novedosos y posibles mitigaciones”.

 

ChatGPT ha sido lanzada inicialmente de manera gratuita en fase “feedback”, es decir, en busca de los comentarios de mejor por parte de los usuarios. No obstante, tal y como ha comentado Sam Altman, CEO de OpenAI, en respuestas a las preguntas de Twitter, la intención de la compañía es monetizar la herramienta para poder hacer frente a los costes de computación. Precisamente en respuesta a Elon Musk, quien comenzó financiando OpenAI en su lanzamiento en 2015, Altman ha sugerido que el precio podrían ser unos céntimos por cada chat.

 

A pesar de encontrarse en fase de optimización, muchos agentes del sector sugieren que el lanzamiento de ChatGPT marca un importante paso adelante en el desarrollo de la inteligencia artificial y del aprendizaje automático, y que abre un abanico de posibilidades infinitas en sus aplicaciones.

 

No obstante, muchos advierten todavía de la necesidad de optimizar el modelo y de resolver algunos de los principales desafíos, desde legales a morales, a los que se enfrentan este tipo de sistemas, como las fuentes de información de las que aprenden, el debate de la autoría, o la importancia de trabajar la seguridad. Con todo, Altman considera que ChatGPT supone un paso firme hacia la Inteligencia Artificial Generalizada que persigue OpenAI.

Enlace a la fuente original