Inicio / Artículos / Herramientas Web / Conoce ChatGPT: una guía para usar modelos de lenguaje extenso por diversión y (quizás) ganancias

Conoce ChatGPT: una guía para usar modelos de lenguaje extenso por diversión y (quizás) ganancias

ChatGPT es uno de los chatbots más conocidos, si no el más conocido, en el mundo actual. Como alguien que ha estado leyendo activamente tweets de entusiastas de SEO y de inteligencia artificial (IA), ChatGPT es un nombre que veo cada vez que abro mi Twitter. 

ChatGPT en Twitter
Ver estos tuits aquí, aquíy aquí.

¿Qué es Chat GPT?

ChatGPT es un chatbot creado por Open.AI con tecnología de aprendizaje automático, conocido como "Generative Pre-trained Transformer 3 (GPT-3)". En caso de que sea la primera vez que lo escuches, GPT-3 es un modelo de lenguaje grande (LLM). Utiliza el aprendizaje automático para generar texto en lenguaje natural que es difícil de distinguir del texto escrito por humanos.

¡Boom! Eso es mucha jerga en un solo párrafo.

Tres nombres para recordar

El término "Modelo de lenguaje grande“, o LLM (Large Language Model), se refiere a un modelo de aprendizaje automático que se entrena en un gran conjunto de datos de lenguaje humano y es capaz de generar texto con un sonido natural. 

Transformador generativo pre-entrenado 3, o GPT-3 (Generative Pre-trained Transformer 3), es un LLM específico, desarrollado por una empresa llamada OpenAI, que ha logrado resultados impresionantes en una amplia gama de tareas lingüísticas, como traducción y resúmenes de texto. 

ChatGPT es una variante del modelo de lenguaje GPT-3 que está diseñado específicamente para generar texto similar al humano en un contexto de chatbot.

Entonces piensa: 

  • LLM como la tecnología que ayuda a los robots a leer y escribir el lenguaje humano;
  • GPT-3 es un tipo de LLM desarrollado por una empresa privada (OpenAI);
  • ChatGPT es el robot que usa GPT-3 para interactuar con humanos en el chat en vivo.

¿Por qué ChatGPT es especial?

Lo que diferencia a ChatGPT de otros modelos de lenguaje (¡hay muchos de ellos! Más sobre esto más adelante) es su capacidad para mantener el contexto en múltiples turnos en una conversación. Cuando chateas con el bot, tiene "memoria" y puede generar respuestas similares a las humanas que son relevantes para el tema que se está discutiendo y que se basan en declaraciones anteriores hechas por el usuario o el chatbot en sí.

Pero eso no es todo: la herramienta puede hacer más que simplemente mantener una conversación. También es capaz de realizar una amplia gama de tareas lingüísticas, como traducción, resumen, codificación (sí, los lenguajes de Programación también son lenguaje humano), e incluso escribir poemas.  

¿Qué puede hacer ChatGPT por ti?

Desde generar ideas y contenido hasta proporcionar investigación y apoyo, ChatGPT es un recurso valioso que puede ayudar a individuos y organizaciones a aumentar la productividad y la eficiencia. Ya seas un bloguero aficionado, un abogado, un maestro de escuela o incluso el director ejecutivo de una empresa, ChatGPT puede tener un impacto significativo en tu trabajo.

A continuación se presentan algunas tareas específicas que puedes darle a ChatGPT. 

Para blogueros

Ejemplo: comparar dos herramientas diferentes y mostrar el contenido en formato de tabla usando ChatGPT-3.
  • Generar ideas y escribir borradores para tus próximas publicaciones de blog.
  • Investigar y verificar el contenido del blog.
  • Conversión de contenido (es decir, reseñas, cronograma de desarrollo) en tablas o listas de viñetas

Para abogados

Ejemplo: resumir conceptos legales complejos en términos sencillos utilizando ChatGPT-3.
  • Redacción de documentos legales y contratos.
  • Resumir conceptos legales complejos para audiencias inexpertas
  • Organización y gestión de documentos legales y expedientes de casos.

Para maestros de escuela

Ejemplo: generar preguntas de prueba con ChatGPT-3.
  • en desarrollosson planos y material didáctico
  • Creación de evaluaciones y cuestionarios
  • Generación de diferentes guiones para diferentes niveles de estudiantes.

Para programadores

Ejemplo: escribir JavaScript con ChatGPT-3.
  • Generación de fragmentos de código y depuración de errores de codificación
  • Explicación de tus códigos en lenguaje escrito 
  • Cambio de funciones entre diferentes lenguajes de programación

Para músicos

Ejemplo: escribir nuevas letras con ChatGPT-3.
  • Generación de ideas de canciones y melodías.
  • Escribir letras
  • Investigar y mantenerse actualizado sobre las tendencias y técnicas de la industria.

Para directores generales de empresas

Ejemplo: una noticia rápida directamente desde ChatGPT-3.
  • Organización y gestión de proyectos y tareas de la empresa.
  • Resumen de noticias comerciales, informes del personal y presentaciones.
  • Colaboración con los miembros del equipo y otras partes interesadas (escribir correos electrónicos, enviar mensajes de texto, etc.)

Mensajes que puedes usar para ChatGPT

Uso ChatGPT principalmente como mi educador y asistente de escritura. Aquí hay algunas indicaciones que uso con frecuencia durante el trabajo. Fatih Kadir Akın ha curado una lista más grande de indicaciones increíbles en Mensajes.chat y en este libro electrónico gratuito – Asegúrate de revisar si quieres más.

I want you to act as an educational content creator. You will need to create engaging and informative lessons for students seeking guidance or advice in a particular topic.
I want you to act as a stand-up comedian. I will provide you with some statements and you will use your wit and creativity to create scripts based on those statements. You are allowed to incorporate personal anecdotes or experiences into the routine in order to make it more relatable and engaging for the audience. 

This is the first statements: 
Translate the following statements to English for me:

Una inmersión más profunda en el aprendizaje automático en el lenguaje humano 

ChatGPT no está solo

Si bien GPT-3 es todopoderoso y popular, hay muchos otros modelos de idiomas grandes disponibles en el mercado (consulte la tabla a continuación).

La mayoría de estos LLM vienen con sus propias capacidades únicas y han logrado buenos resultados en varias tareas lingüísticas. La traducción de idiomas, el análisis de sentimientos y la respuesta a preguntas son algunos de los trabajos lingüísticos comunes realizados por las herramientas LLM.

Otros LLM notables disponibles en el mercado

ModeloDescripciónTamañoPrincipales características
LLMModelo de lenguaje de formato largo desarrollado por OpenAIMás pequeño y más simple que GPT-3Enfocado en generar texto coherente dentro de un dominio o tema específico
BERTModelo de lenguaje preentrenado desarrollado por GoogleModeradoSe puede ajustar para una amplia gama de tareas de procesamiento de lenguaje natural
XLnetModelo de lenguaje preentrenado desarrollado por Google y la Universidad Carnegie MellonGrandeUtiliza un enfoque novedoso llamado "modelado de lenguaje de permutación" para lograr resultados sólidos en una amplia gama de tareas
RoBERTaModelo de lenguaje preentrenado desarrollado por Facebook AIGrandeVariante de BERT que se entrenó en un conjunto de datos más grande y con varias modificaciones al procedimiento de entrenamiento
ALBERTModelo de lenguaje preentrenado desarrollado por GoogleModeradoVersión ligera de BERT que utiliza técnicas para reducir el tamaño y los requisitos computacionales
ELMoModelo de lenguaje preentrenado desarrollado por el Instituto Allen de Inteligencia ArtificialGrandeUtiliza una representación de palabras contextualizada profunda que es capaz de capturar el significado del texto circundante
T5Modelo de lenguaje preentrenado desarrollado por GoogleGrandeCapaz de realizar una amplia gama de tareas de procesamiento de lenguaje natural sin capacitación específica para la tarea
CTRLModelo de lenguaje preentrenado desarrollado por OpenAIGrandeUtiliza un enfoque novedoso llamado "transformadores condicionales" para generar texto similar al humano
Transformer-XLModelo de lenguaje preentrenado desarrollado por GoogleGrandeUtiliza un enfoque novedoso llamado "codificación posicional relativa" para modelar dependencias de largo alcance en el texto

Los LLM no entienden

Si bien los LLM como ChatGPT son muy buenos para generar texto de tipo humano, no tienen una verdadera comprensión, opiniones o creencias sobre el tema (* ver nota al margen a continuación) están discutiendo de la misma manera que lo haría una persona.

* Nota al margen: Aunque... no todo el mundo está de acuerdo con esto. Blake Lemoine, ex ingeniero senior de software de Google, dijo que el modelo de lenguaje de Google tiene alma. La empresa lo suspendió en junio de 2022 y lo despidieron más tarde.

En cambio, los LLM pueden generar texto mediante el uso de algoritmos de aprendizaje automático para analizar un gran conjunto de datos de lenguaje humano y aprender los patrones y las relaciones que existen dentro de los datos. Una vez que se han aprendido estos patrones, los LLM los usan para generar un nuevo texto que es similar al texto en los datos de entrenamiento.

En otras palabras, los LLM no son inteligentes. Simplemente son muy buenos para adivinar las palabras correctas para usar en sus "escritos".

Los LLM (ChatGPT, especialmente) son muy buenos para adivinar

Lo que hacen los LLM es analizar cualquier texto que hayan "leído" en el pasado y adivinar cuáles son las mejores palabras para escribir a continuación. 

Por ejemplo, para determinar las siguientes palabras para completar una oración como "Wayne Rooney ha regateado, pase..." ChatGPT, el LLM que estoy usando actualmente, analizaría los patrones y las relaciones en los datos del lenguaje en los que se ha entrenado para determinar las palabras y frases que es más probable que aparezcan a continuación en este contexto. 

Wayne Rooney ha regateado... ¿a través...? ¿alrededor...? del defensor.

El modelo podría haber aprendido de sus datos de entrenamiento que palabras como "pasado", "alrededor" o "a través" se usan comúnmente después de la frase "pase regateado". Luego podría usar esta información para generar una nueva oración que diga:

  • “Wayne Rooney ha regateado al defensor”, o 
  • “Wayne Rooney ha regateado al defensor”, o 
  • “Wayne Rooney ha regateado al defensor”.

Las oraciones son solo cadenas de palabras.

Aquí hay otro ejemplo para demostrar aún más el poder de la predicción de ChatGPT. El siguiente fragmento se toma de el primer capítulo de Percy Jackson y el ladrón del rayo (Libro 1) de Rick Riordan (la novela favorita de mi hijo). 

"Being a half-blood is dangerous. It's scary. Most of the time, it gets you killed in painful, nasty ways." 

Le pedí a ChatGPT que completara el párrafo. Aquí hay dos variaciones que ChatGPT me dio:

Versión #1

"But I've always known that I was different. I've always known that I was a target. That's why I've trained myself to be strong. That's why I've learned how to defend myself. I won't let anyone hurt me. I won't let anyone take away the person I am."

Versión #2

"I've tried to stay hidden, to keep a low profile. But it's not easy. There are always people watching, waiting for me to slip up. I can't let them catch me. I can't let them hurt me or my family."

En ambos ejemplos, las siguientes tres oraciones continúan explorando el tema de ser un mestizo y los peligros y desafíos que conlleva. 

La primera opción se centra en los propios esfuerzos del narrador por ser fuerte y defenderse, mientras que la segunda opción se centra en los esfuerzos del narrador por permanecer oculto y evitar ser detectado. Ambas opciones se basan en la idea de que ser un mestizo es peligroso y puede causar daño, pero abordan este tema desde diferentes ángulos y tonos.

Impresionante, ¿verdad?

Las desventajas y los problemas con los LLM 

Como cualquier modelo de aprendizaje automático, ChatGPT no es del todo genial y brillante. Aquí hay algunos ejemplos de algunos posibles problemas que pueden surgir con ChatGPT.

1. Sesgo en los datos de entrenamiento

Como la mayoría de los modelos de aprendizaje automático, ChatGPT se entrena en un gran conjunto de datos. Puede incorporar sesgos presentes en los datos. Los monos ven, los monos hacen. Si los datos de entrenamiento contienen una cantidad desproporcionada de ejemplos escritos por un grupo particular de personas, ChatGPT puede generar texto sesgado hacia ese grupo.

Lee el artículo de Melissa Lensa, la aplicación viral de avatar de IA, me desnudó sin mi consentimiento. No está relacionado con ChatGPT pero demuestra lo que podría salir mal con la IA.

2. Dificultad para entender el contexto

ChatGPT está diseñado para generar respuestas basadas en el contexto y el significado del texto de entrada. Sin embargo, a veces puede tener dificultades para comprender el contexto de una indicación o conversación en particular, lo que podría dar lugar a respuestas inexactas o sin sentido.

3. Capacidad limitada para manejar tareas abiertas

ChatGPT está diseñado para generar respuestas a indicaciones o preguntas específicas. Puede tener dificultad para manejar tareas abiertas o situaciones en las que la respuesta deseada no está claramente definida.

4. Capacidad limitada para manejar lenguaje poco común o específico del dominio

ChatGPT está capacitado en una amplia gama de texto, pero puede tener dificultades para comprender o generar un lenguaje poco común o específico del dominio. Esto podría ser un problema si estás utilizando ChatGPT para tareas que requieren una comprensión profunda de un campo o tema en particular.

En general, ChatGPT es una herramienta poderosa y útil, pero tiene sus limitaciones. Es importante tener en cuenta estas limitaciones al usar ChatGPT y considerar cuidadosamente la idoneidad del modelo para una tarea en particular.

Resumen

Quizás la razón principal por la que ChatGPT ha conquistado al mundo es por su simplicidad. No confíes en mi palabra - Puedes probarlo tú mismo aquí, gratis. No tienes que ser un mago de la tecnología, solo dale unas pocas palabras y mira si hace su magia. Solo asegúrate de verificar dos veces su salida antes de enviársela a tu jefe, a tu abuela o al presidente. 

Y como siempre, recuerda: un gran poder de modelado del lenguaje conlleva una gran responsabilidad (y, con suerte, algunas risas en el camino).

Notas adicionales

El desarrollo de GPT-3

El desarrollo de GPT-3 se remonta al artículo de investigación original “Mejorar la comprensión del lenguaje mediante la formación previa generativa”, escrito por Alec Radford y sus colegas, y publicado en una preimpresión en el sitio web de OpenAI en junio de 2018. 

En noviembre de 2019, OpenAI lanzó GPT-2, que supuso una mejora significativa con respecto al modelo GPT original. GPT-2 se entrenó en un conjunto de datos de más de 8 mil millones de páginas web y tenía un tamaño mucho mayor (1.5 billones de parámetros). 

En mayo de 2020, OpenAI lanzó GPT-3, que era una versión aún más grande y potente del modelo GPT. GPT-3 se entrenó en un conjunto de datos de miles de millones de páginas web y tenía un tamaño de 175 mil millones de parámetros, lo que lo convierte en uno de los modelos de lenguaje más grandes jamás desarrollados. Fue capaz de realizar una amplia gama de tareas lingüísticas, incluidas la traducción, el resumen y la respuesta a preguntas, y pudo generar texto similar al humano que era difícil de distinguir del texto escrito por una persona.

Acerca de Open.AI la empresa

OpenAI es un laboratorio de investigación con sede en San Francisco, California. La empresa se dedica a promover la inteligencia artificial de manera responsable y segura. Fue fundada en 2015 y financiada por grandes nombres familiares en las industrias tecnológicas, incluidas Microsoft, Elon Musky Peter Thiel

Los líderes notables en la compañía incluyen:

  • Sam Altman – CEO de OpenAI y un conocido líder de la industria tecnológica. Ha estado involucrado con la empresa desde su fundación y ha jugado un papel clave en su crecimiento y desarrollo (lee su blog aquí).
  • Greg Brockman – Cofundador y CTO de OpenAI, ex CTO de Stripe.. Ha jugado un papel clave en el desarrollo de los modelos de lenguaje grande de la compañía, incluido GPT-3 (Más información).
  • Ilya Sutskever – Científico jefe de OpenAI y cofundador de la empresa. Es un destacado experto en el campo del aprendizaje automático y ha desempeñado un papel clave en el desarrollo de los esfuerzos de investigación y desarrollo de la empresa (lee sus tweets aquí).
  • Wojciech Zaremba – Cofundador y científico investigador de OpenAI y ha desempeñado un papel clave en el desarrollo de los grandes modelos de lenguaje de la empresa, incluido GPT-3 (Perfil de Twitter).
  • Juan Schulman – Investigador científico en OpenAI y ha desempeñado un papel clave en el desarrollo de los algoritmos y tecnologías de aprendizaje por refuerzo de la empresa (Perfil de Twitter).

Leer también

Foto del autor

Artículo de Jerry Low

Siga Leyendo