nombre completo de caht gpt
El nombre completo de caht gpt: Chat Generative Pre-trained Transformer
1 Introducción a chatGPT
chatGPT es un programa de robot de chat de inteligencia artificial desarrollado por OpenAI. , lanzado en 2022 Lanzado en noviembre. El programa utiliza un modelo de lenguaje grande basado en la arquitectura GPT-3.5 y se entrena mediante aprendizaje por refuerzo.
Actualmente, ChatGPT todavía interactúa en modo texto. Además de interactuar a través de un diálogo humano natural, también se puede utilizar para trabajos de lenguaje relativamente complejos, incluida la generación automática de texto, preguntas y respuestas automáticas, resúmenes automáticos, etc. Tareas varias.
Por ejemplo: en términos de generación automática de texto, ChatGPT puede generar automáticamente textos similares (guiones, canciones, planos, etc.) en función del texto ingresado. En términos de preguntas y respuestas automáticas, ChatGPT puede hacerlo automáticamente. generar respuestas basadas en las preguntas de entrada. También tiene la capacidad de escribir y depurar programas informáticos.
Durante el período de promoción, todos pueden registrarse de forma gratuita y usar ChatGPT para chatear con robots de IA de forma gratuita después de iniciar sesión.
ChatGPT puede escribir artículos similares a personas reales y rápidamente ha llamado la atención por sus respuestas detalladas y claras en muchas áreas de conocimiento, lo que demuestra que antes se pensaba que el conocimiento no podía ser reemplazado por la IA. También es competente en diversos tipos de trabajo y ha tenido un impacto considerable en los mercados financieros y laborales. Sin embargo, su precisión fáctica desigual se considera un defecto importante.
Los resultados de su base ideológica. Se ha criticado el entrenamiento del modelo. Después del lanzamiento de ChatGPT en noviembre de 2022, la valoración de OpenAI aumentó a 29 mil millones de dólares [7]. Dos meses después de conectarse, el número de usuarios alcanzó los 100 millones.
2. Cómo chatGPT entrena datos
ChatGPT está optimizado sobre GPT-3.5 mediante aprendizaje supervisado y aprendizaje reforzado basado en comentarios humanos. Ambos métodos utilizan entrenadores humanos para mejorar el rendimiento del modelo, mejorando el aprendizaje automático a través de la intervención humana para lograr resultados más realistas.
En el caso del aprendizaje supervisado, el modelo cuenta con diálogos en los que el formador actúa como usuario y asistente de IA. En el paso de refuerzo, el entrenador humano primero califica las respuestas creadas por el modelo en conversaciones previas.
Estos niveles se utilizan para crear un "modelo de recompensa" que se perfecciona aún más mediante múltiples iteraciones de optimización de política próxima (PPO).
Este algoritmo de optimización de políticas es más eficiente que el algoritmo de optimización de políticas de la región de confianza. Los modelos fueron entrenados en asociación con Microsoft en su infraestructura de supercomputación Microsoft Azure.
Además, OpenAI continúa recopilando datos de los usuarios de ChatGPT, que se pueden utilizar para entrenar y perfeccionar aún más ChatGPT. Permite a los usuarios votar hacia arriba o hacia abajo sobre las respuestas que reciben de ChatGPT; al votar hacia arriba o hacia abajo, también pueden completar un campo de texto con comentarios adicionales.
Los datos de capacitación de ChatGPT incluyen varios documentos y diversos conocimientos sobre Internet, lenguajes de programación, etc., como BBS y el lenguaje de programación Python.
En cuanto al entrenamiento de la capacidad de ChatGPT para escribir y depurar programas informáticos, dado que el modelo de aprendizaje profundo no entiende de programación, como todos los demás modelos de lenguajes basados en el aprendizaje profundo, solo obtiene correlaciones estadísticas entre fragmentos de código.