CHATGPT

CHATGPT PESQUISA
2. História e Evolução
● Como o Chat GPT surgiu?

Criado pela empresa de pesquisa OpenAI, o ChatGPT foi lançado em 30 de novembro de
2022 e, em poucos dias, causou um grande impacto na internet. Além de responder
perguntas simples, a ferramenta também pode produzir redações, dar sugestões de ideias,
escrever códigos, fazer contas, propiciar conversas filosóficas, entre milhares de outras
possibilidades.
Segundo a OpenAI, o modelo de linguagem da ferramenta foi treinado usando diferentes

modelos de conversas, em que a IA precisava desempenhar o papel de um usuário e de um
assistente virtual.
Em outras palavras, o ChatGPT foi desenvolvido para manter uma conversa com o usuário
final, seja produzindo um texto, respondendo questões ou criando códigos de programação.
O Chat GPT é uma versão aprimorada do GPT-3.5, uma família de grandes modelos de
linguagem que a OpenAI lançou alguns meses antes do chatbot. O próprio GPT-3.5 é uma
versão atualizada do GPT-3, que apareceu em 2020.
A empresa disponibiliza estes modelos no seu site como interfaces de programação de
aplicações (APIs, em inglês), o que torna mais fácil para outros programadores de software
colocarem os modelos em seus próprios códigos. A OpenAI também havia lançado uma
versão melhorada do GPT-3.5, chamada Instruct GPT, em janeiro de 2022. Entretanto,
nenhuma dessas versões anteriores da tecnologia foi apresentada ao público.
Fonte: TechMundo
● Quais empresas ou tecnologias desempenharam um papel importante no

desenvolvimento desse Chat?
● Como modelos como o Chat GPT foram desenvolvidos para entender a linguagem
humana?
Segundo a OpenAI, o modelo de linguagem da ferramenta foi treinado usando diferentes

modelos de conversas, em que a IA precisava desempenhar o papel de um usuário e de um
assistente virtual. O ChatGPT foi treinado por meio do sistema Reinforcement Learning
from Human Feedback (RLHF), em portugues, Aprendizagem por Reforço a partir de
Feedback Humano.
ChatGPT usa grandes modelos de linguagem ( LLMs ) que são treinados em uma grande
quantidade de dados para prever a próxima palavra e formar uma frase.
Para ensinar o ChatGPT a criar diálogo em um estilo humano de conversa, ele foi treinado
usando RLHF para que a IA aprenda as expectativas humanas.
O treinamento RLHF é feito em três fases:
● Fase inicial. A primeira fase envolve a seleção de um modelo existente como

modelo principal para determinar e rotular o comportamento correto. Usar um
modelo pré-treinado economiza tempo devido à quantidade de dados necessários
para o treinamento.
● Feedback humano. Depois de treinar o modelo inicial, os testadores humanos
fornecem informações sobre o desempenho. Os treinadores humanos fornecem uma
pontuação de qualidade ou precisão para vários resultados gerados por modelos. O
sistema então avalia seu desempenho com base no feedback humano para criar
recompensas para o aprendizado por reforço.
● Aprendizagem por reforço. O modelo de recompensa é ajustado com os
resultados do modelo principal e recebe uma pontuação de qualidade dos
testadores. O modelo principal utiliza esse feedback para melhorar seu desempenho
em tarefas futuras.
RLHF é um processo iterativo porque a coleta de feedback humano e o refinamento do

modelo com aprendizagem por reforço são repetidos para melhoria contínua.
Treinar o LLM dessa forma é importante para prever a próxima palavra e ajuda a construir
uma frase inteira e coerente. Isso é o que diferencia o ChatGPT de um chatbot simples, que
normalmente fornece uma resposta pré-escrita e pronta para responder a uma pergunta.
Fonte:Techtarget.com

CHATGPT

Enviado por

CHATGPT

Enviado por

CHATGPT PESQUISA

● Como o Chat GPT surgiu?

Segundo a OpenAI, o modelo de linguagem da ferramenta foi treinado usando diferentes

● Quais empresas ou tecnologias desempenharam um papel importante no

Segundo a OpenAI, o modelo de linguagem da ferramenta foi treinado usando diferentes

● Fase inicial. A primeira fase envolve a seleção de um modelo existente como

RLHF é um processo iterativo porque a coleta de feedback humano e o refinamento do

Você também pode gostar