0% acharam este documento útil (0 voto)
85 visualizações3 páginas

CHATGPT

Enviado por

gugsboy2018
Direitos autorais
© © All Rights Reserved
Formatos disponíveis
Baixe no formato DOCX, PDF, TXT ou leia on-line no Scribd
Fazer download em docx, pdf ou txt
0% acharam este documento útil (0 voto)
85 visualizações3 páginas

CHATGPT

Enviado por

gugsboy2018
Direitos autorais
© © All Rights Reserved
Formatos disponíveis
Baixe no formato DOCX, PDF, TXT ou leia on-line no Scribd
Fazer download em docx, pdf ou txt
Fazer download em docx, pdf ou txt
Você está na página 1/ 3

CHATGPT PESQUISA

2. História e Evolução

● Como o Chat GPT surgiu?


Criado pela empresa de pesquisa OpenAI, o ChatGPT foi lançado em 30 de novembro de
2022 e, em poucos dias, causou um grande impacto na internet. Além de responder
perguntas simples, a ferramenta também pode produzir redações, dar sugestões de ideias,
escrever códigos, fazer contas, propiciar conversas filosóficas, entre milhares de outras
possibilidades.

Segundo a OpenAI, o modelo de linguagem da ferramenta foi treinado usando diferentes


modelos de conversas, em que a IA precisava desempenhar o papel de um usuário e de um
assistente virtual.

Em outras palavras, o ChatGPT foi desenvolvido para manter uma conversa com o usuário
final, seja produzindo um texto, respondendo questões ou criando códigos de programação.

O Chat GPT é uma versão aprimorada do GPT-3.5, uma família de grandes modelos de
linguagem que a OpenAI lançou alguns meses antes do chatbot. O próprio GPT-3.5 é uma
versão atualizada do GPT-3, que apareceu em 2020.
A empresa disponibiliza estes modelos no seu site como interfaces de programação de
aplicações (APIs, em inglês), o que torna mais fácil para outros programadores de software
colocarem os modelos em seus próprios códigos. A OpenAI também havia lançado uma
versão melhorada do GPT-3.5, chamada Instruct GPT, em janeiro de 2022. Entretanto,
nenhuma dessas versões anteriores da tecnologia foi apresentada ao público.

Fonte: TechMundo

● Quais empresas ou tecnologias desempenharam um papel importante no


desenvolvimento desse Chat?

● Como modelos como o Chat GPT foram desenvolvidos para entender a linguagem
humana?

Segundo a OpenAI, o modelo de linguagem da ferramenta foi treinado usando diferentes


modelos de conversas, em que a IA precisava desempenhar o papel de um usuário e de um
assistente virtual. O ChatGPT foi treinado por meio do sistema Reinforcement Learning
from Human Feedback (RLHF), em portugues, Aprendizagem por Reforço a partir de
Feedback Humano.

ChatGPT usa grandes modelos de linguagem ( LLMs ) que são treinados em uma grande
quantidade de dados para prever a próxima palavra e formar uma frase.
Para ensinar o ChatGPT a criar diálogo em um estilo humano de conversa, ele foi treinado
usando RLHF para que a IA aprenda as expectativas humanas.
O treinamento RLHF é feito em três fases:

● Fase inicial. A primeira fase envolve a seleção de um modelo existente como


modelo principal para determinar e rotular o comportamento correto. Usar um
modelo pré-treinado economiza tempo devido à quantidade de dados necessários
para o treinamento.
● Feedback humano. Depois de treinar o modelo inicial, os testadores humanos
fornecem informações sobre o desempenho. Os treinadores humanos fornecem uma
pontuação de qualidade ou precisão para vários resultados gerados por modelos. O
sistema então avalia seu desempenho com base no feedback humano para criar
recompensas para o aprendizado por reforço.
● Aprendizagem por reforço. O modelo de recompensa é ajustado com os
resultados do modelo principal e recebe uma pontuação de qualidade dos
testadores. O modelo principal utiliza esse feedback para melhorar seu desempenho
em tarefas futuras.

RLHF é um processo iterativo porque a coleta de feedback humano e o refinamento do


modelo com aprendizagem por reforço são repetidos para melhoria contínua.

Treinar o LLM dessa forma é importante para prever a próxima palavra e ajuda a construir
uma frase inteira e coerente. Isso é o que diferencia o ChatGPT de um chatbot simples, que
normalmente fornece uma resposta pré-escrita e pronta para responder a uma pergunta.

Fonte:Techtarget.com

Você também pode gostar