1-IA Generativa para Analise de Documentos
1-IA Generativa para Analise de Documentos
1-IA Generativa para Analise de Documentos
dem10/Istock
SOBRE O DESAFIO
Para a empresa em questão, uma grande fabricante de eletrônicos dos Estados Unidos, o
problema era agravado pelo alto investimento em pesquisas com clientes e na aquisição
de múltiplos relatórios de diferentes consultorias e empresas de análise de mercado, o
que levou a uma montanha de dados, muitas vezes duplicados ou até contraditórios.
Retrieval (Recuperação)
Ao receber uma consulta, a primeira fase do RAG envolve procurar no banco de dados
por trechos ou documentos relevantes que contêm informações pertinentes à
consulta. Esta fase utiliza um modelo de recuperação para identificar e "recuperar" as
passagens mais relevantes.
Generation (Geração)
Uma vez recuperadas as passagens relevantes, elas são usadas como entrada,
juntamente com a consulta original, para um modelo gerador. Este modelo é treinado
para gerar uma resposta informada com base nas informações recuperadas e na
consulta fornecida.
Etapa 1: Recuperação
Ao receber esta consulta, o modelo RAG começa sua busca no vasto banco de relatórios
Pode encontrar passagens como:
"Em 2020, observou-se um aumento na demanda por smartphones com capacidades
de câmera aprimoradas."
"Os consumidores em 2020 valorizavam fortemente a longevidade da bateria ao
escolher smartphones."
"A integração 5G tornou-se um recurso essencial em muitos smartphones lançados
em 2020."
Etapa 2: Geração
Com base nas passagens recuperadas e na consulta original, o modelo gerador pode criar
uma resposta coesa e informativa:
"Em 2020, as principais tendências no mercado de smartphones incluíram uma
demanda crescente por capacidades de câmera aprimoradas, uma ênfase na
longevidade da bateria e a integração do 5G como um recurso essencial."
Etapa 1: Recuperação
O modelo RAG busca primeiro informações relevantes sobre a aceitação de VEs na Europa
em 2021 e, em seguida, faz o mesmo para a América do Norte. Ele pode encontrar
passagens como:
"Na Europa, em 2021, as vendas de veículos elétricos representaram 20% de todas as
vendas de veículos novos, um aumento de 5% em relação a 2020."
"Vários países europeus introduziram incentivos fiscais para a compra de VEs em
2021, estimulando o crescimento do mercado."
"Na América do Norte, em 2021, os VEs compuseram 15% das vendas totais de
veículos novos, mantendo-se estável em relação ao ano anterior."
"A infraestrutura de carregamento ainda é vista como uma barreira significativa na
América do Norte, limitando a adoção mais ampla."
Etapa 2: Geração
Usando as informações recuperadas, o modelo gerador pode compor a seguinte resposta:
"Em 2021, a Europa viu um aumento na aceitação de veículos elétricos, com VEs
representando 20% de todas as vendas de veículos novos, um aumento de 5% em
relação ao ano anterior. Este crescimento foi, em parte, impulsionado por incentivos
fiscais introduzidos por vários países europeus. Em contraste, na América do Norte, a
aceitação de VEs permaneceu estável em 15% das vendas totais, sem crescimento
significativo em relação ao ano anterior. Uma das razões para essa estagnação pode ser a
percebida falta de infraestrutura de carregamento na região."
IMPLEMENTAÇÃO
Seleção de Modelos
Treinamento e Fine-tuning
No estudo de caso dessa aula, observamos como uma empresa utilizou o Retrieval-
Augmented Generation (RAG) para otimizar a pesquisa e análise de relatórios de
mercado, demonstrando sua eficácia e precisão. No entanto, o potencial do RAG
estende-se muito além dessa aplicação específica.