O que é RAG (Retrieval-Augmented Generation)?
Definição rápida
RAG é uma arquitetura que combina busca de informação (retrieval) com geração de texto por IA (generation). Antes de responder, o sistema busca documentos relevantes no seu banco de conhecimento e usa esse contexto para gerar uma resposta precisa.
Como RAG funciona
- Usuário faz uma pergunta
- Sistema busca documentos relevantes em uma base de conhecimento (banco vetorial)
- Documentos encontrados são incluídos no contexto da LLM
- LLM gera resposta baseada nos documentos recuperados
- Resposta inclui citações/fontes quando possível
Por que usar RAG
- Dados atualizados: LLMs têm conhecimento limitado ao treinamento; RAG dá acesso a dados novos
- Redução de alucinação: respostas baseadas em fontes reais, não em memória da LLM
- Personalização: permite usar dados proprietários da empresa
- Rastreabilidade: fontes podem ser citadas
Aplicações empresariais
Sistemas de Q&A internos, chatbots com base de conhecimento, análise de contratos, atendimento ao cliente.