Sistemas na pratica / IA, busca e contexto
IA, busca e contexto
RAG vs Fine-Tuning Sem Falso Dilema
Como decidir entre retrieval e fine-tuning olhando para o tipo de falha real do sistema, nao para hype.
O problema
Muita conversa sobre RAG e fine-tuning vira disputa de ferramenta.
Parece que voce precisa escolher um lado antes mesmo de entender qual falha o sistema tem.
Com isso, a decisao fica mais ideologica do que tecnica.
Modelo mental
O ponto principal nao e comparar nomes.
O ponto principal e separar dois tipos de problema:
- o modelo nao tem o contexto certo na hora certa
- o modelo tem contexto, mas continua se comportando mal do mesmo jeito
Essa divisao ja melhora muito a conversa.
Quebrando o problema
Antes de escolher, tente responder:
- a falha vem de conhecimento faltando ou desatualizado?
- ou o problema e comportamento repetido mesmo com contexto bom?
- eu preciso de uma camada mais facil de atualizar e inspecionar?
- o custo operacional de fine-tuning faz sentido aqui?
Essas perguntas puxam a decisao para a falha real, nao para moda.
Exemplo simples
Imagine um assistente interno que responde perguntas sobre politica da empresa.
Se ele erra porque nao recebeu o documento mais recente, o problema parece muito mais de retrieval do que de fine-tuning.
Agora imagine um fluxo em que o modelo ate recebe o contexto certo, mas continua respondendo no formato errado ou ignorando instrucoes importantes de forma recorrente.
A conversa entao pode comecar a apontar para ajuste de comportamento, e nao so para busca.
O importante e perceber que o tipo de falha mudou.
Erros comuns
- tratar RAG e fine-tuning como se um anulasse o outro
- puxar fine-tuning cedo demais sem provar que retrieval ja esta bom
- chamar qualquer erro de “falta de contexto”
- ignorar custo de operacao, avaliacao e iteracao
Como um senior pensa
Um senior forte comeca pela falha observavel.
Normalmente isso soa assim:
Se o sistema falha porque nao acessa o conhecimento certo, eu melhoro retrieval primeiro. Se ele falha mesmo com o contexto correto, eu comeco a discutir mudanca de comportamento.
Isso organiza a decisao de um jeito muito mais util.
O que o entrevistador quer ver
Em entrevista, isso costuma mostrar maturidade rapido:
- voce sabe distinguir acesso a conhecimento de comportamento do modelo
- voce escolhe o ponto de controle mais barato e mais inspecionavel primeiro
- voce pensa em iteracao e custo operacional
Quem faz isso bem parece alguem que projeta sistema de IA com criterio, nao com buzzword.
Antes de escolher a tecnica, descubra qual falha voce esta tentando corrigir.
Se o modelo nem recebeu o contexto certo ainda, discutir fine-tuning pode estar cedo demais.