

LLMs eficientes: custo, contexto e arquitetura
🔥 Você está queimando dinheiro com tokens: Como arquitetura, contexto e model routing impactam seu custo
Empresas já avançaram no uso de LLMs, mas poucas estão operando com eficiência real.
O problema deixou de ser acesso à tecnologia e passou a ser como arquitetar sistemas que não desperdiçam recursos.
Na prática, o que vemos em produção:
prompts inflados e pouco estruturados
uso excessivo de modelos de alto custo
pipelines sem estratégia de cache ou reutilização
RAG mal implementado, com excesso de contexto irrelevante
ausência de controle sobre consumo, latência e throughput
Resultado: custos crescentes, baixa previsibilidade e sistemas difíceis de escalar.
⚙️ O que vamos discutir
Este encontro propõe uma discussão técnica e aplicada sobre eficiência em sistemas com LLMs, explorando:
Token economics: impacto direto no custo e performance
Model routing: escolha dinâmica entre modelos menores e mais robustos
Prompt engineering avançado: estrutura, compressão e controle de contexto
RAG eficiente: chunking, retrieval e redução de redundância
Caching e reuse de respostas
Orquestração multi-step vs. chamadas únicas
Observabilidade e controle de consumo em produção
🚀 Contexto de aplicação
A conversa será conduzida em parceria com a Microsoft, trazendo exemplos práticos e aprendizados de ambientes reais de produção.
Serão abordadas ferramentas como Azure OpenAI Service e Azure AI Studio como parte do contexto, mas os princípios discutidos são agnósticos de stack e aplicáveis a diferentes arquiteturas e provedores.
O foco está em eficiência, escala, governança e previsibilidade de custo — independentemente da tecnologia utilizada.
🎯 Para quem é
Engenheiros de dados
Desenvolvedores
Arquitetos de solução
Lideranças técnicas que já estão trabalhando com IA
💡 O que você leva
visão prática de como reduzir consumo de tokens
decisões arquiteturais mais eficientes
caminhos claros para escalar aplicações de IA sem explodir custo
Sem teoria vazia. Sem hype.
Aqui, IA é tratada como sistema.