Cover Image for LLMs eficientes: custo, contexto e arquitetura
Cover Image for LLMs eficientes: custo, contexto e arquitetura
4 Going

LLMs eficientes: custo, contexto e arquitetura

Hosted by Eduardo “Dug” Hilpert
Registration
Approval Required
Your registration is subject to host approval.
Welcome! To join the event, please register below.
About Event

🔥 Você está queimando dinheiro com tokens: Como arquitetura, contexto e model routing impactam seu custo

Empresas já avançaram no uso de LLMs, mas poucas estão operando com eficiência real.
O problema deixou de ser acesso à tecnologia e passou a ser como arquitetar sistemas que não desperdiçam recursos.

Na prática, o que vemos em produção:

  • prompts inflados e pouco estruturados

  • uso excessivo de modelos de alto custo

  • pipelines sem estratégia de cache ou reutilização

  • RAG mal implementado, com excesso de contexto irrelevante

  • ausência de controle sobre consumo, latência e throughput

Resultado: custos crescentes, baixa previsibilidade e sistemas difíceis de escalar.


⚙️ O que vamos discutir

Este encontro propõe uma discussão técnica e aplicada sobre eficiência em sistemas com LLMs, explorando:

  • Token economics: impacto direto no custo e performance

  • Model routing: escolha dinâmica entre modelos menores e mais robustos

  • Prompt engineering avançado: estrutura, compressão e controle de contexto

  • RAG eficiente: chunking, retrieval e redução de redundância

  • Caching e reuse de respostas

  • Orquestração multi-step vs. chamadas únicas

  • Observabilidade e controle de consumo em produção


🚀 Contexto de aplicação

A conversa será conduzida em parceria com a Microsoft, trazendo exemplos práticos e aprendizados de ambientes reais de produção.

Serão abordadas ferramentas como Azure OpenAI Service e Azure AI Studio como parte do contexto, mas os princípios discutidos são agnósticos de stack e aplicáveis a diferentes arquiteturas e provedores.

O foco está em eficiência, escala, governança e previsibilidade de custo — independentemente da tecnologia utilizada.


🎯 Para quem é

  • Engenheiros de dados

  • Desenvolvedores

  • Arquitetos de solução

  • Lideranças técnicas que já estão trabalhando com IA


💡 O que você leva

  • visão prática de como reduzir consumo de tokens

  • decisões arquiteturais mais eficientes

  • caminhos claros para escalar aplicações de IA sem explodir custo


Sem teoria vazia. Sem hype.
Aqui, IA é tratada como sistema.

Location
Cubo Itaú
Alameda Vicente Pinzon, 54 - Vila Olímpia, São Paulo - SP, 04547-130, Brazil
4 Going