LLMs eficientes: custo, contexto e arquitetura

Name: LLMs eficientes: custo, contexto e arquitetura
Start: 2026-06-23T17:00:00.000-03:00
End: 2026-06-23T20:00:00.000-03:00
Location: Cubo Itaú

Hosted by Eduardo “Dug” Hilpert

Cubo Itaú

São Paulo, Brazil

Approval Required

Your registration is subject to host approval.

Welcome! To join the event, please register below.

You will be asked to verify token ownership with your wallet.

About Event

🔥 Você está queimando dinheiro com tokens: Como arquitetura, contexto e model routing impactam seu custo

Empresas já avançaram no uso de LLMs, mas poucas estão operando com eficiência real.
O problema deixou de ser acesso à tecnologia e passou a ser como arquitetar sistemas que não desperdiçam recursos.

Na prática, o que vemos em produção:

prompts inflados e pouco estruturados
uso excessivo de modelos de alto custo
pipelines sem estratégia de cache ou reutilização
RAG mal implementado, com excesso de contexto irrelevante
ausência de controle sobre consumo, latência e throughput

Resultado: custos crescentes, baixa previsibilidade e sistemas difíceis de escalar.

⚙️ O que vamos discutir

Este encontro propõe uma discussão técnica e aplicada sobre eficiência em sistemas com LLMs, explorando:

Token economics: impacto direto no custo e performance
Model routing: escolha dinâmica entre modelos menores e mais robustos
Prompt engineering avançado: estrutura, compressão e controle de contexto
RAG eficiente: chunking, retrieval e redução de redundância
Caching e reuse de respostas
Orquestração multi-step vs. chamadas únicas
Observabilidade e controle de consumo em produção

🚀 Contexto de aplicação

A conversa será conduzida em parceria com a Microsoft, trazendo exemplos práticos e aprendizados de ambientes reais de produção.

Serão abordadas ferramentas como Azure OpenAI Service e Azure AI Studio como parte do contexto, mas os princípios discutidos são agnósticos de stack e aplicáveis a diferentes arquiteturas e provedores.

O foco está em eficiência, escala, governança e previsibilidade de custo — independentemente da tecnologia utilizada.

🎯 Para quem é

Engenheiros de dados
Desenvolvedores
Arquitetos de solução
Lideranças técnicas que já estão trabalhando com IA

💡 O que você leva

visão prática de como reduzir consumo de tokens
decisões arquiteturais mais eficientes
caminhos claros para escalar aplicações de IA sem explodir custo

Sem teoria vazia. Sem hype.
Aqui, IA é tratada como sistema.

Location

Cubo Itaú

Alameda Vicente Pinzon, 54 - Vila Olímpia, São Paulo - SP, 04547-130, Brazil

Hosted By

4 Going

AI

LLMs eficientes: custo, contexto e arquitetura

​🔥 Você está queimando dinheiro com tokens: Como arquitetura, contexto e model routing impactam seu custo

​⚙️ O que vamos discutir

​🚀 Contexto de aplicação

​🎯 Para quem é

​💡 O que você leva

🔥 Você está queimando dinheiro com tokens: Como arquitetura, contexto e model routing impactam seu custo

⚙️ O que vamos discutir

🚀 Contexto de aplicação

🎯 Para quem é

💡 O que você leva