

Třetí Evals.cz meetup
Benchmarky modelů jsou všude. Ale když nasazujete AI do produktu, zajímá vás něco jiného: funguje to u vás, s vašimi daty, pro vaše uživatele?
[English below]
evals.cz je pražský meetup pro lidi, kteří AI produkty staví - a potřebují je měřit.
Co čekat
3 krátké přednášky + diskuze
Praktické zkušenosti z praxe
Žádné sales pitche
Převážně anglicky
Témata
RAG kvalita · používání veřejných benchmarků · human-in-the-loop · metriky a metodologie
Pro koho
ML/AI engineers, backend vývojáři integrující LLMs, data scientists, product manažeři, AI researchers — i zvědaví začátečníci.
Speakers
TBD
[English here]
Model benchmarks are everywhere. But when you're shipping AI in a product, you care about something different: does it work for you, with your data, for your users?
evals.cz is a Prague meetup for people building AI products who need to measure them.
What to expect
3 short talks + discussion
Practical, real-world experience
No sales pitches
Mostly in English
Topics
RAG quality · using public benchmarks · human-in-the-loop · metrics and methodology
Who it's for
ML/AI engineers, backend developers integrating LLMs, data scientists, product managers, AI researchers — and curious beginners too.
Speakers
TBD