

Druhý Evals.cz meetup
Benchmarky modelů jsou všude. Ale když nasazujete AI do produktu, zajímá vás něco jiného: funguje to u vás, s vašimi daty, pro vaše uživatele?
evals.cz je pražský meetup pro lidi, kteří AI produkty staví - a potřebují je měřit.
Co čekat
3 krátké přednášky + diskuze
Praktické zkušenosti z praxe
Žádné sales pitche
Převážně anglicky
Témata
RAG kvalita · používání veřejných benchmarků · human-in-the-loop · metriky a metodologie
Pro koho
ML/AI engineers, backend vývojáři integrující LLMs, data scientists, product manažeři, AI researchers — i zvědaví začátečníci.
Speakers
Po úspěchu minulého meetupu jsme se rozhodli soustředit na praktické oblasti, obzvláště kolem RAGu.
Jak používat veřejné benchmarky v oblasti duševního zdraví pro vlastní aplikace (Aneta @ Promethist),
Jak vyvíjet a evaluovat RAG produkt (Matouš @ Waypoint AI),
a v jednání máme třetí prezentaci o vyhodnocování a zlepšování searche v RAGu - stay tuned!