

LLMs i Agents sota control: Riscos i estratègies de mitigació
Resum de la xerrada: Aquesta xerrada té com a objectiu introduir l'audiència al camp d'AI Safety. El Dr. Roberto Rafael Maura Rivero analitza el risc que suposa la transició dels models de llenguatge cap a agents autònoms capaços d'actuar al món real. Tot i que els LLM són inicialment motors de predicció de text, la seva transformació en agents multiplica els perills si no s'aconsegueix una alineació real amb els valors humans, més enllà de la simple optimització de mètriques. Mitjançant evidència empírica, Maura Rivero mostra com models avançats ja presenten comportaments enganyosos o capacitats d'exfiltració, i exposarà quines estratègies podem dur a terme per vetllar per una intel·ligència artificial segura.
Biografia del ponent: Roberto-Rafael és investigador postdoctoral a la Universitat d'Oxford i research engineer a Meta, treballant a la intersecció entre economia, teoria de jocs, democracia i alineament de la IA. Va completar el seu doctorat en Economia a la London School of Economics, on la seva recerca es va centrar en l'ús de la microeconomia per a l'alineament de la IA —incloent-hi la teoria de l'elecció social i el RLHF. Abans d'Oxford, en Roberto va adquirir experiència en recerca a la indústria com a Student Researcher a Google DeepMind i com a Applied Scientist intern a Amazon. És graduat en Matemàtiques (2018) i en Administració d'Empreses (2020) per la Universitat de Barcelona.
Idioma: TBD
Coneixements previs necessaris: -
Agenda:
15:00 h Check-in
15:10 h Inici de la conferència
16:00 h Torn de preguntes (Q&A).
16:10 h Networking & Pica-pica