Cover Image for LLMs i Agents sota control: Riscos i estratègies de mitigació
Cover Image for LLMs i Agents sota control: Riscos i estratègies de mitigació
Avatar for Data Talks (AED)
Presented by
Data Talks (AED)

LLMs i Agents sota control: Riscos i estratègies de mitigació

Registration
Welcome! To join the event, please register below.
About Event

Resum de la xerrada: Aquesta xerrada té com a objectiu introduir l'audiència al camp d'AI Safety. El Dr. Roberto Rafael Maura Rivero analitza el risc que suposa la transició dels models de llenguatge cap a agents autònoms capaços d'actuar al món real. Tot i que els LLM són inicialment motors de predicció de text, la seva transformació en agents multiplica els perills si no s'aconsegueix una alineació real amb els valors humans, més enllà de la simple optimització de mètriques. Mitjançant evidència empírica, Maura Rivero mostra com models avançats ja presenten comportaments enganyosos o capacitats d'exfiltració, i exposarà quines estratègies podem dur a terme per vetllar per una intel·ligència artificial segura.

Biografia del ponent: Roberto-Rafael és investigador postdoctoral a la Universitat d'Oxford i research engineer a Meta, treballant a la intersecció entre economia, teoria de jocs, democracia i alineament de la IA. Va completar el seu doctorat en Economia a la London School of Economics, on la seva recerca es va centrar en l'ús de la microeconomia per a l'alineament de la IA —incloent-hi la teoria de l'elecció social i el RLHF. Abans d'Oxford, en Roberto va adquirir experiència en recerca a la indústria com a Student Researcher a Google DeepMind i com a Applied Scientist intern a Amazon. És graduat en Matemàtiques (2018) i en Administració d'Empreses (2020) per la Universitat de Barcelona.

Idioma: TBD

Coneixements previs necessaris: -

Agenda:

  • 15:00 h Check-in

  • 15:10 h Inici de la conferència

  • 16:00 h Torn de preguntes (Q&A).

  • 16:10 h Networking & Pica-pica

Location
School of Industrial Engineering of Barcelona (ETSEIB) - UPC
Av. Diagonal, 647, Planta 0, Pavelló G, Les Corts, 08028 Barcelona, Spain
Sala d'Actes
Avatar for Data Talks (AED)
Presented by
Data Talks (AED)