

No Time to Whisper: Hard Lessons from Scaling GPU-Powered AI for Doctor Visit Transcription
En esta primera sesión contaremos con Carlos López, Staff Platform Engineer en Docplanner, quien compartirá valiosas lecciones sobre cómo escalar y gestionar un sistema de IA en producción.
The talk will be in Spanish, unless someone doesn’t speak the language, in which case we’ll switch to English.
Descripción de la charla
Crear IA para entornos clínicos deja muy poco margen para el error. En esta charla compartimos el recorrido de Docplanner (https://www.docplanner.com) al disponibilizar y escalar un sistema IA de transcripción para visitas médicas basado en GPUs, partiendo de un equipo con experiencia limitada en MLOps y en el uso de GPUs.
Repasaremos los retos reales a los que nos enfrentamos: desplegar y operar modelos de gran tamaño en producción, gestionar GPUs de forma eficiente, garantizar la fiabilidad bajo carga y cumplir con estrictos requisitos de cumplimiento en materia de datos médicos. Aprenderás las lecciones que aprendimos por la fuerza, las decisiones de arquitectura y las estrategias prácticas de MLOps que nos permitieron pasar de los primeros fracasos a un sistema estable y de alta precisión en un entorno sanitario crítico.
Sobre el ponente
Carlos López Vecino es un ingeniero de plataforma con más de diez años de experiencia.
Ahora mismo está enfocado en construir una plataforma de IA en Docplanner mientras ayuda a los equipos de producto a integrar IA en sus aplicaciones.
Agenda
18:30 Bienvenida y recepción de asistentes
19:00 Charla: No Time to Whisper: Hard Lessons from Scaling GPU-Powered AI for Doctor Visit Transcription
20:00 Cierre y networking