

Lecture 3 - CUDA Scheduling and Profiling Kernels with Nsight Compute
En esta sesión entramos en la fase de Ingeniería de Precisión. No basta con que el kernel funcione; debe ser eficiente. Aprenderemos a abrir la "caja negra" de la ejecución en la GPU para identificar cuellos de botella y maximizar el rendimiento de nuestros desarrollos en el semillero.
🛠️ ¿Qué cubriremos?
CUDA Scheduling: Cómo el GigaThread Engine distribuye bloques y hilos en los Streaming Multiprocessors (SMs).
Nsight Compute Deep Dive: Uso de la herramienta profesional de NVIDIA para medir throughput de memoria, ocupación y eficiencia de instrucciones.
Identificación de Stalls: Análisis de por qué un kernel se detiene y cómo optimizar el ruteo de datos para el Benchmark de Español.
🎯 Perfil del Asistente
Desarrolladores de alto nivel: Que busquen exprimir cada TFLOP de su hardware.
Investigadores de Soberanía Tecnológica: Para quienes la eficiencia energética y de cómputo es clave en modelos locales.
Futuros Líderes del SIMG: Si tienes talento técnico, los Grupos de Liderazgo te esperan para aplicar este conocimiento en los Papers que estamos produciendo.
📍 Dónde atender
Stream en Vivo: YouTube (SIMG Official).
Interacción: Preguntas técnicas en vivo y seguimiento en nuestro Discord y WhatsApp Público.