Cover Image for Lecture 3 - CUDA Scheduling and Profiling Kernels with Nsight Compute
Cover Image for Lecture 3 - CUDA Scheduling and Profiling Kernels with Nsight Compute
5 Going

Lecture 3 - CUDA Scheduling and Profiling Kernels with Nsight Compute

Google Meet
Registration
Welcome! To join the event, please register below.
About Event

En esta sesión entramos en la fase de Ingeniería de Precisión. No basta con que el kernel funcione; debe ser eficiente. Aprenderemos a abrir la "caja negra" de la ejecución en la GPU para identificar cuellos de botella y maximizar el rendimiento de nuestros desarrollos en el semillero.

🛠️ ¿Qué cubriremos?

  • CUDA Scheduling: Cómo el GigaThread Engine distribuye bloques y hilos en los Streaming Multiprocessors (SMs).

  • Nsight Compute Deep Dive: Uso de la herramienta profesional de NVIDIA para medir throughput de memoria, ocupación y eficiencia de instrucciones.

  • Identificación de Stalls: Análisis de por qué un kernel se detiene y cómo optimizar el ruteo de datos para el Benchmark de Español.

🎯 Perfil del Asistente

  • Desarrolladores de alto nivel: Que busquen exprimir cada TFLOP de su hardware.

  • Investigadores de Soberanía Tecnológica: Para quienes la eficiencia energética y de cómputo es clave en modelos locales.

  • Futuros Líderes del SIMG: Si tienes talento técnico, los Grupos de Liderazgo te esperan para aplicar este conocimiento en los Papers que estamos produciendo.

📍 Dónde atender

  • Stream en Vivo: YouTube (SIMG Official).

  • Interacción: Preguntas técnicas en vivo y seguimiento en nuestro Discord y WhatsApp Público.

5 Going