Foto de portada de Lecture 3 - CUDA Scheduling and Profiling Kernels with Nsight Compute
Foto de portada de Lecture 3 - CUDA Scheduling and Profiling Kernels with Nsight Compute
5 asistirán

Lecture 3 - CUDA Scheduling and Profiling Kernels with Nsight Compute

Google Meet
Inscripción
¡Bienvenido! Para unirte al evento, regístrate a continuación.
Acerca del evento

En esta sesión entramos en la fase de Ingeniería de Precisión. No basta con que el kernel funcione; debe ser eficiente. Aprenderemos a abrir la "caja negra" de la ejecución en la GPU para identificar cuellos de botella y maximizar el rendimiento de nuestros desarrollos en el semillero.

🛠️ ¿Qué cubriremos?

  • CUDA Scheduling: Cómo el GigaThread Engine distribuye bloques y hilos en los Streaming Multiprocessors (SMs).

  • Nsight Compute Deep Dive: Uso de la herramienta profesional de NVIDIA para medir throughput de memoria, ocupación y eficiencia de instrucciones.

  • Identificación de Stalls: Análisis de por qué un kernel se detiene y cómo optimizar el ruteo de datos para el Benchmark de Español.

🎯 Perfil del Asistente

  • Desarrolladores de alto nivel: Que busquen exprimir cada TFLOP de su hardware.

  • Investigadores de Soberanía Tecnológica: Para quienes la eficiencia energética y de cómputo es clave en modelos locales.

  • Futuros Líderes del SIMG: Si tienes talento técnico, los Grupos de Liderazgo te esperan para aplicar este conocimiento en los Papers que estamos produciendo.

📍 Dónde atender

  • Stream en Vivo: YouTube (SIMG Official).

  • Interacción: Preguntas técnicas en vivo y seguimiento en nuestro Discord y WhatsApp Público.

5 asistirán