vLLM Meetup-推理优化实战
10 月 25 日,聚焦 vLLM 推理技术的重磅线下 Meetup 将在上海开启!本次活动由 vLLM 社区联合「DaoCloud 道客」共同承办,集结全球科技巨头与国内顶尖厂商,更有开源领域技术先锋坐镇,堪称 vLLM 推理圈的 “年度技术盛宴”!
演讲阵容全面拉满:英伟达、SK 海力士旗下 Solidigm、阿里云的技术专家将深度拆解 vLLM 推理在底层硬件适配、大规模集群部署中的核心实践;上海交大、DaoCloud、PPIO、无限光年、摩尔线程、密瓜智能等 AI 硬件领域知名企业高校机构的技术大拿,将分享模型推理优化的实战经验。无论你是想紧跟 vLLM 推理的最新技术趋势,还是想学习大模型推理优化的实战方法论,或是想和行业大佬面对面交流、链接优质技术人脉 —— 这次机会都堪称 “稀缺”!线下交流的深度、技术干货的密度,绝对是提升技术视野、拓展行业资源的绝佳契机。
议程详情
主题演讲:《通过 NVIDIA Dynamo 实现高性能的 vLLM 分布式推理》
NVIDIA 英伟达 程治玮
主题演讲:《vLLM Elastic EP 的按需扩缩与业务连续性》
「DaoCloud 道客」 刘齐均
闪电演讲:《基于 vLLM 的 serverless 推理系统的探索》
无限光年 王超
主题演讲:《面向 AI SSD 的 CSAL 存储基础架构》
Solidigm (SK 海力士旗下) 高伟
闪电演讲:《vLLM 可观测》
阿里云 杨龙
主题演讲:《XGrammer : 面向 LLM 的快速、灵活且可移植的结构化生成引擎》
上海交通大学 李林璋
闪电演讲:《HAMi 在 vLLM production-stack 中的工程实践》
密瓜智能 陈文
主题演讲:《基于 vLLM 的国产芯片分布式推理方案介绍与优化》
摩尔线程 薛磊
还有神秘嘉宾等待解锁···
立即报名抢占席位,与行业顶尖实践者同行,探索 vLLM 推理效率跃迁的下一站,共同挖掘大模型的更多潜力!
