vLLM Meetup-推理优化实战 的封面图片
vLLM Meetup-推理优化实战 的封面图片
主办人
5 人参加

vLLM Meetup-推理优化实战

主办人:HULuna
报名
往期活动
欢迎!请在下方注册以参加活动。
活动详情

10 月 25 日,聚焦 vLLM 推理技术的重磅线下 Meetup 将在上海开启!本次活动由 vLLM 社区联合「DaoCloud 道客」共同承办,集结全球科技巨头与国内顶尖厂商,更有开源领域技术先锋坐镇,堪称 vLLM 推理圈的 “年度技术盛宴”!

演讲阵容全面拉满:英伟达、SK 海力士旗下 Solidigm、阿里云的技术专家将深度拆解 vLLM 推理在底层硬件适配、大规模集群部署中的核心实践;上海交大、DaoCloud、PPIO、无限光年、摩尔线程、密瓜智能等 AI  硬件领域知名企业高校机构的技术大拿,将分享模型推理优化的实战经验。无论你是想紧跟 vLLM 推理的最新技术趋势,还是想学习大模型推理优化的实战方法论,或是想和行业大佬面对面交流、链接优质技术人脉 —— 这次机会都堪称 “稀缺”!线下交流的深度、技术干货的密度,绝对是提升技术视野、拓展行业资源的绝佳契机。

议程详情

主题演讲:《通过 NVIDIA Dynamo 实现高性能的 vLLM 分布式推理》

NVIDIA 英伟达  程治玮

主题演讲:《vLLM Elastic EP 的按需扩缩与业务连续性》

「DaoCloud 道客」 刘齐均

闪电演讲:《基于 vLLM 的 serverless 推理系统的探索》

无限光年   王超

主题演讲:《面向 AI SSD 的 CSAL 存储基础架构》

Solidigm (SK 海力士旗下) 高伟

闪电演讲:《vLLM 可观测》

阿里云  杨龙

主题演讲:《XGrammer : 面向 LLM 的快速、灵活且可移植的结构化生成引擎》

上海交通大学  李林璋

闪电演讲:《HAMi 在 vLLM production-stack 中的工程实践》

密瓜智能   陈文

主题演讲:《基于 vLLM 的国产芯片分布式推理方案介绍与优化》

摩尔线程  薛磊

还有神秘嘉宾等待解锁···

立即报名抢占席位,与行业顶尖实践者同行,探索 vLLM 推理效率跃迁的下一站,共同挖掘大模型的更多潜力!

地点
上海 魔力社区 浦东新区中科路 1750 号 1 幢 5F
主办人
5 人参加