vLLM Meetup-推理优化实战

Hosted by HULuna

上海魔力社区浦东新区中科路 1750 号 1 幢 5F

Past Event

Welcome! To join the event, please register below.

You will be asked to verify token ownership with your wallet.

About Event

10 月 25 日，聚焦 vLLM 推理技术的重磅线下 Meetup 将在上海开启！本次活动由 vLLM 社区联合「DaoCloud 道客」共同承办，集结全球科技巨头与国内顶尖厂商，更有开源领域技术先锋坐镇，堪称 vLLM 推理圈的 “年度技术盛宴”！

演讲阵容全面拉满：英伟达、SK 海力士旗下 Solidigm、阿里云的技术专家将深度拆解 vLLM 推理在底层硬件适配、大规模集群部署中的核心实践；上海交大、DaoCloud、PPIO、无限光年、摩尔线程、密瓜智能等 AI 硬件领域知名企业高校机构的技术大拿，将分享模型推理优化的实战经验。无论你是想紧跟 vLLM 推理的最新技术趋势，还是想学习大模型推理优化的实战方法论，或是想和行业大佬面对面交流、链接优质技术人脉 —— 这次机会都堪称 “稀缺”！线下交流的深度、技术干货的密度，绝对是提升技术视野、拓展行业资源的绝佳契机。

议程详情

主题演讲：《通过 NVIDIA Dynamo 实现高性能的 vLLM 分布式推理》

NVIDIA 英伟达程治玮

主题演讲：《vLLM Elastic EP 的按需扩缩与业务连续性》

「DaoCloud 道客」刘齐均

闪电演讲：《基于 vLLM 的 serverless 推理系统的探索》

无限光年王超

主题演讲：《面向 AI SSD 的 CSAL 存储基础架构》

Solidigm (SK 海力士旗下）高伟

闪电演讲：《vLLM 可观测》

阿里云杨龙

主题演讲：《XGrammer : 面向 LLM 的快速、灵活且可移植的结构化生成引擎》

上海交通大学李林璋

闪电演讲：《HAMi 在 vLLM production-stack 中的工程实践》

密瓜智能陈文

主题演讲：《基于 vLLM 的国产芯片分布式推理方案介绍与优化》

摩尔线程薛磊

还有神秘嘉宾等待解锁···

立即报名抢占席位，与行业顶尖实践者同行，探索 vLLM 推理效率跃迁的下一站，共同挖掘大模型的更多潜力！

Location

上海魔力社区浦东新区中科路 1750 号 1 幢 5F

Hosted By

5 Went

AI

vLLM Meetup-推理优化实战

​议程详情

议程详情