面向所有热爱硬核技术的你:这一次,用代码说话,用性能封神。
北京2026年3月25日/美通社/ -- 在 DeepSeek-R1 和 Kimi K2.5 等顶级开源模型确立了万亿参数的工业基准后,真正的极限性能压榨才刚刚开始。谁能在极高并发下打破内存墙?谁能用最优雅的代码实现最高效的算子重构?在当下的 AI 战场,速度即是正义,吞吐量决定生死。由 AMD 与 GPU MODE 联合发起的极客巅峰对决,正式向全球发榜:2026 线上黑客松:AMD E2E Model Speedrun 正式吹响集结号!
作为本次活动的战略社区合作伙伴,CSDN将全程见证这场智力与算力的巅峰对决。
你,敢来迎战吗?
立即报名:AMD x GPU MODE - E2E Model Speedrun · Luma
百万美金奖池,凭实力"拿钱"
本次挑战赛设立了高达 110 万美元的总奖金池!只要你的技术够硬,名与利双丰收。
决赛入围奖:只要从预选赛杀出重围,跻身 Top 10,每支队伍保底斩获 10,000 美金!
注:两大赛道完全独立,有实力的团队完全可以双线作战,包揽百万美金!
赛制硬核,分秒必争的"大逃杀"
比赛绝非易事,本次大赛将采用"底层算子突围 + 端到端决赛大考"的双阶段赛制。能留到最后的,注定是地表最强的性能架构师。
预选赛 —— 底层内核的绝对厮杀
所有参赛者需对三大核心 GPU 算子进行极限打磨:
总决赛 —— 真实世界的端到端狂飙
Top 10 选手将获得 AMD 提供的单节点 8 卡云端 Instinct™ GPU 集群。你们需要在极致并发下,挑战两大明星模型:
在 4、32、128 三种并发度下,你不仅要保证极高的吞吐量 (Token Throughput),还要死守低延迟的交互性 (Interactivity),更要确保模型精度不能掉(本赛道要求 GSM8K ≥ 0.93)。性能门槛(三个并发级别必须同时达标):
在4、32、128三种并发度下,你不仅要保证极高的吞吐量 (Token Throughput),还要死守低延迟的交互性 (Interactivity),更要确保模型精度不能掉(如 Track 1 要求 GSM8K ≥ 0.93)性能门槛(三个并发级别必须同时达标):
评分:Token Throughput per GPU(最高 600 分)+ Interactivity(最高 400 分),三个并发级别满分 3000 分。
跑分不是终点
我们寻找的不是为了跑分的"特供版代码",而是能真正造福全人类 AI 社区的工业级优化。终极必杀规则:代码必须可 Merge!所有具备获奖资格的团队,其提交的代码必须在赛后 2-4 周内,在 AMD 工程师的指导下,成功向 AMD 官方仓库(AMD ATOM / vLLM / SGLang)发起 Pull Request 并完成合并。让你的名字,永远镌刻在推动大模型时代前行的开源主分支上!
决战时刻表 (北京标准时间)
报名&预选赛截止时间:4 月 7 日 2:59 PM(TOP 10 诞生)
决赛排位战:4 月 8 日 0:00 AM —— 5 月 16 日 2:59 PM
全球颁奖典礼: 5 月 19 日
如何加入这场算力狂欢?
无论你是 AI 底层优化老兵、CUDA/Triton 极客,还是系统架构师、开源社区贡献者,只要你对 AI 系统性能工程充满狂热,这里就是你的主场!(支持个人或至多 3 人组队参赛)
第一步:加入 AMD AI Developer Program,获取官方弹药库。
聚焦AI前沿,解读科技未来
110万美元悬赏!AMD发起全球战书:谁能打破DeepSeek与Kimi的推理速度极限?
阅读量:1184