110万美元悬赏！AMD发起全球战书：谁能打破DeepSeek与Kimi的推理速度极限？

面向所有热爱硬核技术的你：这一次，用代码说话，用性能封神。

北京2026年3月25日/美通社/ -- 在 DeepSeek-R1 和 Kimi K2.5 等顶级开源模型确立了万亿参数的工业基准后，真正的极限性能压榨才刚刚开始。谁能在极高并发下打破内存墙？谁能用最优雅的代码实现最高效的算子重构？在当下的 AI 战场，速度即是正义，吞吐量决定生死。由 AMD 与 GPU MODE 联合发起的极客巅峰对决，正式向全球发榜：2026 线上黑客松：AMD E2E Model Speedrun 正式吹响集结号！

作为本次活动的战略社区合作伙伴，CSDN将全程见证这场智力与算力的巅峰对决。

你，敢来迎战吗？

立即报名：AMD x GPU MODE - E2E Model Speedrun · Luma

百万美金奖池，凭实力"拿钱"

本次挑战赛设立了高达 110 万美元的总奖金池！只要你的技术够硬，名与利双丰收。

决赛入围奖：只要从预选赛杀出重围，跻身 Top 10，每支队伍保底斩获 10,000 美金！

注：两大赛道完全独立，有实力的团队完全可以双线作战，包揽百万美金！

赛制硬核，分秒必争的"大逃杀"

比赛绝非易事，本次大赛将采用"底层算子突围 + 端到端决赛大考"的双阶段赛制。能留到最后的，注定是地表最强的性能架构师。

预选赛 —— 底层内核的绝对厮杀

所有参赛者需对三大核心 GPU 算子进行极限打磨：

总决赛 —— 真实世界的端到端狂飙

Top 10 选手将获得 AMD 提供的单节点 8 卡云端 Instinct™ GPU 集群。你们需要在极致并发下，挑战两大明星模型：

在 4、32、128 三种并发度下，你不仅要保证极高的吞吐量 (Token Throughput)，还要死守低延迟的交互性 (Interactivity)，更要确保模型精度不能掉（本赛道要求 GSM8K ≥ 0.93）。性能门槛（三个并发级别必须同时达标）：

在4、32、128三种并发度下，你不仅要保证极高的吞吐量 (Token Throughput)，还要死守低延迟的交互性 (Interactivity)，更要确保模型精度不能掉（如 Track 1 要求 GSM8K ≥ 0.93）性能门槛（三个并发级别必须同时达标）：

评分：Token Throughput per GPU（最高 600 分）+ Interactivity（最高 400 分），三个并发级别满分 3000 分。

跑分不是终点

我们寻找的不是为了跑分的"特供版代码"，而是能真正造福全人类 AI 社区的工业级优化。终极必杀规则：代码必须可 Merge！所有具备获奖资格的团队，其提交的代码必须在赛后 2-4 周内，在 AMD 工程师的指导下，成功向 AMD 官方仓库（AMD ATOM / vLLM / SGLang）发起 Pull Request 并完成合并。让你的名字，永远镌刻在推动大模型时代前行的开源主分支上！

决战时刻表 (北京标准时间)

报名&预选赛截止时间：4 月 7 日 2:59 PM（TOP 10 诞生）

决赛排位战：4 月 8 日 0:00 AM —— 5 月 16 日 2:59 PM

全球颁奖典礼： 5 月 19 日

如何加入这场算力狂欢？

无论你是 AI 底层优化老兵、CUDA/Triton 极客，还是系统架构师、开源社区贡献者，只要你对 AI 系统性能工程充满狂热，这里就是你的主场！（支持个人或至多 3 人组队参赛）

第一步：加入 AMD AI Developer Program，获取官方弹药库。

110万美元悬赏！AMD发起全球战书：谁能打破DeepSeek与Kimi的推理速度极限？

分享图片预览