AI跑进千家万户？AMD、高通硬件联手，让大型模型在手机电脑上“动起来”

智享AI

封面图

想象一下，你的笔记本电脑甚至智能手机，未来能像高端服务器一样，直接运行那些曾经需要庞大算力才能驾驭的AI大模型。这不再是遥不可及的愿景。近日，AMD与高通这两家在芯片领域举足轻重的公司，联手宣布了一个重要进展：它们旗下的硬件将全面支持OpenAI新推出的gpt-oss系列开放模型。这意味着，过去只存在于云端或专业工作站的强大AI能力，正以前所未有的速度向我们的个人设备渗透。
这次合作的核心在于OpenAI的gpt-oss系列模型。这个系列包含了两个不同规模的模型：一个相对轻量级的gpt-oss-20b，以及一个更为庞大的gpt-oss-120b。前者对硬件的要求并不算苛刻，16GB内存的设备就能让它流畅运行；而后者，这个拥有1200亿参数的巨兽，则需要一块80GB显存的显卡才能施展拳脚。而AMD和高通的角色，正是要让这些“大块头”模型，能够真正地在消费者触手可及的设备上跑起来。
AMD在这场合作中表现得尤为亮眼。他们推出的锐龙AI Max+395处理器，一举成为全球首款能支持gpt-oss-120b模型的消费级AI PC处理器。为了让这款强大的模型能够在有限的硬件资源下运行，AMD采用了GGML框架和MXFP4格式进行优化。这意味着，即使显存占用控制在61GB左右，也能保证模型顺畅运行，并且能够达到每秒30个Token的输出速度，这在处理复杂指令时，意味着更快的响应和更佳的用户体验。更值得一提的是，AMD的“Strix Halo”平台，凭借其128GB的统一内存，能够将96GB分配给GPU，为运行如此庞大的模型提供了坚实的硬件基础。
高通也紧随其后，在自家的骁龙平台上展示了gpt-oss-20b模型的优异表现。早期测试显示，该模型在骁龙平台上能够展现出强大的思维链推理能力，这意味着它在理解和执行复杂指令方面表现出色。对于开发者而言，这一消息更是重大利好。通过Hugging Face和Ollama等主流平台，他们可以轻松地将这一模型部署到搭载骁龙芯片的设备上，从而加速各种AI应用的开发和落地。
此次AMD与高通的合作，不仅仅是硬件厂商对AI浪潮的回应，更是对未来计算模式的一次重要探索。它意味着AI应用将不再局限于云端，而是能够更深入地融入我们的日常生活，从个人电脑到智能手机，再到各种嵌入式设备，都可能成为强大的AI终端。这为我们构想更加智能化的生活和更丰富的AI应用场景，打开了无限可能。可以预见，在不久的将来，AI将以更贴近、更便捷的方式，成为我们不可或缺的一部分。

xiaoxing

这不就是以前的事吗，搞得跟新发明一样！

7月抬头

这下好了，手机电脑都要比我聪明了。