
想象一下,你的笔记本电脑甚至智能手机,未来能像高端服务器一样,直接运行那些曾经需要庞大算力才能驾驭的AI大模型。这不再是遥不可及的愿景。近日,AMD与高通这两家在芯片领域举足轻重的公司,联手宣布了一个重要进展:它们旗下的硬件将全面支持OpenAI新推出的gpt-oss系列开放模型。这意味着,过去只存在于云端或专业工作站的强大AI能力,正以前所未有的速度向我们的个人设备渗透。
这次合作的核心在于OpenAI的gpt-oss系列模型。这个系列包含了两个不同规模的模型:一个相对轻量级的gpt-oss-20b,以及一个更为庞大的gpt-oss-120b。前者对硬件的要求并不算苛刻,16GB内存的设备就能让它流畅运行;而后者,这个拥有1200亿参数的巨兽,则需要一块80GB显存的显卡才能施展拳脚。而AMD和高通的角色,正是要让这些“大块头”模型,能够真正地在消费者触手可及的设备上跑起来。
AMD在这场合作中表现得尤为亮眼。他们推出的锐龙AI Max+395处理器,一举成为全球首款能支持gpt-oss-120b模型的消费级AI PC处理器。为了让这款强大的模型能够在有限的硬件资源下运行,AMD采用了GGML框架和MXFP4格式进行优化。这意味着,即使显存占用控制在61GB左右,也能保证模型顺畅运行,并且能够达到每秒30个Token的输出速度,这在处理复杂指令时,意味着更快的响应和更佳的用户体验。更值得一提的是,AMD的“Strix Halo”平台,凭借其128GB的统一内存,能够将96GB分配给GPU,为运行如此庞大的模型提供了坚实的硬件基础。
高通也紧随其后,在自家的骁龙平台上展示了gpt-oss-20b模型的优异表现。早期测试显示,该模型在骁龙平台上能够展现出强大的思维链推理能力,这意味着它在理解和执行复杂指令方面表现出色。对于开发者而言,这一消息更是重大利好。通过Hugging Face和Ollama等主流平台,他们可以轻松地将这一模型部署到搭载骁龙芯片的设备上,从而加速各种AI应用的开发和落地。
此次AMD与高通的合作,不仅仅是硬件厂商对AI浪潮的回应,更是对未来计算模式的一次重要探索。它意味着AI应用将不再局限于云端,而是能够更深入地融入我们的日常生活,从个人电脑到智能手机,再到各种嵌入式设备,都可能成为强大的AI终端。这为我们构想更加智能化的生活和更丰富的AI应用场景,打开了无限可能。可以预见,在不久的将来,AI将以更贴近、更便捷的方式,成为我们不可或缺的一部分。