人工智能智力排行榜系列

智享AI

人工智能排行榜持续更新，新榜单向下查看最新回复：

2025年3月28日更新：谁是智力王者，谁是分项冠军？
根据最新的“人工智能能力分析指数”，我们来盘点一下智力排行榜的第一名以及各细分领域的冠军！

智力排行榜第一名：Gemini 2.5 Pro Experimental
在人工智能能力分析指数中，Gemini 2.5 Pro Experimental横空出世，总分66.410分，位列第一，第2名的是66分整的Grok。

智力总榜：

总结：Gemini 2.5 Pro Experimental不仅拿下总分第一，并且在多模态方面展现了无与伦比的全面实力，稳坐智力排行榜的“王座”！

分项第一名：专项领域的王者们

编程（SciCode）第一名：Claude 3.5 Sonnet（Anthropic）
得分：40%
亮点：在科学代码任务中，Claude 3.5 Sonnet 以微弱优势领先 Grok 2（38%），展现了超强的代码编写能力。如果你需要一个能处理复杂算法的 AI，它绝对是“编程之王”！
多模态（人机协作）第一名：DeepSeek-V2
得分：86%
亮点：DeepSeek-V2 在人机协作的多模态任务中拔得头筹，领先 Grok 2（84%）。它在图文结合的场景中表现出色，是智能交互领域的“多模态之王”！
科学（GPQA）第一名：Gemini 1.5 Pro（Google）
得分：80%
亮点：在专业科学问题上，Gemini 1.5 Pro 以 80% 的高分力压 Grok 2（78%），成为科学领域的“知识之王”。科研工作者们有福了！

分项排名

智享AI

2025年4月19日更新排行榜系列之状元秀🚀
当今AI的发展速度，用两个成语形容不为过：日新月异、百花齐放。有很多厂商改变了策略，求精而不求全，他们在各自的专业领域能做到一枝独秀。
但对于我们而言，更关心的是我要用哪个和应该用哪个大模型，下面来盘点一下，各个领域的大模型状元，来帮助大家选择在各个领域应该选择哪个厂商的哪个模型：

1. AI智商层，状元：OpenAI-o4mini：

OpenAI与Google领跑，新兴模型还是待提升

2. 数学专项，状元：OpenAI-o4mini：

金融、医疗、制造业、科技、交通、零售和能源等行业，大家在数据分析、风险评估、优化算法和预测等方面可以选择OpenAI-o4minni。

3. 推理与知识专项，状元：Gemini 2.5 ProPreview：

推理与知识的AI应用在教育、医疗、法律、金融等行业中，通过智能决策、问题解决和知识管理，提升效率和决策质量。

4. 科学推理专项，状元：Gemini 2.5 ProPreview：

5. 人类考试专项，状元：OpenAI-o4mini：

科学（如物理、生物等）、历史、文学、哲学等方面基于事实或逻辑给出精准的答案，有这方面的需求，大家可以使用OpenAI-o4mini

6. 编程之LiveCodeBench，状元：OpenAI-o4mini：

难度较高的编程，包含竞赛级别的编程问题，适合在复杂编程任务。

7. 编程之SciCode，状元：OpenAI-o4mini：

在科学研究领域的编码能力，强调实际研究中的问题解决能力，这个还是OpenAI-o4mini

8. 编程之HumanEval，状元：OpenAI-o4mini：

包含类似于软件面试的简单编程问题，难度较低的编码能力，基础代码生成能力

9. MATH-500（定量推理），状元：Grok 3 miniReasoning(high)：

主要应用于金融、商业分析、数据科学和公共政策等行业，通过评估逻辑推理、数据分析和问题解决能力，支持风险评估、决策优化和政策制定

10. AIME 2024（竞赛数学），状元：OpenAI-o4mini：

主要服务于教育和学术研究领域，面向顶尖高中生，培养高级数学思维和问题解决能力，为国际数学奥林匹克（IMO）选拔人才，同时为学生提供学术认可和升学优势。

如何快速体验gpt-o4-mini和Gemini 2.5 ProPreview

目前，官方尚未完全开放官方API，但用户可以通过智享AI导航的国外AI通用网址提供的API模型“o4-mini”和“gemini-2.5-pro-preview”进行体验。访问
https://online.chatgpt5x.com即可购买和使用，操作简单且适合国内用户。

总结与展望

随着AI大厂如OpenAI、Google、Grok及国内DeepSeek等在推理、知识和编码能力上的显著提升，未来AI的智商水平有望进一步突破，推动科学研究、医疗诊断、金融决策等领域实现更大飞跃，为人类解决复杂问题提供更强大的助力，最终迈向通用人工智能（AGI）的目标。

PS：那时候有多少人失业？又有多少人站在风口上，飞上了天？去站在未来，来看当下的风口吧。

智享AI

5月25日更新：

智商总榜单：

文本转图像榜单：

文本转视频榜单：

图像转视频榜单：

智享AI

6月17日更新：

智商总榜单：

智享AI

鸟枪换炮，咱们改成正式网址啦：https://news.chatgpt5x.com/ai-rankings