Grok4 以 73 分登顶 AI 智力榜,这让马斯克在川普政府政策下,多维竞争的方式变得更复杂。 (前情提要:Grok 4 来了!马斯克本周四直播发布:将重写整个人类知识库,跑分传大胜 GPT o3 ) (背景补充:微软高管:AI 已为公司节省五亿美元、35% 程式码由 AI 撰写,裁员 1.5 万人只是开始? )   这个月 10 日,Elon Musk 领军的 xAI 端出 Grok4,在大型语言模型智力指数以 73 分称冠 Artificial Analysis 最新榜单,首次把 OpenAI o3 与 Google Gemini 2.5 Pro 压在后头,这可能表示竞争规则正快速改写。 Grok4 冲上榜首 根据 Office Chai 报导,Grok4 在 MMLU-Pro、GPQA Diamond、SciCode、AIME、Math-500 等测试全面领先,SAT 满分、GRE 接近满分,展现推理硬实力。Musk 公开说: 「我创建 Grok 是为了寻求对宇宙的最大理解。」 OpenAI、Google 分数落后不代表实战失色。OpenAI o3-pro 强调可靠性与生态整合,针对科学、数学、商业与语音互动优化,目标是把模型嵌入更广泛的应用。 Google Gemini 2.5 Pro 则以 200 万 token 上下文视窗取胜,能一次处理整个程式码库或长篇电影,并支援文字、图像、音讯、视讯多模态输入,在需要具身推理的场景格外突出。 不只是比分数的多维战局 单一智力指标已不足描述当前的 AI 语言模型竞争。DeepSeek-R1 以十分之一运算成本追上 GPT-4 推理水准;GPT-4o mini 在数学测验通过率达 99.5%。 根据 Semrush 统计,主流模型性能差距从 2024 年的 11.9% 收敛到 5.4%。企业真正关心的是效率、成本、部署便利与安全。实务上,AI 在资料分析能带来 25% 至 80% 的生产力提升,能直接拉高企业利润空间。 川普政府上任后,外界预期共和党将放宽科技监管、加码 AI 投资,尤其在与中国科技竞逐下,AI 被视为战略核心。美国国防部透过不断的基准测试巩固 AI 语言模型的安全与可信度,也暗示政府资源将向美国本土模型倾斜。对投资人来说,政策友善与地缘政治风险交织,报酬与不确定性并存。 Grok4 的 73 分刷新天花板,但真正胜负将取决于谁能在技术、商业与政策三线找到最稳妥的交会点。而大家都能预测,马斯克和川普之间的「感情纠葛」,再创新党派,可能会让 Grok 的市场占有产生变数。 相关报导 马斯克再呛川普:不公开萝莉岛档案谁信你?「美国党」主张优先调查  法币没救了!马斯克喊「美国党支持比特币」,中本聪思想或成党纲 川普开呛马斯克美国党「根本来乱」,共和党幕僚战翻:让他滚回南非 "Grok4智力比分赢了OpenAI o3和Gemini 2.5 Pro!多元竞争转战政治面?"这篇文章最早发布于动区BlockTempo(动区动趋-最具影响力的区块链新闻媒体)。