Grok4智力比分赢了OpenAI o3和Gemini 2.5 Pro！多元竞争转战政治面？

Grok4 以 73 分登顶 AI 智力榜，这让马斯克在川普政府政策下，多维竞争的方式变得更复杂。 （前情提要：Grok 4 来了！马斯克本周四直播发布：将重写整个人类知识库，跑分传大胜 GPT o3 ） （背景补充：微软高管：AI 已为公司节省五亿美元、35% 程式码由 AI 撰写，裁员 1.5 万人只是开始？ ）   这个月 10 日，Elon Musk 领军的 xAI 端出 Grok4，在大型语言模型智力指数以 73 分称冠 Artificial Analysis 最新榜单，首次把 OpenAI o3 与 Google Gemini 2.5 Pro 压在后头，这可能表示竞争规则正快速改写。 Grok4 冲上榜首 根据 Office Chai 报导，Grok4 在 MMLU-Pro、GPQA Diamond、SciCode、AIME、Math-500 等测试全面领先，SAT 满分、GRE 接近满分，展现推理硬实力。Musk 公开说： 「我创建 Grok 是为了寻求对宇宙的最大理解。」 OpenAI、Google 分数落后不代表实战失色。OpenAI o3-pro 强调可靠性与生态整合，针对科学、数学、商业与语音互动优化，目标是把模型嵌入更广泛的应用。 Google Gemini 2.5 Pro 则以 200 万 token 上下文视窗取胜，能一次处理整个程式码库或长篇电影，并支援文字、图像、音讯、视讯多模态输入，在需要具身推理的场景格外突出。 不只是比分数的多维战局 单一智力指标已不足描述当前的 AI 语言模型竞争。DeepSeek-R1 以十分之一运算成本追上 GPT-4 推理水准；GPT-4o mini 在数学测验通过率达 99.5%。 根据 Semrush 统计，主流模型性能差距从 2024 年的 11.9% 收敛到 5.4%。企业真正关心的是效率、成本、部署便利与安全。实务上，AI 在资料分析能带来 25% 至 80% 的生产力提升，能直接拉高企业利润空间。 川普政府上任后，外界预期共和党将放宽科技监管、加码 AI 投资，尤其在与中国科技竞逐下，AI 被视为战略核心。美国国防部透过不断的基准测试巩固 AI 语言模型的安全与可信度，也暗示政府资源将向美国本土模型倾斜。对投资人来说，政策友善与地缘政治风险交织，报酬与不确定性并存。 Grok4 的 73 分刷新天花板，但真正胜负将取决于谁能在技术、商业与政策三线找到最稳妥的交会点。而大家都能预测，马斯克和川普之间的「感情纠葛」，再创新党派，可能会让 Grok 的市场占有产生变数。 相关报导 马斯克再呛川普：不公开萝莉岛档案谁信你？「美国党」主张优先调查  法币没救了！马斯克喊「美国党支持比特币」，中本聪思想或成党纲 川普开呛马斯克美国党「根本来乱」，共和党幕僚战翻：让他滚回南非 "Grok4智力比分赢了OpenAI o3和Gemini 2.5 Pro！多元竞争转战政治面？"这篇文章最早发布于动区BlockTempo(动区动趋-最具影响力的区块链新闻媒体)。

Grok4智力比分赢了OpenAI o3和Gemini 2.5 Pro！多元竞争转战政治面？

创作者的更多内容

实时新闻

Grok4智力比分赢了OpenAI o3和Gemini 2.5 Pro！多元竞争转战政治面？

创作者的更多内容

实时新闻

热门文章