来源:经济观察报
媒体
2025-07-11 20:06:54
(原标题:“最强AI模型”Grok 4发布 马斯克称超越人类的推理水平)
7月10日,特斯拉创始人兼首席执行官马斯克旗下的人工智能公司xAI正式发布了Grok 4,迎来了作为xAI在2023年推出首代大模型以来的第四次重要更新。
得益于计算能力的增强、强化学习的训练,Grok 4 的推理能力相较于前代提升了 10 倍,因此也被称为“最强AI模型”。马斯克称,Grok 4 最强大的地方是其推理能力,它已经实现了超越人类的推理水平,不过,Grok 4也引发了业界对其安全、伦理冲突等方面的担忧。
或自主发现科学理论
在发布会直播中,xAI发布了两款模型,分别是Grok 4(单智能体版本)和Grok 4 Heavy(多智能体版本),其中后者支持4个智能体并行思考,在推理过程中横向比对、纵向协同,调用更大规模的计算资源以完成更复杂、更精密的任务。
“在所有学科上,Grok 4比博士还强——没有例外。”马斯克在直播中表示,虽然Grok 4目前还没有发现新科学或新的物理定律,但这只是一个时间问题,他相信Grok 4可以在今年内实现科学新发现。
马斯克表示,Grok 4 每次都能在 SAT 考试(美国高考)中获得满分,无需事先查看题目,它也可以做到 GRE 任何学科接近满分,超过了全世界所有研究生的水平。Grok 4 最强大的地方是其推理能力,它已经实现了超越人类的推理水平。
直播中,xAI的研究人员将“人类的最后考试”扩展到了2500个问题,涵盖了数学、自然科学、工程以及所有人文学科,问题广泛且都是博士甚至高级研究水平,极具挑战性,但Grok 4在这些问题上都可以得到很好的分数。
据介绍,从 Grok 2 到 Grok 4,xAI采用的技术范式不同,在训练计算量、推理能力较前一代提升了10倍。今年2月,xAI团队发布Grok 3,Grok 3的诞生被普遍认为是AI计算能力的全新时代。彼时,为了达到理想的训练效果,xAI公司动用了20万块英伟达GPU,构建了全球最大的超算集群。
发布会上,Grok 4的训练是在一个拥有超过20万张H100 GPU的超级计算机集群上完成的,是Grok 3时期的两倍。更重要的是,xAI改变了训练策略,将更多的算力投入到“推理能力”的专项训练上。
相比于Grok 2,Grok 4的训练量提升了整整100倍,在GPQA、AIME25、LCB(Jan-May)、HMMT25等多项测评中,Grok 4都超越了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等模型。
须警惕潜在的负面影响
2024年6月,xAI宣布在美国田纳西州孟菲斯建造超级计算机以训练其人工智能大模型Grok。该系统初期配备20万个英伟达GPU,马斯克计划将GPU规模最终扩大到100万个,而xAI计划今年8月推出代码模型,9月上线多模态智能代理,10月发布视频生成模型。
Grok 4的发布在全球科技界引起了巨大反响,它不仅标志着AI性能的新飞跃,也引发了关于追求极致智能的AI是人类文明里程碑还是未知风险源的讨论。
此前,Grok 3曾因传播不当言论而受到批评,这使得Grok 4在发布之初就被贴上了“高性能之下的高风险”标签。尽管马斯克强调Grok 4的目标是“成为尽可能追求真相的AI”,甚至设想其与类人机器人结合以发现新物理定律,但缺乏结构性的安全机制和透明的训练方式,依然引发了国际专家的担忧。
Google旗下人工智能公司DeepMind研究副总裁Oriol Vinyals指出,过度纠正错误可能使模型失去检测和修复新错误的能力,这警示了在追求“真相”过程中平衡开放性和安全性的复杂问题。
专家表示,AI正以指数级的速度重塑社会结构、经济模式乃至人类的认知边界。在享受AI带来的效率提升和知识拓展的同时,我们必须警惕其潜在的负面影响,并构建完善的伦理框架和监管体系。只有技术创新与社会责任并驾齐驱,AI才能真正推动人类文明的进步。
经济观察报
2025-07-12
经济观察报
2025-07-11
经济观察报
2025-07-11
经济观察报
2025-07-11
经济观察报
2025-07-11
经济观察报
2025-07-11
证券之星资讯
2025-07-11
证券之星资讯
2025-07-11
证券之星资讯
2025-07-11