马斯克靠烧钱能赢DeepSeek吗

文 | 科技旋涡

北京时间2月18日午间，马斯克旗下人工智能初创公司xAI正式发布新一代聊天机器人Grok 3。马斯克和他的人工智能团队声称，Grok 3测试版的高级推理能力超过了现有的人工智能模型。

马斯克这个号称地表最聪明的AI，完美诠释了什么叫“有钱任性”，只因其使用了20万块GPU训练模型。那么，它真的能够超越风头正盛的DeepSeek和行业先锋OpenAI吗?

烧钱无数的Grok 3有多强?

在Grok 3的直播中，马斯克等人介绍了Grok 3的训练历程。去年马斯克剧透，Grok 3在10万张H100上进行训练，是首个达到如此训练集群规模的模型。今天的发布会上又透露，到训练进行到第92天时，集群规模扩展到了20万卡。

Grok 3的实力也的确证明了，在当下这个时期，砸钱是一种巨大的优势。这一波Grok 3有满血和mini两个版本，在数学、科学、代码等数据集上表现均超过了GPT-4o、DeepSeek-V3等非推理模型。

Grok-3 mini的性能基本上领先或媲美其他闭源/开源模型。在著名大模型LMSYS Arena排行榜中，Grok-3刷榜，Elo评分超1400位列最高，没有任何一个模型能与之相比，堪称断层式领先。

xAI团队还展示了Grok 3如何执行有趣的任务。例如计算从地球到火星的航天器任务。Grok 3 生成了一张太空发射的动画 3D 轨迹图(即从地球到火星然后再返回地球的可行轨迹)。这涉及一些复杂的物理知识，Grok 3需要理解这些内容。

Grok 3还展示了在自动化游戏开发方面的潜力。xAI团队要求Grok 3现场创造一款融合《俄罗斯方块》和《宝石迷阵》的新游戏。Grok 3生成的Python脚本定义了游戏的常量、颜色、方块形状等元素，并呈现出独特玩法：当连接了至少三个相同颜色的方块时，会触发重力机制使方块消除，这种方式类似《宝石迷阵》。

此外，Grok 3包含一个名为Big Brain的功能，这是一个推理模型模式，允许在处理查询时进行更深入的思考。马斯克指出，17个月前，最初的Grok模型几乎不能解决高中问题，而现在它已经进步了很多，他幽默地比喻“Grok已经准备好上大学了”。

性价比与猛砸钱，大模型的路该怎么走?

众所周知，DeepSeek通过独特的算法优化、架构设计以及高效的资源利用方式，大幅降低了对英伟达高端GPU的依赖。这也致使英伟达股价暴跌16.97%，市值单日蒸发约5926.58亿美元。

DeepSeek声称其模型训练成本仅为同类模型的1/5至1/10，这意味着其在摆脱英伟达硬件束缚的情况下，仍然在推理性能等方面都表现出与ChatGPT-o1接近的能力，部分领域还有所超越。

反观马斯克的Grok 3不仅砸进去20万块GPU，更是为了尽快推出Grok 3，在短短四个月内建成数据中心。如此巨大的投入换来的也仅仅只是lmArena 排行榜中41分的提升，这真的值吗?

事实上，马斯克疯狂砸钱的举动或许有着提前布局的考量。当下，任何AI的训练都离不开GPU，只不过DeepSeek走的是“精算师路线”——通过算法优化，用行业1/10的成本实现90%的性能。而马斯克的20万块GPU不仅是为了快速推出Grok 3，更可能是为了后续依旧保持快速迭代的选择。

写在最后

诚然，马斯克的Grok 3的确超越了DeepSeek，但似乎更像是一个加强版，而非大跨度的领先。我们期待看到未来DeepSeek依旧能够凭借超高的“性价比”再度震惊世界。

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

马斯克靠烧钱能赢DeepSeek吗

烧钱无数的Grok 3有多强?

性价比与猛砸钱，大模型的路该怎么走?

写在最后

友情提示

真正的西格玛男人，是个爷们！盆都被砸出了个五角星

狗狗捉老鼠，真是爱管闲事！老鼠心想，遇见你我太难了

女子在生日宴上对闺蜜泼酒扇耳光大喊：我是闺蜜你睡我老公？

这是一个在全网数亿次播放的演讲

打网约车，遇见红灯女子情绪失控！

女子以40元每桶的价格卖掉家里的两桶花生油。#油有没有保质期

男子晒年夜饭，曾经的一家六口，如今只剩他一人

广东的包租公都这么努力，我们还有什么理由不努力？

麻将冒得巧，就是好好搞……

方涛贷款开运输队，创办物流公司身家上亿，苦等何家欢10年接出狱

《哪吒2》为何受欢迎

马斯克查账风暴：美国防部自减预算