Grok3发布!马斯克口中“地表最强AI”到底有多强?
最近,AI圈又迎来了一场大事件——Grok3发布了!马斯克更是毫不吝啬地称赞它为“地球上最聪明的人工智能” 。发布会刚结束,大家肯定都和我一样,对这款新AI充满了好奇。今天,咱们就一起来深入了解一下Grok3,看看它到底有啥厉害之处。
一、Grok3的诞生
Grok3能有如此强大的能力,背后离不开强大的计算资源支持。在训练过程中,它使用的GPU数量和时长都相当惊人。
(一)GPU使用量
Grok3训练时动用了10万个NVIDIA H100 GPU,而它的前代Grok2仅使用了约2万个H100 GPU。这差距可不是一星半点,大量的GPU为模型训练提供了强大的运算能力。
(二)GPU小时数
从训练时长来看,Grok3累计训练时长达到2亿GPU小时,是Grok2的十倍之多。Grok2的训练规模约为2000万GPU小时,和Grok3相比,明显不在一个量级。
(三)训练硬件
Grok3是由xAI自家打造的超级电脑Colossus训练出来的。这台电脑堪称“巨无霸”,从无到有仅用了八个月就完成搭建,里面装了足足10万个英伟达H100显卡。而且,在机房扩建时,技术团队的效率越来越高,最初搭建拥有10万块显卡的机房用了122天,之后将规模扩大一倍到20万块显卡,仅仅花了92天,比第一次快了差不多一个月。
二、Grok3的功能特点
经过大量计算资源训练出来的Grok3,整体构成包含推理、思考、Agent这些常见部分。不过,咱们普通用户更关心它有哪些实用的新功能。
(一)DeepSearch功能
Grok3的DeepSearch有点像DeepSeek的“联网搜索”,但又有独特之处。在发布会演示中可以看到,它不仅能进行搜索,还会把搜索的思考链路展示出来。比如,当用户询问关于SpaceX发射的相关信息时,它会一步步展示自己从不同网站获取信息、分析信息的过程,像提到Wikipedia上关于SpaceX 2025年发射计划的内容,以及从rocketlaunch.org等网站查找具体发射日期的思考过程 。
(二)Big Brain(Agent)功能
Big Brain其实就是Grok3的Agent功能。简单来说,它能帮你完成各种复杂任务。比如你可以要求它用Python代码写一个融合俄罗斯方块(Tetris)和宝石迷阵(Bejeweled)玩法的小游戏,它就能按照要求输出代码。
三、Grok3的性能表现:真的超越同行?
发布会上展示了Grok3在多个基准测试中的成绩,结果显示它在多个领域超过了OpenAI的gpt – 4o、Claude 3.5、Deepseek V3和Gemini 2 Pro等知名AI。在数学(AIME’24)、科学(GPQA)、编程(LCB Oct – Feb)等测试项目中,Grok3的得分都名列前茅。不过,大家心里肯定也和我一样犯嘀咕,这数据是不是真这么靠谱,还得打个问号。毕竟实际使用效果可能和测试结果存在差异。
四、使用权限与费用:哪些用户能用上?
目前Grok3不是免费向所有用户开放的。从发布当天起,X Premium +用户可以免费使用。成为X Premium +用户后,不仅能使用Grok3,还能提前体验新功能,使用DeepSearch、Reasoning功能,并且拥有更高的使用权限。
五、总结与展望:Grok3未来会怎样?
马斯克推出Grok3,很大程度上是想证明“Scaling Laws”(缩放定律)仍然有效,至于他是否成功,接下来就看广大用户的使用反馈了。咱们作为旁观者,也只能拭目以待,看看Grok3在实际应用中到底能不能像发布会上展示的那么厉害。另外,不知道大家发现没有,现在海外AI团队里华裔的占比好像越来越高了,这也是一个很有意思的现象。