您的位置:首页资讯软件新闻 → 马斯克说Grok- 3 强得惊人!真的吗?我用 5 条指令测试了一下

马斯克说Grok- 3 强得惊人!真的吗?我用 5 条指令测试了一下

时间:2025/2/24 16:38:13来源:www.pc6.com作者:路西蓝我要评论(0)

近日,马斯克创办的人工智能公司 xAI 开发的比较新先进人工智能聊天机器人Grok- 3 正式发布。根据官方宣传称,Grok-3 的计算能力是前身 Grok-2 的十倍以上,同时还引入了增强的推理能力,能够通过拆分复杂任务来处理更加复杂的问题。

在早期的一些测试中,Grok-3 甚至比 GPT-4o、Gemini 等模型都更加优越。Grok- 3 提供了两种不同的推理模式:1、思考模式(Think)会展示 Grok 在解决问题时的思考过程(类似Deepseek的深度思考);大脑模式(Big Brain)则适用于计算量更大的任务。与此同时,xAI 还推出了 “Deep Search”—— 一款新一代的人工智能搜索引擎。有传言称,Grok 很快将推出合成语音功能。

要使用 Grok-3 功能,用户可以订阅 X Premium Plus 会员服务,该服务最近涨价至每月 40 美元,用户也可以选择高档的 SuperGrok 计划。

此前的版本 Grok-2 曾因输出错误信息和冒犯性内容而被诟病,xAI 计划在不久后开源 Grok-2。

回归正题,我用 Perplexity 想了 5 个用来测试 Grok-3 的指令。本次测试的原因之一是要确定它们的可靠程度。在注意到 Grok-3 偶尔会不提供引用信息来源后,我不得不调整指令,以确保能够进行自行研究,从而对 Grok-3 的回答进行核查。

1、高档推理

1.png

指令:解释量子纠缠的概念及其对信息传输的影响

Grok-3 的回复有效地介绍了量子纠缠,描述了粒子是如何相互关联的、以至于一个粒子的状态会直接影响另一个粒子的状态,无论它们之间的距离有多远。Grok-3 运用了通俗易懂的类比,比如将纠缠粒子比作相互连接的物体,这有助于让外行人更加通俗易懂地理解复杂的量子现象。

但遗憾的是,Grok-3 没有引用保障的信息源来支持它的观点。如果能引用一些来自知名科学文献的内容,会大大提高用户对其所提供信息的可信度和可靠性的信心。

2. 深度研究

2.png

指令:总结一下过去一个月(2025 年 1 月中旬至 2 月中旬)发布的关于可再生能源的比较新研究

诚然,Grok-3 能迅速地从各种渠道获取信息,它的回复涵盖了可再生能源研究的多个方面,包括太阳能和风能的进展、能源存储解决方案、绿色氢能生产、生物能源发展以及电网整合策略等。这种广泛的涵盖面彰显了其对可再生能源领域不同方面的理解。

此外,它提到了将AI和机器学习整合到相关产业,用以实现更好的电网管理,这表明Grok- 3 还了解可能会增强可再生能源系统的跨学科方法。

然而,Grok-3 的回复虽然提供了一个大致的概述,但依然缺乏对过去一个月内具体研究、出版物或数据的引用,也没有加入一些具体的例子或研究结果,来增强总结的可信度和相关性。

虽然我能自己看到这些信息的来源,但如果 Grok-3 能在回答中明确指出这些来源,那就更好了。

此外,Grok-3 在回答中还使用了 “研究很可能还在继续” 、 “研究可能是在之前努力的基础上进行的” 等表述,暗示了相关内容存在“假设”的可能性,这大大削弱了回复的保障性和可靠性。

3. 大脑模式

3.png


指令:分析在发达国家实施全民基本收入(UBI)的经济影响

Grok-3 的回复陈述了 UBI 的积极影响和消极影响两方面的情况,提供了一个较为细致的视角,同时也认识到了这个问题的复杂性。这一次,Grok-3 引用了具体的研究和试点项目,这些内容也让它的回答有了现实世界的例子作为支撑,提高了可信度。

但遗憾的是,它在回复中使用了 “might” 和 “could” 等词汇,这也从一定程度上削弱了保障性。同时,Grok- 3 在回答中也没有充分考虑到可能存在的反对意见,且分析主要是集中在即时影响上,没有研究长期的经济后果。

4、利用Aurora生成图片

4.png

指令:生成一张现实风的、日落时分的、未来城市景观图片

生成的图片非常逼真,光线、反射效果和大气效果都很棒,视觉上相当吸引力和沉浸感。未来风格的建筑和色彩搭配带来了强烈的视觉冲击,而且不同的图片提供了不一样的视角。从街道视角到河畔景观,我很喜欢它的这种“多样性”。

不过呢,逼真倒是逼真,但未来主义不够 —— 图片看起来和当下的城市景观大差不差。简而言之,就是太过中规中矩,几乎没啥“未来感”可言。

5、多模态输入处理

5.png


指令:分析过去一个世纪全球气温的变化,并总结关键趋势

Grok-3 的回复正确地概述了自 20 世纪初以来全球气温总体上升了约 1.1-1.2 摄氏度,这与美国国家海洋和大气管理局(NOAA)、美国国家航空航天局(NASA)和政府间气候变化专门委员会(IPCC)的研究结果一致(我是自己查找资料进行调查核实的)。它还确定了两个关键的变暖阶段(1910-1940 年和 1970 年之后),捕捉到了变暖趋势的历史变化,并提到北极地区变暖加剧以及陆地和海洋变暖速率的差异,这些内容在科学上都有充分的依据。

Grok-3 主张陆地地区的变暖速度比全球海洋平均速度要快。但它又又又没有引用具体的数据集或报告,要是引用了信息源出处,会大大提高可信度(我又是自己进行研究以确定其准确性的)。比如,可以引用一个被广泛认可的温度数据集(例如,哈德利中心全球温度数据集(HadCRUT)、戈达德太空研究所表面温度分析(GISTEMP))会使论点更有说服力。

和上述的其他回复一样,“typically observed” 和 “often cited” 等表述也让它的回答有了一定程度上的的不确定性。

最终结论

Grok-3 在处理一系列复杂主题的分析性和解释性指令方面确实展现出了很大的优势,这些主题包括气候科学、经济学、人工智能和物理学。虽然回复的内容总体上结构良好且信息丰富,但仍有一些可以改进的地方。例如,如果有用户选择利用 Grok-3 来做学术或专业研究,仍需要自己花费额外的时间,对Grok-3 回答的真实性进行核查。在这次实验中,因为 Grok 经常不引经据典,我就没少干这事儿。

它倒是经常引用诸如NASA之类的大型机构的内容,但却没有直接链接到具体的报告或数据库。此外,虽然科学上存在一定的不确定性是合理的,但你也不能总是用一些带有强烈不确定性的措辞,这大大削弱了我对其观点的信心。由于这种科学上的不确定性、以及缺乏具体数据的支撑,总是让我对它的回答持怀疑态度。

然后,虽然 Grok-3 在很大程度上理解了我关于图像的指令,但它并没有完全融入所要求的元素,或者说我没看到自己期望中的样子。

当然,这大概是因为还没好好“训练”它的原因,但总归是有些遗憾的。

总的来说,Grok-3 确实是一款能力很强的AI工具,但它真算得上 “好得惊人” 吗?马斯克啊,你还是先别这么急着下结论!


相关视频

    没有数据

相关阅读 苹果M4版MacBook Air或将下月发布:性能显著提升小米首款AI专业办公笔记本!REDMI Book Pro 16 2025首批搭载第二M4 MacBook Air首次跑分:仅比MacBook Pro低了5%马斯克呼吁:快让国际空间站退役 让我们去火星苹果iPhone 15 Pro将升级视觉智能 通过AI理解图像内容小米“血洗”空调行业!曝米家中央空调Pro仅23999元起:用料超越xAI 新模型 Grok 3 逻辑推理能力获 OpenAI 创始人点赞iPhone17Pro系列或回归铝合金:出于环保考虑放弃钛合金

文章评论
发表评论

热门文章 何小鹏:人形机器人想盛大出手!Tanka AI “马斯克第13个孩子五个​2025 年生成式

最新文章 回归GMV,抖音电商有了女孩大学毕业后回家照 AI日报:DeepSeek开源大模型加速器FlashMLA微软CEO:Xbox将运用生成式AI开发一系列视频马斯克说Grok- 3 强得惊人!真的吗?我用 5AI硅胶娃娃”不是噱头!专家:好看皮囊和有

人气排行 2020年放假安排时间表全年图 2020年法定节假2021年放假安排时间表全年图 2021年法定节假微信公众号怎么申请 微信公众号申请要钱吗zune怎么用?zune使用攻略!2014台式机装机配置推荐微信朋友圈三天可见怎么破解 朋友圈仅展示三snmp协议在windows下的安装与配置2016猴年邮票多少钱一套 2016猴年邮票价格表