时间:2025/2/20 0:08:19来源:www.pc6.com作者:佚名我要评论(0)
埃隆・马斯克的人工智能公司 xAI 于本周一发布了其最新的语言模型 Grok3,标志着该公司在人工智能领域的重要进展。据马斯克介绍,新模型所需的计算能力是其前身的十倍,使用了位于孟菲斯的数据中心,配备了约20万块 GPU。
Grok3系列模型推出了多种变体,其中包括一个精简版,旨在提高速度但牺牲部分准确性。此外,新的 “推理” 模型专门设计用于解决数学和科学问题。用户可以通过 Grok 界面中的 “思考” 和 “大脑” 设置来调整这些功能。xAI 表示,这一版本尚未最终定型,模型仍在持续训练中,团队计划在未来几周内进行改进。
根据 AI 基准测试平台 lmarena.ai 的数据,Grok3在聊天机器人领域的得分超过了1400,成为领先者,涵盖编程等所有类别,超越了 OpenAI、Anthropic 和谷歌的模型。然而,实际性能可能与基准结果有所不同。例如,尽管 Claude3.5Sonnet 在编码基准测试中的得分低于某些模型,但许多用户仍认为它是编程任务的更优选择。
OpenAI 创始人安德烈・卡尔帕西(Andrej Karpathy)获得了 Grok3的早期访问权,他对该模型的逻辑推理能力给予了高度评价。“思考” 功能能够成功处理复杂任务,比如计算 GPT-2的训练 flops 或为棋盘游戏创建六边形网格,这些能力在之前仅限于 OpenAI 的高端模型 o1-pro。此外,该功能还提高了基本数学操作的准确性,比如字母计数和比较小数。
在新搜索功能方面,卡尔帕西指出,DeepSearch 的质量与 Perplexity 的研究工具相当,可以提供关于即将发布的苹果产品和 Palantir 股票动态等主题的相关答案。然而,他也发现了一些明显的问题:模型有时会生成虚假的网址,做出不支持的声明,并且仅在特定提示下引用 X 的帖子。
它似乎还对自己的存在缺乏意识,遗漏了 xAI 在主要 AI 实验室中的位置。这些局限性使 DeepSearch 尚未达到 OpenAI “深度研究” 的质量水平,并且在幽默和伦理问题上表现不佳。
相关视频
相关阅读 AI Pin“猝死”:Humane1.16亿美元“卖身”惠普,设备下月停服小红书重点打击黑灰产团伙用AIGC大模型大规模矩阵养号行为OpenAI 举报者之死疑云重重,家属送检有疑头发样本月之暗面Kimi暂停大规模投流 战略重心转向底层模型FF公布AI人才招聘计划 夯实FF及FX战略AI研发基础大决战!OpenAI可能发布GPT-4.5,狙击马斯克Gork3全球首测!OpenAI开源SWELancer,大模型冲击100万年薪网文编辑拒绝AI投稿,为什么AI写小说有股伪人感?
热门文章
OpenAI 举报者
秘塔科技推出 “先想后
OpenAI低调更新GPT4o模
微信接入DeepSeek 腾讯
最新文章
xAI 新模型 Grok 3 逻
OpenAI 举报者
秘塔科技推出 “先想后搜” 研究模式,引领OpenAI低调更新GPT4o模型,多项能力反超Dee用Deepseek翻译哪吒2急急如律令,结果有点意首度揭秘!大众点评如何用“AI+人工”守护
人气排行 CPU天梯图2021年5月最新版 CPU性能排行天梯显卡天梯图2021年5月最新版 显卡排行榜天梯蓝牙5.1和5.0有什么区别 蓝牙5.1规范一览主板天梯图2019最新版 2019年9月主板性能天小米手环支持什么手机 小米手环支持其他手机高通骁龙cpu排行天梯图2019 高通骁龙处理器天猫精灵怎么用 阿里天猫精灵使用体验cpu风扇怎么拆下来
查看所有0条评论>>