时间:2025/1/12 13:42:05来源:www.pc6.com作者:教学助手我要评论(0)
加州大学伯克利分校天空计算实验室的研究团队NovaSky于周五发布了Sky-T1-32B-Preview推理模型,这一模型在多个关键基准测试中表现优异,与OpenAI的o1早期版本相媲美,更令人瞩目的是其极低的训练成本。
Sky-T1-32B-Preview是首个真正的开源推理模型,NovaSky团队不仅发布了模型,还公开了用于训练它的数据集及必要的训练代码,这意味着该模型可从头开始复制。据团队在博客文章中所述,“Sky-T1-32B-Preview的训练成本不到450美元,这表明可以经济高效地复制高级推理能力。”在不久前,训练同等性能的模型价格往往高达数百万美元,而如今成本的大幅降低,主要得益于合成训练数据或由其他模型生成的训练数据的应用。例如,人工智能公司Writer最近发布的模型Palmyra X004几乎完全基于合成数据进行训练,开发成本仅为70万美元。
图源备注:图片由AI生成,图片授权服务商Midjourney
推理模型与普通人工智能模型不同,能够有效进行自我事实核查,从而避免一些常见陷阱。不过,推理模型得出解决方案通常需要更长时间,从几秒到几分钟不等。但其在物理、科学和数学等领域的可靠性更高,这是其显著优势。
NovaSky团队透露,他们借助阿里巴巴的QwQ-32B-Preview推理模型生成Sky-T1的初始训练数据,之后对数据进行“整理”,并利用OpenAI的GPT-4o-mini将数据重构为更易用的格式。使用8个Nvidia H100GPU机架训练320亿参数的Sky-T1大约需要19个小时,参数数量大致对应模型解决问题的能力。
在性能测试方面,Sky-T1在MATH500(一组“竞赛级”数学挑战)上的表现优于o1的早期预览版本,还在一组来自LiveCodeBench(一种编码评估)的难题上击败了o1的预览版本。然而,Sky-T1在GPQA-Diamond上的表现不如o1预览版,后者包含博士毕业生应掌握的物理、生物和化学相关问题。此外,OpenAI的o1GA版本比预览版更强大,且OpenAI预计在未来几周发布性能更佳的推理模型o3。
尽管如此,NovaSky团队表示,Sky-T1仅是他们开发具有高级推理能力的开源模型的起点。“展望未来,我们将专注于开发更高效的模型,保持强大的推理性能,并探索先进技术,进一步提高模型在测试时的效率和准确性,”团队在帖子中写道,“请继续关注我们在这些激动人心的计划上取得的进展。”这一开源推理模型的出现,无疑为人工智能领域带来了新的机遇和挑战,其未来发展值得持续关注。
相关视频
相关阅读 ChatGPT卷入爆炸案刷屏,AI安全正在成为最贵的学费被吹爆的终迎来增长,又一国内产品加入AI商品图竞赛重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1中国AI硬件,正在占领CES小红书新做的这个AI搜索,有Perplexity们都眼馋的能力海螺AI悄悄上线的这个新功能,我愿称为一致性的新王。大模型六小虎,要撞上版权墙了ChatGPT卷入爆炸案刷屏,AI安全正在成为最贵的学费
热门文章 Meta 提出新型可扩展记英伟达 CEO:我们的AI京东回应App内支持支付鸿蒙版微信正式上架:
最新文章
开源推理AI模型Sky-T1ChatGPT卷入爆炸案刷屏
Meta 提出新型可扩展记忆层,提升语言模型知英伟达 CEO:我们的AI 芯片改进速度超越摩尔Avataar 推出全新 AI 视频生成工具,助力产3个月DAU增长2.8倍,这款AI图片App避免了“
人气排行 八门神器教程,图文传授怎么使用图文教程:R-Studio万能通用数据恢复方法UEFI+GTP模式下使用GHO文件安装WIN7或WIN8图MHDD4.6使用方法图解DirectX修复工具无法打开 DirectX修复工具分区助手怎么扩大c盘?分区助手调整c盘大小教pqmagic 9.0中文使用教程图解按键精灵如何找图 按键精灵找图教程
查看所有0条评论>>