开源推理AI模型Sky-T1横空出世，训练成本不到 450 美元 -pc6资讯

您的位置：首页 → 资讯 → 系统工具 → 开源推理AI模型Sky-T1横空出世，训练成本不到 450 美元

开源推理AI模型Sky-T1横空出世，训练成本不到 450 美元 时间：2025/1/12 13:42:05来源：www.pc6.com作者：教学助手我要评论(0)

加州大学伯克利分校天空计算实验室的研究团队NovaSky于周五发布了Sky-T1-32B-Preview推理模型，这一模型在多个关键基准测试中表现优异，与OpenAI的o1早期版本相媲美，更令人瞩目的是其极低的训练成本。

Sky-T1-32B-Preview是首个真正的开源推理模型，NovaSky团队不仅发布了模型，还公开了用于训练它的数据集及必要的训练代码，这意味着该模型可从头开始复制。据团队在博客文章中所述，“Sky-T1-32B-Preview的训练成本不到450美元，这表明可以经济高效地复制高级推理能力。”在不久前，训练同等性能的模型价格往往高达数百万美元，而如今成本的大幅降低，主要得益于合成训练数据或由其他模型生成的训练数据的应用。例如，人工智能公司Writer最近发布的模型Palmyra X004几乎完全基于合成数据进行训练，开发成本仅为70万美元。

1_1693449769614_ai2023_Facial_AI_robots_a_lot_of_cash_on_the_conference_table_i_d531bb02-0ec5-4e0a-9f1c-a65fa11a4c51

图源备注：图片由AI生成，图片授权服务商Midjourney

推理模型与普通人工智能模型不同，能够有效进行自我事实核查，从而避免一些常见陷阱。不过，推理模型得出解决方案通常需要更长时间，从几秒到几分钟不等。但其在物理、科学和数学等领域的可靠性更高，这是其显著优势。

NovaSky团队透露，他们借助阿里巴巴的QwQ-32B-Preview推理模型生成Sky-T1的初始训练数据，之后对数据进行“整理”，并利用OpenAI的GPT-4o-mini将数据重构为更易用的格式。使用8个Nvidia H100GPU机架训练320亿参数的Sky-T1大约需要19个小时，参数数量大致对应模型解决问题的能力。

在性能测试方面，Sky-T1在MATH500（一组“竞赛级”数学挑战）上的表现优于o1的早期预览版本，还在一组来自LiveCodeBench(一种编码评估)的难题上击败了o1的预览版本。然而，Sky-T1在GPQA-Diamond上的表现不如o1预览版，后者包含博士毕业生应掌握的物理、生物和化学相关问题。此外，OpenAI的o1GA版本比预览版更强大，且OpenAI预计在未来几周发布性能更佳的推理模型o3。

尽管如此，NovaSky团队表示，Sky-T1仅是他们开发具有高级推理能力的开源模型的起点。“展望未来，我们将专注于开发更高效的模型，保持强大的推理性能，并探索先进技术，进一步提高模型在测试时的效率和准确性，”团队在帖子中写道，“请继续关注我们在这些激动人心的计划上取得的进展。”这一开源推理模型的出现，无疑为人工智能领域带来了新的机遇和挑战，其未来发展值得持续关注。

相关视频

没有数据

文章评论

查看所有0条评论>>