时间:2025/2/2 13:35:06来源:www.pc6.com作者:路西蓝我要评论(0)
今天凌晨3点,OpenAI正式发布了新模型o3-mini,可在ChatGPT和API中可用。
Pro用户可无限使用o3-mini,Plus和Team用户的速率限制将是o1-mini的3倍。免费版ChatGPT用户可以免费使用o3-mini,但有次数限制。
此外,o3-mini可以执行网络搜索功能,并展示完整的深度思考过程。遗憾的是,o3-mini不支持视觉推理。
o3-mini也是 OpenAI 首款支持多项开发者需求特性的小型推理模型,包括函数调用、结构化输出和开发者消息,无需额外调整可直接应用于实际环境中。
o3-mini和OpenAI o1-mini、OpenAI o1-preview 一样,也支持流式传输。开发者还能根据具体应用场景,在低、中、高三种推理强度选项中灵活选择:面对复杂难题时,可选择高推理强度让模型深入思考;面对延迟敏感问题时,可选择低推理强度优先保证速度。
在性能表现方面,OpenAI o3-mini 针对 STEM 推理进行了优化。在数学、编码和科学领域,中等推理强度的o3-mini 性能与OpenAI o1相当,但响应速度更快。专家评估发现,o3-mini给出的答案比OpenAI o1-mini更准确、清晰,推理能力更强。
在美国数学竞赛(AIME2024)中,低推理强度时o3-mini 与 o1-mini 表现相近,中等推理强度时与o1相当,高推理强度时则超越 o1-mini 和 o1;在博士水平科学问题测试中,不同推理强度的 o3-mini 表现同样出色。
在研究级数学测试里,高推理强度的 o3-mini 表现优于其前代模型;在竞赛编程中,o3-mini 随着推理强度增加,Elo评分逐步提高,均超过 o1-mini,中等推理强度时与o1表现相当;
在软件工程测试中,o3-mini 是表现最佳的模型。在速度上,o3-mini 平均响应时间为7.7秒,比 o1-mini的10.16秒快了24%。
在OpenAI发布新模型之后,网友上来就是灵魂发问,这个会比Deepseek的R1更好吗?
感谢新增网络搜索功能,非常喜欢这个。
功能请求:请在 ChatGPT 中添加一个选项,允许选择 DeepSeek R1作为模型,类似于 Perplexity AI。谢谢!
虽然不支持视觉功能,o3仍然遛的起飞。
在评估 o3-mini 后,到目前为止我对它很满意。很高兴它现在可以在处理我那庞大的代码库时展示其思考过程。注意到 DeepSeek 的影响,这很好,简单的功能就能带来很好的体验,帮助用户保持参与并获得新想法。
o3-mini高推理模式,Plus用户每周只有50条消息?
到目前为止我印象不错,本来可以更好,但实际上o3-mini已经很好了。
相关视频
相关阅读 被DeepSeek干服了!OpenAI承认闭源错误,领先优势变小OpenAI透露明天发布满血版o3微软 CEO Nadella 称赞 DeepSeek,并将其提供给客户在 Azure AI 硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去英伟达市值蒸发近6000亿美元,而DeepSeek刚刚又开源新模型阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏微软与高校合作开源 AIOpsLab:可构建自主云AI AgentAI语音独角兽ElevenLabs完成2.5亿美元C轮融资,估值突破30亿
热门文章 360集团发布鸿蒙原生A阿里智能互联并入夸克Meta 提出新型可扩展记英伟达 CEO:我们的AI
最新文章
刚刚,OpenAI发布o3-m被DeepSeek干服了!Op
谷歌与以色列军方暗中合作 AI 技术加360集团发布鸿蒙原生AI应用,纳米搜索月访问阿里智能互联并入夸克:布局AI眼镜 整合通义“满屏”的Perplexity,5人小团队为何还要做
人气排行 八门神器教程,图文传授怎么使用图文教程:R-Studio万能通用数据恢复方法UEFI+GTP模式下使用GHO文件安装WIN7或WIN8图MHDD4.6使用方法图解DirectX修复工具无法打开 DirectX修复工具分区助手怎么扩大c盘?分区助手调整c盘大小教pqmagic 9.0中文使用教程图解按键精灵如何找图 按键精灵找图教程
查看所有0条评论>>