时间:2025/1/2 12:06:34来源:www.pc6.com作者:路西蓝我要评论(0)
o1-preview约300B参数,GPT-4o约200B,GPT-4o-mini约8B……
英伟达2024年初发布B200时,就摊牌了GPT-4是1.8T MoE也就是1800B,这里微软的数字更精确,为1.76T。
除此之外,论文中给OpenAI的mini系列,Claude3.5Sonnet也都附上了参数,总结如下:
o1-preview约300B;o1-mini约100B
GPT-4o约200B;GPT-4o-mini约8B
Claude3.5Sonnet2024-10-22版本约175B
微软自己的Phi-3-7B,这个不用约了就是7B
虽然论文中后面也有免责声明:
确切数据尚未公开,这里大部分数字是估计的。
但还是有不少人觉得事情没这么简单。
比如为什么唯独没有放谷歌Gemini模型的参数估计?或许他们对放出来的数字还是有信心的。
也有人认为,大多数模型都是在英伟达GPU上运行的,所以可以通过token生成速度来估计。
只有谷歌模型是在TPU上运行的,所以不好估计。
而且微软也不是第一次干这事了。
23年10月,微软就在一篇论文里“意外”曝出GPT-3.5-Turbo模型的20B参数,在后续论文版本中又删除了这一信息。
就说你是故意的还是不小心的?
实际上,原论文介绍了一项与医学相关的benchmark——MEDEC。
12月26日就已经发布,不过是比较垂直领域的论文,可能非相关方向的人都不会看,年后才被列文虎克网友们发现。
研究起因是,据美国医疗机构调查显示,有1/5的患者在阅读临床笔记时报告发现了错误,而40%的患者认为这些错误可能影响他们的治疗。
而且另一方面,LLMs(大语言模型)被越来越多的用于医学文档任务(如生成诊疗方法)。
因此,MEDEC此番有两个任务。一是识别并发现临床笔记中的错误;二是还能予以改正。
为了进行研究,MEDEC数据集包含3848份临床文本,其中包括来自三个美国医院系统的488份临床笔记,这些笔记之前未被任何LLM见过。
它涵盖五种类型的错误(诊断、管理、治疗、药物治疗和致病因子),这些错误类型是通过分析医学委员会考试中最常见的问题类型选择的,并由8位医疗人员参与错误标注。
而参数泄露即发生在实验环节。
按照实验设计,研究者将选取近期主流的大模型和小模型来参与笔记识别和纠错。
而就在介绍最终选定的模型时,模型参数、发布时间一下子都被公开了。
对了,省去中间过程,这项研究得出的结论是:Claude3.5Sonnet在错误标志检测方面优于其他LLM方法,得分为70.16,第二名是o1-mini。
每一次,ChatGPT相关模型架构和参数泄露,都会引起轩然大波,这次也不例外。
23年10月,微软论文声称GPT-3.5-Turbo只有20B参数的时候,就有人感叹:难怪OpenAI对开源模型这么紧张。
24年3月,英伟达确认GPT-4是1.8T MoE,而2000张B200可以在90天内完成训练的时候,大家觉得MoE已经且仍将是大模型架构趋势。
这一次,基于微软估计的数据,网友们主要有几个关注点:
如果Claude3.5Sonnet真的比GPT-4o还小, 那Anthropic团队就拥有技术优势。
以及不相信GPT-4o-mini只有8B这么小。
不过此前也有人根据推理成本来算,4o-mini的价格是3.5-turbo的40%,如果3.5-turbo的20B数字准确,那么4o-mini刚好是8B左右。
不过这里的8B也是指MoE模型的激活参数。
总之,OpenAI大概是不会公布确切数字了。
此前奥特曼征集2024年新年愿望,最后公布的清单中还有“开源”。2025年的最新版本里,开源已经被去掉了。
相关视频
相关阅读 REDMI Turbo 4防水大满贯:支持IP66/IP68/IP69REDMI Turbo 4外观公布:“祥云白”配色首次亮相 精致利落cline AI编程助手功能介绍及使用指南 VSCode插件安装下载地址入口哈尔滨吸粉“进口土豆子”:“China travel”吹起东北风了两部短剧付费8000万后,奇树有鱼决定All in免费首款骁龙8至尊版双潜望旗舰!OPPO Find X8 Ultra影像出炉微软Phi-4封神,14B小模型数学击败GPT-4o,合成数据占比40%,36页直接运行Windows exe!统信UOS应用兼容引擎V3发布
热门文章 《雄狮少年2》发布新剧PS6将采用AMD技术:会AI日报:张文宏被AI假OpenAI 联合创始人认为
最新文章
4o-mini只有8B,o1也才钩织、编绳、石塑粘土
“另类”生图产品,上线4个月拿下420万流量《雄狮少年2》发布新剧照:大秀全新肌肉模拟沾AI价格暴涨十倍,玩具圈想再造一个泡泡玛字节紧急发布了一个警示
人气排行 CPU天梯图2021年5月最新版 CPU性能排行天梯显卡天梯图2021年5月最新版 显卡排行榜天梯蓝牙5.1和5.0有什么区别 蓝牙5.1规范一览主板天梯图2019最新版 2019年9月主板性能天小米手环支持什么手机 小米手环支持其他手机高通骁龙cpu排行天梯图2019 高通骁龙处理器天猫精灵怎么用 阿里天猫精灵使用体验cpu风扇怎么拆下来
查看所有0条评论>>