您的位置:首页iOS资讯IOS新闻 → 苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力

苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力

时间:2024/10/13 12:05:19来源:www.pc6.com作者:路西蓝我要评论(0)

10月13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。

该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在Hugging Face上发布。

MM1.5提供了从10亿到300亿的多种参数规模,拥有图像识别和自然语言推理能力。

在新版本中,苹果公司的研发人员改进了数据混合策略,极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。

参考论文可知,团队在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,这显著提高了模型对包含大量文本的图像的理解水平。

此外,研究人员在监督式微调阶段深入分析了不同数据类型对模型表现的作用,优化了视觉指令微调数据的混合方式,使得即便是小规模的模型(如10亿、30亿参数版本)也能有出色的发挥,实现了更高的效率。

值得一提的是,苹果公司这次还推出了专门用于视频理解的MM1.5-Video模型和专门处理移动设备用户界面(UI)理解的MM1.5-UI模型。

其中,MM1.5-UI模型未来有望成为iOS背后的苹果牌”AI,能够处理各种视觉引用与定位任务,还能总结屏幕上的功能,或者通过与用户的对话进行交互。

尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从而让苹果牌”AI更强大。

苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力


装机必备更多

相关阅读 人人体育app苹果版官方网站下载方法和易倍体育app苹果版下载方法和评测汇总博亿堂bo98007官网下载方法和评测汇总500彩票手机版app官方网站下载方法和评沙巴体育app软件苹果下载方法和评测汇德州solverios苹果手机版下载在线安装

文章评论
发表评论

iOS游戏排行榜 糖果苏打传奇iPad版世界OL iPad版倩女幽魂手游iPad版王者荣耀iPad版割绳子2 iPad版炉石传说iPad版

本类文章排行 iphone7什么时候上市?iphone7大概多少钱?Apple ID已锁定怎么办?苹果手机Apple ID已锁新用户入手iPhone6s后必须学会的10件事iOS9.2.1怎么样?iOS9.2.1升级后卡不卡?iOS9.0新功能 iOS 9.0最新消息Live Photos是什么?Live Photos功能怎么用?ipad pro分屏功能怎么用?ipad pro使用技巧iOS9.3.1能越狱吗 iOS9.3.1怎么越狱

最新资讯更多 苹果推出300亿参数多模iPhone SE 4保护壳曝光 苹果推出300亿参数多模态AI大模型MM1.5:拥iPhone SE 4保护壳曝光:6.1寸屏幕 后置单摄首款大屏iPhone落幕!苹果昔日神机iPhone 6一个时代彻底终结!苹果将最终款iPod nano、

使用教程更多 网友吐槽苹果犯低级错2499元起!vivo Pad3正百度文心大模型学习机手机打车软件哪个比较

游戏攻略更多 《魔兽世界》plus牧师《ff14》独角兽坐骑获