您的位置:首页资讯软件新闻 → 腾讯申请“大语言模型训练方法”专利,提升模型泛化能力与准确性

腾讯申请“大语言模型训练方法”专利,提升模型泛化能力与准确性

时间:2025/2/10 12:58:16来源:www.pc6.com作者:教学助手我要评论(0)

天眼查App显示,腾讯科技(深圳)有限公司近日申请了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利。这项专利的摘要揭示了该方法通过引入第一摘要文本和第二摘要文本,在大语言模型的训练过程中为模型提供更多可学习的信息。

QQ20250210-103054.png

根据专利描述,第一摘要文本和第二摘要文本所包含的信息量不同,其中第一摘要文本中还包含了正确语句和错误语句。通过对同一文本的这两个不同摘要进行对比学习,并区分学习其中的正确语句与错误语句,能够有效避免摘要文本单一可能导致的模型过拟合和生成不准确等问题。

腾讯 (2)

该方法的创新之处在于提升了模型的泛化性能,并有效提高了模型的准确性。通过引入多样化的摘要文本内容,腾讯的这一训练方法为大语言模型的训练过程带来了更高效、更精准的提升。


相关视频

    没有数据

相关阅读 IBM发布视觉语言模型Granite-Vision-3.1-2B,轻松解析复杂文档"小米入局AR眼镜"引发热议 官方:官微为往年申请OpenAI 新商标申请暗示进军 AR/VR 硬件领域腾讯云推出 DeepSeek-R1 大模型:三分钟快速部署,AI 开发更便捷苹果宣布Apple Intelligence 4月新增多语言支持:简体中文在列​字节跳动推出 PaSa:基于大语言模型的智能学术论文搜索代腾讯地图上线「你用我赔」保障计划:导航出错 腾讯赔付新消费“大逃杀”时代,细分赛道依然遍地白银

文章评论
发表评论

热门文章 2025年,MCN走到了“分马斯克团队利用 AI 处Hugging Face 推出 “OpenAI前CTO新创业公司

最新文章 腾讯申请“大语言模型OpenAI 的 1400 万美元 黑客利用 “损坏” pickle 文件在 HuggingF刚刚,Sam Altman深夜发文,AI Agent将重塑重磅内测,天猫试行微信私域直连2025年,MCN走到了“分水岭”

人气排行 2020年放假安排时间表全年图 2020年法定节假2021年放假安排时间表全年图 2021年法定节假微信公众号怎么申请 微信公众号申请要钱吗zune怎么用?zune使用攻略!2014台式机装机配置推荐微信朋友圈三天可见怎么破解 朋友圈仅展示三snmp协议在windows下的安装与配置2016猴年邮票多少钱一套 2016猴年邮票价格表