时间:2025/1/20 13:28:19来源:www.pc6.com作者:教学助手我要评论(0)
近年来,视觉大模型(Large Vision Language Models, LVLMs)在图像理解和跨模态任务中展现出非凡的能力,然而随之而来的 “幻觉现象” 问题也日益突出。为了应对这一挑战,淘天集团的未来生活实验室团队提出了一种名为 “令牌偏好优化”(Token Preference Optimization,简称 TPO)的新方法,并引入了一种自我校准的视觉锚定奖励机制。
TPO 的最大创新在于它实现了自动化的令牌级奖励信号。这一方法能够自动识别偏好数据中的视觉锚定令牌,避免了人工细粒度标注的繁琐,同时在训练过程中为每个令牌分配了反映其与视觉信息依赖程度的奖励。这一自校准的视觉锚定奖励信号,旨在优化模型对视觉信息的依赖性,从而有效减轻幻觉现象的发生。
研究表明,采用 TPO 的模型在多个评测基准中显著优于传统的方法,尤其是在更复杂的任务中,模型生成的答案越来越依赖于图像信息而非语言模型的先验知识。这一进步不仅提升了模型的理解能力,也为进一步研究提供了重要的理论基础。
此外,研究团队还对 TPO 的不同参数设置进行了消融实验,发现优化的加噪步骤和奖励分配策略能够进一步提高模型性能。这一发现无疑为未来的视觉大模型研究和应用指明了方向。
总之,淘天的这一创新成果为多模态对齐技术提供了新的思路,推动了 AI 技术在生活和消费领域的深入应用。
相关视频
相关阅读 材料设计重大突破!微软发布创新大模型,准确率提升10倍!OpenAI 推出自动化任务功能,AI 管家时代即将来临Snowflake 推出 “百万思想与一个平台” 计划,投资2000万美元助苹果预计上半年推出全新Mac Studio 搭载M4 Ultra芯片小鹏推出“陆地航空母舰”飞行汽车,计划2026年量产科大讯飞将于1月15日推出全新深度推理模型 X1,增强智慧办公能力LG 推出新 AI 服务,助力家庭、车载和办公日常生活Timekettle推出Babel OS:实现实时多语言交流 重新定义AI同声传译
热门文章 TikTok在美暂停服务后OpenAI 推出自动化任务苹果、阿里巴巴与赛诺微软成立新AI开发组织
最新文章
淘天推出创新对齐方法MiniMax海螺语音全球同
TikTok在美暂停服务后 剪映海外版CapCut同步大厂争相押注的“AI编剧”,能否成为短剧“给AI一个机会,他还你一个颠覆式组织结这年头,谁在互联网上学这么“硬核”的AI?
人气排行 CPU天梯图2021年5月最新版 CPU性能排行天梯显卡天梯图2021年5月最新版 显卡排行榜天梯蓝牙5.1和5.0有什么区别 蓝牙5.1规范一览主板天梯图2019最新版 2019年9月主板性能天小米手环支持什么手机 小米手环支持其他手机高通骁龙cpu排行天梯图2019 高通骁龙处理器天猫精灵怎么用 阿里天猫精灵使用体验cpu风扇怎么拆下来
查看所有0条评论>>