您的位置:首页精文荟萃软件行情 → 成本直降!南大与旷视研究院联手破解视觉大模型对齐难题 无需人类或GPT-4打标签

成本直降!南大与旷视研究院联手破解视觉大模型对齐难题 无需人类或GPT-4打标签

时间:2024/6/24 12:31:47来源:www.pc6.com作者:路西蓝我要评论(0)

南京大学与旷视研究院的研究人员们携手,为视觉大模型带来了一场革命。他们推出的无监督范式——SeVa,成功解决了视觉语言模型的偏好对齐问题,而且整个过程无需人类或GPT-4的参与,大大降低了对齐成本。

这项技术的核心在于自动化构造偏好数据的pipeline,通过对比偏好对齐前后的模型输出,可以明显看出变化。研究人员们发现,即使是微小的图像增广,也可能让VLM对同一问题产生不同的回答。因此,他们将原始图像的回答作为正样本,增广后的图像回答作为负样本,用于训练。

image.png

SeVa的实验结果令人瞩目。仅使用8k构造的无监督数据,就显著提升了VLM的指令遵循能力,降低了幻觉,并在多模态等benchmark上取得了明显提升。更重要的是,这种方法简单易行,成本低廉,不需要任何人类或GPT-4的标注。

在多个benchmark上的测试结果表明,SeVa在提升视觉模型的人类偏好对齐方面具有显著优势。特别是在GPT-4评估的MMVet和LLaVA-bench上,SeVa的表现尤为突出。此外,SeVa还能产生更长、更详细的回答,且每次回答的一致性更高,对不同temperature的扰动具有更强的鲁棒性。

这项研究不仅为视觉大模型的对齐问题提供了一种有效的解决方案,也为AI领域的发展开辟了新的可能性。随着SeVa的开源,我们可以预见,未来将有更多的研究者和开发者利用这一范式,推动AI技术的进一步发展。在这个充满无限可能的时代,让我们共同期待AI技术带来的更多惊喜。


相关视频

    没有数据

相关阅读 关税没有本质作用!大众高管:降低成本才能保护欧洲电动汽车戴尔与Nvidia共同打造AI工厂,扩大与Hugging Face、Meta和微软的Meta训AI,成本已超阿波罗登月!谷歌豪言投资超千亿美元,赛过Op性能超越LLaMA2-7B!AI模型JetMoE-8B训练成本不到10万美元李彦宏:开源模型会越来越落后 小尺寸模型效果更好成本更低共享单车节假日变“刺客” 企业:假期运维成本上涨通义千问开源新Qwen1.5-32B模型 推理速度更快,成本更低就业前景广阔!香港岭南大学推出数据科学理学硕士课程

文章评论
发表评论

热门文章 《王者荣耀》S36新赛季

最新文章 成本直降!南大与旷视《王者荣耀》S36新赛季 跟年轻人互换血浆后:46岁美国富豪为求长生捐出大部分财富!OpenAI CEO奥特曼格局拉满男子心脏骤停 竟因前1天喝了可乐:过量饮用国产大模型登陆国产系统!百度文心一言上架

人气排行 用乐鱼影音盒找到高清影视大片大作缤纷!一周软件销售排行榜暴风影音称2010年上市三大件争奇斗艳 CPU内存硬盘价格同时飘红VeryCD流量下跌50%,卖网游救命腾讯Q币10月15日涨价 由8.9折上调至9.3折迷你快车皮肤黑暗三部曲之-耀斑!金山毒霸和可牛合并金山毒霸宣布永久免费