时间:2025/2/10 13:01:43来源:www.pc6.com作者:清晨我要评论(0)
近日,微软研究院联合华盛顿大学、斯坦福大学、南加州大学、加利福尼亚大学戴维斯分校以及加利福尼亚大学旧金山分校的研究人员共同推出了 LLaVA-Rad,这是一种新型的小型多模态模型(SMM),旨在提升临床放射学报告的生成效率。该模型的推出不仅标志着医学图像处理技术的一大进步,也为放射学的临床应用带来了更多的可能性。
在生物医学领域,基于大规模基础模型的研究已经展现出良好的应用前景,尤其是在多模态生成 AI 的发展下,可以同时处理文本与图像,从而支持视觉问答和放射学报告生成等任务。然而,目前仍然存在诸多挑战,例如大模型的资源需求过高,难以在临床环境中广泛部署。小型多模态模型虽然在效率上有所提高,但与大型模型相比,性能仍存在显著差距。此外,缺乏开放源代码模型以及可靠的事实准确性评估方法也使得临床应用受到限制。
LLaVA-Rad 模型的训练基于来自七个不同来源的697,435对放射学图像与报告的数据集,专注于胸部 X 光(CXR)成像,这是最常见的医学影像检查类型。该模型的设计采用了一种模块化的训练方式,包括单模态预训练、对齐和微调三个阶段,利用高效的适配器机制将非文本模态嵌入文本嵌入空间。尽管 LLaVA-Rad 的规模小于一些大型模型,如 Med-PaLM M,但在性能上却表现优异,尤其是在 ROUGE-L 和 F1-RadGraph 等关键指标上,相较于其他同类模型提升了12.1% 和10.1%。
值得一提的是,LLaVA-Rad 在多个数据集上均保持了优越的性能,即便是在未见过的数据测试中也表现稳定。这一切都归功于其模块化设计和高效的数据利用架构。此外,研究团队还推出了 CheXprompt,一个用于自动评分事实正确性的指标,进一步解决了临床应用中的评估难题。
LLaVA-Rad 的发布,无疑是推动基础模型在临床环境中应用的一大步,为放射学报告生成提供了一种轻量级且高效的解决方案,标志着技术与临床需求之间的进一步融合。
相关视频
相关阅读 真我GT7 Pro竞速版官宣2月13日发布 海王星探索版亮相IBM发布视觉语言模型Granite-Vision-3.1-2B,轻松解析复杂文档Krea ai 发布支持 Deepseek R1 驱动的 Krea chat功能马斯克起诉 OpenAI 与微软的官司再度升级,法官决定将案件继续审最终幻想7:重生》PC版1.001补丁发布:大小为274.3G甜品卡来了!曝RTX 5060 Ti将于3月发布微软、英伟达带头接入Deepseek OpenAI紧急寻求400亿美元新融资刚刚,OpenAI发布o3-mini,可免费使用、3大推理模式
热门文章
小而强!微软发布小型
奥特曼透露:GPT-4.5
努比亚接入满血版Deep
2025年,MCN走到了“分
最新文章
小而强!微软发布小型
奥特曼透露:GPT-4.5
努比亚接入满血版DeepSeek:Z70 Ultra已在内腾讯申请“大语言模型训练方法”专利,提升OpenAI 的 1400 万美元超级碗广告首秀来了黑客利用 “损坏” pickle 文件在 HuggingF
人气排行 2020年放假安排时间表全年图 2020年法定节假2021年放假安排时间表全年图 2021年法定节假微信公众号怎么申请 微信公众号申请要钱吗zune怎么用?zune使用攻略!2014台式机装机配置推荐微信朋友圈三天可见怎么破解 朋友圈仅展示三snmp协议在windows下的安装与配置2016猴年邮票多少钱一套 2016猴年邮票价格表
查看所有0条评论>>