您的位置:首页精文荟萃硬件改造 → ​研究揭示:仅需 0.001% 的虚假数据就能让 AI 模型失效

​研究揭示:仅需 0.001% 的虚假数据就能让 AI 模型失效

时间:2025/1/14 13:25:52来源:www.pc6.com作者:路西蓝我要评论(0)

近期,纽约大学的研究团队发表了一项研究,揭示了大规模语言模型(LLM)在数据训练中的脆弱性。他们发现,即使是极少量的虚假信息,只需占训练数据的0.001%,就能导致整个模型出现重大错误。这一发现对于医疗领域尤其引人关注,因为错误的信息可能直接影响患者的安全。

代码 互联网  (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

研究人员在《自然医学》杂志上发表的论文中指出,虽然 LLM 表现出色,但如果其训练数据中被注入了虚假信息,这些模型依然可能在一些开放源代码的评估基准上表现得与未受影响的模型一样好。这意味着,在常规测试下,我们可能无法察觉到这些模型潜在的风险。

为了验证这一点,研究团队对一个名为 “The Pile” 的训练数据集进行了实验,他们在其中故意加入了150,000篇 AI 生成的医疗虚假文章。仅用24小时,他们就生成了这些内容,研究表明,给数据集替换0.001% 的内容,即使是一个小小的1百万个训练标记,也能导致有害内容增加4.8%。这个过程的成本极其低廉,仅花费了5美元。

这种数据中毒攻击不需要直接接触模型的权重,而是攻击者只需在网络上发布有害信息,就能削弱 LLM 的有效性。研究团队强调,这一发现凸显了在医疗领域使用 AI 工具时存在的重大风险。与此同时,他们也提到,已经有相关案例显示,某些 AI 医疗平台,例如 MyChart,在自动回复患者问题时,常常会生成错误的信息,给患者带来困扰。

因此,研究人员呼吁 AI 开发者和医疗提供者在开发医疗 LLM 时,必须清楚认识到这一脆弱性。他们建议,在未来能够确保安全性之前,不应将 LLM 用于诊断或治疗等关键任务。


相关视频

    没有数据

相关阅读 2025年,年轻人的抠门远远不止反向消费博猫娱乐代理注册下载方法和评测汇总2024博猫游戏注册下载方法和评测汇总2024博猫游戏注册登录下载方法和评测汇总2024博猫游戏网址下载方法和评测汇总2024博猫游戏网址多少下载方法和评测汇总2024博猫游戏手机客户端下载方法和评测汇总2024博猫游戏手机版下载方法和评测汇总2024

文章评论
发表评论

热门文章 史上最严年检 OBD检测接棒P1!迈凯伦全新旗128核心500W功耗!AMD幺正量子离子阱量子计

最新文章 ​研究揭示:仅需史上最严年检 OBD检测 买到就是爆赚!小米SU7 Ultra量产版开启预约接棒P1!迈凯伦全新旗舰超跑W1发布:1840万128核心500W功耗!AMD Zen5 EPYC提前走光幺正量子离子阱量子计算工程机正式发布:可

人气排行 笔记本键盘失灵怎么办?笔记本键盘拆卸图解ThinkPad笔记本刷BIOS教程显卡不够怎么办?主板电池没电引起电脑无法正常启动的故障手动探秘--IBM X31笔记本电脑完全拆解联想L197显示器支架拆装图解苹果g5机箱改造功放机箱实战分享廉价声卡也有尊严--CMI8738声卡使用心得