尴尬！Meta 的 AI 安全系统被 “空格”攻击轻松绕过

最近，Meta 推出了一款名为 Prompt-Guard-86M 的机器学习模型，旨在检测和应对提示注入攻击。这类攻击通常是通过特殊的输入，让大型语言模型（LLM）表现得不当或者规避安全限制。不过，令人惊讶的是，这款新系统自身却也暴露了被攻击的风险。

图源备注：图片由AI生成，图片授权服务商Midjourney

Prompt-Guard-86M 是 Meta 与其 Llama3.1生成模型一起推出的，主要是为了帮助开发者过滤掉那些可能会导致问题的提示。大型语言模型通常会处理大量的文本和数据，如果不加以限制，它们可能会随意重复危险或敏感的信息。因此，开发者们在模型中加入了 “护栏”，用于捕捉那些可能导致伤害的输入和输出。

然而，使用 AI 的用户们似乎将绕过这些护栏视为一项挑战，采用提示注入和越狱的方式来让模型忽略自身的安全指令。最近，有研究人员指出，Meta 的 Prompt-Guard-86M 在处理一些特殊输入时显得不堪一击。例如，当输入 “Ignore previous instructions” 并在字母之间加上空格，Prompt-Guard-86M 竟然会乖乖地忽视先前的指令。

这项发现是由一位名叫 Aman Priyanshu 的漏洞猎人提出的，他在分析 Meta 模型和微软的基准模型时，发现了这一安全漏洞。Priyanshu 表示，微调 Prompt-Guard-86M 的过程对单个英文字母的影响非常小，因此他能够设计出这种攻击方式。他在 GitHub 上分享了这一发现，指出通过简单字符间隔和去除标点符号的方式，可以让分类器失去检测能力。

而 Robust Intelligence 的首席技术官 Hyrum Anderson 也对此表示赞同，他指出，这种方式的攻击成功率几乎接近100%。虽然 Prompt-Guard 只是防线的一部分，但这个漏洞的曝光确实企业在使用 AI 时敲响了警钟。Meta 方面尚未对此作出回应，但有消息称他们正在积极寻找解决方案。

举报/反馈

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

尴尬！Meta 的 AI 安全系统被 “空格”攻击轻松绕过

友情提示

突发，GitHub疑似屏蔽所有中国IP访问

微软 GitHub 推出 Models 服务：让开发者试用和部署 AI 模型

B2B获客常用手段：成本与收益一次说明白️

快手可灵团队最新开源项目火了：大叔变身少女，GitHub狂揽7.5K星

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星

男子被路虎车撞飞后，司机下车疯狂追赶男子！冲动是魔鬼！

大妈骑三轮撞上路边停车不规范的小车下一秒直接倒车后逃逸！

十三届全国政协教科卫体委员会副主任刘慧被查

小女孩斑马线被车撞倒，后续是。。。#孩子安全#斑马线

蒋欣为什么把关晓彤的手拿下来？真的是手上都戒指被人看到吗？

游客在五台山，喂牛吃牛肉干，用登山杖捅牛屁股，牛反击踩踏

石破茂真的只剩下台一条路可走了吗

泽连斯基为何对乌反腐局出手

祖坟冒青烟了！安徽阜阳，一男生高考之后感觉自己考得不好，去兼职送外卖，不料就在送餐途中，他收到班主任发来的消息，得知是被中国人民解放军空军航空大学录取，他说当时

陈若琳估计后槽牙都咬碎了，原本以为，全红婵偶尔划划船也就算了，可万万没料到，她竟然变胖了！ 7月17日，全红婵戴着草帽划船的视频，突然在网上爆火，比起全妹划船时

大快人心日本突然宣布了！7月22号，日本内阁官房长官林芳正突然放话，说要推动跨党派讨论价格措施。这消息听着是好事？可日本老百姓的钱包早被物价狂飙掏空啦！鸡蛋、面

快讯！快讯！印度突然宣布！ 2025年7月22日，印度宣布继续对中国苯胺产品实施为期5年的反倾销税，这是该国第三次延长该关税政策，此举导致中国化工企业对印出口

尴尬！Meta 的 AI 安全系统被 “空格”攻击轻松绕过

友情提示

突发，GitHub疑似屏蔽所有中国IP访问

微软 GitHub 推出 Models 服务：让开发者试用和部署 AI 模型

B2B获客常用手段：成本与收益一次说明白️

快手可灵团队最新开源项目火了：大叔变身少女，GitHub狂揽7.5K星

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星​

男子被路虎车撞飞后，司机下车疯狂追赶男子！冲动是魔鬼！

大妈骑三轮撞上路边停车不规范的小车下一秒直接倒车后逃逸！

十三届全国政协教科卫体委员会副主任刘慧被查

小女孩斑马线被车撞倒，后续是。。。#孩子安全#斑马线

蒋欣为什么把关晓彤的手拿下来？真的是手上都戒指被人看到吗？

游客在五台山，喂牛吃牛肉干，用登山杖捅牛屁股，牛反击踩踏

石破茂真的只剩下台一条路可走了吗

泽连斯基为何对乌反腐局出手

祖坟冒青烟了！安徽阜阳，一男生高考之后感觉自己考得不好，去兼职送外卖，不料就在送餐途中，他收到班主任发来的消息，得知是被中国人民解放军空军航空大学录取，他说当时

陈若琳估计后槽牙都咬碎了，原本以为，全红婵偶尔划划船也就算了，可万万没料到，她竟然变胖了！ 7月17日，全红婵戴着草帽划船的视频，突然在网上爆火，比起全妹划船时

大快人心日本突然宣布了！7月22号，日本内阁官房长官林芳正突然放话，说要推动跨党派讨论价格措施。这消息听着是好事？可日本老百姓的钱包早被物价狂飙掏空啦！鸡蛋、面

快讯！快讯！ 印度突然宣布！ 2025年7月22日，印度宣布继续对中国苯胺产品实施为期5年的反倾销税，这是该国第三次延长该关税政策，此举导致中国化工企业对印出口

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星

快讯！快讯！印度突然宣布！ 2025年7月22日，印度宣布继续对中国苯胺产品实施为期5年的反倾销税，这是该国第三次延长该关税政策，此举导致中国化工企业对印出口