Meta 开源了 LlamaFirewall 安全框架,针对 AI 智能体在生产环境中面临的威胁提供系统级保护。该框架包含 PromptGuard 2、AlignmentCheck 和 CodeShield 三个模块,分别应对提示注入攻击、行为对齐问题和不安全代码生成。测试结果显示,LlamaFirewall 能显著降低攻击成功率,同时保持较高任务实用性。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验