谷歌研究团队发现了一种通过 API 访问窃取大模型关键信息的方法,攻击目标是模型的嵌入投影层。他们成功破解了 OpenAI 的 GPT 系列两个基础模型 Ada 和 Babbage 的整个投影矩阵,并获取了隐藏维度等关键信息。这种攻击方式成本低廉,只需少量 API 调用即可。然而,研究团队在攻击前已获得 OpenAI 的同意,并在攻击后与 OpenAI 确认了方法的有效性,并删除了所有相关数据。OpenAI 已采取措施修改模型 API 以防止类似攻击。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验