共计 815 个字符,预计需要花费 3 分钟才能阅读完成。
界面新闻记者 |
界面新闻编辑 | 文姝琪
10 月 18 日,多个 微信群 流传 一则 消息 :“ 某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了 8000 多张卡,带来的损失可能超过千万美元。”
界面 新闻 从知情人士 处获悉 , 该头部 大厂 为字节跳动 。 此事 发生 在今年 6 月,起因 是某 高校 的博士 在字节 跳动 商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。
界面 新闻 向字节跳动 求方面证 此事 , 截至 目前 , 官方 未进行 回应。
传闻 显示 , 该田姓实习生 利用了 HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且 AML 团队无法核查原因 。但传闻 曝出 之后 , 该实习生 还在某微信 群里 辟谣 称,自己 发完 论文 后就从 字节跳动 离职 , 这个当口有另一个人钻漏洞改模型代码 , 把锅 扣到 自己 头上。
界面 新闻 从知情人士 处了解 到,字节跳动 内部 已经 调查 明确 此事 为田姓实习生 所为。目前,该实习生已被辞退,字节跳动同时 把此事 同步给 大模型 行业联盟 和该 实习生 所在 的给学校。但 这名 实习生 被辞退后到处“辟谣”甩锅,称是其他人所为。
但 该实习生 攻击 的并不是 豆包 大模型 , 而是商业化技术团队的模型训练任务,影响了 该技术团队 的一些 业务 进展 , 但整体 对公司 造成 的损失 并没有 传闻 中的 超过千万美元 那么大。
一位 技术 安全 专家 告诉 界面 新闻 ,HF 漏洞产生肯定是单一性集中训练, 此事 暴露 了字节跳动技术 训练 存在 安全管理问题。公司既没做权限隔离 , 也没有 做好 共用代码的审计 。 正常 情况 下,每次大的代码变动必须做审计 , 无论谁做操作都有痕迹记录 , 一个人想动代码是不可能 的。
上述 技术 安全 专家 表示 , 目前 行业 通用 的做法 是做 三级隔离导向性部署,每一级只有镜像,每次先扫描。调用按次算、必须密钥。每一级完成后,才能进入下一级,而上一级自动删除,进行分级训练。