
前两天,不少DeepSeek用户被吓了一大跳——在对话框里输入几个特殊字符,系统突然跳出一段莫名其妙的文本,看起来像是别人的聊天记录。“我的隐私被泄露了?”网上瞬间炸开了锅。
别慌,DeepSeek连夜排查,今天凌晨给出结论:这不是数据泄露,是模型“自己瞎编”的。
说白了,大模型就像个聪明但偶尔犯晕的学生。你输入一串它没见过的符号,比如“#$%&”,它脑回路一卡壳,就开始自由发挥,从训练数据里随机拼接出一段话。这些内容看起来像其他人的提问,其实只是模型“幻觉”作祟——它根本没有权限去翻你的对话记录。
官方技术团队强调:安全没问题,数据没外泄,纯粹是特殊字符触发了模型的认知偏差。为了彻底堵住这个漏洞,DeepSeek接下来会对模型进行针对性训练,让它在遇到奇葩符号时保持清醒,不乱蹦答案。
有意思的是,DeepSeek刚发布了V4预览版,主打百万字超长上下文,这次算是小插曲。用户监督不是坏事,能让大模型更快学会“什么该说,什么不该说”。