OpenAI的文本水印技术:保护还是威胁?
08/05/2024, 10:53 PM UTC
OpenAI开发文本水印技术以检测ChatGPT生成内容OpenAI has built a text watermarking method to detect ChatGPT-written content — company has mulled its release over the past year
➀ OpenAI开发了一种文本水印方法来检测ChatGPT生成的内容,但由于对其有效性和对非英语母语者的潜在偏见的担忧,尚未发布。➁ 这种水印技术并非万无一失,可以通过简单的手段如使用谷歌翻译或编辑工具来规避。➂ OpenAI正在考虑其客户基础的影响以及其水印技术被逆向工程的风险。➀ OpenAI has developed a text watermarking method to detect ChatGPT-written content, but has not released it due to concerns about its effectiveness and potential bias against non-native English writers. ➁ The watermarking technique is not foolproof and can be circumvented by simple methods such as using Google Translate or editing tools. ➂ OpenAI is considering the impact on its customer base and the risk of reverse engineering of its watermarking technique.
大家好,欢迎收听我们的播客节目。今天我们要聊的是OpenAI的一项新技术——文本水印技术。这项技术旨在检测由ChatGPT生成的内容,但OpenAI至今未将其公开发布。为什么呢?让我们深入探讨。 首先,这项技术通过在大型语言模型(LLM)的输出中添加一种模式来工作,使OpenAI能够检测出是否由ChatGPT创建。然而,这种模式对人类来说是不可见的,因此不会影响LLM的质量。据内部文件显示,该工具在检测ChatGPT输出方面有效性高达99.9%。 但是,问题来了。这种水印技术并非无懈可击。例如,你可以将ChatGPT的输出通过谷歌翻译转换成另一种语言,然后再转回英语,这样就能有效地去除水印。更简单的方法是,让AI在单词之间插入一个独特的字符、表情符号或短语,然后使用如微软Word的查找和替换功能删除它们。 此外,OpenAI还担心这项技术可能对非英语母语者有偏见。去年,OpenAI曾发布过一个生成式AI文本检测工具,但由于其低检测率和频繁的误报,仅七个月后就被迫停止使用。甚至有一次,一位教授因为所有提交的论文都被错误地标记为AI生成而挂掉了一整个班级的成绩。 OpenAI还考虑到了其客户基础的反应。调查显示,69%的ChatGPT用户担心这项工具会导致对AI作弊的错误指控。30%的用户甚至表示,如果OpenAI部署这项工具,他们可能会转向竞争对手的LLM。此外,OpenAI还面临着另一个问题,即其他用户可能会逆向工程OpenAI的水印技术,并发布插件或应用程序来中和它。 尽管如此,OpenAI明白AI生成内容对社会构成的风险,并一直在寻找文本水印技术的替代方案。内部数据显示,全球有80%的人支持AI检测器的存在。 那么,OpenAI是否会发布这项文本水印工具和检测器呢?我们拭目以待。但有一点是肯定的,作为AI发展的领先组织之一,OpenAI必须采取措施确保其工具的负责任使用。我们每个人都应该对我们阅读的内容持批判态度,确保我们获取的是真相。 感谢收听,我们下期节目再见。---
本文由大语言模型(LLM)生成,旨在为读者提供半导体新闻内容的知识扩展(Beta)。