NVIDIA涉嫌大规模抓取视频用于AI训练
08/06/2024, 10:57 PM UTC
NVIDIA被指控每天抓取‘相当于人类一生’的视频用于AI训练Nvidia accused of scraping ‘A Human Lifetime’ of videos per day to train AI
➀ NVIDIA被指控每天抓取数百万视频用于训练其AI产品。➁ 这些视频包括公开可用内容、授权数据以及可能来自Netflix的受版权保护材料。➂ 此举引发了关于合法性和伦理的担忧,目前关于AI训练和版权法的讨论仍在进行中。➀ Nvidia is accused of scraping millions of videos daily to train its AI products. ➁ The videos include publicly available content, licensed data, and potentially copyrighted material from Netflix. ➂ Concerns over legality and ethics have been raised, with ongoing debates about AI training and copyright laws.
大家好,欢迎收听我们的播客节目。今天我们要讨论的话题是关于NVIDIA的一项争议性行为——被指控每天抓取数百万视频用于训练其AI产品。这些视频不仅包括公开可用的内容,还有通过特殊许可的数据,甚至可能涉及Netflix上的电影和节目。这种做法引发了广泛的合法性和伦理问题。 据报道,NVIDIA的员工被指示下载这些视频,用于训练包括Omniverse 3D世界生成器、自动驾驶汽车系统和数字人类化身生成器等产品。尽管项目经理一再保证,但许多人对这种做法的合法性和伦理提出了质疑。NVIDIA的研究副总裁Ming-Yu Liu回应称,这是一个高管决策,所有数据都有伞形批准。 这不是AI技术公司第一次被指控未经许可抓取在线内容。已有几起针对OpenAI、Stability AI等公司的诉讼。NVIDIA目前虽未受影响,但似乎也希望通过创建基础AI模型来进入数据处理领域,以在竞争激烈的AI市场中获得优势。 然而,这种做法正处于一个巨大的法律灰色地带。目前还没有专门针对AI训练的法律,但立法者已经开始关注这个问题。国会中已有几项法案专门针对此问题,如AI基础模型透明度法案和生成式AI版权披露法案。 谷歌认为AI抓取是‘合理使用’,但我们还不知道这些法律将如何发展。因此,尽管目前还没有明确的黑白分界,许多公司仍希望尽可能利用在线数据来获得竞争优势。 感谢收听,我们下次节目再见。---
本文由大语言模型(LLM)生成,旨在为读者提供半导体新闻内容的知识扩展(Beta)。