英伟达被曝秘密抓取 YouTube 视频数据训练AI

发布时间：2024-08-06 16:35:57

最近，科技巨头英伟达在数据获取方面的一项秘密行动被曝光。根据媒体404的报道，英伟达通过抓取海量 YouTube 视频数据来训练他们的人工智能模型，这一行为在法律和伦理上都相当模糊。

报告中指出，英伟达正利用这些视频数据训练其多款 AI 模型，包括 Cosmos 深度学习模型、自动驾驶算法、数字人类 AI 头像产品，以及3D 世界构建工具 Omniverse。

据了解，英伟达采取了许多隐蔽措施来掩盖他们的数据抓取行为，使用了多个 “虚拟机器” 并不断更换 IP 地址，以避免被 YouTube 发现。而且，视频创作者和 YouTube 的母公司谷歌并未对此次数据抓取活动给予任何授权。英伟达内部的沟通显示，他们的策略相当大胆，一位高管在邮件中提到正在构建一个 “视频数据工厂”，每天能够产生相当于人类一生的视觉体验数据。

有意思的是，当员工对这种数据获取的合法性和伦理性表示担忧时，管理层对此却显得相当自信，认为这一切都是高层的决定。邮件中写道:“我们对所有数据都有一个全面的批准。”

更令人感到不安的是，英伟达曾在一段时间内明知自己正在使用一个包含1.3亿个 YouTube 视频的 HD-VG-130M 数据集，而这个数据集本来是为了学术研究而创建的。许多专家对此表示强烈不满，认为将用于研究的数据用于商业化是一种不当行为。

作为 AI 产业的核心参与者，英伟达在市场上占据了显著的地位，其图形处理单元（GPU）是许多计算密集型 AI 系统的基础。与英伟达合作的公司如 OpenAI、微软和谷歌等都对此行为表示关注。谷歌的发言人提到，未经许可使用 YouTube 数据是明显违反平台服务条款的。

英伟达在回应媒体时声称，他们的 AI 训练行为是 “完全符合版权法的精神和字面意思”。然而，使用这些内容的创作者们对这一说法又会有怎样的看法呢?

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

如有疑问请发送邮件至：bangqikeconnect@gmail.com

英伟达被曝秘密抓取 YouTube 视频数据训练AI

相关阅读

ai资讯推荐

最新资讯

​英伟达被曝秘密抓取 YouTube 视频数据训练AI

相关阅读

ai资讯推荐

最新资讯

英伟达被曝秘密抓取 YouTube 视频数据训练AI