
就在不久前,《纽约时报》向美国纽约南区联邦法院提起诉讼,将AI搜索初创公司Perplexity推上了风口浪尖。这并非《纽约时报》首次就生成式AI的版权问题采取法律行动,去年他们就曾将OpenAI和微软告上法庭。这一次,矛头直指Perplexity,指控其大规模、未经授权地抓取并传播《纽约时报》旗下包括新闻报道、视频、播客在内的海量版权内容,要求法院禁止这种侵权行为,并赔偿损失。
这场诉讼的核心,在于Perplexity所使用的“检索增强生成”(RAG)技术。据《纽约时报》的诉状披露,Perplexity在生成搜索结果时,会将《纽约时报》的文章内容,甚至是“大段摘要”,直接嵌入到AI的回答中。这意味着,用户在Perplexity上搜索相关信息时,可以直接获得“近乎逐字”的答案,而无需点击进入《纽约时报》的网站阅读原文。这种方式,直接绕过了《纽约时报》的付费订阅和广告收入模式,被《纽约时报》视为对其商业利益的直接冲击。
《纽约时报》提供的证据显示,仅仅在今年8月,Perplexity就向其网站发起了超过17.5万次的爬取请求。更令人担忧的是,诉状中提到,Perplexity似乎采取了一系列技术手段来规避《纽约时报》的robots.txt协议和所谓的“硬封锁”,例如使用未声明的用户代理(User-Agent)、第三方爬虫池以及动态IP地址等,这被指控违反了《数字千年版权法》(DMCA)中的相关条款。
除了直接复制内容,《纽约时报》还指控Perplexity存在“商标淡化”的行为。例如,在其旗下产品评测品牌Wirecutter的案例中,Perplexity曾将一款从未被Wirecutter评测过的召回产品,标注为“Wirecutter推荐”,这被《纽约时报》视为“虚假来源标识”,损害了其品牌声誉。
《纽约时报》此次诉讼的目标明确:除了要求Perplexity立即停止抓取和使用其内容,并销毁已复制的数据库外,还要求法院进行赔偿,并希望通过陪审团审判,为AI内容版权纠纷树立一个具有威慑力的判例。尽管Perplexity估值已达20亿美元,并获得了1.5亿美元的融资,但《纽约时报》认为,其在未经许可使用他人内容的情况下,却“零补偿”,这显然是不可接受的。
值得注意的是,出版商与AI公司之间的版权拉锯战并非孤例。《芝加哥论坛报》也在同一周对Perplexity提起了类似的诉讼,而包括News Corp、Dow Jones在内的40多家媒体,也已发起约40起相关案件。
面对《纽约时报》的指控,Perplexity传播主管Jesse Dwyer的回应颇具戏剧性,他表示:“出版商百年来一直在起诉新技术……幸运的是,这从未奏效,否则我们今天只能靠电报交流。”这番话暗示,Perplexity认为AI技术的发展是不可阻挡的,过去的“技术恐慌”最终都被证明是杞人忧天。
然而,《纽约时报》发言人Graham James则强调:“我们支持AI的伦理发展,但坚决反对未经许可使用我们的内容来推广商业产品。”这番表态,清晰地划出了《纽约时报》的底线——在商业利益和内容版权之间,他们选择坚守。
这场诉讼的后续发展,无疑将对整个AI行业产生深远影响。Perplexity需要在30天内提交答辩,而法院是否会颁布临时禁令,迫使Perplexity从其RAG索引中剔除《纽约时报》的内容,将是案件的关键节点。最终的判决结果,很可能为“AI搜索如何获取和使用出版商内容”定下基调,并直接影响到未来的授权定价模式。OpenAI、Google等行业巨头,以及其他众多出版商,都在密切关注这场“版权迷局”的走向,以及由此可能加速的联邦层面立法。