全国首例!抓取百度百科词条,被判赔偿800万

360影视 欧美动漫 2025-05-27 14:29 4

摘要:同时,被告伪造用户信息,以普通用户发布的形式,将抓取的词条内容上传至运营的百科网站中,向自身用户进行展示和提供服务,涉及范围广,足以产生部分实质性替代的效果。

字节和百度打官司,百度赢了!

一、抖音抓取百度百科词条

被判赔偿800万

5月21日,百度百科官方公众号转发了《海淀法院审结全国首例涉百科词条数据竞争案》一文。

称某公司未经许可,大量抓取其平台60余万条百科词条数据,严重削弱了原告的竞争优势。

同时,被告伪造用户信息,以普通用户发布的形式,将抓取的词条内容上传至运营的百科网站中,向自身用户进行展示和提供服务,涉及范围广,足以产生部分实质性替代的效果。

经海淀法院审理,其行为构成了不正当竞争,判决被告删除涉案词条,并赔偿原告经济损失500万元及合理开支300万元(含律师费、公证费等)。

5月23日,九派财经记者从知情人士获悉,该案件诉讼双方分别为百度百科和抖音百科,原告为百度,被告为抖音。

二、字节、百度拉扯战

首次明确平台数据整合权益

企查查显示,早在2020年,字节收购互动百科,并将其更名为抖音百科后不久,百度就曾以“不正当竞争”为由起诉抖音百科,但随后撤诉。

此外,字节与百度之间以“不正当竞争”为由产生的纠纷颇多。

2019年百度称今日头条大量窃取百度“Top1”搜索产品结果,以不正当竞争为由要求赔偿9000万元,并连续30天在其APP及网站首页道歉。当天,抖音就反诉指控百度在“简单搜索”APP中窃取了海量抖音短视频,以同样的赔偿要求百度。

据统计,从2019年至2024年,双方围绕流量劫持、内容侵权等已发生27起案件,小到赔偿40元。

此次案件是双方以“不正当竞争”为由,赔偿最大的一次,也是双方长达6年诉讼的重要节点。

百度百科自2006年上线以来,至今收录了超2860万个词条,参与词条编辑的网友超过795万人,覆盖科学、文化、历史、科技等几乎所有已知知识领域,是全球规模最大的中文百科全书之一。

网友编辑的词条版权到底归谁所有?平台拥有对词条的合法权益吗?

抖音百科抗辩称:百度百科词条内容由用户生成,平台不享有独立权益。

而法院首次明确,百科平台对词条的系统化运营,如收集、存储、编排、管理、传播等,形成了独立于用户的“竞争性权益”,这种权益并非基于版权,即使词条内容本身公开,未经授权的系统性搬运仍构成不正当竞争。

此案的核心意义不仅在于赔偿金额巨大,更是确立了“平台数据整合权益”的法律地位,为互联网行业的数据合规划定了清晰边界。

三、AI数据合规性

这也为AI企业敲响了警钟。

数据是大模型的重要训练资源,而数据来源的合法性直接决定了技术应用的合规性。

未来,未经授权的系统性数据搬运可能会面临法律重罚。即使数据公开,若AI应用直接分流原平台用户或替代其核心功能,仍可能构成侵权。

AI企业需与数据来源方签署数据使用协议,明确数据用途和范围,并且保留数据来源的授权协议、版权声明等法律文件。

同时,企业还应通过技术手段验证数据来源,比如百度文心大模型通过“内容溯源链”技术,对训练数据的采集时间、地点、授权状态进行实时标记,确保数据流向可追溯。

这种技术与法律的双重保障,为数据合规提供了“双保险”。

优质内容、海量数据已经成为AI时代兵家必争之地,AI企业需建构数据溯源管理、合理使用把控、全流程合规体系,探索更加合法合规获取数据方式。

来源:科技每日推送一点号

相关推荐