全国首例！抓取百度百科词条，被判赔偿800万

摘要：同时，被告伪造用户信息，以普通用户发布的形式，将抓取的词条内容上传至运营的百科网站中，向自身用户进行展示和提供服务，涉及范围广，足以产生部分实质性替代的效果。

字节和百度打官司，百度赢了！

一、抖音抓取百度百科词条

被判赔偿800万

5月21日，百度百科官方公众号转发了《海淀法院审结全国首例涉百科词条数据竞争案》一文。

称某公司未经许可，大量抓取其平台60余万条百科词条数据，严重削弱了原告的竞争优势。

同时，被告伪造用户信息，以普通用户发布的形式，将抓取的词条内容上传至运营的百科网站中，向自身用户进行展示和提供服务，涉及范围广，足以产生部分实质性替代的效果。

经海淀法院审理，其行为构成了不正当竞争，判决被告删除涉案词条，并赔偿原告经济损失500万元及合理开支300万元（含律师费、公证费等）。

5月23日，九派财经记者从知情人士获悉，该案件诉讼双方分别为百度百科和抖音百科，原告为百度，被告为抖音。

二、字节、百度拉扯战

首次明确平台数据整合权益

企查查显示，早在2020年，字节收购互动百科，并将其更名为抖音百科后不久，百度就曾以“不正当竞争”为由起诉抖音百科，但随后撤诉。

此外，字节与百度之间以“不正当竞争”为由产生的纠纷颇多。

2019年百度称今日头条大量窃取百度“Top1”搜索产品结果，以不正当竞争为由要求赔偿9000万元，并连续30天在其APP及网站首页道歉。当天，抖音就反诉指控百度在“简单搜索”APP中窃取了海量抖音短视频，以同样的赔偿要求百度。

据统计，从2019年至2024年，双方围绕流量劫持、内容侵权等已发生27起案件，小到赔偿40元。

此次案件是双方以“不正当竞争”为由，赔偿最大的一次，也是双方长达6年诉讼的重要节点。

百度百科自2006年上线以来，至今收录了超2860万个词条，参与词条编辑的网友超过795万人，覆盖科学、文化、历史、科技等几乎所有已知知识领域，是全球规模最大的中文百科全书之一。

网友编辑的词条版权到底归谁所有？平台拥有对词条的合法权益吗？

抖音百科抗辩称：百度百科词条内容由用户生成，平台不享有独立权益。

而法院首次明确，百科平台对词条的系统化运营，如收集、存储、编排、管理、传播等，形成了独立于用户的“竞争性权益”，这种权益并非基于版权，即使词条内容本身公开，未经授权的系统性搬运仍构成不正当竞争。

此案的核心意义不仅在于赔偿金额巨大，更是确立了“平台数据整合权益”的法律地位，为互联网行业的数据合规划定了清晰边界。

三、AI数据合规性

这也为AI企业敲响了警钟。

数据是大模型的重要训练资源，而数据来源的合法性直接决定了技术应用的合规性。

未来，未经授权的系统性数据搬运可能会面临法律重罚。即使数据公开，若AI应用直接分流原平台用户或替代其核心功能，仍可能构成侵权。

同时，企业还应通过技术手段验证数据来源，比如百度文心大模型通过“内容溯源链”技术，对训练数据的采集时间、地点、授权状态进行实时标记，确保数据流向可追溯。

这种技术与法律的双重保障，为数据合规提供了“双保险”。

优质内容、海量数据已经成为AI时代兵家必争之地，AI企业需建构数据溯源管理、合理使用把控、全流程合规体系，探索更加合法合规获取数据方式。

来源：科技每日推送一点号

标签：首例赔偿百度百科百科词条

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!