Yandex开放全球最大的推荐系统数据集之一“Yambda”

360影视 欧美动漫 2025-05-29 09:54 2

摘要:俄罗斯科技公司Yandex于近日宣布,公开其名为Yambda的数据集,这是目前世界上最大的用于开发推荐系统的数据集之一。Yambda基于Yandex Music的匿名数据,旨在帮助全球科学家、研究人员和大学测试和改进推荐算法。

据IXBT网5月28日报道,俄罗斯科技公司Yandex于近日宣布,公开其名为Yambda的数据集,这是目前世界上最大的用于开发推荐系统的数据集之一。Yambda基于Yandex Music的匿名数据,旨在帮助全球科学家、研究人员和大学测试和改进推荐算法。

Yambda数据集提供三个版本:完整版包含50亿条数据,缩减版包含5亿条数据和5000万条数据。开发者和研究人员可以根据任务需求和计算资源选择合适的版本。该数据集及测量代码已在HuggingFace平台上线。

Yandex Music是俄罗斯最大的订阅音乐服务,Yambda数据集包括汇总的播放、喜欢、不喜欢及部分曲目统计数据。所有用户和轨迹数据均匿名处理,仅以数字标识符形式存在,确保数据的机密性。

(编译:胡伟)

来源:邮电设计技术

相关推荐