川观智库资讯|数据标注产业迎来新机遇

360影视 欧美动漫 2025-09-02 09:19 1

摘要:近日,中国信息通信研究院(简称“中国信通院”)人工智能研究所联合中电信人工智能科技(北京)有限公司共同发布《数据标注产业发展研究报告(2025年)》(以下简称《报告》)。《报告》指出, 数据标注是人工智能技术应用的核心支撑,近年来数据标注产业在AI技术推动下快

川观智库研究员 燕巧

近日,中国信息通信研究院(简称“中国信通院”)人工智能研究所联合中电信人工智能科技(北京)有限公司共同发布《数据标注产业发展研究报告(2025年)》(以下简称《报告》)。《报告》指出, 数据标注是人工智能技术应用的核心支撑,近年来数据标注产业在AI技术推动下快速发展,伴随着政策支撑体系的不断完善、产业生态的不断健全、自动化和智能化工具的普及、新兴市场的崛起、数据隐私保护需求的增加和数据标注市场的蓬勃发展等,都为行业带来了新的机遇。

为加快推动数据标注产业发展,2024年,全国数据工作会议提出“探索建设数据标注基地”,此后确定了四川省成都市、辽宁省沈阳市、安徽省合肥市、湖南省长沙市、海南省海口市、河北省保定市、山西省大同市承担数据标注基地建设任务城市。目前,七个数据标注基地数据标注总规模达到17282TB,相当于中国国家图书馆数字资源总量的6倍左右;引进和培育标注企业223家;标注从业人员达5.8万人;带动数据标注行业相关产值超过83亿元。在7个基地的牵引带动下,北京市、天津市、广东省等20多个省市,积极培育和发展数据标注产业,出台规划文件和扶持政策,以人工智能基础数据服务为切入点,寻求人工智能及数据标注产业的参与机会。

与传统人工智能相比,大模型在数据需求和数据维度上都有显著不同。大模型需要大量数据来实现良好性能,大模型蓬勃发展带来新的数据标注需求,对数据需求呈海量增长,同时在不同训练阶段呈现显著差异,对标注数据质量要求也不断提升。高质量标注需满足四大核心标准:其一,事实准确性;其二,语义一致性,需建立跨场景的标注规范体系;其三,价值安全性;其四,场景完备性。大模型落地工程化需求对数据工程提出更高要求,标注系统需支持超大规模并发处理,需构建动态评估体系,合规性工程成为刚性要求。

《报告》指出,数据标注产业作为人工智能发展的基石,当前呈现出高技术含量、高知识密度、高价值应用的“三高”特征,预示着其未来发展的广阔前景。同时,数据标注产业仍然存在顶层设计尚需完善,高水平人才供不应求,技术创新能力有待提升,专业平台能力不足等问题,制约着产业生态的进一步完善。

比如就以标注方式而言,数据标注主要分为人工标注、半自动标注和全自动标注,当前仍以人工标注为主。另外,数据标注行业对从业者的专业素养要求越来越高,高学历背景和多学科融合成为从业者基本特征,比如随着应用场景的拓展,需要融合医学、金融、法律等特定领域的专业知识。

《报告》对推动数据标注产业发展提出建议:首先要不断加强数据标注技术创新能力,高自动化、智能化的数据标注工具,是推动数据标注产业快速发展的关键支撑,各地可以与行业头部企业联手共建联合实验室,提升标注工具在效率、质量精度和稳定性等多方面的性能指标。另外还要持续提升数据标注行业赋能水平,积极完善数据标注生态体系,大力推动数据标注标准编制和应用,着重强化数据标注人才培养力度,切实保障数据安全可靠。

本文来自【四川日报-川观新闻】,仅代表作者观点。全国党媒信息公共平台提供信息发布传播服务。

ID:jrtt

来源:全国党媒信息公共平台

相关推荐