
一名数据标注员在进行数据分析。
快速读懂
什么是数据标注
数据标注是指对图片、语音、文本、视频等数据进行处理,标记对象的特征,生成满足机器学习训练要求的可读数据编码。
数据标注企业,通常需要完成数据集结构/流程设计、数据处理、数据质检等工作,为下游客户提供训练数据集、定制化服务。数据标注作为将原始数据转化为可识别、可训练、可计算的关键环节,其质量直接决定了数据集的应用价值。
数据标注是人工智能技术研发中不可或缺的一环,伴随着AI在自动驾驶、金融、医疗、安防等多个垂直场景的深度落地,数据训练需求海量增长,数据标注也摆脱了传统劳动密集型行业的局限性,向高技术含量、高知识密度和高价值等特性发展。
日前召开的2026年全省数据工作会议提出,要把大力发展数据标注产业作为推动贵州省从“数据仓库”向“数据工厂”转型的重要抓手,从五个方面加大措施力度,推动数据标注从业人员数量在2025年1万人的基础上实现翻番,今年力争突破2万人。
会议明确,要强化数源供给。将加速公共数据市场化开发,通过整体或分领域授权方式,有序推动人口、法人、电子证照、宏观经济4个基础库及信用、基层治理等5个主题库的数据资源“拿出来”开发利用,并加快第二批数据产品开发。同时,鼓励在黔数据中心将数据标注需求优先释放给本地数据企业。积极对接国内互联网平台企业及数据龙头企业,推动其数据服务、标注处理、分析应用等业务向贵州本地企业转移和外包,扩大省内产业承接规模。
要壮大数商主体。通过外引内育,围绕数据产业“一图三清单”,聚焦产业链关键环节,瞄准省外重点区域的龙头企业与高成长性数据企业开展精准招商,加快景联文、博研科技、科大讯飞等在谈企业签约落地,加速形成特色鲜明、优势互补的数据产业集聚区;加快数据企业、数据产品认定,加大对本地数据企业的培育支持力度,推动百事通、东软集团、上海本原等一批已签约优质企业扩大投资规模、提升能级、创建品牌,打造一批具有区域竞争力的骨干企业。
要加强数才引育。将深入实施“百千万人才引进计划”,围绕产业关键领域,靶向引进高端技术人才、复合型管理人才及创新团队;推动表彰荣誉向数据产业从业人员倾斜,将数据产业从业人员纳入大数据职称评审系列,畅通数据人才职业晋升通道,开展数据技能人才、先锋人才、数据标注工匠等选树评选活动,切实增强归属感与获得感。
要高质量建设数园。将重点发挥4个省级数智产业园和其他重点园区平台载体作用,不断完善配套服务,集中资源新建或改造一批L3、L4等级数据标注厂房,提升园区专业化服务水平;引导各地市(州)按照“一核引领、多点协同”布局,结合本地特色,在少数民族语言、非物质文化遗产、旅游等领域形成差异化发展格局。
要持续优化产业发展环境。打造“公开、透明、可预期”的政策体系;抓好数据产业发展10条政策及25条配套实施细则落实,进一步深化“免申即享”“即申即享”政策兑现机制;大力支持贵阳贵安围绕自动驾驶、医疗、法律等领域,以及三个民族自治州围绕少数民族高质量数据集,争创国家第二批数据标注试点。(记者 李姗)
1、“国际在线”由中国国际广播电台主办。经中国国际广播电台授权,国广国际在线网络(北京)有限公司独家负责“国际在线”网站的市场经营。
2、凡本网注明“来源:国际在线”的所有信息内容,未经书面授权,任何单位及个人不得转载、摘编、复制或利用其他方式使用。
3、“国际在线”自有版权信息(包括但不限于“国际在线专稿”、“国际在线消息”、“国际在线XX消息”“国际在线报道”“国际在线XX报道”等信息内容,但明确标注为第三方版权的内容除外)均由国广国际在线网络(北京)有限公司统一管理和销售。
已取得国广国际在线网络(北京)有限公司使用授权的被授权人,应严格在授权范围内使用,不得超范围使用,使用时应注明“来源:国际在线”。违反上述声明者,本网将追究其相关法律责任。
任何未与国广国际在线网络(北京)有限公司签订相关协议或未取得授权书的公司、媒体、网站和个人均无权销售、使用“国际在线”网站的自有版权信息产品。否则,国广国际在线网络(北京)有限公司将采取法律手段维护合法权益,因此产生的损失及为此所花费的全部费用(包括但不限于律师费、诉讼费、差旅费、公证费等)全部由侵权方承担。
4、凡本网注明“来源:XXX(非国际在线)”的作品,均转载自其它媒体,转载目的在于传递更多信息,丰富网络文化,此类稿件并不代表本网赞同其观点和对其真实性负责。
5、如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。