创·新声|数据标注产业爆发式增长下的“冷”思考

内容摘要在政策支持与产业需求的双重带动下,我国数据标注产业正处于爆发式增长的风口。面对日趋激烈的全球科技竞争和广阔的市场需求,我国需加快在数据要素及标注数据确权、流通安全以及“主权AI”建设等方面的布局,推动数据标注产业在高质量发展的道路上行稳致

在政策支持与产业需求的双重带动下,我国数据标注产业正处于爆发式增长的风口。面对日趋激烈的全球科技竞争和广阔的市场需求,我国需加快在数据要素及标注数据确权、流通安全以及“主权AI”建设等方面的布局,推动数据标注产业在高质量发展的道路上行稳致远。

数据标注是对数据进行添加标记、说明、解释、分类和编码的过程,是提升人工智能算法、模型核心能力的关键环节。数据标注质量直接关系到模型输出的准确性和可靠性。

随着各行业数字化、智能化进程的加速推进,数据标注自动化水平显著提升,专业化趋势日益明显,应用领域也在不断拓展和深化,从传统的语音转写、图片文字识别等领域,向更高端、更复杂的场景延伸,应用价值持续提升。

国家数据局近日发布的数据显示,我国七个数据标注基地数据标注规模再创新高,总规模达到17282TB,相当于中国国家图书馆数字资源总量的6倍左右;目前已形成医疗、工业、教育等行业的高质量数据集335个;赋能121个国产人工智能大模型研发;引进和培育标注企业223家;标注从业人员达5.8万人;带动数据标注行业相关产值超过83亿元。

我国作为人工智能大国,必须加快在数据要素及标注数据确权、数据流通安全以及“主权AI”建设等方面的布局,以确保在人工智能领域的国际竞争力和话语权。

一是要完善数据要素确权机制,筑牢数据市场的基石。数据要素确权是数据标注产业健康发展的前提和基础。在数字经济时代,数据已成为至关重要的生产要素,其权属问题直接关系到数据的流通、利用和价值实现。数据的无形性、易复制性及权属界定模糊等特性,使得数据要素的确权工作成为亟待解决的棘手问题。

我国出台的《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法规制度,为数据要素确权提供了法律基础。但在实际操作中,仍面临如何界定数据权属、如何平衡数据主体与数据使用者之间的利益关系等问题,需进一步深入探索和完善相关机制。

二是要明确标注数据的权属归属和利益分配机制。作为在原始数据基础上通过人工或机器标注而产生的新数据,标注数据的权属问题需综合考虑原始数据提供方、标注服务提供方及标注数据使用方等多方权益。同时,应加强法律法规的宣传和培训力度,提高产业界的法律意识和合规意识,确保数据要素确权工作顺利进行。

三是构建完善数据流通安全治理制度体系,保障数字经济稳健发展的生命线。数据标注过程可能涉及敏感信息的处理和传输,如个人隐私数据、商业机密等。一旦这些数据泄露或被恶意利用,可能会给个人和社会带来重大损失。

我国已经出台一系列数据流通安全相关的法律法规和政策文件,如《关于完善数据流通安全治理 更好促进数据要素市场化价值化的实施方案》等,但在实际操作中,仍需深入探索如何保障数据在流通过程中的安全性、完整性和可追溯性等,包括建立严格的数据流通安全管理制度,明确数据提供方、数据接收方和数据流通平台等各方的责任和义务;加强数据流通安全技术的应用和创新,如采用数字水印、数据指纹、区块链等技术手段,确保数据流通过程中的安全性和可追溯性;加强与国际社会合作与交流,共同推动全球数据流通安全治理体系的建设。

四是加强“主权AI”建设,提升国家核心竞争力。在全球科技竞争日益激烈的今天,“主权AI”建设已成为各国关注的焦点。我国作为人工智能大国,必须加快“主权AI”建设的步伐,确保在人工智能领域的国际话语权和竞争力。

具体到数据标注产业,我们应建立自主安全可控的AI基础设施,确保关键核心技术基本实现自主控制;加强AI底层技术领域领军人才培养,加强科研创新;持续优化产业布局,推动产业集群发展;积极参与国际AI标准制定,提高我国AI技术的国际认可度和影响力。此外,在“主权AI”建设过程中,还需注重保护个人隐私等敏感信息的安全,确保AI技术的合规应用和发展。

完善数据要素确权机制、构建数据流通安全治理体系、加强“主权AI”建设,不仅是保障数据标注产业健康发展的必由之路,更是推动我国数字经济迈上新台阶的关键举措。

通过政策引导、技术创新与国际合作的多重驱动,我国数据标注产业将不断提升自身竞争力,为人工智能技术的深入应用与数字经济的蓬勃发展提供坚实支撑。

(作者:付建龙系江苏经贸职业技术学院副院长、中国法治现代化研究院特邀研究员;杜帅系对外经贸大学社会保障与企业金融研究中心主任)

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备2021030705号-9