问AI那得清如许?因有源头数据来——“数据治理实践案例解读专题分享会”第7期:AI高质量数据

2021-12-10 16:40 浏览量:186


 

 

 

2021 年 12 月 2 日晚 9 点,由国家工业信息安全中心指导、中国电子商会数据资源服务创新专委会主办、北京赛昇科技公司协办协办的“信息技术大讲堂——数据治理实践案例解读专题分享会”第六期,以互联网直播形式成功举办。

 

本次直播邀请了云测数据总经理贾宇航做了主题为“AI训练数据在人工智能技术中的发展与应用”精彩分享。贾宇航指出:AI数据是人工智能技术应用和发展的基石,AI的大规模应用需要海量的AI数据对模型进行训练。人工智能相关企业想要更快更稳发展,就要不断提升对AI数据的质量、效率、场景化方面的要求,才能在“百家争鸣”的智能化浪潮中迎头而上。贾宇航以云测数据在行业中的应用实践为例,给出了在AI数据维度,如何通过提升AI数据质量,持续提升人工智能模型效果的思路建议。
 

 

 
 

随着国家政策的倾斜和5G等相关基础技术的发展,中国人工智能产业进入快速增长阶段,人工智能广泛应用的商业化落地阶段来临。国家工业信息安全发展研究中心发布的《2020年AI新基建发展白皮书》指出,人工智能算法的演进升级需要高质量数据作为支撑。经过清洗标注、去掉噪声数据的高质量数据集比未经过处理的数据集更适合人工智能算法进行训练。质量不断提升的数据集已经成为人工智能技术发展的重要推动力,高质量AI数据正驱动人工智能算法更加智能化。

 

回顾过去,早期的AI数据行业曾长期处于粗放的发展模式,数据粗制、混乱、复用的情况屡见不鲜;但随着AI与各个产业结合得愈加紧密,AI商业化程度进入新的高度,行业属性较强的垂直领域加速落地,AI数据的需求正逐渐转向个性化、场景化和准确化,数据服务供应商的技术实力、精细化管理能力、流程把控能力不断提升,AI数据服务行业走向专业化、精细化、多维化。

 


 

在人工智能数据市场中,数据服务商想要形成强劲的业务优势,就要摆脱同质化竞争,保持在模式、技术、服务等方面的不断发展:
 

一是加强场景化数据的采集能力,换言之就是为人工智能细分场景的落地,提供更加垂直且丰富的数据,满足其长尾场景的需求;

二是提升数据标注的准确性,从工具、规则、流程的开发制定,到标注人员的素质培养,不放过任何可以提升标注准确性的可能;

三是充分发挥“底层技术+服务能力”的力量,具备更深刻的行业领域知识、更懂场景、更懂技术、更具行业前瞻性。

 

  


 

 类似云测数据通过高质量、场景化的数据采集标注服务领军AI数据服务市场,更高质量的数据也促使着人工智能产业加速发展。这种双向促进的“供求”关系,让AI数据服务精细化、场景化和专业化的趋势愈演愈烈。贾宇航分享了云测数据产品、数据处理工具与数据服务“三螺旋”业务在智能驾驶、智慧城市、智能IOT、智慧金融等行业的应用实践。

 基础数据集:图像/语音/文本等在多场景下的数据集;

数据采集:数据场景实验室用于AI应用场景的构建;

数据标注:视觉、语音、文本的全品类标注能力;

数据处理工具:数据标注平台、数据集管理系统的技术支撑;

 

 当前,不管是人工智能技术的研发以及应用领域的发展,“数据”都是一个不可或缺、位于重中之重的因素,以数据价值驱动的数字经济正成为推动社会前进的主要模式。AI数据作为新的生产要素声名渐显,它是人工智能长期发展的重要保障,人工智能技术研发、训练的关键。只有当AI应用获取了更为准确、及时、一致的高质量数据,才能提供更有效、有用、精准性高的智能化服务。相信随着AI数据服务行业的高速发展和规范并举,AI数据价值将进一步飞跃,人工智能产业落地进程将大步平稳向前。

 

舍恩伯格在他的《大数据时代》中预言:“数据可以量化一切,文字变成了数据,方位变成了数据,沟通变成了数据,直到万物的数据化。

 

以提供高效率、高质量、多维度、场景化的数据服务与策略,最大化地发挥训练数据的价值,为人工智能场景化落地输送更多卓越的数据支撑,从而推动数据要素有序发展及高效利用,是当今数据标注等提供数据治理服务企业的历史使命。

来源:数据要素发展委员会

上一篇:业界访谈 | 直面挑战、探寻路径,夯实数据长效运营基础

下一篇:数据安全与数据治理

分享到-微信
X

为什么选择龙石数据?