云测数据:新基建时代的“AI数据雄兵”
2020-03-19 10:33:32来源:民营经济网·民企动力
几年前,AlphaGo瞬间点燃了AI的激情与梦想,巨大的光环把AI推向了市场的风口。之后的几年国内的AI创业虽然几经起落,但也逐渐走向成熟。AI产业将逐渐褪去浪漫主义的“光环”,走向实用主义的落地。
在3月4日,国家决策层提出要发力于科技端的基础设施建设,人工智能成为“新基建”七大版块中的重要一项。“新基建”的呼啸而至,显然为中国AI产业的稳步推进起到了关键的作用。
简单回顾一下AI的发展历程,AI的三大要素是指算法、算力和数据。人工智能学科源起于1956年,之后在半个世纪的发展中几乎停滞不前,算力和数据的发展远远落后于算法,是当时制约AI发展的主要因素。而从2000互联网时代之后,因为云计算的逐渐普及,算力的制约也被打破。
所以,下一阶段AI产业发展的关键,其实是数据,基于行业场景化的AI数据,将是推动AI产业为新基建赋能的重要力量。
1)新基建下的AI产业化“催化剂”
大数据技术已经发展了很多年,一些科技企业也特别喜欢标榜,自己已拥有了多庞大的数据量。但这些所谓的大量数据,对AI的实际价值,到底有多大?
我们知道,真正改变当代AI产业的技术是深度学习。从2009年的ImageNet数据集发布,算起,深度学习时代已经有超过10年的历史。对深度学习而言,没有标注的数据,就没有 AI 算法模型。而模型迭代和调整,则需要更多的数据。越是准确的算法,就越依赖于大量高质量的标注数据。
由此可见,AI产业进一步发展的关键瓶颈,就是高质量的标注数据。
从场景化的角度,以自动驾驶为例:第一步是利用车上的摄像头或激光雷达获取周围的数据;第二步,由人工对这些数据进行标注;最后一步,这些标注好的数据被用于到AI模型训练,帮助汽车更好的感知道路场景,为智能驾驶技术的发展保驾护航。在这个流程当中,被标注好的高质量数据像是燃料,更像是AI走向落地的基石。
新基建当中提到的AI,其实更倾向于AI与行业场景的结合,更看重智能化的落地。尤其在数字化转型的背景下,百行百业对智能化的需求爆发的很快,各种AI基础设施和解决方案的发展也极为迅速。
而在AI应用实践中,优质的AI数据对于行业解决方案的价值提升就会更为明显,高质量的AI数据将最大限度地提升人工智能应用的效率。所以,数据之于AI产业的意义,就在于可以最大程度上提升AI在行业落地的效率与稳定,进而推动新基建的落地,可见其意义之深远。
2)数据标注行业的领头羊
看似简单的数据标注,其实蕴含了巨大的市场机会。
2015年,成立于旧金山的Scale AI,在整个AI产业当中或许是一个名不见经传的小公司。令人意外的是三年多的时间,它就获得了1亿美元的C轮融资,估值超过10亿美元,成为了当之无愧的独角兽。从Scale AI备受关注的背后,即可见数据标注行业的未来。
在中国市场,过去的数据标注行业曾长期处于粗放的发展模式,数据粗制、混乱、复用的情况屡见不鲜;但随着AI与各个产业结合得愈加紧密,AI商业化程度进入新的高度,人工智能对数据标注的质量提出了更高要求,数据小作坊的模式已不适用于AI产业化落地前夕的数据需求,而在这其中,定制化、场景化的高质量数据服务更是成为其中关键。据《2019年中国人工智能基础数据服务行业白皮书》统计,早在2018年,高质量的数据资源定制服务就占中国人工智能基础数据服务的86%,可见优质数据市场之潜力巨大。
同时,随着AI产业发展的逐渐升温,大型企业对AI数据的质量和安全要求也水涨船高,这意味着必须有能力超群的企业站出来,定义数据标注行业的规则。Testin云测旗下AI数据标注服务品牌,云测数据就是如今数据采集标注领域的领跑者,由于业界对其提供高质量AI数据的认可,被称为“人工智能五强”之一。
与简单粗放式的数据标注公司不同的是,云测数据更强调高质量的场景化的数据服务,Testin云测CTO陈冠诚认为,“通过使用定制场景化数据服务,企业可以将自己算法的识别精度推到一个新的高度,进而落地成为产品被用户使用,而沉淀的用户数据以及用户在分享过程中逐渐产生的更多互联网数据,则会让整个数据库演变成大数据生态。”
实际上,这所体现的正是对数据质量的把控能力和对场景深度的还原能力。为了满足AI落地场景的高质量数据需求,云测数据搭建了场景实验室和数据标注基地进行相应的数据生产。在项目前期,项目经理会帮助客户梳理更贴合实际情况的需求,试标验收合格后开始大规模作业。在数据标注作业提交后,还有三层质检环节和抽检环节来确保数据的高质量输出,并有项目经理全程跟踪数据交付的流程。
这种规范的数据作业流程和硬实力的投入,是高质量数据交付的基础逻辑,也是云测数据在AI数据领域极强的战斗力的体现。
同时,云测数据也是业界鲜有的将安全意识融入业务流程的企业。部分用户反馈,选择云测数据除了对其的专业度和服务能力了解之外,更为看重的是云测数据的质量和安全性把控。这也是云测数据“精准高质、独立安全的数据服务商角色”的最佳体现。
如今,云测数据的AI数据服务,已经覆盖了智能驾驶、智慧城市、智能家居、智慧金融、新零售等诸多领域的高质量的数据采集标注服务,实现了语音、图像、文本、视频的全领域覆盖,支持各类型数据的处理。在为众多企业提供AI数据服务的同时,云测数据奠定了在数据采集标注领域的头部位置,并深受各行业头部企业的认可。
3)成功从来没有偶然
事实上,云测数据在数据标注领域的成功并不是偶然。
第一,云测数据没有选择随波逐流,在市场秩序缺失,数据工坊林立的背景下,选择了建立规范、安全正规化的生产流程,提高了整个行业的门槛,为整个行业树立新的专业标准提供了可能。
第二,云测数据始终坚守自己的边界。承诺不滥用数据,数据交付后清毁数据不留底,绝不二次使用,并在技术上建立各项的数据保障机制,来守护数据的安全。数据是每个企业的珍贵资产,在保证数据隐私安全的前提下,更容易打动更多的大型客户。
第三,云测数据尊重数据,尊重AI落地。从帮助客户梳理数据需求出发,提供专业化的文本、语音、图像、视频等各类型数据生产,在保证数据的质量、效率和隐私安全的前提下,来帮助AI企业或部门快速构建核心数据壁垒,加速AI产业化落地的进程。
2013年,舍恩伯格在他的《大数据时代》中预言:“数据可以量化一切,文字变成了数据,方位变成了数据,沟通变成了数据,直到万物的数据化。”
的确,数据价值驱动的数字经济正成为推动社会前进的主要模式,由各种AI等创新技术驱动的数字化转型成为了新基建的核心。云测数据正处在大时代变革的中心,作为数据标注行业的领导者,堪称是新基建时代的“AI数据雄兵”。(郑凯)
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:张富强
免责声明:本文仅代表作者个人观点,与民营经济网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有问题,请联系我们!