|新一代信息技术 信息基础设施建设 互联网+ 大数据 人工智能 高端信息技术核心产业
|高端制造 机器人 智能制造 新材料
|生物产业 生物医药 生物农业 生物技术
|绿色低碳 清洁能源汽车 环保产业 高效节能产业 生态修复 资源循环利用
|数字创意 数创装备 内容创新 设计创新
|产业资讯
|地方亮点及地方发改委动态
|独家内容
|杂志订阅
✍️ 投稿
您的位置:首页 > 声音
云测数据: 揭秘智能驾驶背后“感知密码”
2021-01-15 18:01
来源:中国战略新兴产业
字体: [   ]

中国战略新兴产业融媒体记者 杜壮

  数据、算力、算法是推动人工智能技术进步的“三驾马车”。如今,在计算机视觉、语音识别领域,AI的商业化落地突破并不明显,原因就在于算法算力的技术瓶颈。从宏观角度来看,现有算法、算力无法准确处理复杂环境下无限可能的长尾场景,这时候AI数据的覆盖就显得更加重要。

  华为连续发布智能驾驶计算平台MDC210和MDC610,覆盖L2-L4级别自动驾驶需求,有望在2021年量产;美国加州出台首个允许自动驾驶出租车服务收费的政策,特斯拉推送FSD beta……2020年,对自动驾驶来说,可谓充满传奇。
  一方面,技术的进化带来了产业的变化。另一方面,智能驾驶领域的火热使得AI(人工智能)数据备受各界关注。目前在现有的算法算力的基础上,越来越多的AI进化方式是通过对大量的原始数据进行框选、提取、分类,从而将复杂的原始数据标签化,转为机器学习可以识别的精准数据,以提升AI的感知能力。从产业的角度来看,智能驾驶的产业化落地将成为高精度数据标注行业未来发展方向的一个重要缩影,高质量数据在促使自动驾驶产业化落地的同时,也成为数据产业商业化程度不断深入的着力点。
  更好的数据意味着更好的决策
  相关研究数据显示,我国2018年约产生7.6ZB,到2025年将增至48.6ZB,已成为世界第一数据大国和“世界数据中心”。随着AI技术商业化的持续深入,算法、算力方兴未艾之时,高质量、场景化的数据成为推动智能驾驶深入长尾应用的关键推动力。
  与其他人工智能应用场景相比,智能驾驶的落地场景相对复杂,想要让汽车本身的算法做到处理更多、更复杂的场景,背后就需要有海量的真实道路场景数据做支撑。然而,场景数据缺失、数据质量良莠不齐,以及数据隐私安全问题,成为智能驾驶领域AI数据面临的几大痛点。
  数据、算力、算法是推动人工智能技术进步的“三驾马车”。如今,在计算机视觉、语音识别领域,AI的商业化落地突破并不明显,原因就在于算法算力的技术瓶颈。从宏观角度来看,现有算法、算力无法准确处理复杂环境下无限可能的长尾场景,这时候AI数据的覆盖就显得更加重要。
  “更好的数据意味着更好的决策”。正如人类的飞天梦一样,人们对自动驾驶有着热切的需求。让汽车具备“智慧”,智能驾驶成为全球许多国家都在关注的一个重要课题。而在这一过程中,AI数据对于汽车智能驾驶而言至关重要,它是汽车变得更“聪明”的关键。自动驾驶真正商业化落地的关键之一,就是要通过人工智能算法处理更多更复杂的场景。
  实际上,数据是整个人工智能行业的燃料,数据在智能驾驶领域的重要性毋庸讳言。绝大部分智能驾驶企业对数据也非常重视,但现实情况是缺乏获得大量且高质量数据的渠道。
  云测数据总经理贾宇航告诉本刊记者,云测数据为了满足智能驾驶领域不同场景的特殊需求,在业内首创了“数据场景实验室”模式,通过还原多种智能驾驶细分场景,以解决特定场景下的数据缺失、质量良莠不齐等行业问题。一方面,在场景下的定制化数据采集更加精准、数据质量更高。另一方面,定制化的场景数据也与智能驾驶需求端的匹配度更高,从而最大化将数据转化为生产力。
  自动驾驶所需数据正向多模态方向发展
  实际上,人工智能行业发展前景良好,而作为强关联性的AI基础数据服务行业受其发展红利的影响,未来市场仍有不小的上升空间。
  在人工智能的众多商用目标中,自动驾驶是最受看好、也是前景最为广阔的领域之一。一方面,目前,包括北京、上海、重庆、广州、长沙、深圳等城市正在火热开展Robotaxi(自动驾驶出租车)在城市道路上的载人研发测试。另一方面,在这场未来出行市场入场券的竞赛中,包括互联网公司、传统车厂、新兴科技创业公司的各类厂商如雨后春笋一般出现。
  值得注意的是,自动驾驶汽车所要采集标注和处理分析的AI数据多样、海量、丰富、场景化AI数据已成为自动驾驶成必争之地。AI数据也将为自动驾驶未来发展奠定基础,和其他关键技术一起,驱动完全无人驾驶的全面商业化时代的到来。
  在贾宇航看来,当前的自动驾驶数据需求,正向着多模态的方向发展。所谓多模态,即是对多维时间、空间、环境数据的感知与融合。比如当前的自动驾驶需要雷达+摄像头才能跑得更稳,相对应的,就需要2D/3D融合标注工具。
  据介绍,云测数据在标注工具方面,自研了一套可以支持图片、语音、文本等多品类的标注平台,可满足业内图片通用拉框、车道线、DMS、3D点云、2D/3D融合、全景语义分割等标注类型,支持自动驾驶、智能驾舱、自动泊车等场景数据标注。
  值得一提的是,云测数据的三维标注工具,尤其是3D点云的标注工具,通过渲染引擎等方面的优化,可保证整个过程的流畅和快捷。对雷达成像的图像中的机动车、障碍物、行人等多目标进行3D标注,也是业内率先实现2D、3D融合标注的平台之一。在数据质量的导向下实现更优的品控和更快的数据交付。
  “数据标注的准确率和贴合度至关重要,比如要在一个2D图片或3D点云图里标注出汽车,要尽可能地不出现错标和漏标的情况。同时,标注的矩形框还要尽可能地与物体贴合。”贾宇航认为,“云测数据利用自主开发的标注工具,即使是3D点云图像,也可以保证数据标注的流畅性和时效性,以及行业内领先的数据标注精准度。”
  “目前,云测数据做到了视觉、语音、文本的全品类支撑。面对这3个维度其数据的需求层次和维度发生变化,需要做到更高精度的支持。云测数据采用的基于规则的机器筛查方式,在人工校验流程前根据所标注项目要求,引入相关查错规则,为数据精度提升设置保障。”贾宇航希望通过精准高质、独立安全的数据,帮助智能驾驶客户快速构建核心数据壁垒。这也是支撑云测数据在众多竞争者中脱颖而出的底气。
  数据标注行业快速发展
  如今,人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,伴随着产业智能化的大潮,人工智能正成为诸多行业转型升级的通用技术。不过,想要更快落地,解决行业具体痛点,需要大量经过标注处理的相关数据做算法训练支撑。数据标注行业实现快速发展。艾瑞咨询发布的《2019年中国人工智能基础数据服务白皮书》显示,2019年中国AI基础数据服务行业市场规模可达30.9亿元,预计2025年市场规模将突破100亿元,年化增长率为21.8%。
  市场扩大一定程度上意味着市场竞争加剧。正是拥有定制化的场景、丰富的数据量和高质量的AI数据交付,才让云测数据与行内包括自主、合资车企,大型Tier1以及做无人出租车的自动驾驶公司等众多企业的亲睐。
  目前,不只是智能驾驶,云测数据在智慧城市、智能家居、智慧金融等领域,为互联网企业、科技企业和众多智能化转型的传统企业提供数据采集和数据标注服务。同时,云测数据在华东、华北、华南设有数据交付中心和数据采集基地,构建整体AI数据的生态。
  贾宇航表示,数据标注行业发展日趋成熟,在人工智能落地各个垂直行业过程中,AI数据服务的需求持续爆发,数据标注将迎来更大空间和发展机遇。

来源:《中国战略新兴产业》杂志2021年1月1日期
关注微信公众号:

官方账号直达 | 关于我们 | 联系我们 | 招聘 | 广告刊例 | 版权声明

地址(Address):北京市西城区广内大街315号信息大厦B座8-13层(8-13 Floor, IT Center B Block, No.315 GuangNei Street, Xicheng District, Beijing, China)

邮编:100053 传真:010-63691514 Post Code:100053 Fax:010-63691514

Copyright 中国战略新兴产业网 京ICP备09051002号-3 技术支持:wicep