首页 > 智能网

商汤科技AI+3D能否成为AI行业变革新引擎?

来源:智能网
时间:2020-02-19 12:03:15
热度:81

商汤科技AI+3D能否成为AI行业变革新引擎?AI+3D,一项具有革命性改变的感知技术,正在慢慢向工业生产、硬件制造,以及人们日常生活渗入。3D感知硬件能够提供距离、深度等数据信息

AI+3D,一项具有革命性改变的感知技术,正在慢慢向工业生产、硬件制造,以及人们日常生活渗入。

3D感知硬件能够提供距离、深度等数据信息,但这并不是单纯的数据,而是基于这些数据,通过不同的表达和理解方式,实现不同的应用。比如对三维场景进行数字化建模,或者绘制三维地图,从而让机器能够实时感知自己在所处空间中的位置,以便在运动时及时避开障碍物等。

这需要根据深度信息生成深度图像,并与RGB图像,甚至是红外图像进行融合并完成大量计算。

而商汤科技向笔者表示,通过硬件感知信息生成的深度图像,往往存在因硬件性能限制而产生瑕的疵。例如在细小或复杂交错的物体之间,出现深度信息估计错误等问题。此外,精准度、鲁棒性、实时性、效率等都是决定实际应用效果的关键。这些问题和应用效果都需要依靠额外的算法进行实时处理予以弥补和增强。

据悉,AI可通过对大量实际数据进行学习,自行总结其中的规律和特征。这种方法可以在短时间内,完成传统算法需要多年才能突破的问题,有效弥补硬件能力的不足。

3D硬件小型化,是3D视觉技术应用场景拓展和创新的硬件基础,而AI技术则是真正的动力引擎,两者密不可分。在商汤科技看来,AI+3D视觉技术拐点已至。

什么是AI+3D?

初次接触,可能很多人,对于AI+3D这项技术有些陌生。但实际上,了解之后便会发现,就如前文所说“AI+3D是一项最新的感知技术”。3D属于成像技术,是靠人两眼的视觉差产生的。基于摄像头获取的图像信息,视觉技术可以搭配AI技术解决各种实际应用问题。

这些深度图像信息则可以丰富AI图像视觉技术,如同人眼一样对场景深度进行感知。商汤科技向笔者称:“对于AI来说,能像人类一样获得深度信息后的感知能力,是他们研究这项课题的想法。行业早些年研究结构光、ToF、双摄等基于硬件设备技术都是为了带来深度信息,搭配AI对3D图像的感知能力,丰富不同领域的应用”。

ToF技术与结构光技术对比(以手机行业为例)

同时,光鉴科技首席执行官朱力认为:“3D视觉技术的意义,是打开了更加广阔的AI应用空间。无论是辅助驾驶,还是各种虚拟现实、增强现实技术的应用,这些前沿概念的落地都建立在信息交互基础上。对正处于发展中的AI产业来说,3D视觉将帮助机器更好地“看”世界”。

据笔者了解,随着硬件设备的小型化,AI+3D技术及其成熟的解决方案,可在手机应用、人脸识别、AR/VR领域、汽车、工业等具有相关性领域进行研发和场景落地。

例如:通用3D重建技术,从毛绒玩具、纸箱、书包、鞋子到雕塑,用户只需拿手机沿着物体360度环绕扫描,就能将其扫描成数字化的模型。生成的模型文件可直接用于3D打印、3D/AR相册预览,也可应用于生成短视频直播的内容并设置动画,也可植入到AR养宠等游戏、电商的商品展示或预览等场景中。

除此,在汽车领域,AI+3D技术能够实现更加精准的人、车、物识别和距离感知,从而有力推动自动驾驶发展。在工业领域,AI+3D将进一步优化工业生产流程,可为机械臂赋予3D感知能力,通过高精准的SLAM、物体重建和测量等技术,判断立体物体所处的位置,以及相应尺寸、形状和质量等信息,提升工业生产智能化能力。

目前,商汤科技已在人脸识别、汽车、工业、电商、手机等领域进行了深入研究。

AI+3D能否成为AI业又一“强心剂”

人工智能作为第四次工业革命的产物之一,给社会、工业、人带来的是一场人机交互变革。与此同时在该产业也诞生了许多新兴企业,如:商汤科技、寒武纪、旷视科技、云从科技、同盾科技等估值达到或超过10亿美元的AI企业。

按照产业链,从底层硬件到上层的应用,整个AI+3D产业链可以分为四类厂商,在国内外均有企业在进行相应的开发:一、3D感知硬件设备的相关供应商,包括镜头、摄像头模组、图像传感器,以及红外光源等器件;二、基于3D感知的AI技术/算法提供商;三、手机厂商,将AI+3D软硬件技术进行整合;四、应用开发商,开发基于AI+3D技术的应用。

很多AI企业则属于第二类:基于3D感知的AI技术/算法提供商。

而本次AI+3D技术的应用和产业链延伸更是将AI行业发展推向高潮。国外调研机构QYResearch曾预测,全球3D技术市场规模2012年为796亿美元,至2022年将达到3892亿美元,年复合增长率为17.20%。

商汤科技认为,“ToF在智能手机上的加速应用,有助于3D视觉技术的广泛普及化,会成为接下来10年中非常重要的科技趋势。业内统计,2019年TOF新机出货约0.5亿台,预估2020年将达到1.5亿台”。

在笔者看来,AI+3D技术所产生的价值则是对以往机器2D视觉认知的更新迭代或替代,可以让机器通过视觉三维影像,更加智能化,对所处世界有一个较为全面且深刻的信息感知与理解。从人机交互、互动娱乐、内容创作、身份验证、拍照、电商等层面激发大量的创新应用场景。改变传统商业运作模式。

不过,目前除了商汤科技外,谷歌、微软、旷视科技在AI+3D技术方面也有研究。据旷视科技云事业部高级副总裁吴文昊介绍称,“该技术已在手机领域有多种案例出来,但包含算法和模组的整体解决方案仍是缺位,公司正在尝试一种从上往下的整合方案,从3D应用层往下依次至AI算法、解决方案,最后到摄像、传感等硬件设备制造上”。

另有行业人士认为:“AI技术可以让3D打印实现以机器制造机器人,这也是新一轮制造业革命的助推剂”。

作者:珍珍