激光雷达固态化、低成本化是趋势?“瑞特森”希望以固态面阵激光雷达做3D视觉感知
感知、决策、执行,是无人驾驶车与外部环境交互的主要流程。目前典型的无人驾驶感知系统由多种传感器构成,包括毫米波雷达,多线激光雷达,图像传感器,超声波雷达等构成,其中图像传感器和激光雷达是完成障碍物识别和定位的主要部件。但在这种搭配下,传感器能够识别人、车、交通标牌等一些规则障碍,对于石头、散落的包裹、小动物等非规则障碍则不一定能够识别,这是因为一来当前感知系统架构中,对于环境的认知能力提升主要通过深度学习的方式进行,即通过大量的模型训练,让机器能够认识越来越多的物体。其弊端就是对于很多非规则的模型物体,无法进行大量的学习训练。二是多线激光雷达是三维重构的主要构件,但由于多线激光雷达是对实际场景的三维离散采样,这制约了感知系统对环境的空间理解能力。多线扫描雷达需要进行360度机械旋转,成本较高,同时机械旋转也会降低机器的可靠性。
整体来说,传感器系统的低成本化、固态化、小型化正成为趋势。与此同时,像Quanergy这样的激光雷达则在尝试固态方案,同时以光学相控技术实现激光扫描。另外,曾在去年8月份完成了A轮融资的以色列初创公司Innoviz,则在研发面阵扫描激光雷达。
我近期接触的“瑞特森科技”专注于3D视觉感知的硬、软件解决方案,致力于量产的固态高清面阵激光雷达传感器的研发,并通过人工智能技术,实现三维重建、物体识别、分类与跟踪,给无人驾驶车一双“眼睛”,使无人驾驶的感知系统具备全天候,全类别交通要素认知的能力。
瑞特森CEO贾相飞告诉36氪,这种高清面阵激光雷达传感器主要基于3D凝视成像技术。这种雷达的工作原理可以理解为,成像系统向外发射光源,发射出的光源在到达物体表面后,一部分反射回图像上的像素点。而由于物体表面到返回点的距离不同,其反射光飞行时间(TOF)不同,通过对光飞行时间的测量,每个像素就可获得独立的距离信息,其探测范围可以达到百米以上。摄像头可以实现百万像素级别的分辨率快速3D成像,成像频率在每秒30帧以上。
相比于原来有复杂旋转结构的激光雷达,这种面阵激光雷达的软硬件成本从原来的百万元级别下降到了万元级别。同时,系统得到的是包含三维信息的图像,辅以三维场景下的深度学习技术,能实现全部交通要素的认知能力。这种雷达系统在识别障碍物上性能得到质提升,其对环境的理解能力能够达到人眼水平,比如识别路上的一块石头、塌陷的坑、散落的包裹等。同时,由于产品采用主动照明技术,使得该产品具有全天候的工作能力。
那么,这种对障碍物的识别是如何实现的呢?贾相飞告诉36氪,在现有的图像解决方案中,要识别物体需要进行样本比对,由于图像二维的,因此原则上需要穷举各个角度的样本才能保证能够保证对目标样本库的覆盖(比如从各个角度拍一张桌子);而在具有三维信息的图像中进行识别时,其深度学习算法可以加入一些特定三维属性特征(比如桌子有一张桌面,有桌腿等通用属性),那么对物体的识别训练的学习成本将大大降低,同时识别效果得到大幅提升。
也即通过3D图像传感器+人工智能,瑞特森科技便能对车辆前方的物体进行三维重建,同时进行目标分类,并完成目标检测与跟踪,而在车辆行驶这一场景下,即主要对前方车辆、行人等进行识别、与追踪。
贾相飞告诉36氪,瑞特森的探测精度能够达到10cm以内,同时在探测范围上,瑞特森能够达到百米范围内的远距离探测。
在商业化考虑上,贾相飞表示,公司近期重点是做好3D图像传感器,同时在商业化上会从近距离、低精度的视觉应用场景切入,比如VR内容制作中的定位。随后再切入远距离、高精度的视觉应用场景。今年,瑞特森计划谈下1-2家无人驾驶汽车厂商,产品希望明年能达到商用级别。
我是36氪汽车小组负责人卢姿伊,负责特斯拉、无人驾驶、新能源、车联网、出行及后市场,欢迎直接与我联系,微信:17701221940















