纯视觉自动驾驶方案的「偏见」与「诱惑」
“特斯拉的全自动驾驶,是一个根本不准确的说法。”“真正的自动驾驶,需要激光雷达发挥作用。”
说出这些话的是激光雷达公司 Luminar CEO 奥斯汀·拉塞尔,他最近在接受媒体采访时,直言不讳地评价特斯拉的全自动驾驶系统(FSD),并否定纯视觉方案可实现自动驾驶。
这又是一个反对纯视觉自动驾驶方案的个例,但事实上,激光雷达的自动驾驶传感器地位已经有所松动。
七年前,自动驾驶汽车走出实验室不久,激光雷达因其特性被人们认为是自动驾驶实现的必备传感器,因此被业界抬至神坛。不过,在激光雷达的量产应用经历了一轮祛魅后,部分车企已站队纯视觉自动驾驶方案。
纯视觉自动驾驶方案正得到更多人士的认可,但这一方案在当下依旧是一个小众的流派,而应用新方案的特斯拉汽车也还未进入大众市场,无法得知其实际表现。
在一片争议声中,新智驾邀请几位业内人士,分享他们对于纯视觉自动驾驶方案可行性,以及其中可能存在难题。
纯视觉自动驾驶方案的诱惑
在多年争议声中,特斯拉的纯视觉自动驾驶方案即将应用于量产车型。
特斯拉计划,自10月起,北美、欧洲及中东地区交付的Model 3、Model Y将率先移除超声波雷达,随后将在全球范围政策允许的国家推进。此外,2023年起交付的Model X及Model S也不再配备超声波雷达。
这意味着,特斯拉将采用只有摄像头的纯视觉自动驾驶方案。据马斯克介绍,特斯拉的纯视觉自动驾驶方案将采用8个摄像头,配合视觉处理能力可实现360度的视野范围,对周围环境的监测距离最远可达250米。
(特斯拉纯视觉自动驾驶方案介绍)
而为了弥补移除超声波雷达引起的功能缺失,特斯拉将启用基于视觉的占据栅格网络(Occupancy Networks),以提供更清晰的空间定位、更远距离的可见性以及更强的物体识别能力。
对于移除超声波雷达的原因,马斯克给出的理由是,每辆车可节省114美元成本。
商汤绝影进一步向新智驾解释了特斯拉的理由。其表示,量产汽车对整车BOM成本非常敏感,哪怕单车降低成本10元都值得深入研究分析,更何况能省去多个传感器。并且,视觉传感器是所有自动驾驶传感器中信息最为丰富的,也是感知能力上限最高的传感器。
而在智行者研发中心高级总监徐成看来,纯视觉方案的技术优势也吸引了特斯拉坚持。
徐成介绍,纯视觉方案所有的数据都是图像,因为没有点云,没有毫米波的目标,以及超声波雷达的回波数据,所以数据源都是单一模态,特征提取、融合会更容易一些。
此外,因为都是图像数据,只需要围绕视觉处理进行数据积累、迭代模型,不会因为加入新的传感器而导致积累的历史数据不能用,进而需要重新积累标注数据进行训练。
经过数十年发展,超声波雷达已经成为汽车较为成熟的标配传感器,且成本较低。超声波雷达生产商电应普科技表示,目前市面的超声波雷达单价为45元左右。
其进一步表示:“纯视觉技术方案是最经济的一种,但纯视觉自动驾驶方案也存在比较明显的缺陷。在一些强光、大雾、大雨的环境下,摄像头的综合感知能力会极大程度受限。”
方案可行,问题难解
总体而言,特斯拉的感知方案经历了“快速瘦身”的过程,由最初不采用激光雷达,到减去毫米波雷达、超声波雷达。特斯拉过于快速抛弃传感器,引发了一系列让人诟病的副作用。
自2016年起,多个地区的特斯拉电动汽车在Autopilot模式下高速撞击倒在路面的白色货车,外界认为事故原因是特斯拉电动汽车将白色货车的车身与天空相混淆,从而没有发现障碍物。
2021年,特斯拉宣布取消毫米波雷达。采用新方案的车型上市后,美国国家公路交通安全管理局(NHTSA)收到关于特斯拉“幽灵刹车”的投诉量激增,投诉量由单月354起增至单月758起。
大量投诉为特斯拉引来了NHTSA的调查。今年6月,NHTSA决定对 83 万辆特斯拉电动汽车展开调查,重点调查部分为自动驾驶功能 Autopilot。
不过,在仅有摄像头作为传感器的情况下,特斯拉曾自信地表示,新方案比多传感器融合方案的安全性更高。
对于纯视觉自动驾驶方案的可行性,业内人士有着不同的看法。
德赛西威智能驾驶辅助事业单元总经理李乐乐曾对新智驾表示,受各种传感器的物理限制,中短期内不太可能仅使用一种传感器解决所有场景的感知可靠性,智能汽车若需具备高度可靠的环境感知能力,一定需要多种传感器融合以提高感知性能。
商汤绝影、智行者的多位业内人士从长期判断,纯视觉自动驾驶方案具备可行性,但目前存在不少需要攻克的难点。
在徐成看来,纯视觉方案主要有三大难点:
其一,可能存在近距离安全风险。
特斯拉采用360度环视摄像头方案,其中前视相机被自身车头遮挡,在车头附近会存在一定的盲区;周视相机由于各自视角差异和画面裁切导致近距离障碍物在画面中不完整,容易漏检或者给出错误的运动趋势;鱼眼相机理论上能够看到车身近处的目标,但是如果障碍物太近,在鱼眼相机中也无法看到全貌,难以描述障碍物的存在性和运动情况,从而导致可能存在近距离安全风险。
其二,摄像头对不常见的物体可能漏检或误检。
特斯拉主要通过基于深度学习的视觉检测技术提高对物体的识别能力,需要将不同类别的物体标注后训练AI,最终让AI能识别尽可能多的物体。
值得注意的是,道路上有一些不常见的物体如漂浮的气球、塑料袋,或者停放的手推车等,如果特斯拉的训练数据中没有标注这类物体,但车辆在实际行驶中遇见这类物体,可能容易引发不刹车或者幽灵刹车等情况。除非特斯拉的数据包含生活中的所有元素,否则一定存在漏检误检物体。
此外,摄像头法无法识别透明物体,在特殊情况下可能因此引发事故。
其三,摄像头获取深度信息较难。
从探测能力来看,超声波雷达可通过声波回波测量距离,但特斯拉所采用的多目摄像头无法像双目摄像头般获取距离信息,只能获取各个摄像头看到的图像信息,再通过深度估计网络给出一个可能的深度。
此外还可基于小孔成像原理给出距离、结合自身的运动估计环境中障碍物的3D位置、结合多目相机对同一目标的观测给出可能的深度信息等方法。
不过,这些间接的深度信息获取方法存在各种局限:
- 深度估计网络的结果会存在错误和被欺骗的可能;
- 小孔成像原理需要获取障碍物的大小,或者地平面的先验假设;
- 结合自身运动的方法,需要自车处于运动状态;
- 多目相机对同一目标进行观测,需要目标处于多目相机的共视区域。
由于这些方法的局限性,将导致目标深度信息的获取在某些情况下会变得异常困难。
目前,特斯拉的公开内容未包括以上问题的解决方法,至于特斯拉的纯视觉自动驾驶方案是否真如其宣称的极高安全性,还需等待实车上市。
纯视觉自动驾驶方案,适合中国道路场景吗?
目前而言,特斯拉坚持的纯视觉自动驾驶方案是一个小众的感知流派,近几年越来越多车企却成为其中一员。
集度汽车CEO夏一平曾表示,集度看好纯视觉的自动驾驶路线,目前其首款量产车型虽然搭载激光雷达,但并不是自动驾驶传感器的核心。集度汽车此后将逐渐减少雷达等感知硬件,实现纯视觉感知。
丰田旗下子公司Woven Planet今年表示,将通过摄像头采集数据,采用单一的视觉方案开发自动驾驶,这一方案也将供丰田未来的量产车型使用。
双方都没有说明将通过何种方式实现纯视觉自动驾驶,但它们的选择,至少证明了纯视觉自动驾驶方案有着实际应用的可能。
然而,如果纯视觉自动驾驶方案在中国道路交通场景应用,可能面临不小的挑战。
商汤绝影介绍,中国道路特有的长尾场景相对国外更多,比如拉货三轮车、外卖车等交通工具较多,同时中国交通流的密度高,路面动态目标的轨迹更随机,驾驶员的驾驶策略也更激进。
此外,中国各地的交通灯、交通标志、锥形桶、防撞柱、施工标志等道路元素的形态也存在差异化,这些对于中国的纯视觉解决方案而言都是比较大的挑战。
但这并未影响商汤绝影研发视觉感知方案。商汤绝影表示,多类别长尾场景的快速迭代解决,需要算法供应商有高效的数据获取能力、数据处理能力,能够支持感知算法的快速迭代。正因此,商汤绝影打磨通用目标感知体系,用赋能引擎来支持长尾场景的解决,实现智能驾驶能力的自演化。
无独有偶,不久前大疆车载参与研发售价10万元左右,却具备L2+辅助驾驶功能的Kiwi EV正式上市。大疆车载表示其系统可以仅通过在线感知实现ADAS核心能力,这使得主流的辅助驾驶功能可以在基础的硬件构架上实现ADAS功能。
大疆车载曾在相关的媒体沟通会上表示,更高阶的智能驾驶体验不等于更高阶的硬件,而是基于车型本身的定位、体验设计、功能需求进行软硬件的配置和开发,合适的配置与成本完全可以让广大消费者轻松用上智能驾驶。
除了商汤、大疆车载以外,智行者、元戎启行等自动驾驶公司相关负责人也表示:“纯视觉自动驾驶方案在中国道路场景应用可行,但仍有很多问题需要解决。”
钢丝绳上的舞者
纯视觉自动驾驶方案目前已有不少拥趸,但统观各企业的具体做法,目前如信奉宗教般践行该方案的勇者极少。
即便已研发视觉方案的供应商,也有着备选方案。比如大疆车载的辅助驾驶方案根据客户需求决定,商汤绝影也提供激光雷达感知产品。而公开站队纯视觉自动驾驶方案的集度与丰田,目前还未推出相关产品。
毫无疑问,第一个将纯视觉自动驾驶方案应用量产车型的特斯拉是一只出头鸟,需要准备应对可能出现的各类事故。而此前因取消毫米波雷达而导致投诉量增多,正为特斯拉招来更大的麻烦。
近日,消息称特斯拉正在接受美国司法部有关自动驾驶技术的调查,特斯拉或其公司高层可能收到司法部的刑事诉讼。
上一版本方案已证明失利,若更激进的视觉方案应用后导致更多事故,特斯拉应用纯视觉自动驾驶方案可能遭遇更大的挫折。此时的特斯拉,更像是钢丝绳上的舞者,前有唆使降低成本的毒蛇,后方的退路却被自己毁坏。
更重要的是,消费者对此方案的接受程度也是一个问题。如果有可能,你愿意成为特斯拉纯视觉自动驾驶方案的付费用户吗?
本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!