将类似人的推理带入无人驾驶汽车导航!

访客2年前AI生活184
将类似人的推理带入无人驾驶汽车导航!

为了使自动驾驶汽车具有更多类似人的推理能力,麻省理工学院的研究人员创建了一个系统,该系统仅使用简单的地图和视觉数据即可使无人驾驶汽车在新的复杂环境中导航。

驾驶员非常擅长使用观察和简单的工具来导航之前未曾驾驶过的道路。我们只需将周围看到的信息与我们在GPS设备上看到的信息进行匹配,即可确定我们在哪里以及需要去哪里。然而,无人驾驶汽车在这种基本推理上苦苦挣扎。在每个新区域中,汽车必须首先绘制地图并分析所有新道路,这非常耗时。该系统还依赖于复杂的地图(通常由3-D扫描生成),这些地图计算量大,无法即时生成和处理。

在本周举行的国际机器人与自动化国际会议上发表的一篇论文中,麻省理工学院的研究人员描述了一种自动控制系统,该系统“学习”驾驶员在小范围内的道路导航时的转向模式,仅使用摄像机输入的数据和简单的类似GPS的地图。然后,受过训练的系统可以通过模仿人类驾驶员来在全新区域中按计划的路线控制无人驾驶汽车。

与人类驾驶员类似,该系统还可以检测其地图和道路特征之间的任何不匹配情况。这有助于系统确定其位置,传感器或地图是否不正确,以更正汽车的行驶路线。

为了对系统进行最初的培训,一名人工操作员控制了自动Toyota Prius(配备数个摄像头和基本的GPS导航系统),以从本地郊区街道收集数据,包括各种道路结构和障碍物。当自动部署时,该系统可以在指定用于自动车辆测试的不同林区中沿着预定路径成功驾驶汽车。

“借助我们的系统,您无需事先在每条道路上进行培训,”麻省理工学院研究生的第一作者亚历山大·阿米尼说。“您可以下载汽车的新地图,以浏览从未见过的道路。”

“我们的目标是实现在新环境中行驶时具有鲁棒性的自主导航,”计算机科学与人工智能实验室(CSAIL)主任,安德鲁和厄纳·维特比(Andrew and Erna Viterbi)电机工程与计算机科学教授合着。“例如,如果我们训练自动驾驶汽车在诸如剑桥街道之类的城市环境中驾驶,即使在以前从未见过的环境中,该系统也应该能够在树林中平稳行驶。”

丰田研究所的研究员盖伊·罗斯曼(Guy Rosman)和麻省理工学院的航空与航天学副教授塞拉特·卡拉曼(Sertac Karaman)与Rus和Amini同行。

点对点导航

传统的导航系统通过针对诸如定位,地图绘制,对象检测,运动计划和转向控制等任务定制的多个模块来处理来自传感器的数据。多年来,Rus的团队一直在开发“端到端”导航系统,该系统无需输入任何专用模块即可处理输入的传感数据和输出转向命令。

但是,到目前为止,这些模型都经过严格设计,可以安全地沿着道路行驶,而无需考虑任何实际目的地。在新论文中,研究人员改进了端到端系统,以在以前看不见的环境中从目标驱动到目的地。为此,研究人员对他们的系统进行了训练,以预测驾驶过程中任何给定瞬间所有可能的转向命令的全部概率分布。

该系统使用一种称为卷积神经网络(CNN)的机器学习模型,通常用于图像识别。在训练期间,系统会观察并学习如何向驾驶员驾驶。CNN将方向盘旋转与通过摄像机和输入地图观察到的道路曲率相关联。最终,它会学习各种驾驶情况下最可能的转向命令,例如直路,四向或T形交叉路口,前叉和回转。

罗斯说:“起初,在一个T形交叉口,汽车可以有许多不同的方向旋转。” “该模型首先考虑所有这些方向,但是当它看到人们做事的数据越来越多时,它将看到有些人向左转,有些人向右转,但没有人直行。排除了直线向前的可能性,并且该模型得知,在T形交叉路口,它只能向左或向右移动。”

地图怎么说?

在测试中,研究人员向系统输入了带有随机选择路线的地图。行驶时,系统从摄像头中提取视觉特征,从而使其能够预测道路结构。例如,它将远方的停车标志或道路旁的换行符标识为即将到来的十字路口的标志。在每个时刻,它都使用预测的转向指令概率分布来选择最可能遵循的路线。

研究人员说,重要的是,该系统使用易于存储和处理的地图。自治控制系统通常使用LIDAR扫描来创建大规模,复杂的地图,这些地图大约需要4,000 GB(4 TB)的数据来仅存储旧金山市。对于每个新目的地,汽车都必须创建新地图,这需要进行大量数据处理。但是,研究人员系统使用的地图仅使用40 GB的数据即可捕获整个世界。  

在自动驾驶过程中,系统还将其视觉数据与地图数据连续匹配,并记录所有不匹配情况。这样做有助于自动驾驶汽车更好地确定其在道路上的位置。如果输入了矛盾的输入信息,它可以确保汽车保持在最安全的道路上:例如,如果汽车在没有转弯的直线道路上行驶,并且GPS指示汽车必须向右转,则汽车会知道保持直行或停车。

“在现实世界中,传感器确实会发生故障,”阿米尼说。“我们希望通过构建一个可以接受这些嘈杂输入并仍能在道路上正确导航和定位的系​​统来确保该系统对于不同传感器的不同故障具有鲁棒性。”

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

五问“ChatGPT+医学影像”:新一代的AI能否成为放射科医生的一把利器?

五问“ChatGPT+医学影像”:新一代的AI能否成为放射科医生的一把利器?

自ChatGPT引爆人工智能领域以来,迅速吸引了来自不同领域的科学家和从业者的目光,期待着这一里程碑式的技术为自己的行业带来新的变革。 近日,...

商汤科技:原创AI构筑竞争壁垒,多领域实现商业化突破加速增长

香港,2023年3月28日全球领先的人工智能软件公司商汤集团股份有限公司(“商汤集团”或“公司”;股份代号:0020.HK)今日公布截至202...

从几天到几十秒,从繁杂操作到一条指令,AI 帮你征服 PPT

从几天到几十秒,从繁杂操作到一条指令,AI 帮你征服 PPT

“明天开会需要一个PPT,你今天晚上回去准备一下。” 大部分打工人尤其是职场小白接到这样的通知,内心都会瑟瑟发抖。 因为这不仅意味着加班,还...

腾讯公布2022年第一季度财报,金融与企业服务成腾讯主要收入方向!

腾讯公布2022年第一季度财报,金融与企业服务成腾讯主要收入方向!

5月18日,腾讯发布2022年第一季度业绩报告。腾讯“金融科技及企业服务”单季收入428亿元,占总营收32%,成为腾讯主要收入增长引擎。 财...

规模化L2公司融资加速,渐进式路线才是自动驾驶最优解?

规模化L2公司融资加速,渐进式路线才是自动驾驶最优解?

“目前市场上有20%的项目能接受比上一轮更低的价格融资。即使是明星项目,比上一轮的加价率也从50%下降到10%~20%。” 这是全国社会保障...

To B深水区:大包大揽的解决方案,正在「失效」

To B深水区:大包大揽的解决方案,正在「失效」

今天,没有人会否认数字化转型的必要性,也没人会否认数字化转型的急迫性 。 但是,如何回答好数字化转型这个宏大的命题,实则不易。客观地讲,长期...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。