本文摘要:2月20-21日,2019全球第二届自动驾驶论坛在武汉举行,本次论坛以智能驾驶 转变未来为主题。
2月20-21日,2019全球第二届自动驾驶论坛在武汉举行,本次论坛以智能驾驶 转变未来为主题。上海保隆汽车科技股份有限公司汽车电子总监李威公开发表了主题演说,演说内容如下:上海保隆汽车科技股份有限公司汽车电子总监李威我今天的主题是用机器的视角去感官世界,为什么有这样一个主题?只不过现在大多数车上的传感器,视觉也好,雷达也好,往往都是基于仿生学去做到的,而仿生最主要的主体是人类自己,但是车是一个很类似的主体。所以说道首先我们要从车本身的视角去看这个世界,而不是把人代入这个世界,所以我们未来所设计的各种传感器也好,其他部件也好,应当更加合乎车本身的特点。
那么车的特点是什么?车有很多个跟我们人类不过于一样的东西,其中最主要的是体积,大家可以想象一下现在一个小车的体积是人的多少倍。第二是速度,我们人的步行速度是十分快的,即使你骑马上自行车也就十几二、三十公里每小时,但车我告诉在德国最慢的话,如果不车速可以做几百公里。另外一个是距离,正是因为速度快了,所以说道它的距离较小。大家可以想象一下,你速度快了,那么你对距离的感官一定拒绝更加近,我们人的目视距离即使在晴天的时候,你在高速公路上看远处东西是较为模糊不清的,但车往往必须很远的距离。
对人来说,我们的眼睛更好的是适应环境阳光,我们是生活在地球上,所以我们的眼睛是为了适应环境太阳而不存在的。当我们在夜晚的时候,除非一些很类似的,比如说我们告诉有些色盲对夜晚的敏感度较为低,除了这种以外,我们在夜晚的可用距离是很短的,我们却是不像狼等生物,在夜晚有十分好的视觉。
车不一样,车拒绝全天候在道路上行经,不光是白天还是夜晚,所以你很难说我今天做到一个自动驾驶系统,一个感官系统,只拒绝他在白天行经,夜晚或者有些极端情况下我们不拒绝,这是不现实的。基于此我们有一个辨别,如果我们从仿生学的角度去看,车只不过具备两个特点,第一它有猎豹的速度,而且它不是一个冲刺的速度,它享有一个长时间跳跃的猎豹的速度。第二它享有大象的体积,它必须看得很远。我们可以想象一下,像车这样一个东西,自然界里面是没对标的,我们在自然界去找将近这样一个动物像车一样。
你们可以想要一下,一个大象以猎豹的速度向前飞驰,那是怎样一种可怕的情形。所以说道基于此我们可以看见,当我们为车去适应环境整个感官系统的时候,他一定和传统是不一样的。
荐个非常简单的例子,大家告诉我们现在很多的视觉系统是以30帧每秒去定义整个频率,为什么是30帧?有一个基本的特点它是合适人类速度的,我们当时最先定义30帧每秒的一个想法是人眼,我们的眼睛看著这个画面是无闪烁的。我们可以看见,今天大量的车上的传感器都是以30帧每秒以定的,但是我们早已可以找到很多不适应环境的地方。所以说道现在我们很多新的传感器比如说60帧每秒,或者以定的更高。
我很赞成一个点车上的传感器一定无法以人为出发点,一定有很多校验。三个层,感官层、决策层和执行层,在感官层上面,我们看见现在最主要的几个传感器有毫米波雷达、激光雷达、摄像头,热光学在夜晚可以看得很近,它和摄像头的原理是不一样的。刚才上面有几个红色的点,红色的部分我们都做到了,而且是全线产品。
第二就是车的特点是不一样的,不光有速度和体积,它环境拒绝尤其低,有很高的温度拒绝,它有陆地到水面的拒绝,我们无法拒绝一个车只在晴天行经,它一定会在雨天、在雪天行经,而我们的传感器都是曝露在外面。所有曝露在外面传感器一定要有很高的防污性,所以说道这一点也是另外一个点,我们无法把车跟手机转换,很多人会回答我,我们手机上的摄像头早已是1000万像素了,那么你车上的像素多少?我可以很坦率地告诉他大家,现在在车规级我们还是百万级别,我们目前最差的摄像头早已做两三百万像素,并没做到得更高,为什么无法做到得更高?不是因为技术约将近,而是因为可靠性,所以车对可靠性一定有很高的拒绝。这是车的另外一个特点,它拒绝全方位的监测。
我们可以看见人的眼睛是朝前看的,我们的耳朵是朝两边的,我们都不是无死角的监测,多达视角范围内,我们不会扭着脖子向后看,但车不一样,车是一个庞然大物,我们刚才说道过它是一头大象,大象上前是很难的,所以对车上的拒绝如果你必须超过360度无死角监测,那么就一定拒绝在车上装有很多摄像头,装有很多个雷达,而不是一个摄像头一个雷达,这就是车的一个有所不同,所以说道我们千万无法以人的观点去取决于车。这是我们保隆做到的雷达,这是我们做到的77Ghz雷达,我们现在另外一个特点就在于对分辨率的拒绝,车上雷达只不过更加类似于蝙蝠的耳朵,而不是人类的耳朵,蝙蝠的耳朵必须有很高的分辨率,目前来说77Ghz雷达分辨率是不高的,但事实上在未来我们到了图像雷达的区别到更加高级别的时候,车一定必须更高的分辨率,我们有布局。这是我们对汽车电子发展方向的一个辨别。第一,我们指出感官层和继续执行层面未来一定要因应,甚至更好的融合,我们有一个感觉,随着对算力的拒绝更加低,算力一定会分层。
我们不有可能把所有的算力全部集中于到决策层面,算力一定有一部分不会分配到感官层面。第二,所有点的感官层面一定会拒绝对简单信息有一个很好的辨识,还包括各种环境。整车的性能提升对传感器的拒绝更高,我说道的整车性能是由于自动驾驶的前进,所以我们拒绝对整个车的性能拒绝更高。
这个传感器叫DVS,是一个很类似的传感器,是我们保隆近期跟国内的一家高科技芯片企业一起研发的一个产品。今天我为什么要谈这样一个传感器,因为这个传感器合乎我刚才谈的那些定义,它是一个很尤其的东西,跟雷达、摄像头都不一样,甚至我们指出它有可能是另外一种摄像头,它仅次于的一个特点在于它并不是以帧这样一个传统的概念去取决于,而是以流这样一个概念,它更加合乎汽车的特点。汽车最低的特点是速度,这样一个传感器可以号召十分慢,它是高速动态的。有一个学术上的名称叫事件驱动,如果这个事件有变化,它就输入图像,如果没变化,它就不输入图像。
正是因为这样一个特点,这样一颗传感器的输入响应速度最低的时候可以超过纳秒级。大家不要把它和高速摄像头混合在一起,这样一个新的技术更好的时候是事件驱动的,它的每一个像素我们可以解读为一个电源,当世界的光线发生变化的时候,电源关上就往外输入,使它具备十分好的实时性和对这个事件的反应能力。
所以说道它是倒数高速处置。正是因为它可以对动态的物体展开处置,对传统的视觉来说如果我们要做到一些计算出来的话,我们要对构图图像做到所有的计算出来,这样就消耗了大量的算力。
算力是一个十分困难的问题,而这样一个传感器由于它是对事件动态产生变化,在前端相等它做到了基于动态视觉萃取ROI,增大了你的图像处理区域,大大提高了处置时间。第二,由于它是事件驱动,所以说道它的像素点透射不必须去累积,我们传统的摄像头都是必须累积一定的透射然后输入,那么它不必须透射累积。它还有一个很冷笑话的特点,因为它是基于事件驱动的,所以它天然输入了物体的动态矢量信息,所以说道它天然的可以去辨别这个事物体的运动方向。
大家可以想象一下,当一条路上有很多个人在回头的时候,传统的照相机都重合在一起了,你是无法去辨别的,但是如果是基于目前新的技术,由于可以对每个运动方向有一个预测,对每一个物体的运动有一个输入,它天然地就可以把所有的物体区分出去。最后它的时间可以超过纳秒级,我们也可以原作让它做微秒级。
传统上它也可以做到一些灰度值的输入。我们可以看见一个人在打电话,这个人的动作幅度十分小,你可以看见他的轮廓在大大地输入,从上面的图里基本上看到这个人在动,这个人基本上没一动,它有十分微小的动作,那么我们的事件驱动摄像头可以把这种十分微小的动作捕捉到然后输入出来,所以你可以看见他的轮廓在大大的变化,所有的变化就是轮廓的变化点。
最后一个尤其有意思,光流。我刚才说道过它可以测试物体的运动方向。吸烟的烟雾是由无数颗小粒子构成的,我们可以这么去解读,可以看见这个人在吸烟呼烟的时候,烟雾里面有有所不同的颜色,这种有所不同的颜色就是它的速度、矢量,矢量有所不同造成它的速度,即使是烟这样一种很微小的物体,我们仍然可以通过动态驱动的摄像头捉到它的整个的特征。
我们看见这两个人是纵向从里边穿出来,这是我们现在自动驾驶的一个软肋。现在不管是摄像头也好,雷达也好,甚至激光雷达也好,都有一个很可怕的问题,我们对纵向物体的敏感度是过于的,我们一般来说说道自动驾驶在中国有一个仅次于的bug是电动自行车。如果今天有一辆电动自行车以很高的速度纵向穿入的时候,我可以很坦率的告诉他大家目前所有的自动驾驶车全部都可以挂掉,没一个自动驾驶车需要在这个时候及时的对纵向穿入的电动自行车作出很好的反应,这是由它的物理特征所要求的。我们这颗摄像头因为对运动物体有很较好的输入,只要有东西纵向穿出有,我立刻可以把它逃跑,立刻可以输入。
上面和下面我们做到了一个对比,上面是某个国际知名的做到单目摄像头的企业的一个输入,下面是我们的输入,你可以看见他没逃跑,我们很好的逃跑,我们也用雷达做到过对比测试,雷达也反应不过来。在这种情况下我们目前熟知的需要反应过来的只有这一颗动态视觉摄像头。这是一个很冷笑话的案例。
这是夜晚,这个是传统的摄像头,我们做到了一些灰度处置之后,那边是低动态摄像头输入的,即使在夜晚,周边物体的轮廓仍然可以十分明晰的输入,它具备十分强劲的光线适应能力,它的动态范围十分大。我们大约测试过应当是多达120个dB,应当不会超过130dB左右,这个值我们现在还在测量中,还没几乎得出结论一个结论。为什么我今天跟大家谈这样一个DVS摄像头?第一,显然是因为保隆现在正在研发这样一个较为前沿的摄像头,我们有传统的东西,但是我们也在研发这样一个前沿的摄像头。
第二,目前自动驾驶再行往后走,我们除了传统的一些东西,只不过还源源不断的有新的技术经常出现,而所有这些新的技术,于是以一点一点地把汽车这样一台狂奔的大象的感官层空缺得更加好,它就不会狂奔的更加安全性,这是一个点。所以说道我们指出如果你是一个企业,你要去做到感官层,你认同无法说道我只说道一种或者两种,你一定要把所有这些感官层的东西按照特点去分类,制成有所不同的产品线,这样才需要在未来的市场上有竞争力。所以保隆整个的目标就是去做到汽车的眼睛和耳朵,所以我们致力于沦为汽车的眼睛和耳朵,这个是我们目前部分的产品线。
刚才的DVS是我们还在研发的东西,我们现在和国内的几家车厂早已达成协议了一些协议,预计在今年下半年就可以在国内的很多自动驾驶车上可以看见。这是我们的一些算法,这是我们的双目。
刚才也谈及究竟是双目还是单目好,只不过现在并没一个结论,很多人说道单目好,很多人说道很差,我们在单目上有我们的系统,我们在双目上也有我们的系统,但是总的来说我们这边在感官层上所有的算法都是保隆自己研发的。偷偷地讲一下双目的一个问题,很多时候我们谈及双目就有一个问题,就说到底是双目好还是单目好,只不过这里面有一个相当大的前提就是距离是以八厘米或者十厘米标准去取决于一个双目,但比如说一下你为什么要定八厘米或者十厘米?这里面有两个因素,第一个因素你还是拿人去做到转换,用我们人类眼睛的瞳距,第二点,我们想象一下汽车是一台狂奔的大象,它的双目距究竟是多少尤为适合?认同不是八。
我仍然在特别强调在汽车上如果你要做到双目一定是大双目距,一定不要做到小双目距。大双目距只不过更大的考验不是在算法上,而是在结构、材料应力,在这些材料学上,你怎么去填补这些材料学的误差给双目带给的天然的差,这是一个大的特点。这是我们的雷达,基本上我们的雷达全部都是自己研发,还包括从天线到前端到算法都是自己研发,我们目前的雷达是2T4R、3T4R的,我们也不会做到一个是4T12R,我们的目标是到2021年的时候,我们需要输入一颗实际意义上的图像雷达,如果我们有一颗实际意义上的图像雷达因应我们刚才所说的DVS的时候,在感官层我们早已超过了速度和分辨率两者的统一,这个时候我们再行去做到图像和雷达的融合,整个世界就不会不一样,我们或许需要确实现实地体现实际的三维的世界,这是我们的目标。
当我们现实地体现了实际的三维世界的时候,我们可以给车厂获取更加详尽的感官层信息的时候,在感官层上,我们早已作好了打算。这是我们雷达的一些技术优势。偷偷地说道一下,如果我们要做到这样一个东西,我们是要做到整个系统,我们也做到了一个评估系统,去评估我们整个系统否有效地。为了评估我们的产品线和产品链,我们做到了一个软件工具链,基于软件工具链,我们可以实际的评估我们的摄像头、雷达在实际场景中的应用于否符合标准。
最后总结一下保隆的思路,宗旨是让更加多人获益于汽车科技的发展,所以我们自始至终是沿着这条路在往前行进。同时在整个自动驾驶和ADAS上面,我们保隆一直是focus在感官层领域,我们期望需要把感官层做到得更佳,给更好的OEM获取更佳的感官层产品。我们的目标是沦为汽车的眼睛和耳朵,谢谢大家。
本文来源:jbo竞博-www.jfask.com