作者| 车东西团队

编辑| 晓寒

刚刚,特斯拉又一次震荡了全体汽车行业!

本日上午举行的特斯拉人工智能日(AI Day)中,特斯拉亮出“完备自动驾驶功能(FSD)”背后的大脑——特斯拉超级打算机Dojo。

特斯拉造出人形机械人身高1米7最强AI计算机也来了附168页PPT

Dojo肩负演习AI算法的重任,它内置特斯拉自研AI芯片D1,单颗D1拥有500亿个晶体管、362TFLOPS的峰值算力(BF16/CFP8),功耗不超过400W。
由3000颗D1芯片组成的特斯拉ExaPOD算力更是高达1.1EFLOPS!

而在此之前,特斯拉乃至还用5760个英伟达A100 Tensor Core GPU,组装了一台1.8EFLOPS算力的超级打算机,排名天下第五。

没错,特斯拉早已经成为一家AI打算公司。

如此强大的算力,肯定是做事于特斯拉的FSD功能。
而当前,特斯拉的城市道路L2级自动驾驶已经开放小规模测试靠近1年,还没能向大众开放。
与此同时,今年美版特斯拉Model 3/Y取消毫米波雷达,采取纯视觉感知,FSD真的靠谱吗?

本日在现场,特斯拉AI高等总监Andrej Karpathy和自动驾驶软件总监Ashok Elluswamy等几位特斯拉高管,把纯视觉感知实现自动驾驶这件事讲清楚了。
可谓是把特斯拉自动驾驶的技能上风进行了一次大公开,干货非常之多。

发布会结束前马斯克还放出了一个彩蛋,特斯拉要“造人”了!
特斯拉机器人将在明年量产,它将替代人类去做危险的、重复的、无聊的任务。

与其他机器人不同,名为Tesla Bot的机器人形状与人非常靠近,并且还拥有人类级的手和事情能力。
马斯克表示,它将在2022年量产。

总结来看,特斯拉的AI Day可谓是干货十足,并且也给出了Tesla Bot这个one more thing,以下是活动干货。

没空看特斯拉AI Day?没紧要,我们已经帮你把PPT下载好了。
关注公众年夜众号车东西(ID:chedongxi),对话框回答【特斯拉PPT】下载。

一、推自研AI演习芯片 机柜算力达1.1EFLOPS

比既定时间延迟半小时以上开始,已经是特斯拉开拓布会的“老传统”了。
AI Day会场外停放着一辆最新款Cybertruck车型,目测会场外有数十人参不雅观。
但现场直播的媒体表示,本日现场参会人数并不算多。

会场外停放了一辆的Cybertruck

发布会开始时,已经比操持延后靠近40分钟,特斯拉首先秀出了最新版本的FSD。
无保护路口左转、没有车道线的村落庄道路、避让行人、路口停车、识别红绿灯……这些动作特斯拉都做得非常闇练。

特斯拉AI Day活动前的FSD展示

比较于2019年特斯拉FSD的演示视频完备脱手驾驶,今年的演示视频中特斯拉的驾驶员用一只手扶着方向盘,这表明特斯拉的自动驾驶能力仍在L2级,并非想象中的“完备自动驾驶”那样美好。

特斯拉FSD视频的变革,从手松开逐步转得手握方向盘

从技能层面出发,特斯拉如何实现自动驾驶,如何产生演习数据、如何在车内运行以及如何迭代算法便是实现自动驾驶的四大核心问题。

而在本日的AI Day发布会上,最重磅的信息莫过于特斯拉发布了演习自动驾驶的超级打算机,也便是特斯拉如何不断迭代算法。

据Dojo项目卖力人Ganesh Venkataramanan先容,几年前,马斯克几年前曾哀求特斯拉工程师设计一台超高速演习打算机,这便是特斯拉启动Dojo项目的缘故原由。
Dojo超级打算机将于明年投入运营,基于大量视频演习AI算法。

特斯拉D1芯片展示

Dojo是一个通过网络构造连接的分布式打算体系构造,拥有一个大型打算平面、超高带宽和低延迟、大型网络分区和映射等等,并有一个新编译器来减少局部通信和全局通信,可扩展性强。

该超算内置特斯拉自研AI演习芯片D1。
D1芯片采取7nm工艺制造,单芯片面积达645mm²,包含500亿个晶体管,BF16/CFP8峰值算力达362TFLOPS,FP32峰值算力达22.6TFLOPS,热设计功耗(TDP)不超过400W。

特斯拉D1芯片的各项性能

该芯片具有GPU级别演习能力和CPU级别可控性,可实现50万个演习节点无缝连接。
由此特斯拉提出由25个D1芯片组成的演习单元(tile)。

一个演习单元的接口带宽每秒36TB,算力达9 PFLOPS,采取了集中供电和散热设计,散热能力15kW。

特斯拉芯片阵列

拥有120个演习单元、3000颗D1芯片、超过100万个演习节点的特斯拉机柜模型ExaPOD,其BF16/CFP8算力高达1.1EFLOPS。

特斯拉芯片阵列展示

其分布式系统是分区块的,Dojo处理单元DPU(Dojo Processing Unit)是一个可根据运用需求调度大小的虚拟设备,包含多个D1芯片和接口处理器。
特斯拉编译器引擎可自动将实行指令映射到DPU上,无需人工操作。
特斯拉打造了一整套软件堆栈。

Dojo软件栈架构

Ganesh说,特斯拉Dojo是史上最快的AI演习打算机。
同等功耗下,Dojo超算比现有打算机性能提升4倍、能效提升1.3倍、碳足迹只有原来的1/5。
此外,特斯拉预报下一代Dojo超算性能将再提升10倍,不过它并没有透露详细实现日期。

在Dojo发布环节的末了,Ganesh提到特斯拉正在大力招募人才以推进AI研发。

而在特斯拉造出自己的超算之前,也已经利用英伟达GPU搭建了一个天下排名第五的超级打算机。

特斯拉超级打算机

这个超算利用了720个节点,每个节点8个英伟达A100 Tensor Core GPU(共5760个GPU),实现了1.8EFLOPS的性能。

英伟达A100 Tensor Core GPU

由此可见,无论是特斯拉的Dojo,还是此前用英伟达GPU组装的超算,都能够跻身AI打算领域的前几名。

问答环节,马斯克回应称,开拓所有这些技能非常昂贵,以是他不愿定如何实现开源,但对将AI技能授权给其他汽车公司持开放态度。

二、破除纯视觉感知的所有不靠谱 千人团队标记数据

特斯拉AI高等总监Andrej Karpathy上台,讲述了特斯拉是如何通过视觉感知,再进行方案掌握,实现自动驾驶的。

他说,特斯拉通过车身四周的8枚摄像头,形成三维矢量空间,感知出车身周围的环境。

人眼视觉信息通报与特斯拉AI视觉信息通报比拟

Karpathy说,设计自动驾驶AI视觉时可以逆向工程成人脑识别图像。
例如在为汽车设计其“视觉皮层”时,特斯拉根据眼睛如何感知生物视觉进行建模。

特斯拉的8个摄像头都采取1280960分辨率12bit HDR图像,以每秒36帧的速率采集,就能够实现良好的感知效果。

车身上的八个摄像头搜集成三维的“向量空间”

经由神经网络打算时,自动驾驶电脑会不断缩小分辨率,同时提升通道数量。

除了识别车辆,特斯拉还会识别人、红绿灯等多种物体,因此特斯拉开拓了多人需学习的HydraNets网络。
HydraNets网络共有三个特点,第一是能够高效测试;二是能够单独微调每个任务,同时还能特色缓存与加速微调,打破再现的瓶颈。

当前,许多车企采取高精舆图合营传感器,实现感知领悟,但是这种办法并不能让车辆精确自动驾驶。
因此,特斯拉开拓了Occupancy Tracker,此时特斯拉碰着了两个问题,其一是多传感器领悟算法并不精密(例如一辆超长的挂车,单个摄像头无法全部感知到),二是图像空间并非真实的物理空间。

特斯拉采取Transformer算法用于预测间隔。
实际测试创造,在一段两侧都停放车辆的城市道路上,多摄像头感知的准确性和稳定性都要强大很多。

特斯拉认为,在自动驾驶决策方面共有两个难点,第一在于空间是非凸的,第二是高维度的。

特斯拉自动驾驶软件总监Ashok Elluswamy表示,特斯拉采取稠浊决策系统,首先让感知数据通过向量空间的粗搜索,然后经由连续优化,末了能够形成平滑的运动轨迹。

在一个案例中,车辆判断可以向左变道,但是左侧有正常行驶的车辆,此时如果溘然变道,车内的乘坐感想熏染不佳,同时也威胁交通安全。
因此,特斯拉会在1.5毫秒内进行2500次变道机遇搜索,终极能够选择一条最安全且最舒适的变道机遇采纳变道方法。

在另一个案例中,特斯拉行驶到了一个超窄路段,两辆车无法同时通畅。
第一辆对向来车是一辆SUV,车主主动让行。
因此特斯拉判断连续前行。
但是前行一段间隔之后,又创造了另一辆对向来车。

特斯拉FSD通过繁芜路况

此时,特斯拉选择避让停车同时,对向车辆同样选择了停车避让。
因此,特斯拉果断改变了驾驶决策,再次起步通过了这一起段。

随着自动驾驶研发韶光的增长,特斯拉须要为更多的物体标记标签,现在已经有1000人的数据标签团队,打造数据标签和剖析根本举动步伐事情。

并且,从之前的2D图像标签,进化为现在的4D空间+韶光的标签。
乃至能够在做一次标签之后,一个摄像头内的标签化图像,就能迁移到其他摄像头。

特斯拉建立4D空间+韶光

特斯拉还能够在感知过程中重修道路,通过标记车道线和其他物体。
与此同时,特斯拉还会网络同一路段的数据,通过多辆汽车采集数据合并在一起,终极实现更精确的重新建图。

终极,车辆能够流畅地标记路旁物体,在准确识别物体之后,才能够实现流畅的城市道路自动驾驶。

今年5月,特斯拉面向美国市场发卖的Model 3/Y车型取消了毫米波雷达,不过在雨、雾、雪等能见度较低的景象下,摄像头能看清楚吗?答案是能。

仍旧依赖短片记录驾驶场景,特斯拉每周能够得到1万段类似的恶劣环境短片,通过自动标签终极实现精准的间隔感知。

特斯拉FSD可应对多种恶劣景象

同时,特斯拉也在进行Autopilot仿真测试,特斯拉称其为带有Autopilot的游戏。
在仿真测试中,电脑能够精确标注、支配虚拟的车辆。
仿真测试用于仿照在生活中难以创造的情形,例如在高速道路上有人行走怎么办?如果有太多人如何标签?停车场如何避让其他车辆?

特斯拉进行仿真测试

在仿真测试中,工程师可以测试这些极为分外的情形。
仿真测试有多项必要准备事情:第一是传感器仿照要和真实情形基本相似,第二是要真实的渲染,第三是要有基本真实的场景,包括车辆、行人,特斯拉乃至还造了超过2000英里的路。
第四是要有可扩展的场景,包括白天黑夜平分歧场景;第五还能通过真实场景重构,在仿真测试中测试算法。

到目前为止,经由特斯拉车内网络演习的图像共有3.71亿张,还有4.8亿个标签。

接下来,除了人、车等动态物体,特斯拉还将检测静态物体、道路拓扑、更多车辆和行人以及强化学习,让纯视觉感知更精准。

三、机器人新品亮相 能代替人事情

在一个简短的机器人装扮服装舞蹈后,马斯克宣告2022年推出特斯拉机器人Tesla Bot,它将替代人类去做危险的、重复的、无聊的任务。

特斯拉机器人展示

马斯克先容到,该机器人将有5英尺8英寸高(约合1.73米),体重有125磅(约合56.7千克),可抱起45磅重的货色(约合20.4千克),也可以通过举重硬拉姿势举起150磅的重物(约合68.0千克)。

特斯拉机器人参数

它的四肢利用40个机电实行器进行操作,并通过力反馈感应系统来实现平稳和敏捷双脚行走,最快行走速率可能为5英里/小时(约合8公里/小时)。

马斯克说:“如果这机器人‘造反’了,你还是能跑的过他的。

此外,这款机器人的手与人类的手非常类似,有5根可以灵巧弯折的手指。
马斯克称它具有“人类等级”(Human-Level)的手,换句话说它有潜力代替人类实行一些精确操作任务。

特斯拉机器人布局

特斯拉还操持将包括FSD Computer在内的硬件系统植入机器人体内作为后者的“器官”,并以演习自动驾驶系统AI的办法演习机器人的AI,让这款机器人能够成为多面手。

马斯克称,特斯拉推出这款机器人的初衷是希望它能代替人类完成一些呆板、危险、重复性强的事情,他希望今后人类不想干的事统统交给特斯拉机器人来干。
当然了,人的创意是无限的,马斯克推测人们可能会发掘出连他都预见不到的用场。

不过,这款机器人恐怕要等明年才能上市了。
马斯克称,为了担保特斯拉机器人功能性,他们还须要用Dojo演习场对它进行严格的演习。

结语:特斯拉离自动驾驶更近一步

如今,AI技能已经是实现自动驾驶的关键,从传感器感知完成后,打算、决策所有流程都须要AI技能的加持。
节制AI技能,才能让自动驾驶更靠谱。

如今,特斯拉造出自己的AI超算,演习AI模型将不断提速,通过更多的场景、案例,终极实现更安全的自动驾驶功能。