当前位置：首页 > 资讯 >

特斯拉自动驾驶的底层逻辑(2)

2023-05-20 来源:飞速影视

01
“云端司机”的神经网络
纯视觉自动驾驶方案是特斯拉的独门绝技，但需建立对计算机视觉深度训练之上。
计算机视觉是一种研究机器如何“看”的科学，当人类看到一张图片时，能清晰辨析图片里的事物，比如说美丽的风景照、或者一张小狗的照片，然而计算机看到的却是像素（pixel），像素是指由图像的小方格组成的，这些小方块都有一个明确的位置和相对应的色彩数值，计算机“记住”的就是这堆数字字符，而不是具体事物。
如果想让计算机能像人类一样快速准确识别出图片里的事物，机器也有了人工大脑，来模拟人脑处理加工图像信息过程，分为输入层、隐藏层、输出层，里面有许多人工神经元，可视作人脑初级视觉皮层中的锥体细胞和中间神经元。
整个训练过程亦可类比小孩看图识物，通过一次次输入、对比、纠正，完成机器图像认知。通常在训练初期，人工神经网络识别结果的准确度非常低，输出结果和实际值相似度可能只有10%；为了提高准确度，需要再将两者误差从输出层反向传播至输入层，并在反向传播中，修正神经网络隐藏层的参数值，经过上百万次的训练，误差逐渐将收敛，直至输入和输出端匹配度达到99%。

上述过程是理解特斯拉自动驾驶AI的关键，只不过特斯拉开发的人工神经网络专注于驾驶领域，做一名专职云端司机。对它来说，最好的学习材料就是行车数据，大量、多样化、来自真实世界的驾驶训练数据集（training dataset）是自动驾驶AI能应对各种路况、交通问题的百宝书。
在影子模式的支持下，特斯拉全球百万车队每时每刻的行车数据都成为这位云端“老司机”提升自身驾驶能力的养分。时至今日，特斯拉Autopilot已经能瞬间完成道路上各种动静目标、道路标识、交通符号的语义识别，反应速度甚至比人脑条件反射更快。

除了应对日常驾驶场景外，AI司机还需要处理一些较为少见的长尾情况（Corner cases）。在2020年Matroid机器学习大会上，卡帕西以交通指标STOP为例，讲解Autopilot应对这些长尾情况的具体方法。

1 2 3 4 5 ...7 查看全文

特斯拉自动驾驶的底层逻辑(2)

雏逻辑：来自幸运逻辑

驾驶我的车

失去贝拉特斯的波利斯

学会驾驶

无人驾驶

超速驾驶

X驾驶员

亡命驾驶