特斯拉全自动驾驶:正在全速超越人类!
很久没在雪球发长文了。我最近一直在别的平台发英文分析,然后被人转发回国。今天发一个雪球独占的中文分析长文,给国内关注我的朋友汇报一下我这段时间的研究结果。总的来说,我认为我们到了一个关键点——FSD正如身边呼啸而过的火车——曾经离得很远我们对它不屑一顾,如今它在身边飞驰而过,才明白未来再也没有机会追上。
一、FSD的使用量变化
我们知道FSD 12.3在体验上实现了重大飞跃,而FSD 12.5在FSD 12.3的基础上又将模型扩大了5倍,实现了又一次的巨大进步。那么,我们有什么方法来量化这种进步带来的影响吗?我使用了来自“FSD社区追踪器”的数据,基于相同测试员人群在不同版本中人均每日驾驶里程的相对变化来进行跨版本分析,结论是惊人的——用户的需求似乎被“激活”了。我们可以看到,在过去很长时间里,在v10-v11之间,人均每日里程基本上没有变化。而在v12.3.6中,用户的每日里程上涨到了v10的2.44倍,而在v12.5中,用户的每日里程上涨到了v10的3.31倍,同时是v12.3.6的2.52倍。
这就是为什么我常说对AI的分析不能“刻舟求剑”。很多人都说,马斯克搞FSD搞了这么多年,每年都是说明年,FSD仍然会犯很多低级错误。永远是明年复明年,可明年何其多?这种感受其实是准确的。在过去很多年里,FSD的进步其实并不明显,用户的使用量其实也一直没有起色。然而,AI的需求往往就是一个“激活函数”——它一直在蓄力,由量变产生质变,直到人们有一天突然发现——哦?好像终于能勉强用一用了,于是他们对FSD的观念就会开始突然产生天翻地覆的变化。
这也是为什么我认为大多数人不适合投资科技股。科技的发展就是如此——技术是持续进步的,但是体验却是阶梯式变化的。如果人们不关注技术原理的变化,仅通过外在的体验来进行趋势预测,那么科技行业对他们来说就是完全不可预测的高风险行业。昨天还奄奄一息的技术,今天可能就生龙活虎。但是实际上这种风险并不是科技股的本质,技术的发展一直是渐进的,但太多人不了解,或者选择忽视。投资科技股最大的风险,就来源于刻舟求剑的傲慢。
二、FSD的渗透率变化
关于FSD的渗透率(take rate),大多数人引用的数据有两个:a. 来自Troy Teslike在2022基于约21,000份调查问卷得到的数据,认为FSD在北美2022的Q3渗透率为14%;b.来自YipitData的3500份抽样调查中,对FSD在北美免费试用的转换率的统计结果,认为只有2%的人继续订阅了FSD。这些数据给特斯拉的投资者们带来了很大的困惑,因此在这里我想解释为什么他们的数据有问题,并且给出我算出的相对正确的估算。
事实上,Troy自己在他2022的报告中就承认了他这份报告的短板:“对于在交付之后产生的FSD购买,我没有任何数据。这可能是我这份报告最大的局限性。”可问题是,特斯拉的每一辆车在硬件上都是支持FSD的,因此不仅可以在下单时选装,也可以在后期下单后再安装软件,因此这就使这份数据无可避免的对FSD的订阅购买率产生了低估。根据我的估算,同期FSD的实际订阅购买率在23%以上,显著的高于Troy的估算。而另一个方面,YipitData是根据信用卡收据来确认是否续订FSD的,后来他们公司公开发表声明,承认了他们的方式在技术上有严重问题——大量续订FSD的用户并没有收到信用卡的收据。马斯克也在推文中公开辟谣——表明实际数据远比2%要高。
那么,现在FSD的实际订阅率是多少呢?特斯拉官方仅在2022的第四季度公布了FSD的用户总量,即截至2022年12月31日FSD车队大约有40万。根据特斯拉官方公布的交付数据,北美在2022的Q4累计交付了134万辆HW3的车型。同时,根据官方公布的FSD里程数据,FSD车队每月行驶约1100万英里,因此可以推算出平均每个FSD用户月均行驶约30英里。注意这个数据并不代表实际上用户的使用量,因为有很多人天天用,还有一些人从来不用,我们在这个仅计算一个均值。
另一方面,根据我在“一、FSD的渗透率变化”中的估算,FSD v12.3.6用户的行驶里程大约是v10.69.25.2用户(接近2022年第四季度)的2-3倍,这表明当前每辆车的月行驶里程大约在60-90英里之间。由于免费试用带来了100万的非付费用户,他们极大程度的让行驶里程虚高,因此我采用了免费试用前的数据。在免费试用前,根据特斯拉官方公布的数据,FSD车队每月行驶了约8300万英里。结合60-90的人均每月里程,可以推算出FSD车队规模大约为92万至138万辆车。根据交付数据,截止2024年Q2,特斯拉在北美累计交付的HW3+车队约为235万辆,这意味着当前FSD在北美的渗透率大约为39%-58%(将近一半)。
三、马斯克实现了他的“承诺”
马斯克曾表示v12.5会有重大的进步(5-10倍),同时他还说在8月份计划将进步约2倍。这样的承诺经常被人拿来嘲笑,因为从“FSD社区追踪器”上我们看不出这样的进步。然而,这很大程度是因为FSD上的测试员群体的“周转率”极高。两个相邻的版本中,可能只有10%的测试员维持不变,而其它90%的人都变了。不同的人群对于接管的倾向是完全不同的——有经验的人更喜欢晚一点接管,而经验不足的人更喜欢早一点接管——这很大程度上影响了“FSD社区追踪器”的数据准确率。如果在“测试人群”上控制变量,我们会得到截然不同的结论。
由图可见,我们可以看出马斯克某种程度上来说,已经兑现了他的承诺。v12.5.1.3 相较于 v12.3.6 在整体表现上提升了约 14 倍,在安全性上提升了约 4 倍。而仅在本月(8月),FSD 12.5.X 已经在整体表现上提升了约 1.4 倍,在安全性上提升了约 2 倍。马斯克回复了我的这一分析,他使用“逃逸速度(escape velocity)”这一词来描述FSD当前的进步速度。
四、FSD的安全性和人类处于同一数量级
很多人都错误的用“接管率”与人类的“事故率”进行对比,在我来看这是极其不合理的。北美人类平均每3000英里就会闯一次红灯,然而这些人每67万英里才会被卷入一场交通事故。每一次闯红灯,都等同于FSD的一次“安全性接管”,但是需要安全性接管的场景,绝对不等同于立马发生交通事故。为了尽可能准确的评估FSD当前的安全性,我做了以下分析。
已知美国交通事故中有71%是两车碰撞。为了简化估算,我们假设所有事故都是两车碰撞。人类事故的概率等于一名驾驶员涉险且避险失败的概率乘以另一名驾驶员在同一安全事件中涉险并避险失败的概率。注意如果一名驾驶员避险失败,但另一名驾驶员成功避险,则事故不会发生。涉险时主动方被动方避险成功率可能不同,需要注意的是,假设成功率相同是对人类的最好预期。在事故率已知的情况下,主动/被动避险成功率相同时,总体涉险次数是最少的。如果概率不同,那么人类的实际“涉险概率”只会更高。在这里,我们对人类做最好的假设,也就得出人类事故的概率即为单个驾驶员参与安全事件且避险失败的概率的平方。
同时,我们知道美国人类事故每670,000英里发生一次,这意味着每英里的人类事故概率为1/670,000。也就是说,每英里单个驾驶员参与到安全事件并避险失败的概率大约为1/818.5。无论谁是责任方,车辆参与安全事件并需要避险的情况与FSD驾驶汽车时需要人类安全性接管的情况完全相同。
根据之前的讨论,假设FSD的每次安全接管之间的里程为700英里。那么,我们可以估算FSD每英里的事故概率为FSD每英里参与到安全事件且独立避险失败的概率(需要安全性接管)乘以人类每英里参与同一安全事件且避险失败的概率,即1/700 × 1/818.5 = 1/572,950。这意味着如果FSD在无监督的情况下与人类一起行驶,它大约每57万英里就会与另一个人类发生一次事故。这与人类驾驶员的安全性大致处于同一数量级。我将NHTSA报告的数据与FSD的数据根据时间对齐到一起,我们可以很明显的看到,FSD正在实现对人类的反超。
五、FSD当前的短板
有了这些数据,那么为什么FSD还没有发布无人车呢?FSD在统计数据上实现和人类相同的安全性,并不代表每个人都可以得到相同的安全体验。事实上,FSD和人类最大的不同在于,它犯错的波动率要远远高得多。
具体来说,人类的犯错主要是由分心、疲劳、鲁莽等造成的。虽然在不同司机身上有显著不同,但总体来说,整个车队的安全事件在不同时间、不同地点的分布相对均匀。同时,人类的智商对于驾驶来说是过剩的,所以那些相对复杂的驾驶场景并不会显著提高人类发生事故的概率,这就导致人类驾驶安全性波动率并不高。
相反,对于AI来说,它从不会有个体差异,但是基于不同地域数据密度不同、多样性不同,AI在不同时间、不同场景下的犯错概率波动极高。同时,智商仍是目前AI能力的瓶颈,因此在相对复杂的场景下,AI会显著的犯更多的错误。这带来的结果是,目前的FSD在一些情况下的驾驶安全性已经数倍于人类,在另一些场景下则明显弱于人类。虽然平均数据来看已经和人类水平相同,但是最坏情况比人类要差。但一现象并不会持续太久,以目前AI的进步速度来说,到明年年底时FSD可能会在最差情况下依然超过人类,而届时它的平均水平可能已经是人类平均水平的5-10倍。