发布时间:2025-05-09 点此:481次
IT之家 12 月 26 日音讯,抱负轿车今晚发布“抱负 AI Talk 访谈实录 02”,抱负轿车董事长兼 CEO 李想、智能驾驭研制副总裁郎咸朋答复了关于智驾方面的部分问题。
IT之家附“抱负 AI Talk 访谈实录 02”部分要点内容如下:
张小珺:第一次试驾端到端是什么样的体会?
郎咸朋:我第一次试到这个车,从中关村开到了北京交通大学。开了几公里我就问周围的贾鹏,这是规矩仍是怎样做的?怎样我觉得开得这么好呢?他说一句规矩都没写,全都是系统依照咱们给它的数据自己练习出来的。
咱们开车都知道,假如前面有个车刹停的话,它是要缓慢减速,乃至还再抬起一点刹车,有这样十分舒适的刹车进程。这个进程咱们团队在规矩阶段写了很长时刻的代码,都没有到达一个彻底拟人、处理一切场景的表现。
但我第一次试驾端到端,它的纵向就现已比之前试过一切的都要好的状况,这才用了短短不到 15 天。所以我觉得那时分建立了一个决心,便是端到端必定能做出来。并且一旦它做出来,就必定会比现在一切的智能驾驭软件都要好。
张小珺:已然端到端是灵丹妙药,为什么上一年不上?特斯拉上一年就上了,你上一年在干嘛?
郎咸朋:咱们在等,等满足的数据和算力,等到了咱们就能上了。
端到端 VLM 大模型其实终究的实质是用人工智能来做主动驾驭。人工智能的三个要素:算法、数据和算力。这三个要素有必要全都完备。咱们是本年是预备好了,所以咱们能做这个作业。
抱负 AD Max 车型的销量,上一年起来了之后到本年头(高质量练习)数据量到达 10 亿(公里)左右规划,这是一个根底。第二是算力根底,本年头咱们算力也到了 5EFLOPS。再加上第三步,便是端到端的一些预研也有必定作用,所以到本年头是天时地利人和,能够做这个作业了,上一年咱们还在补课的一个进程。
张小珺:为什么许多企业的端到端是两个模型,而不是 One Model?
郎咸朋:这个是算法和理念的问题。咱们要做端到端时就给自己定了一个方针,必定要用纯数据驱动的方法来做这件作业,而不是结合了之前的规矩来做,所以说它的功用上限会十分高。
张小珺:为什么抱负是端到端 + VLM,不像特斯拉只用端到端?你们对自己的端到端不行自傲吗?
郎咸朋:不能这么讲,咱们在做技术计划时充沛参阅了世界上一切的先进计划,但一直无法处理一个问题是,当一套主动驾驭或智能驾驭系统,它作业时假如遇到之前没有见过的场景,应该怎样处理?咱们以为便是端到端 + VLM,便是系统 1 + 系统 2 的方法,很好地仿照人类大脑的作业方法。
张小珺:特斯拉没有用激光雷达,你们为什么要用?
李想:许多人不太理说明:为什么要保存激光雷达,仍是为了安全。是不是由于你技术欠好?不是,我国和美国是不一样的,假如你常常在我国晚上夜路开车,你会看到有尾灯坏了的大卡车、乃至或许尾灯坏的大卡车会直接停在主路上,至少咱们今日的摄像头,能够在深夜里没有光线下看到的间隔,其实只需 100 米出面。
可是激光雷达,在没有任何光线的状况下是能够看到 200 米的。这就能够协助咱们完成 130 公里 / 小时的 AEB 主动紧急制动。那我觉得这个是十分重要的,由于咱们是个面向家庭的车,每个人生命安全都十分的重要,所以这是咱们持续保存激光雷达底子地点。并且后边的车型仍然会保存。我信任假如马斯克在我国,在深夜里不同的高速开过车,他也会挑选把前面的一颗激光雷达保存下来。由于特斯拉关于安全同样地注重,仅仅他要在这个环境里来看到。
张小珺:抱负急进的用只需一个模型的端到端,其他车企还在用两个模型,为什么?
李想:许多时分或许跟咱们有一些比较好的外脑有关,像王兴、陆奇博士,他们会给咱们带来许多启示。有一次陆奇博士跟咱们讲,你们应该考虑一下人是怎样作业的?我觉得这个其时对咱们协助很大。
本年头我还逼着智驾团队去美国,他们在不同的城市开 FSD V12。另一方面咱们研讨作业也在进行,那时现已在发端到端 + VLM 的各种研讨论文了。回来今后我觉得要么你做这个,要么咱们就不要再做主动驾驭了。今日你靠这些规矩上来做的,跟请个供货商做出来的东西有啥差异?没有啥差异。
我压服郎博他们很重要的一点,我说你们常常处理了一个 Corner Case(极点状况),又呈现三个其他的 Corner Case。你们一辈子都在处理 Corner Case,处理不完。
张小珺:咱们都说抱负做智驾是投入最晚最慢的,你怎样看?
郎咸朋:2018 年 1 月我参加抱负时,跟李想讨论过这个问题。什么才是决议终究智能驾驭或主动驾驭完成的最关键因素?咱们其时聊的便是数据。人才能够活动、算法能够提高、算力也十分重要,可是只需有健康的资金、合理的资金运用也是能买得到的。
那么最重要便是数据,数据它是买不到的,有必要自己有这样一个十分高质量、规划十分大的数据,才能够做好主动驾驭。所以咱们要依照节奏来做主动驾驭,刚开端咱们要先把车造好、把车卖好,然后堆集更多的资金、人才和数据,到了必定时刻点再很多投入,去到达更好的主动驾驭的作用。其实从现在成果上也是能看出这一点的:咱们主动驾驭的节奏是十分好的。
张小珺:什么时分抱负意识到,智驾关于卖车是有协助的?
郎咸朋:从实践表现来看是从本年开端的,本年智能驾驭的确关于销量有十分好的促进作用。咱们 2 月 AD Max 的交给量占比只到 20% 左右,然后到本年下半年超越 50% 了,这是实打实的成绩。前期咱们以为主动驾驭是一个功用,它跟座椅加热没有大的差异,并没有处理用户日常出行的舒适性。直到现在咱们用 AI 来做主动驾驭,端到端 + VLM 真实解放用户长时刻的驾驭疲惫。当咱们能到达归纳 MPI(城市 + 高速归纳接收路程)100 公里、几百公里时,咱们就真实愿意为主动驾驭买单了。
张小珺:抱负提出有监督智能驾驭,跟主动驾驭 L1 到 L5 传统分级有什么差异?
郎咸朋:这儿边其实表现咱们对主动驾驭研制的思路不同。之前许多人以为 L3 主动驾驭是 L2 辅佐驾驭的连续,只需把 L2 辅佐驾驭的场景越做越多,总有一天能无限趋近于 L3,乃至或许就能够做到 L3。
但在咱们看来,L3 或许有监督智能驾驭,它并不是 L2 的连续,而是 L4 或许主动驾驭的先导程序。实践上咱们是锚着未来的主动驾驭才能去研制、去生长和迭代的,而不是沿着曩昔一套用 L2 的思路,去做现在的主动驾驭。
张小珺:你说主动驾驭是才能、辅佐驾驭是功用,两者实质差异是什么?
郎咸朋:功用是预设条件,才能是应对一切条件。你不或许尽头一切的预设。
功用的话,仍是用上一代的这种软件 1.0 计划来做主动驾驭。最大的问题是在研制之初,就要明晰地设定一切条件、一切鸿沟,以及终究确定性的成果。这在主动驾驭里是十分困难的。
才能的话,是用人工智能的方法来做主动驾驭。当咱们把主动驾驭当成才能来开发,从最实质考虑人是怎样学会开车的。最开端人去驾校学习,把握根本驾驭技术再考试。考完把握根本才能之后,作为实习司机一边实践一边提高才能,渐渐地生长为老司机。咱们系统 1 + 系统 2 的计划,让主动驾驭系统具有这种才能去迭代和生长,跟着数据量的增加,它会渐渐地让功用随之提高,这个便是咱们常常说的规划效应。
张小珺:你们验证了主动驾驭的规划效应吗?
郎咸朋:咱们现已验证出来了。这不是咱们创造的,一切的大模型使用都契合这种规则,也便是说数据规划和数据质量的增加,会带动功用的增加。并且功用增加是接近于线性的,这便是咱们用大模型最实质的优点。
张小珺:有监督智能驾驭阶段,抱负交给给用户的产品长什么样?
郎咸朋:全场景的、一体化端到端产品。要想完成有监督智能驾驭,一个条件是完成车位到车位,也便是处理最前面一百米和最后面一百米。曾经智驾是从干道开端,现在能够从小区车位开端,然后包含园区路途、泊车、城市路途,还有高速和收费站 ETC 都会悉数打通。
高速城市全场景晋级端到端 + VLM,以及立异的 AI 推理可视化的交互,将在近期随 OTA 全量推送给一切的 AD Max 用户。
张小珺:L3 什么时分完成?
郎咸朋:依照现在的端到端 + VLM 这套系统,才能持续迭代的话,咱们是有期望在 2025 年去完成 L3 的。
张小珺:面临李想年头关于智驾的发火,你的工作危机是什么时分免除的?
郎咸朋:我觉得到现在还没免除,由于还没有做到极致。咱们的方针是本年归纳 MPI(城市 + 高速归纳接收路程)做到 100 公里接收一次的才能。这个接收不是安全接收,不是说你要撞车了才接收,是用户觉得车开得不契合体会、不舒服的接收。到下一年、后年,咱们会逐步提高至 500 公里、乃至 1000 公里以上。渐渐让咱们对智驾越来越自傲、越来越依靠。
张小珺:要完成这样的方针,需求储藏多少算力和数据?
郎咸朋:要到达 500 公里的归纳 MPI(城市 + 高速归纳接收路程),估计需求 2000 万 Clips(视频片段)的水平。假如 2000 万 Clips 从不到 5% 的老司机去挑选,这儿隐含的数据量,要到达 50 亿公里乃至上百亿公里的水平。
相关推荐