首页 > 手机活动 > 手机活动 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

手机活动更多>>

物业费或迎来“停收”?2025年新规发布后,未来将进行统一办理? 黑河市五大连池生态环境保护综合执法队公开招聘公益性岗位人员公告 vivo X200 Pro mini上手:mini和Pro体验独一份 职高之后的进阶之路:再上大专,重塑未来 竞争享界S9、蔚来ET7?沃尔沃ES90纯电轿车将于3月初发布 deepseek预测房价五年内下跌最大的三个城市有你家吗 日产计划2025年推出奇骏PHEV插混版,采用三菱技术 上汽MG打破常规,重新发布ES5,吹响转型号角 极狐汽车与蔚来能源合作深化,充电网络全面升级 捷达品牌未来20个月推多款新车,包括VA7、VS8以及5款新能源车 长期主义、量体裁衣、协同创新——三大法宝助力金旅客车构建中国客车出口新范式 比自动驾驶更抢戏,2025年智能座舱爆了? 汽车行业深度变革之际,一汽丰田连续保持正增长意味着什么? 长安马自达:内卷市场下的价值初心 长安马自达:内卷市场下的价值初心 呼声很高,汽车首购补贴能不能有? 他,因汽车人才工作,获评“全国离退休老干部先进个人” 10万元以下,这几款车值得买 到外滩看“岛屿”,从约翰·莫尔绘画奖走出来的80后艺术家 他是顶级网球赛事的穿线师,为小德费德勒拍子穿线,如今在沪有了自己的工作室 三小时搜索量猛增48%!沪上旅游企业着手策划赴台团队游新产品 2024中国游戏产业IP发展报告,文化强国战略与游戏产业发展 花江峡谷大桥,合龙!“地球裂缝”上的桥,实打实“横竖都是第一” 全球看春晚启动!中央广播电视总台“春晚序曲”美国专场活动在纽约举行 6.28万元 江铃新款羿驰05和易至EV3 PLUS上市 年销量突破50万辆 理想汽车凭什么? 携手一汽红旗,宁德时代巧克力换电香港首站正式动工 定位纯电中型车 比亚迪秦L EV申报图曝光 时隔八年,再续前缘:广汽华为合作打造新品牌加速落地 2024乘用车数据全出炉:总销量、自主、新能源都有重大突破