盖世汽车获悉 日前,小米汽车正式推出Xiaomi Auto World Model全新框架,将三维重建与视频生成进行深度耦合。与传统“重建+生成”简单串联的路径不同,该框架让两者在结构上互相约束:重建侧提供几何锚点,为生成“打地基”;生成侧补全未观测区域,为重建“扩边界”,共同抑制长时序漂移。
世界模型被视为辅助驾驶的“大脑预演系统”,能够基于历史与当前观测,预测环境下一步演化,帮助车辆应对暴雨、落石、逆行等低概率高危场景。此前行业两条主流路线——重建与生成(能预测但易漂移)——各自存在短板。小米的一体化架构尝试将两者优势融合。
在技术实现上,重建模块WorldRec采用稀疏三维锚点表征,替代传统逐像素稠密高斯方法,通过多视角多时刻特征聚合与可见性加权融合,实现10秒视频重建仅需10秒。生成模块WorldGen经两阶段训练,仅需4步去噪、0.19秒生成一帧,支持最长1分钟视频,可模拟罕见动物闯入、极端天气等长尾场景。
据小米公布,该框架在Waymo、nuScenes等主流基准测试中全面取得SOTA。其中WorldRec在Waymo数据集上PSNR达28.48,超出此前最佳方法;WorldGen在nuScenes上FVD达64.97,单视角生成速度较同类自回归方法快约5.6倍。
目前该框架已在小米汽车三大场景落地:合成数据生成、仿真测试(闭环复现真实事故)、辅助驾驶学堂(已上线全车型实景模拟功能)。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
FUN肆一夏,满逸即达,长安逸达夏日出游季在成都
成都,一个来了就不想走的城市;益达,一个为了更好生活的“滚王”,...
这个春天,不妨与哈弗H9一起进藏乐游
如果说自驾游最重要的不是抵达,而是沿途的风景。看完全中国最难忘的...
中国手机制造商在孟加拉国首个工厂:传音ISMAR
,IT之家从传音控股官方获悉,5月24日,传音ISMARTU孟加...
蔚来智能电动全能SUV全新ES6正式上市售价36
全新换代的蔚来智能电动全能SUV——ES6于昨晚正式上市。201...
四大智能技术加持,售价11.68万元起一汽丰田新
5月21日,“一汽丰田智能电混技术发布暨新卡罗拉上市发布会”在珠...
【这个城市有点潮】青岛:帆船之都 扬帆起航踏浪逐
说到青岛这个城市,大家都能想到什么呢?是高峻挺拔的崂山?还是清爽...