本文目录一览:
- 1、当GPT遇到自动驾驶,毫末首发DriveGPT
- 2、字节跳动进军汽车云业务追赶腾讯
- 3、毫末发布自动驾驶生成式大模型DriveGPT 中文名"雪湖·海若"
- 4、为什么是毫末智行成为了DriveGPT的破壁人?
- 5、毫末智行建成中国最大自动驾驶智算中心 训练成本降低100倍
- 6、车企智算中心,究竟谁家最强?
当GPT遇到自动驾驶,毫末首发DriveGPT
GPT之于自动驾驶意味着什么字节旗下火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍?
文丨智驾网 黄华丹
ChatGPT带火了AI字节旗下火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍,那么字节旗下火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍,当GPT遇到自动驾驶,又会发生怎样的化学反应?
GPT全称Generative Pre-trained Transformer,即生成式预训练Transformer。简单概括即是一种基于互联扒告网可用数据训练的文本生成深度学习模型。
4月11日,在第八届毫末AI DAY上,毫末CEO顾维灏正式发布了基于GPT技术的DriveGPT,中文名雪湖·海若。
DriveGPT能做到什么?又是如何构建的?顾维灏在AI DAY上都做了详细解读。此外,AI DAY还展示了毫末自动驾驶数据体系MANA的升级情况,主要是其在视觉感知能力上的进展。
01.
什么是DriveGPT?能实现什么?
顾维灏首先讲解了GPT的原理,生成式预训练Transformer模型本质上是在求解下一个词出现的概率,每一次调用都是从概率分布中抽样并生成一个词,这样不断地循环,就能生成册销一连串的字符,用于各种下游任务。
以中文自然语言为例,单字或单词就是Token,中文的Token词表有5万个左右。把Token输入到模型,输出就是下一个字词的概率,这种概率分布体现的是语言中的知识和逻辑,大模型在输出下一个字词时就是根据语言知识和逻辑进行推理的结果,就像根据一部侦探小说的复杂线索来推理凶手是谁。
而作为适用于自动驾驶训练的大模型,DriveGPT雪湖·海若三个能力:
1.可以按概率生成很多个这样的场景序列,每个场景都是一个全局的场景,每个场景序列都是未来有可能发生的一种实际情况。
2.是在所有场景序列都产生的情况下,能把场景中最关注的自车行为轨迹给量化出来,也就是生成场景的同时,便会产生自车未来的轨迹信息。
3.有了这段轨迹之后,DriveGPT雪湖·海若还能在生成场景序列、轨迹的同时,输出整个决策逻辑链。
也就是说,利用DriveGPT雪湖·海若,在一个统一的生成式框架下,就能做到将规划、决策与推理等多个任务全部完成。
具体来看,DriveGPT雪湖·海若的设计是将场景Token化,毫末将其称为Drive Language。
Drive Language将驾驶空间进行离散化处理,每一个Token都表征场景的一小部分。目前毫末拥有50万个左右的Token词表空间。如果输入一连串过去已经发生的场景Token序列,模型就可以根据历史,生成未来所有可能的场景。
也就是说,DriveGPT雪湖·海若同样像是一部推理机器,告诉它过去发生了什么,它就能按概率推理出未来的多个可能。
一连串Token拼在一起就是一个完整的驾驶场景时间序列,包括了未来某个时刻整个交通环境的状态以及自车的状态。
有了Drive Language,就可以对DriveGPT进行训练了。
毫末对DriveGPT的训练过程首先是根据驾驶数据以及之前定义的驾驶尝试做一个大规模的预训练。
然后,通过在使用过程中接管或者不接管的场景,对预训练的结果进行打分和排序,训练反馈模型。也就是说利用正确的人类开法来替代错误的自动驾驶开法。
后续就是用强化学习的思路不断优化迭代模型。
在预训练模型上,毫末采用Decode-only结构的GPT模型,每一个Token用于描述某时刻的场景状态,包括障碍物的状态、自车状态、车道线情况等等。
目前,毫末的预训练模型拥有1200亿个参数,使用4000万量产车的驾驶数据,本身就能够对各种场景做生成式任务。
这些生成结果会按照人类偏好进行调优,在安全、高效、舒适等维度上做出取舍。同时,毫末会用部分经过筛选的人类接管数据,大概5万个Clips去做反馈模型的训练,不断优化预训练模型。
在输出决策逻辑链时,DriveGPT雪湖·海若利用了prompt提示语技术。输入端给到模型一个提示,告诉它“要去哪、慢一点还是快一点、并且让它一步步推理”,经过这种提示后,它就会朝着期望的方向去生成结果,并且每个结果都带有决策逻辑链。每个结果也会有未来出现的可能性。这样字节旗下火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍我们就可以选择未来出现可能性最大,最有逻辑的链条驾驶策略。
可以用一个形象的示春姿明例来解释DriveGPT雪湖·海若的推理能力。假设提示模型要“抵达某个目标点”,DriveGPT雪湖·海若会生成很多个可能的开法,有的激进,会连续变道超车,快速抵达目标点,有的稳重,跟车行驶到终点。这时如果提示语里没有其他额外指示,DriveGPT雪湖·海若就会按照反馈训练时的调优效果,最终给到一个更符合大部分人驾驶偏好的效果。
02.
实现DriveGPT毫末做了什么?
首先,DriveGPT雪湖·海若的训练和落地,离不开算力的支持。
今年1月,毫末就和火山引擎共同发布了其自建智算中心,毫末雪湖·绿洲MANA OASIS。OASIS的算力高达67亿亿次/秒,存储带宽2T/秒,通信带宽达到800G/秒。
当然,光有算力还不够,还需要训练和推理框架的支持。因此,毫末也做了以下三方面的升级。
一是训练稳定性的保障和升级。
大模型训练是一个十分艰巨的任务,随着数据规模、集群规模、训练时间的数量级增长,系统稳定性方面微小的问题也会被无限放大,如果不加处理,训练任务就会经常出错导致非正常中断,浪费前期投入的大量资源。
毫末在大模型训练框架的基础上,与火山引擎共同建立了全套训练保障框架,通过训练保障框架,毫末实现了异常任务分钟级捕获和恢复能力,可以保证千卡任务连续训练数月没有任何非正常中断,有效地保障了DriveGPT雪湖·海若大模型训练的稳定性。
二是弹性调度资源的升级。
毫末拥有量产车带来的海量真实数据,可自动化的利用回传数据不断的学习真实世界。由于每天不同时段回传的数据量差异巨大,需要训练平台具备弹性调度能力,自适应数据规模大小。
毫末将增量学习技术推广到大模型训练,构建了一个大模型持续学习系统,研发了任务级弹性伸缩调度器,分钟级调度资源,集群计算资源利用率达到95%。
三是吞吐效率的升级。
在训练效率上,毫末在Transformer的大矩阵计算上,通过对内外循环的数据拆分、尽量保持数据在SRAM中来提升计算的效率。在传统的训练框架中,算子流程很长,毫末通过引入火山引擎提供的Lego算之库实现算子融合,使端到端吞吐提升84%。
有了算力和这三方面的升级,毫末可对DriveGPT雪湖·海若进行更好的训练迭代升级。
03.
MANA大升级,摄像头代替超声波雷达
毫末在2021年12月的第四届AI DAY上发布自动驾驶数据智能体系MANA,经过一年多时间的应用迭代,现在MANA迎来了全面的升级。
据顾维灏介绍,本次升级主要包括:
1.感知和认知相关大模型能力统一整合到DriveGPT。
2.计算基础服务针对大模型训练在参数规模、稳定性和效率方面做了专项优化,并集成到OASIS当中。
3.增加了使用NeRF技术的数据合成服务,降低Corner Case数据的获取成本。
4.针对多种芯片和多种车型的快速交付难题,优化了异构部署工具和车型适配工具。
前文我们已经详细介绍了DriveGPT相关的内容,以下主要来看MANA在视觉感知上的进展。
顾维灏表示,视觉感知任务的核心目的都是恢复真实世界的动静态信息和纹理分布。因此毫末对视觉自监督大模型做了一次架构升级,将预测环境的三维结构,速度场和纹理分布融合到一个训练目标里面,使其能从容应对各种具体任务。目前毫末视觉自监督大模型的数据集超过400万Clips,感知性能提升20%。
在泊车场景下,毫末做到了用鱼眼相机纯视觉测距达到泊车要求,可做到在15米范围内达测量精度30cm,2米内精度高于10cm。用纯视觉代替超声波雷达,进一步降低整体方案的成本。
此外,在纯视觉三维重建方面,通过视觉自监督大模型技术,毫末不依赖激光雷达,就能将收集的大量量产回传视频转化为可用于BEV模型训练的带3D标注的真值数据。
通过对NeRF的升级,毫末表示可以做到重建误差小于10
【本文来自易车号作者智驾网,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
字节跳动进军汽车云业务追赶腾讯
字节跳动进军汽车云业务追赶腾讯
字节跳动进军汽车云业务追赶腾讯,字节跳动B端业务在汽车领域的首个动作,即组建车联网团队。互联网巨头腾讯和阿里都有类似的车联方案推出,字节跳动进军汽车云拍毕业务追赶腾讯。
字节跳动进军汽车云业务追赶腾讯1
字节跳动近期推出了汽车云业务,已从亚马逊云和京东云等公司招募人员,负责推进该项目。同时,字节也开始与一家新造车和货运自动驾驶公司等洽谈“智驾云”的项目合作。
据36氪了解,字节的汽车云提供三大服务:IaaS(Infrastructure as a Service,基础设施即服务),即火山引擎公有云,包括计算、网络、存储三大能力;PaaS,即火山引擎-自动驾驶云服务,包括仿真平台、数据标注、图像渲染、数据拆包等能力;SaaS,包括服务管理、车辆管理、售后数据、生产数据等能力。
对于上述信息,字节跳动向36氪表示:不予置评,请以官方信息为准。
今年6月,《晚点latepost》曾报道,字节跳动推出云计算IaaS服务 。而从汽车云的业务规划来看,字节已经面向汽车行业,推出一个完整的垂直行业云方案。
进军汽车云,或是字节在推动云业务背景下的一个重大尝试。消息人士透露,在字节跳动最近的5年商业规划中,汽车云也被写入其中,并分为2个阶段推进。
第一阶段,2021-2022年,字节将以增量云业务切入点,包括车联网云(车联网运营、场景引擎);自动驾驶云(数据标注、高性价比的GPU集群等);商务策略“带云”,火山车娱(年费模式+云)、广告带云。
而在2023 - 2025年,字节的目标是逐步实现客户云业务覆盖率过半,“整体营收追赶腾讯”。
智能汽车浪潮下,华为、腾讯、百度等科技巨头,都在角逐汽车云市场,华为有“八爪鱼”项目,腾讯也有主打仿真技术的汽车云业务。字节跳动也意识到进军汽车云市场较晚,因此其策略是,前期并不看中营收额,而是看云业务覆盖量。
去年9月,36氪曾独家报道,字节跳动B端业务在汽车领域的首个动作,即组建车联网团队。据消息人士透露,该团队研发人员目前已有50人左右,分部在北京和上海,也已经推出“火山车娱”车联网应用。
据介绍,“火山车娱”集成了整个字节系的内容生态,包括抖音短视频、西瓜视频、今日头条的新闻资讯等,还可以通过AI文字转语音TTS的技术,自动转化成语音播放出来。“火山车娱”也已经与吉利和长安等车企达成了装车合作。
知情人士告诉36氪,目前“火山车娱”的装机量已经超过10万台,但是相比于拥有数亿级活跃用户的抖音,“火山车娱”的DAU(日活跃用户数)只有数千个。
字节车联产品的境遇并非特例,互联网巨头腾讯和阿里都有类似的车联方案推出,如腾讯的TAI车联网方案,阿里巴巴猛毕旗下的斑马网络。除了为科技公司赚取研发和装机授权费,这些车联网产品还都承载着将科技公司的内容和服务生态上车,打通更多流量入口的使命。
但进展并不顺利。最早一批搭载车载微信的理想汽车,已经搁置这个应用,将其放进应用商店,供用户自行下载。“我们从后台的数据能看到,用户对车载微信的接受度不高,所以就把选择权交给用户了。”理想汽车人士告诉36氪。而斑马网络的主要订单也大都来自其股东上汽集团。
除了将字节系服务上车,字节车联网团队也曾有过造车想法,负责部门为其早前收购的锤子科技团队成员,但在今年6月字节造车传闻喧嚣直上时,张一鸣与车联网部门开会,明确提出“不造车”。
而相比车联网和造车,云业务或许是一块确定性更高的市场。车企在智能化转型当中,对数据中心和数据平台的需求更为明确。但同样,也需要各家云服务公司比拼基础技术能力。而字节跳动也在借助投资完善其技术储备。
消息人士向36氪透露,字节跳动汽车云当中的场景和仿真能力就来自轻舟智航。后者是一家具有谷歌Waymo成员背景的自动驾驶公司,今年3月,字节跳动参与了轻舟智航数千万美元A轮次融资。
字节跳动也在与上汽旗下的高精地图公司中海庭洽谈合作,“中海庭的诉求是,引入字节的战略投资,或者双方成立合资公司。”
在2C领域,字节跳动成就显著,拥有数亿月活用户的明星产品今日头条与袭知芹抖音,但在2B领域,动作较慢。2017年,字节开始试水to B,主要给国产手机厂商的内置浏览器输出推荐算法和内容。 2020年6月,字节推出火山引擎,依托字节跳动的大数据、人工智能等技术能力,提供技术产品与解决方案。此外,字节主要的to B布局还包括2019年推出的企业级协同办公工具飞书等。
云设施显然是不容错过的下一个大市场。市场研究公司Canalys发布中国云计算市场2021年第二季度报告显示,中国的云基础设施市场在2021年第二季度增长了54%,达到66亿美元。数字化转型、人工智能等产业驱动下,需求依然强劲。
字节跳动似乎也做好了进场角逐的准备,该公司企业合作与解决方案部门负责人肖默在近期工作文档写道,“以终为始,全力做云”。
字节跳动进军汽车云业务追赶腾讯2
9月26日下午消息,近日,在字节跳动巨量引擎搜索大会上,巨量引擎商业产品负责人周盛、抖音搜索产品负责人赵绚解读了字节跳动对于新搜索的.定义和搜索业务的产品逻辑,以及新搜索的商业价值。
新搜索下,用户意图更主动、精确
“提到今日头条和抖音,大家可能首先想到的都是推荐的分发机制。在推荐机制下,很多时效性的热点内容很容易在平台上爆发出来。 而我们发现,用户还有另一方面的需求。”
赵绚表示,用户会在平台上搜索,表达更加主动、精确的意图;同时,用户需要解决一些非热点类的问题,而这些需求和内容,也通常具有长期沉淀的价值。基于用户的需求,字节跳动希望构建一个更加多元稳定的内容生态:通过推荐和搜索的双向内容分发,让爆款内容和长效内容都能在平台上生产和沉淀。
赵绚提到一组数据:打开App30秒以后,有超过57%的用户,搜索前的动作是浏览。“我们把这个现象叫做‘看后搜’,也符合前面所说的行业趋势,用户的确更喜欢‘边看边搜’了。”
基于此,字节跳动把“新搜索”定义为:内容激发,视频搜索,和看后搜。今日头条创造“随看随搜”的环境;抖音提供“边刷边搜”的体验。
赵绚提到这几年来搜索的几点变化:
首先,大家搜索的内容越来越具体,搜索词越来越长。以前可能平均搜5个字,现在平均搜7个字,这意味着用户来搜索的不是泛泛的需求,而是来解决更精准的问题;
其次,大家搜索的长效内容越来越多了。以前可能搜热点比较多,现在更多再搜一些“怎么做”这样的问题;
此外,大家搜索的内容更广泛了,高中低频词的分布更加均匀了。
“我们对于用户搜索内容的高中低频有一个界定,比如一个月搜索30次的词,一定是搜索的高频词;5-7天才搜一次的词,就低频一些。这些词的分布越均匀,说明用户搜索的需求更多元,生态更成熟。”赵绚表示。
部分视频搜索广告转化率40%将撬动更大商业增长空间
周盛提到,新搜索有几个显著的特点:
第一,新的搜索不止于刚需工具,丰富的内容搜索形式和结果,最大程度拓宽了用户好奇心的边界;
第二,新的搜索不仅限于单一平台,而是呈现出更多元的趋势,知识平台、短视频平台、垂直媒体等多元搜索平台可以愈发共融共生;
第三,新的搜索不再是让用户即搜即走,只有兴趣才能激发兴趣,随看随搜,边看边搜成为新的搜索趋势。
极光调研数据显示,巨量引擎的搜索人群年龄更多集中在26-35岁,他们中的68%月收入超过了1万元。周盛透露,平台内投放图文和视频搜索广告,相比于只投放图文搜索广告,转化率能够提升2.5倍;视频搜索在转化效率上更加高效,以搜索品牌词的场景为例,视频搜索转化可达到40%。
对于搜索未来的发展方向,赵绚认为主要有三点:
第一、优化电商搜索的体验,让用户“想买的东西都能在抖音搜索里找到” ;
第二、做好热点场景的探索,比如在热点、合集、话题等场景上,做更好的交互;
第三、做好本地和生活服务,对同城以及线下服务的搜索需求有更好的支持。
大会上,字节跳动方面提到了“新搜索”的营销红利,搜索带来的流量价值将撬动更大的商业增长空间。巨量引擎搜索广告负责人焦颖颖表示,巨量引擎搜索发挥“营销枢纽”的角色价值,帮助品牌做好内容生态下的收口、活动的引流和品牌资产的深度沉淀,满足品牌品宣、转化、经营的需求。
毫末发布自动驾驶生成式大模型DriveGPT 中文名"雪湖·海若"
易车讯 日前,我们从官方渠道获悉,在第八届HAOMO AI DAY上,毫末智行发布自动驾驶生成式大模型DriveGPT,中文名"雪湖·海若"。生态方面,毫末官宣取得3个主机厂定点合同,商业化迎来跃升一步;同时毫末推出的中国首个重感知、不依赖高精地图的城市NOH即将量产上车,最先落地北京、上海、保定等城市。
毫末打造的自动驾驶生成式大模型DriveGPT雪湖·海若通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化,现阶段主要用于解决自动驾驶的认知决策问题,终极目标是实现端到端自动驾驶。
毫末DriveGPT雪湖·海若已开启对销败亏限量首批生态伙伴的开放合作,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等高校与企业加入。
产品方面,毫末中国首款可大规模量产落地、重感知城市NOH,将首批落地北京、保定、上海等城市,并开启泛化测试,到2024年有序落地100城。首款搭载HPilot3.0的新摩卡DHT-PHEV即将重磅上市,这也是毫末DriveGPT雪湖·海若的首发落地车型,全面确保毫末城市NOH的行业领先性。
生态层面,毫末乘用车6P开放合作取得重大突破,已与3家主机厂签署定点合同,相关项目正在交付中。这是毫末商业化的重要一跃,全面保障了毫末高速发展态势。
毫末智行董事长张凯判断:“2023年智驾产品进入全线爆发期,大模型开启在车端的落地应用,车主的使用频率和满意度成为产品竞争力的重要衡量标准。毫末不断进步的数据驱动的六大闭环能力将进一步加速毫末进入自动驾驶3.0时代的步伐并形成相应的护城河。”
张凯认为,智驾产品正在进入快速增长的全线爆发期,2023年是非常关键的一年。首先,城市导航辅助驾驶产品在2023年将围绕量产上车发力,主要玩家的城市导航辅助驾驶产品进入到真实用户覆盖和多城市落地的比拼。其次,行泊一体和末端物流自动配送产亏神业商业化将成为自动驾驶公司深耕的重点。在乘用车领域,搭载行泊一体功能的智驾产品将迎来前装量产潮;在末端物流自动配送领域,末端物流自动配送车在商超、快递等场景迎来爆发,2023年将在这些场景实现可持续商业化闭环。
首款搭载HPilot3.0的新摩卡DHT-PHEV即将重磅上市,第二款搭载毫末HPilot3.0的车型魏牌蓝山也将在今年发布。毫末HPilot整体已搭载近20款车型。用户辅助驾驶行驶里程突破4000万公里,HPilot2.0辅助驾驶日均行驶里程使用率达到了12.6%。海外布局方面,搭载毫末HPilot的车辆已运往欧盟、以色列等地区和国家,陆续交付到用户手中,接下来将在中东、南非、澳大利亚等市场陆续投放;同时,毫末HPilot即将量产墨西哥版本及俄罗斯版本。
3月,高工智能汽车研究院在每个年度基于前装量产数据库及定点车型库数据进行综合评估,通过对毫末前装近20款车辆等数据研究,为毫末颁发年度高阶智能驾驶系统量产份额领军奖。第三方数据佐证毫末是中国量产自动驾驶绝对领军者。
其次是“MANA大模型巅峰之战”,中国首个自动驾驶数据智能体系MANA架构已迎来全线升级。到2023年4月,MANA学习时长超56万小时,相当于人类司机枯则6.8万年。毫末DriveGPT雪湖·海若,已经完成基于4000万公里驾驶数据的训练,参数规模达1200亿。
第三是“城市NOH百城大战”,中国首款可大规模量产落地、重感知城市NOH,已在北京、保定、上海等城市开启泛化测试,即将量产上车,到2024年有序落地100城。毫末会以“安全为先、用户为先、规模为先”的原则,加速赢得城市NOH百城大战。
最后是“末端物流自动配送商业之战”,毫末末端物流自动配送车小魔驼已在商超履约、智慧社区、校园配送、餐饮零售、机场巡逻、高校教育、快递接驳、智慧园区、大气环评等九大场景开启运营,加速商业化闭环能力。2023年3月,小魔驼2.0获北京亦庄无人配送车车辆编码,开启亦庄运营。毫末也成为《北京智能网联汽车政策先行区无人配送测试规范》升级后,准许在北京市高级别自动驾驶示范区公开道路进行无人配送车测试的首个公司。
“技术领先是生存根本,毫末鼓励所有技术研发同学投入到技术创新当中。”张凯在演讲中再次强调了毫末对于技术研发投入的坚定决心。截至目前,毫末已获得专利证书164件,国际顶级学术会议论文收录6篇,最新2篇更是分别入选计算机视觉识别领域三大顶会之一的CVPR和全球首个智能车专业期刊IEEE TIV。毫末已将所有论文在GitHub开源,与业内共享。
现场,张凯还向外界公布了毫末6P开放合作的重要进展,目前已与3家主机厂签署定点合同,相关项目正在交付中。“毫末始终认为,自动驾驶是一个共同进退、共享成果的前沿产业。只有健康的生态伙伴才能支持毫末高速发展。”张凯表示。
此外,毫末一直坚持场景化用户体验设计、人工智能技术、技术工程化能力均衡发展,不断以数据驱动闭环的方式完善用户体验。张凯介绍,三个月时间,毫末在数据驱动六大闭环体系上实现多重进展。
用户需求闭环方面,毫末对驾驶场景数据持续分析完善策略,并进行新功能体验反馈;研发效能闭环方面,毫末将数据驱动理念深入到产品需求定义、感知与认知算法开发等产品开发流程,整体开发效率提升30%;数据积累闭环方面,毫末在车端部署诊断服务数据场景标签覆盖92%的驾驶场景。
数据价值闭环方面,毫末大模型正在持续挖掘数据价值解决关键问题;产品自完善闭环方面,毫末实现售后问题处理速度较传统方式的十倍效率提升,实现最快10分钟定位售后问题。两年时间有效挖掘产品提升点,问题闭环率达76%;业务工程化闭环方面,毫末进一步完善了从采集回流、标注训练、系统标定、仿真验证等环节到最终OTA释放环节的产品研发全流程工程化闭环。
毫末DriveGPT雪湖·海若通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化。它的最终目标是实现端到端自动驾驶,现阶段主要用于解决自动驾驶的认知决策问题,后续持续会将毫末多个大模型的能力整合到DriveGPT。目前,毫末DriveGPT雪湖·海若实现了模型架构与参数规模的升级,参数规模达到1200亿,预训练阶段引入4000万公里量产车驾驶数据,RLHF阶段引入 5万段人工精选的困难场景接管Clips。
DriveGPT雪湖·海若的底层模型采用GPT(Generative Pre-trained Transformer)生成式预训练大模型,与ChatGPT使用自然语言进行输入与输出不同,DriveGPT输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景Token化,形成“Drive Language”,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。
DriveGPT雪湖·海若的实现过程是,首先在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管Clips数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。同时,DriveGPT雪湖·海若还会根据输入端的提示语以及毫末CSS自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。
现场,毫末宣布DriveGPT雪湖·海若首发车型是新摩卡DHT-PHEV,即将量产上市。顾维灏提到,DriveGPT雪湖·海若可以逐步应用到城市NOH、捷径推荐、智能陪练以及脱困场景中。有了DriveGPT雪湖·海若的加持,车辆行驶会更安全;动作更人性、更丝滑,并有合理的逻辑告诉驾驶者,车辆为何选择这样的决策动作。对于普通用户来说,车辆越来越像老司机,用户对智能产品的信任感会更强,理解到车辆的行为都是可预期、可理解的。
毫末DriveGPT雪湖·海若将携手生态伙伴率先探索四大应用能力,包括智能驾驶、驾驶场景识别、驾驶行为验证、困难场景脱困。当前,毫末在使用数据过程中,逐步建立起一套基于4D Clips驾驶场景识别方案,具备极高性价比。在行业上,给出正确的标注结果,一张图片需要约5元;如果使用DriveGPT雪湖·海若的场景识别服务,一张图片的价格将下降到0.5元。单帧图片整体标注成本仅相当于行业的1/10。接下来,毫末会将图像帧及4D Clips场景识别服务逐步向行业开放使用,这将大幅降低行业使用数据的成本,提高数据质量,从而加速自动驾驶技术的快速发展。
顾维灏介绍,毫末在2023年1月发布的中国自动驾驶行业最大的智算中心MANA OASIS(雪湖· 绿洲)此次从算力优化等层面升级了三大能力,进一步支持DriveGPT雪湖·海若的算力。首先,毫末与火山引擎全新搭建了“全套大模型训练保障框架”,实现了异常任务分钟级捕获和恢复能力,可以保证千卡任务连续训练数个月没有任何非正常中断,有效保证了大模型训练稳定性;其次,毫末研发出以真实数据回传为核心的增量学习技术,并将其推广到了大模型训练,构建了一个大模型持续学习系统,自主研发任务级弹性伸缩调度器,分钟级调度资源,集群计算资源利用率达到95%;最后,MANA OASIS通过提升数据吞吐量来降本增效,满足Transformer大模型训练效率,通过引入火山引擎提供的Lego算子库实现算子融合,端到端吞吐提升84%。
毫末打造的中国首个自动驾驶数据智能体系MANA,在经过一年多的应用迭代后,本次AI DAY也迎来了全面的升级,正式开放赋能。顾维灏介绍,MANA计算基础服务针对大模型训练在参数规模、稳定性和效率方面做了专项优化,并集成到OASIS中;其次,MANA感知和认知相关大模型能力统一整合到DriveGPT雪湖·海若中;第三,增加了使用NeRF技术的数据合成服务,降低Corner Case数据的获取成本;同时针对多种芯片和多种车型的快速交付难题优化了异构部署工具和车型适配工具。
此外,MANA的视觉感知能力持续提升,一方面可同时学习三维空间结构和图片纹理,并将纯视觉测距精度超过了超声波雷达,BEV方案也拥有了更强的通用性和适配性;另一方面可实现单趟和多趟纯视觉NeRF三维重建,道路场景更逼真,肉眼几乎看不出差异。通过NeRF进行场景重建后,可以编辑合成真实环境难以收集到的Corner Case。在原有的全局视角修改、添加光照/天气效果的基础上,新增合成虚拟动态物体的能力,可以在原有设定的运动轨迹上,合成各种Hard Case,模拟城市复杂交通环境,用更低成本测试提升城市NOH能力边界,更好提升应对城市复杂交通环境。
值得一提的是,面对目前行业里最难的视觉任务之一——单目视觉测量,继特斯拉后,毫末也在中国率先开始验证能否使用鱼眼相机代替超声波雷达进行测距,以满足泊车要求。毫末把视觉BEV感知框架引入到了车端鱼眼相机,做到了在15米范围内达到30cm的测量精度,2米内精度高于10cm的视觉精度效果。泊车场景使用纯视觉测距来取代超声波雷达,将进一步降低整体智驾成本。
易车超级评测体系重磅上线!专业、硬核、全面的汽车评测内容云集,易车年度车型榜单新鲜出炉!上易车App搜索“超级评测”,等你来看!
为什么是毫末智行成为了DriveGPT的破壁人?
作者 | 魏启扬
来源 | 洞见新研社
毫末智行有着天生字节旗下火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍的紧迫感。
很多科技公司一年才举办一次的品牌日活动字节旗下火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍,毫末智行硬是办成了一个季度一次,活动频次的提高,则意味着组织内部新陈代谢的提速,从研发到落地乃至运营,都要跟上步点节奏。
毫末智行用这样一种方式来鞭策自己在自动驾驶道路上的进取之心。
4月11日结束的第八届HAOMO AI DAY,活动规格再上台阶,吸引了中国汽车芯片联盟联席理事长、中国电动汽车百人会副理事长董扬,同济大学教授埋衫、汽车安全技术研究所所长朱西产,清华大学车辆与运载学院教授曹东璞、华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE/CAAI Fellow田奇等业内大咖参会。
在影响力持续扩大的同时,毫末智行再次更新了自己在技术、产品和生态上的进展,其中城市NOH即将量产上车与毫末DriveGPT 雪湖·海若的发布成最大亮点。
前者是中国首个重感知、不依赖高精地图的城市NOH,将最先落地北京、上海、保定等城市,后者则是全球首个自动驾驶生成式大模型。
NOH量产上车,毫末智行过去就曾做过预告,此次确定了更具体的落地时间,算是兑现了之前“夸下的海口”。
至于雪湖·海若 ,在GPT火热的当下,参与其中的自动驾驶公司也不少,为什么是毫末智行率先发布,成为很多人心中的谜团。
01 自动驾驶大考年,毫末智行冲在最前线
毫末智行加快推进NOH的落地进程,很大一部分原因在于智驾产品已经进入到全线爆发的前夜。
来自工信部和高工智能汽车研究院的数据显示,2021年乘用车L2级智驾产品的搭载率是23.5%,全年共交付了476万辆。
到了2022年,乘用车上车的智驾产品升级到L2级以上,搭载率提升到29.4%,全年了交付了585.99万辆。
按照这一趋势预测,到2025年时,乘用车L2级以上智驾产品的搭载率将达到70%。
毫无疑问,正在经历的2023年和还没到来的2024年将十分关键,用毫末智行董事长张凯的话来说,“2023年既是自动驾驶的冲刺之年,也是大考之年”。
张凯判断,智驾产品今年的爆发将主要集中在两个方面。
第一个是城市导航辅助驾驶产品将围绕量产上车发力,主要玩家的城市辅助驾驶产品进入到真实用户覆盖和多城市落地的比拼。
另一个是行泊一体和无人车商业化将成为自动驾驶公司深耕的重点。在乘用车领弯握腔域,搭载行泊一体功能的智驾产品将迎来前装量产潮。
事实上,毫末智行作为“渐进派”的代表,坚定认为辅助驾驶是通往自动驾驶的必由之路,因而在过往,一直致力于推动智驾产品上车。
2021年推出HPilot 1.0版本,当年即完成坦克300城市版、魏牌拿铁、魏牌玛奇朵、哈弗神兽5款车型的量产上车,搭载乘用车数量超过数万台。
2022年,毫末智行对HPilot进行了两次大版本更新,HPilot月度搭载增速超过200%,与此同时,毫末城市NOH辅助驾驶系统也完成了量产交付,搭载HPilot 3.0的新摩卡DHT-PHEV魏牌蓝山将在2023年先后上市。
根据毫末智行官方公布的数据,截至目前,毫末HPilot整体已搭载近20款车型。用户辅助驾驶行驶里程突破4000万公里,HPilot 2.0 辅助驾驶日均里程使用率达到了12.6%。
NOH的推进方面,目前已经在北京、保定、上海等城市开启泛化测试,即将量产上车,毫末智行预测,到2024年,城市NOH将有序落地100城,届时,毫末辅助驾驶乘用车总量也将来到百万量级别。
有业内人士评述,即便按照当前的节奏不变,毫末智行智驾产品量产落地的速度也已与友商拉开了差距,至少领先行业一年以上。
毫末智行的”快”主要体现在两个方面,一个是产品的推新和迭代速度快,一个是由量产落地而带动的规模覆盖。
不得不说毫末智行选择了一条最为“稳妥”的自动驾驶路线。
在应对行业竞争,推动自动驾驶落地的过程中,我们很清晰的看到,HPilot、城市NOH等智驾产品正在源源不断的为毫末智行提供营收,而随着这些智驾产品的每一次迭代升级,自动驾驶能力一点点的向上提升,毫末智行距离全无人驾驶的星辰大海也更近了。
除了自动驾驶量产上车之外,毫末智行还公布6P开放合作的进展,目前已与3家主机厂签署定点合同,相关项目正在交付中。
在此之前,行业对毫末智行发展潜力存疑的主要观点是过于依赖长城,如皮改今6P合作实现突破,表示毫末智行开始走出长城,迈向更广阔的发展空间,构建属于自己的“长城”。
02 数据“第一性原理”,DriveGPT雪湖·海若的主要支撑点
将ChatGPT与DriveGPT雪湖·海若进行对比,虽然都是GPT,但运行条件和应用场景还是有很大的不同。
ChatGPT是对话式的生成式自然语言模型,输入是自然语言的文本串,输出就是自然语言的文本,目前ChatGPT主要完成通用的下游语言生成任务,比如多轮对话、代码生成、翻译、数学运算等。
DriveGPT雪湖·海若是用于自动驾驶场景的生成式大模型,输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景Token化,形成“Drive Language”,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。
DriveGPT雪湖·海若的实现过程是,首先在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管Clips数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。
毫末智行CEO顾维灏在自动驾驶技术领域的眼光独到,布局非常领先。
早在 2021 年,毫末智行就已经开始了 Transformer 大模型技术的探索,并快速落地应用到 BEV 视觉感知算法当中,然后又以五大模型的方式来实现自动驾驶感知、认知算法的快速升级,现在这些大模型将统一到 DriveGPT 生成式大模型当中,最终目标是实现端到端自动驾驶。
很明显,和ChatGPT一样,DriveGPT雪湖·海若的技术原理并不复杂,但为何是毫末智行抢到了落地的头炮呢?
因为要想获得理想的训练结果,必须具备两个条件,海量的数据和超强的算力,而这恰恰是毫末智行区别于其他自动驾驶公司的优势长板。
先看数据。
去年9月的第6届HAOMO AI DAY上,CEO顾维灏向外界确认,毫末智行正式进入数据驱动的自动驾驶 3.0 时代。
如何理解?毫末智行依托HPilot的量产,目前已经积累了超过4000万公里辅助驾驶里程的数据,就场景来看,包括城市道路、城市快速路和高速字节旗下火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍;就数据分类来看,既有真实的感知数据,也包含真实的人驾数据。
毫末智行的数据优势并不是数据量的多少,而是获取数据的能力。
以HPilot为代表的智驾产品一直在持续的大规模量产上车,这也是说,毫末智行拥有稳定且优质的数据源,这些数据被投喂到MANA数据智能体系的训练中,推动MANA的进化成长,从而完成数据在其设计的技术架构内的闭环。
截至到2023年4月,MANA学习时长超56万小时,虚拟驾龄相当于人类司机6.8万年。
再来看看算力。
毫末智行很早就预见了算力对于自动驾驶研发的重要性,与特斯拉建设超算中心Dojo类似,毫末智行今年1月发布了中国自动驾驶行业最大的智算中心MANA OASIS(雪湖·绿洲),算力达67亿亿次/秒。
通过一系列的训练框架、性能、通信等优化,MANA OASIS可单机实现训练100亿参数规模的大模型的能力,同时执行多任务、多模态并行的训练,大幅提升计算效率。
为了支持DriveGPT雪湖·海若的训练,毫末智行还对MANA OASIS在算力层面进行三大能力的升级。
1、搭建了“全套大模型训练保障框架”,实现了异常任务分钟级捕获和恢复能力,可以保证千卡任务连续训练数个月没有任何非正常中断,有效保证了大模型训练稳定性;
2、研发出以真实数据回传为核心的增量学习技术,并将其推广到大模型训练,构建了一个大模型持续学习系统,自主研发任务级弹性伸缩调度器,分钟级调度资源,集群计算资源利用率达到95%;
3、MANA OASIS通过提升数据吞吐量来降本增效,满足Transformer大模型训练效率,通过引入火山引擎提供的Lego算子库实现算子融合,端到端吞吐提升84%。
古希腊哲学家亚里士多德曾提出过“第一性原理”的哲学术语,翻译过来就是,“每个系统中存在一个最基本的命题,它不能被违背或删除。”
从毫末智行所表现出来的技术理念来看,无论是走“渐进式”路线,还是建设算力基础设施MANA OASIS,围绕的中心都是数据,在毫末智行的认知中,数据就是自动驾驶的“第一性原理”,基于此,毫末智行构建起行业竞争的护城河。
03 从毫末到雪湖再到海诺,自动驾驶的中国式浪漫
在DriveGPT雪湖·海若发布之外,另外一个值得关注的点是,毫末智行还对外开放了该模型。
北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等单位成为首批合作伙伴。
此外,毫末智行在使用数据的过程中,还建立了一套极具性价比的,基于4D Clips数据的自动化标注方案。
目前,一张正确标注结果的图片在行业中的市场价是5块钱,如果使用DriveGPT的标注服务,这个价格将只需5毛钱。
毫末智行计划,这项图像帧及4D Clips自动标注服务将逐步向行业开放使用。
很明显,毫末智行发布DriveGPT雪湖·海若,并不是炒作跟风,而是真真切切的在做自动驾驶研发,更难能可贵的是,毫末智行很多前沿技术不光是为自己所用,还将其开放出来,以生态共建的形式,为行业的发展添砖加瓦。
其实,从毫末智行公司名字的由来,到自动驾驶智算体系MANA雪湖的命名,再到DriveGPT雪湖·海若的来源,能够窥视出毫末智行在自动驾驶这件事情上一以贯之的企业价值观。
“毫末”二字取自道家学派创始人老子之《老子·第六十四章》:“合抱之木,生于毫末。九层之台,起于累土。千里之行,始于足下。”强调的是一点一滴积累、脚踏实地耕耘的重要性。
“雪湖”这一名称,出自科幻小说《三体》第二部《黑暗森林》,说的是主人公罗辑在星空、雪山、森林、草地和湖畔之间徜徉思考,直到有一天在湖中寻找到了破解“三体危机”、拯救地球的方法。
将其延伸,“雪湖”这个名字代表了毫末对人类社会和科技趋势发展的热情,承载着毫末以AI通向自动驾驶梦想的思考。
“海若”则出自《庄子·秋水》,里面有两个神话人物河伯和北海若。河伯请教北海若,何谓大小之分,北海若教导,不因天地而觉大,不因毫末而觉小。其中蕴含着智慧包容、海纳百川的寓意。
将上述命名来源进行梳理,可以发现毫末智行的企业价值观融汇了中国古代经典的道家思想和科幻巨作天马行空式的哲学思辨,再结合当前正在从事的最前沿的自动驾驶事业,毫末智行呈现出特立独行的气质,更宏观的视角,还能看到一种与众不同的中国式浪漫。
【本文来自易车号作者洞见新研社,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
毫末智行建成中国最大自动驾驶智算中心 训练成本降低100倍
易车讯 2023年1月5日,在第七届HAOMO AI DAY现场,毫末智行宣布智算中心雪湖·绿洲(MANA OASIS)正式成立。MANA OASIS是目前中国自动驾驶行业最大智算中心,由毫末智行与火山引擎联合打造,每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。
毫末智行CEO顾维灏表示,“MANA OASIS让毫末拥有字节旗下火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍了超级计算能力,数据、算力充沛,毫末的技术产品能力将更加强大。在‘MANA OASIS’加持下,毫末将冲刺进入自动驾驶3.0时代。”
火山引擎总裁谭待表示,“字节旗下火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍我们很荣幸与毫未智行一道在智算中心领域达成深度合作,共同推动自动驾驶智能训练平合跨越式发展,加速自动驾驶技术敏捷选代和商业化落地。”
数据驱动是自动驾驶发展的方向与趋势,海量的产品数据、超大规模的数据训练、大模型的应用等,都对算力提出了更庞大的需求。基于火山引擎丰富的大数据积累和底层技术,MANA OASIS实现的计算、存储、通讯能力,让数据更快速转化成知识,以实现降本增效的目的。
在数据管理能力方面,为充分发挥智算中心价值,让GPU持续饱和运行,毫末历经两年研发,建立了全套面向大规模训练的Data Engine,实现了百P数据筛选速度提升10倍、百亿小文件随闷唤机读写延迟小于500微秒。在算力优化方面,毫末与火山引擎合作,部署了Lego高性能算子库、ByteCCL通信优化能力、以及大模型训练框架。软硬一体,把算力优化到极致。在训练效率方面,基于Sparse MoE,通过跨机共享,轻松完成千亿参数大模槐袜型训练,且百万个Clips(毫末视频最小标注单位)训练成本只需百卡周级别,训练成本降低100倍。
据毫末介绍,在MANA OASIS助力下,毫末数据智能体系MANA五大模型迎来全面升级,量产自动驾驶产品迭代加速,预计2024年上半年,毫末城市NOH落地将达到100城,2025年实现全无人驾驶。MANA五大模型中,视觉自监督大模型,让毫末在中国首个实现4D Clip的自动标注;多模态互监督大模型,则可以完成通用障碍物的识别;3D重建大模型助力毫末做数据生成,用更低成本解决数据分布问题,提升感知效果;动态环境大模型则进一步使用重感知技术,降低对高精地图依赖;人驾自监督认知大模型让毫末的驾驶策略更加拟人化,安全及顺畅。
MANA五大模型全面提升了毫末感知和认知层面系统化的底层技术能力。“在五大模型助力下,MANA最新的车端感知架构,从过去分散的多个下游任务集成到了一起,形成一个更加端到端的架构,包括通用障碍物识别、局部路网、行为预测等任务,毫末车端感知架构实现了跨代升级。”顾维灏表示。这也意味着毫末的感知能力更强,产品力更强,向全无人驾驶加速迈进。
行业专家表示,当前发展数字经济是国家战略,政策支持力度不断加大“东铅罩激数西算”全面铺开。经历2022年自动驾驶竞速后,量产自动驾驶城市争夺战已经打响,而决定城市辅助驾驶落地、体验和发展速度的关键保障,就是智算中心。火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给合作伙伴。火山引擎基于智能驾驶云,可以助力毫末打造数据驱动的全链路自动驾驶研发闭环。毫末是量产自动驾驶领域的佼佼者,双方联手其实背后也是自动驾驶发展趋势的体现。
车企智算中心,究竟谁家最强?
自从几年前,码虚特斯拉筹建其独立的智算中心Dojo(道场)后,有志于智能驾驶乃至于次世代发展的车企,都已经讲目光投向该领域。
在国内,去年8月,小鹏汽车在乌兰察布建成智算中心“扶摇”;今年1月初,长城汽车旗下毫末智行,宣布“雪湖·绿洲”智算中心投入使用。
至于其他的那些对手,也都在利用各种公云资源,跻身此赛道。
尽管各家在发布设施前,都曾宣称其为“最强”,也实不知做成短视频送去抖音审,最后哪个才能过。
但是有一点是可以肯定的,直到上月末乃至此时,吉利汽车集团在湖州长兴县部署的吉利星睿智算中心贺模神,在性能上于国内堪称首屈一指。
吉利星睿,湖州的新“特产”
今年2月末,笔者有幸受邀,前往湖州长兴县,参加吉利、阿里联合举办的,星睿智算中心启动活动。
为什么要选湖州长兴县,这是我在启程前曾经考虑过的问题。毕竟就个人认知而言,在最近十几年间,这边都有一种,仿佛江浙沪的角落一般的味道。
然而,当我驾车自沪渝高速南太湖互通闸道驶出时,立即就意识到,这个问题已经无需解答了。
彼时,一股强劲的东南风自侧后吹来。其势之猛,使得车身都为之一晃。散热历来是计算中心的重要问题之一。而如此大风,确实是建设计算中心的理想地点。
吉利汽车位于长兴县的生产基地
环太湖地区多风,这几乎是江浙沪的常识。每当一年气温转暖,以太湖为中心的冷高压逐渐生成,来自湖上的风开始不断向四周吹拂。
又加之长兴县东阙紧靠着地处太湖南岸平原中心位置的南云峰,这座海拔521.5米的太湖南岸最高峰挡住了相当一部分气流,迫使其向两侧吹拂。
吉利星睿智算中心,就背靠着南云峰迎风面的西侧一座名曰凤山的小丘。凭借孤山带来绕流效应,这里常年刮着大风,在江浙一带确实是部署计算中心的理想地点。
几年前,阿里集团在河北省张北县小二台镇建设阿里数据港张北数据中心,便是充分考虑了当地的多风以及低气温特点。
尽管江浙地区由于纬度和气候问题,并不能指望有张北县低的平均气温状况,但环太湖地区常年吹拂的大风,对降低计算中心散热系统能耗,确实也有显著的作用。
此外,这里毕竟是毗邻一、二线中心城市。湖州市中心在30分钟车程之内,而往东3小时车程能进到上海市区,向着东南则2小时则可直奔杭州。
而面临产业升级压力、GDP考核等问题的地方政府,对于吉利汽车集团愿意在生产基地之外,进一步在当地部署计算中心一事,自然是高度欢迎。
所以在交付仪式当天,湖州当地众多市、县领导,也专程前来参会齐集一堂,其重视程度可见一斑。
毕竟,这是联通、北斗等国字头背景企业外,第一个部署在湖州境内的车企专属大规模计算设施。
吉利星睿智算数据中心的前身,是吉利控股集团在长兴县设立的企业级数据中心,主要任务是提供云容器服务,用于公司内部运营。
比如网站、OA办公软件,办公云等等。2021年12月,吉利星睿智算中心正式立项,并且在2022年7月正式开始升级建设。
而为星睿智算中心提供建设与后续运维服务的,禅亏则是著名的云计算服务提供商,阿里云。
吉利长兴数据中心,项目总投资约10亿元,占地总面积52.12亩,规划机柜5000架,星睿智算中心一期工程现已建成标准5kW机柜2520架。
星睿智算中心的各项性能,在目前国内同类计算中心中处于领先地位——全系统云端总算力峰值每秒81亿亿次、最大通信网络传输速率为每秒800GB。
特别需要提一句的是,其存储带宽达到每秒4.5TB,是业界普遍采用的以太网的400倍。
目前,星睿智算中心还规划有二期工程。一旦二期项目建成落地,即规划的5000个机柜全部部署到位,则系统总算力规模将突破EFLOPS,达到惊人的120亿亿次。
作为智能汽车的云端支持系统,届时星睿智算中心可支撑的在线车辆并发数,达到350万规模,同时数据存储规模将达EB级别。
智算中心的时代
在这里需要特别强调的是,吉利星睿这个“智算中心”的定位。其有别于传统数据中心、超算中心。
智算中心是一个近两年来逐渐兴起的概念。
“智算”,代表设施并非传统意义上,以通用处理器(CPU)为主的超级计算机设施。其总算力中会有相当一部分由A.I芯片构成,专为人工智能项目服务的部分。
所以,理解星睿重要性,乃至于智算中心价值的关键点在于,什么是A.I芯片。
众所周知,人工智能相关运算,有其特殊性。无论是各种语音信号的识别,还是各类图形图像的判别,抑或是目前流行的,各种基于人工神经网络的深度学习训练。计算机在运行这类任务时,通常面临着任务细碎烦琐,但并行任务数量巨大的问题。
在这类情况下,内核具有较强Control(控制器)以及算术逻辑单元(ALU)的CPU,通常效率非常的差。
之所以差,是因为A.I项目具有其特殊性,往往不存在复杂的运算任务,但一般会存在同时并行的海量的“小数据”需要进行运算。这就意味着,CPU内少量高性能控制器+ALU的组合因为受制于数量,无法高效地并行处理这类由细碎项目组成的任务。
而所谓得A.I芯片在构造上,和CPU可以说是反其道而行之——芯片内部单个控制器以及ALU的面积都非常小,但总数却很多。甚至一级缓存也被拆成小块,分别配给了各个控制器模块。
这些显著区别于CPU的特性,使得其在处理A.I项目时,显得得心应手。举个简单的例子:汽车智能驾驶。
汽车的智能驾驶功能的实现,通常仰赖于多种外部传感器对车辆周边以及自身态势的感知。在自动驾驶域控制器的协调下,实现对当前场景的最优策略。
而在这一过程中,视觉传感器在回送图像信号时,系统会将视频信号拆解成帧来判读,以理解整幅图像各个区域图形的意义——或是交通标志、或是行人、或者是其他机动车辆等等。
这就意味着,系统会面临同时处理大量细小图像区块单独识别的问题。
尽管每个图形都不复杂,但一张图往往由几十上百的对象构成,而每秒又有几十张的图像(视车载视觉传感器具体刷新率而定)。
讲到这里相信许多人已经明白了,A.I芯片实际上就是一类特别优化过的图形处理器(GPU)。
毕竟,这类工作在很大程度上,也可以被视为另一种类型的大量图形处理任务。而即便其执行的任务和图像无关,比如语音识别等,其同样面临着大量声波识别和滤除等复杂多线程问题。
而各种基于神经网络的机器深度学习训练,同样需要面对复杂多线程问题。
理解了何为A.I芯片,自然也也就解决了对智算中心定位的认识。
从现阶段产业发展的角度来看,人工智能有三大驱动力:数据、算法和算力,这些都与计算密切相关。对于车企来说,想要在智能驾驶方面有所发展,海量的仿真、巨量的数据收集是必不可少的。
在此大背景下,建设成规模的大型智算中心,显然能更快地完成自有模型以及算法的迭代和进化。
在智能驾驶研发领域,如果采用传统的本地模型训练模式,完成一千个智驾模型训练,需要大约3个月。而利用星睿智算中心充沛的A.I算力,同样的工作则只需要8个小时,研发效率提升达二百多倍。
当然,吉利星睿智算中心绝不是仅仅用于企业智能驾驶业务的推进,相关技术的研发。其同样可以执行超算中心所具有的各项功能,例如支持汽车研发等等。此外,吉利为用户提供的云端支持,也基于该中心。
作为“云、数、智”一体化云计算平台,能够实现吉利控股集团体系下,含航空航天、高清地图、智慧能量、智慧动力、智能架构、智慧出行在内的全生态数据合规共享,为汽车生态链的全部环节(监测、运行、OTA)提供研发和运营支撑。
此外,吉利还联合阿里,首创了算力智能跨池调度技术,计算资源相对中国头部公有云服务商现有技术提升至少20%资源利用率,进一步加速智驾模型研发及人工智能业务。
当然我们也不能忘记的是,在这一切背后,阿里的身影。上述提及的三家智算中心,除去字节跳动旗下火山引擎协助的雪湖·绿洲,星睿与扶摇,均出自阿里云的手笔。
实际上,那些暂时没有独立建设智算中心的主机厂,目前也大多在利用阿里云提供的公云,在进行着相似的工作。
作为全球第三,亚太第一的云服务提供商,阿里云几乎可以说是为中国新一代智能汽车,搭建起了“产房”。
在其中,以车企独立建设的智算中心的角度,星睿智算中心无疑是现阶段最强大者。
星睿智算中心内景
然而在汽车智能和网联的这条赛道上,最终决胜的关键,并不是掌握了多么强大的工具,而在于车企如何利用手中的工具,打造出锁定胜局的产品。
【本文来自易车号作者汽车公社,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
发表评论