自動(dòng)駕駛?cè)τ?叒叕“出”大事了!
今天一大早,在朋友圈和各種群里刷到這樣一條新聞:DriveGPT來(lái)了!
DriveGPT到底是個(gè)啥?百度搜一下。
(相關(guān)資料圖)
這才一天,已經(jīng)爆了!百度搜索結(jié)果就沖到700萬(wàn)了。然后是谷歌和Bing:
然后注意到這家外媒(這是火出漢語(yǔ)圈了呀)
看熱鬧怎么能不去Twitter……這里竟然也有人在討論DriveGPT
居然這位大叔圈了馬斯克,說(shuō):
有人比你們更快啊!
言外之意,這不是挑事么?
當(dāng)然,估計(jì)有網(wǎng)友也想看看馬斯克同志能回個(gè)信~手動(dòng)狗頭
吃了半天瓜,還是要言歸正傳,簡(jiǎn)單回顧下這個(gè)事情。
首先,毫末是誰(shuí)?
這家公司全名是毫末智行,是中國(guó)一家剛剛成立三年的自動(dòng)駕駛獨(dú)角獸公司,有乘用車輔助駕駛和末端物流自動(dòng)配送車等業(yè)務(wù)。在短時(shí)間內(nèi),就做到了中國(guó)量產(chǎn)自動(dòng)駕駛第一名的位置。
這家公司很努力,兩年間就搞出了中國(guó)第一個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系,而且發(fā)展速度還特別快。
稍微關(guān)注這家公司的話,基本就是每三四個(gè)月迭代一次技術(shù)版本,交的作業(yè)還特別亮眼~
比如去年4月,毫末就在行業(yè)率先喊出了“重感知”的路線,其實(shí)就是特斯拉技術(shù)路線的中國(guó)版。不過(guò),毫末的感知方案里還保留了“激光雷達(dá)”,搞一個(gè)雙冗余。
里面大篇幅提到了“Transformer”、“BEV感知”,這些概念后面承包了整個(gè)自動(dòng)駕駛行業(yè)的新聞稿。
那么,DriveGPT又是啥?
DriveGPT,按毫末官方的說(shuō)法,就是一個(gè)自動(dòng)駕駛認(rèn)知大模型,具體的叫法就是“人駕自監(jiān)督認(rèn)知大模型”。
字每個(gè)都認(rèn)識(shí),連起來(lái)就不知道啥意思了吧。
簡(jiǎn)單來(lái)說(shuō),實(shí)現(xiàn)自動(dòng)駕駛,分這么三步:
感知(看見(jiàn)東西)、認(rèn)知(預(yù)測(cè)、決策、規(guī)劃)、控制執(zhí)行
以往行業(yè)的關(guān)注點(diǎn)都是在感知層面,因?yàn)楦兄@一塊就已經(jīng)夠難搞了,認(rèn)知層面其實(shí)是更加難搞。
很多自動(dòng)駕駛公司談到這塊都會(huì)隱晦不言。
那不如看看毫末是怎么說(shuō)的吧
當(dāng)前自動(dòng)駕駛認(rèn)知主要是靠傳統(tǒng)規(guī)則定義的算法來(lái)做決策規(guī)劃。但是這一方法進(jìn)入瓶頸期,難以取得圖譜。特別是在馬上到來(lái)的復(fù)雜城市場(chǎng)景。
所以,毫末就開始嘗試使用人駕自監(jiān)督大模型的方式來(lái)提升決策效果。
那么,毫末是怎么做的呢?——大致也分了三階段:
第一個(gè)階段,引入個(gè)別場(chǎng)景的端到端的模仿學(xué)習(xí),直接擬合人駕行為;
第二個(gè)階段,通過(guò)認(rèn)知大模型,引入海量正常人駕數(shù)據(jù),通過(guò)Prompt的方式實(shí)現(xiàn)認(rèn)知決策的可控、可解釋;
第三個(gè)階段,也就是毫末認(rèn)知決策算法現(xiàn)在處于的階段,引入真實(shí)接管數(shù)據(jù),并在大模型中開始使用RLHF(人類反饋強(qiáng)化學(xué)習(xí))算法,讓模型學(xué)習(xí)人駕接管數(shù)據(jù)。
為啥要開始采用RLHF算法呢?
毫末CEO顧維灝說(shuō),用大模型去擬合海量人駕數(shù)據(jù),會(huì)導(dǎo)致訓(xùn)練出的模型傾向于擬合平均值,而非最優(yōu)值,也就是練出一個(gè)普通司機(jī)的水平。
所以,第三階段,引入這個(gè)和ChatGPT采用同樣強(qiáng)化學(xué)習(xí)的RLHF技術(shù),就是要去學(xué)習(xí)那些人類更好的駕駛策略,來(lái)優(yōu)化自己的算法。
也就是說(shuō),當(dāng)毫末認(rèn)知決策算法通過(guò)擬合、學(xué)習(xí)人駕數(shù)據(jù),具有一定的駕駛決策能力后,毫末構(gòu)建了一個(gè)自動(dòng)駕駛決策的獎(jiǎng)勵(lì)模型(reward model),從而在各種規(guī)劃場(chǎng)景情況下做出最優(yōu)的決策。
所以,毫末CEO顧維灝才會(huì)在今年1月AI DAY上,提到自家的認(rèn)知大模型和ChatGPT思路不謀而合。現(xiàn)在想來(lái),當(dāng)時(shí)的判斷確實(shí)是比較有前瞻性的!
事實(shí)上,毫末最早在行業(yè)就布局研究Transformer大模型,現(xiàn)在又提前將ChatGPT技術(shù)納入自己的技術(shù)體系
所以,為啥是毫末搞出了DriveGPT!
其實(shí)就是天下武功,唯快不破!
那DriveGPT到底有多能打呢?恐怕還得期待今年4月份毫末的發(fā)布。
如果說(shuō),從毫末DriveGPT里學(xué)到點(diǎn)什么經(jīng)驗(yàn)?zāi)兀?/p>
我們可以從這個(gè)圖里找到答案!
每一次的技術(shù)飛躍,不就是一群技術(shù)狂人的孤注一擲嗎?
如果說(shuō)一次技術(shù)革命必然有一個(gè)確定的結(jié)果的話,那恐怕這個(gè)世界會(huì)非常的無(wú)聊。
但正是一些難以企及的目標(biāo)和一些敢為人先的勇氣,就會(huì)鞭策我們?nèi)Ρ寂堋?/p>
取乎其上,得乎其中……古人把生存的智慧早就寫好了。
標(biāo)簽: 強(qiáng)化學(xué)習(xí) 這個(gè)事情 技術(shù)革命
熱頭條丨毫末DriveGPT大模型刷屏,有人問(wèn)馬斯克:你慌不慌?
當(dāng)前短訊!如何手工刺繡皮革
祥鑫科技:預(yù)計(jì)前三季度歸母凈利潤(rùn)1.6億元1.7億元,同比增長(zhǎng)188.87%206.92%
天天信息:文言文賣炭翁朗讀_賣炭翁朗讀