久久国产欧美精品久久成人,亚洲欧美激情四射在线日,亚洲av高清一区在线

當(dāng)前位置：首頁(yè)> 行業(yè)資訊

熱頭條丨毫末DriveGPT大模型刷屏，有人問(wèn)馬斯克：你慌不慌？

2023-02-18 00:01:04 來(lái)源：IT之家

自動(dòng)駕駛?cè)τ?叒叕“出”大事了！

今天一大早，在朋友圈和各種群里刷到這樣一條新聞：DriveGPT來(lái)了！

DriveGPT到底是個(gè)啥？百度搜一下。

(相關(guān)資料圖)

這才一天，已經(jīng)爆了！百度搜索結(jié)果就沖到700萬(wàn)了。然后是谷歌和Bing：

然后注意到這家外媒（這是火出漢語(yǔ)圈了呀）

看熱鬧怎么能不去Twitter……這里竟然也有人在討論DriveGPT

居然這位大叔圈了馬斯克，說(shuō)：

有人比你們更快啊！

言外之意，這不是挑事么？

當(dāng)然，估計(jì)有網(wǎng)友也想看看馬斯克同志能回個(gè)信~手動(dòng)狗頭

吃了半天瓜，還是要言歸正傳，簡(jiǎn)單回顧下這個(gè)事情。

首先，毫末是誰(shuí)？

這家公司全名是毫末智行，是中國(guó)一家剛剛成立三年的自動(dòng)駕駛獨(dú)角獸公司，有乘用車輔助駕駛和末端物流自動(dòng)配送車等業(yè)務(wù)。在短時(shí)間內(nèi)，就做到了中國(guó)量產(chǎn)自動(dòng)駕駛第一名的位置。

這家公司很努力，兩年間就搞出了中國(guó)第一個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系，而且發(fā)展速度還特別快。

稍微關(guān)注這家公司的話，基本就是每三四個(gè)月迭代一次技術(shù)版本，交的作業(yè)還特別亮眼~

比如去年4月，毫末就在行業(yè)率先喊出了“重感知”的路線，其實(shí)就是特斯拉技術(shù)路線的中國(guó)版。不過(guò)，毫末的感知方案里還保留了“激光雷達(dá)”，搞一個(gè)雙冗余。

里面大篇幅提到了“Transformer”、“BEV感知”，這些概念后面承包了整個(gè)自動(dòng)駕駛行業(yè)的新聞稿。

那么，DriveGPT又是啥？

DriveGPT，按毫末官方的說(shuō)法，就是一個(gè)自動(dòng)駕駛認(rèn)知大模型，具體的叫法就是“人駕自監(jiān)督認(rèn)知大模型”。

字每個(gè)都認(rèn)識(shí)，連起來(lái)就不知道啥意思了吧。

簡(jiǎn)單來(lái)說(shuō)，實(shí)現(xiàn)自動(dòng)駕駛，分這么三步：

感知（看見(jiàn)東西）、認(rèn)知（預(yù)測(cè)、決策、規(guī)劃）、控制執(zhí)行

以往行業(yè)的關(guān)注點(diǎn)都是在感知層面，因?yàn)楦兄@一塊就已經(jīng)夠難搞了，認(rèn)知層面其實(shí)是更加難搞。

很多自動(dòng)駕駛公司談到這塊都會(huì)隱晦不言。

那不如看看毫末是怎么說(shuō)的吧

當(dāng)前自動(dòng)駕駛認(rèn)知主要是靠傳統(tǒng)規(guī)則定義的算法來(lái)做決策規(guī)劃。但是這一方法進(jìn)入瓶頸期，難以取得圖譜。特別是在馬上到來(lái)的復(fù)雜城市場(chǎng)景。

所以，毫末就開始嘗試使用人駕自監(jiān)督大模型的方式來(lái)提升決策效果。

那么，毫末是怎么做的呢？——大致也分了三階段：

第一個(gè)階段，引入個(gè)別場(chǎng)景的端到端的模仿學(xué)習(xí)，直接擬合人駕行為；

第二個(gè)階段，通過(guò)認(rèn)知大模型，引入海量正常人駕數(shù)據(jù)，通過(guò)Prompt的方式實(shí)現(xiàn)認(rèn)知決策的可控、可解釋；

第三個(gè)階段，也就是毫末認(rèn)知決策算法現(xiàn)在處于的階段，引入真實(shí)接管數(shù)據(jù)，并在大模型中開始使用RLHF（人類反饋強(qiáng)化學(xué)習(xí)）算法，讓模型學(xué)習(xí)人駕接管數(shù)據(jù)。

為啥要開始采用RLHF算法呢？

毫末CEO顧維灝說(shuō)，用大模型去擬合海量人駕數(shù)據(jù)，會(huì)導(dǎo)致訓(xùn)練出的模型傾向于擬合平均值，而非最優(yōu)值，也就是練出一個(gè)普通司機(jī)的水平。

所以，第三階段，引入這個(gè)和ChatGPT采用同樣強(qiáng)化學(xué)習(xí)的RLHF技術(shù)，就是要去學(xué)習(xí)那些人類更好的駕駛策略，來(lái)優(yōu)化自己的算法。

也就是說(shuō)，當(dāng)毫末認(rèn)知決策算法通過(guò)擬合、學(xué)習(xí)人駕數(shù)據(jù)，具有一定的駕駛決策能力后，毫末構(gòu)建了一個(gè)自動(dòng)駕駛決策的獎(jiǎng)勵(lì)模型（reward model），從而在各種規(guī)劃場(chǎng)景情況下做出最優(yōu)的決策。

所以，毫末CEO顧維灝才會(huì)在今年1月AI DAY上，提到自家的認(rèn)知大模型和ChatGPT思路不謀而合。現(xiàn)在想來(lái)，當(dāng)時(shí)的判斷確實(shí)是比較有前瞻性的！

事實(shí)上，毫末最早在行業(yè)就布局研究Transformer大模型，現(xiàn)在又提前將ChatGPT技術(shù)納入自己的技術(shù)體系

所以，為啥是毫末搞出了DriveGPT！

其實(shí)就是天下武功，唯快不破！

那DriveGPT到底有多能打呢？恐怕還得期待今年4月份毫末的發(fā)布。

如果說(shuō)，從毫末DriveGPT里學(xué)到點(diǎn)什么經(jīng)驗(yàn)?zāi)兀?/p>

我們可以從這個(gè)圖里找到答案！

每一次的技術(shù)飛躍，不就是一群技術(shù)狂人的孤注一擲嗎？

如果說(shuō)一次技術(shù)革命必然有一個(gè)確定的結(jié)果的話，那恐怕這個(gè)世界會(huì)非常的無(wú)聊。

但正是一些難以企及的目標(biāo)和一些敢為人先的勇氣，就會(huì)鞭策我們?nèi)Ρ寂堋?/p>

取乎其上，得乎其中……古人把生存的智慧早就寫好了。

標(biāo)簽：強(qiáng)化學(xué)習(xí) 這個(gè)事情技術(shù)革命