黑芝麻智能：BEV感知將成為車載感知的主流發(fā)展方向

黑芝麻智能

2023-06-27 10:00 8470

武漢2023年6月27日 /美通社/ -- 近日，由黑芝麻智能主辦的"2023智能汽車高峰論壇"匯聚了眾多行業(yè)專家和企業(yè)代表。在其中的軟件論壇上，來自不用領(lǐng)域的嘉賓共同探討新形勢(shì)下汽車軟件行業(yè)的未來。黑芝麻智能深度學(xué)習(xí)研發(fā)高級(jí)總監(jiān)王祚官在論壇上發(fā)表了主題為"BEV感知，給自動(dòng)駕駛開啟‘上帝視角'"的主旨演講，分享黑芝麻智能在BEV感知方面的研發(fā)進(jìn)展。

感知質(zhì)量更好的前融合方案

BEV是Bird's-Eye-View Perception的縮寫，即鳥瞰視角感知，簡(jiǎn)單而言就是融合車載多視角攝像頭的輸入，然后變成鳥瞰圖的檢測(cè)輸出，可用于各種下游任務(wù)。

相校于傳統(tǒng)的感知算法，BEV感知有明顯優(yōu)勢(shì)。如果把多視角的感知看作一個(gè)融合過程，傳統(tǒng)的感知算法可以看作是一個(gè)后融合方案，其典型做法是對(duì)每一路輸入的視頻做單獨(dú)檢測(cè)，然后通過一些方法把檢測(cè)結(jié)果融合起來。其缺點(diǎn)是會(huì)產(chǎn)生一些比較大的累計(jì)誤差。

BEV感知?jiǎng)t屬于前融合感知，把圖像特征先融合起來，直接生成BEV的檢測(cè)結(jié)果，如此省去了很多中間步驟，生成的感知結(jié)果質(zhì)量比后融合方案的更好。

王祚官表示，BEV感知能為自動(dòng)駕駛感知任務(wù)提供有效的時(shí)空表征方法，將成為車載感知的主流發(fā)展方向。

黑芝麻智能開發(fā)多重亮點(diǎn)的BEV技術(shù)

王祚官介紹，黑芝麻智能的BEV框架主要分三部分：第一部分是特征提取，對(duì)每一路輸入的圖像，提取其圖像特征；第二部分是BEV的特征生成，包含空間的融合和時(shí)間的融合；第三部分是目標(biāo)檢測(cè)。

整體而言，黑芝麻智能開發(fā)的BEV技術(shù)有諸多亮點(diǎn)：上下文感知增強(qiáng)的BEV投影，可自適應(yīng)時(shí)空采樣，可學(xué)習(xí)車道結(jié)構(gòu)的碼本，基于"BST渲染器"的實(shí)時(shí)矢量化地圖構(gòu)建能力，結(jié)合"NeRF + LiDAR"的 Occupancy Grid Map（占位柵格地圖）功能，以及芯片本身的高效網(wǎng)絡(luò)架構(gòu)與強(qiáng)大性能。

在將圖像投影到三維空間時(shí)，現(xiàn)有方法僅從一條光線中采樣上下文特征。黑芝麻智能采用了上下文感知的增強(qiáng)BEV，圖象包括非常豐富的場(chǎng)景信息，最終可以得到質(zhì)量非常高的BEV。

空間的融合之后，緊接著就是時(shí)間的融合，典型做法是把當(dāng)前均勻采樣的幀融合在一起。但這樣做有一個(gè)明顯問題，即車輛停止的時(shí)候，采樣會(huì)產(chǎn)生大量重復(fù)的幀，造成之前的路面信息丟失，導(dǎo)致算力浪費(fèi)，而且感知范圍會(huì)變小。黑芝麻智能的做法是增加了空間上的抽樣，即根據(jù)車身信息，每隔一定的距離做抽樣，然后把空間抽樣和時(shí)間抽樣結(jié)合起來，作為最后的目標(biāo)檢測(cè)。通過這種方式，車輛在緩慢行駛甚至停止的情況下，仍然能夠保證有較大的感知范圍。

車道是高度規(guī)則化的結(jié)構(gòu)，黑芝麻智能設(shè)計(jì)了用低維編碼的方法來引入車道線的結(jié)構(gòu)信息，學(xué)習(xí)并保存多種車道結(jié)構(gòu)的碼本(Codebook)，并在學(xué)習(xí)到的碼本指導(dǎo)下進(jìn)行預(yù)測(cè)。

在車輛周圍實(shí)時(shí)生成地圖對(duì)自動(dòng)駕駛非常關(guān)鍵。但是，地圖通常包含很多種類的元素，比如車道線、人行道、停車位等，這給網(wǎng)絡(luò)實(shí)時(shí)預(yù)測(cè)周圍地圖帶來了困難。黑芝麻智能采用矢量的方法作為統(tǒng)一的表達(dá)方式，開發(fā)了可微分的"BST-Renderer"，將各種地圖元素渲染成圖像，然后對(duì)渲染出的圖像進(jìn)行訓(xùn)練。用一致的矢量表示，的好處就是說，為后期的矢量地圖構(gòu)建提供了便利。

在提到OCCUPANCY GRID時(shí)，王祚官表示，一個(gè)空間是否被占據(jù)，表示方法是把它離散化成等大小的立方體，用一個(gè)參數(shù)來表示這個(gè)立方體被占據(jù)的概率是多少。傳統(tǒng)的典型做法是使用LiDAR信號(hào)，但會(huì)出現(xiàn)信號(hào)缺失或被遮擋的問題。黑芝麻智能設(shè)計(jì)了"NeRF + LiDAR"的方案，與僅使用 LiDAR相比，可端到端訓(xùn)練，充分結(jié)合圖像信息和LiDAR信息，對(duì)被遮擋區(qū)域依然可以進(jìn)行場(chǎng)景流監(jiān)督，可使用無LiDAR數(shù)據(jù)集進(jìn)行模型微調(diào)。

此外，BEV模型里面使用了很多Transformer模型，鑒于Transformer注意力機(jī)制的計(jì)算成本較高，黑芝麻智能簡(jiǎn)化了計(jì)算，使其適合在邊緣設(shè)備上運(yùn)行。

自研高性能芯片為BEV模型落地提供支持

黑芝麻智能已將開發(fā)的BEV模型部署到旗下華山二號(hào)A1000芯片上。A1000芯片擁有58TOPS(INT8)的強(qiáng)大算力，有矩陣運(yùn)行單元和非線性運(yùn)算單元，再加上DSP，能夠滿足行業(yè)需求。與此同時(shí)，BEV模型還可部署在黑芝麻智能最新發(fā)布的武當(dāng)系列C1200芯片上。該系列是業(yè)內(nèi)首個(gè)智能汽車跨域計(jì)算芯片平臺(tái)。

作為中國本土自動(dòng)駕駛芯片的供應(yīng)商之一，黑芝麻智能擁有全棧感知算法量產(chǎn)化能力，能夠提供客戶算法定制服務(wù)，支持第三方算法移植，多種算法交付方式等靈活的商業(yè)模式。這些感知算法能夠加速并且助力一些中短期內(nèi)智能領(lǐng)航和泊車應(yīng)用產(chǎn)品快速落地，從而加速整個(gè)芯片的量產(chǎn)及應(yīng)用。

消息來源：黑芝麻智能