<th id="3focx"></th>
  • <button id="3focx"><object id="3focx"></object></button><dd id="3focx"></dd>
  • <form id="3focx"><strike id="3focx"></strike></form>
  •  

    特斯拉AI Day 變專場招聘?

    發布日期:2021-08-05

    核心提示:不久前,馬斯克通過個人推特,正式公布AI Day將在8月19號舉辦。這場預熱了大半年,還鴿了一個月的技術日,被馬斯克定義為了AI人
    不久前,馬斯克通過個人推特,正式公布AI Day將在8月19號舉辦。
     
    這場“預熱”了大半年,還鴿了一個月的技術日,被馬斯克定義為了“AI人才招聘會”。實際上,早在6月份的CVPR 2021上,特斯拉AI主管Andrej在演講中,也頻繁地暗示,希望有“智”青年加入特斯拉的AI團隊。
     
     
    利用每個公開機會在線“搖人”,特斯拉似乎在這樣的時間點發生了“用工荒”。通過公開信息來看,特斯拉近期并未出現大規模的人才流失。
     
    如此迫切招人,真相只有一個,特斯拉智能駕駛研發上邁入了新的發展階段,也遇到了整個行業此前都沒有遇到的難題。
     
    特斯拉的算法模型領先了多少?
     
    特斯拉今年7月在北美推送了 FSD Beta V9,通過國外網友的熱情分享,國內用戶也“云”體驗了V9的實際上路表現。V9基于純視覺,能實現點到點的自動駕駛輔助,可以自主處理城市道路中復雜的人車混流、無保護左轉等場景。
     
    雖然V9的表現還不盡人意,甚至有國外權威人士吐槽這個版本的FSD,“如同一個喝醉的人在開車”,但至少從系統推出的時間來看,特斯拉是暫時領先的。
     
    消費者視角來看,特斯拉的領先,主要在于算法模型的領先帶來的功能領先。特斯拉通過純視覺就能理解環境的深度信息,能夠預判目標的行動軌跡,不需要高精地圖就能實現微觀的路徑規劃,這些都使得V9能夠僅依靠攝像頭的感知,就能實現全場景的輔助駕駛。
     
     
    部分業內人士并不這么認為。“從算法模型設計模型結構優化方面,我覺得大家基本都拉平了,最大的差距就是在它的數據量上面”,商湯科技高級項目經理趙蒜告訴Dante Tech。
     
    紐邁科技計算機視覺研發總監成二康也告訴Dante Tech,計算機視覺發展到今天,單純算法模型層面,基本已經不存在誰絕對的領先,整個計算機視覺發展是比較開放的,前沿的研究也是開源的,想要在開放的環境中做到一家領先,幾乎是不可能的。
     
    計算機視覺領域有CVPR、ICCV、ECCV這樣的頂會,國內如商湯科技、百度Apollo這些關注計算機視覺研究的企業,每年都會有大量的論文投稿。特斯拉也會參與這些計算機視覺頂會,今年的CVPR上,特斯拉AI主管就分享了特斯拉的最新研發進展。
     
     
    人類在計算機視覺領域的智慧結晶,如同放在一個池子中共享,特斯拉的很多算法模型,也是來自這個池子中的前沿研究。
     
    既然計算機視覺有開放的社區,為何只有特斯拉使用了諸如深度預測、時間預測來識別被遮擋障礙物,SLAM構建局部地圖。亦或者說,如果算法模型層面,特斯拉并不比其他車企領先,那特斯拉在功能上的領先地位又是如何奠定的呢?
     
    數據催生的“天眼玩家”
     
    “魚塘”那么大,特斯拉怎么知道該釣哪條?因為特斯拉是“天眼玩家”,讓特斯拉成為天眼玩家的,正是特斯拉的車主們。
     
    CVPR 2021上,特斯拉AI主管Andrej演講中提到,特斯拉目前已經采集到了100萬個10秒視頻片段(8攝像頭36幀),這些片段中包含了60億個含深度信息的標注目標,總數據量達到了1.5PB。
     
    1.5PB數據是什么概念呢?1.5PB是1536TB,也就是需要1536個1T的移動硬盤才能裝得下,如果換算成高清的電影,大概是50000部,一個人不吃不喝9年才能全部看完。
     
    自動駕駛行業普遍說“掌握場景是獲勝的關鍵”,而場景則是從數據中提煉而來,而想要提煉數據,則需要做好兩件事:在架構上能收集盡可能多的數據,在技術上能處理盡可能多的數據。做到了這些,才能成為“天眼玩家”,知道哪些場景存在哪些需求,哪些需求可以用哪些算法模型來實現。
     
     
    特斯拉收集數據的優勢在于,從自動駕駛的軟硬件研發,到整車的生產銷售,都是特斯拉自己完成的。特斯拉可以通過每輛行駛在路上車,收集并回傳想要的數據,用這些數據來訓練算法模型,再通過影子模式驗證訓練好的算法模型。
     
    特斯拉目前全球保有量已經超過100萬輛,但私家車在數據采集上,和車企自己的工程車是不同的。工程車可以裝配昂貴的存儲設備,然后再直接從車上提取出來,這樣便可以做到實時的數據存儲。私家車無法做到數據實時存儲,而出于流量成本考慮,特斯拉也無法在車上做數據的實時上傳。
     
    自動駕駛企業AutoX創始人肖教授曾表示,特斯拉的存儲硬盤非常小,網絡帶寬也不大,數據都是現場采集現場扔掉。但如果參考特斯拉AI主管Andrej在CVPR 2021上的介紹,肖教授似乎只說對了前面的一半。
     
    Andrej介紹,特斯拉向用戶推送的版本中包含了 Triggers(暫譯作:特征觸發器),也就是說,每輛行駛在路上的特斯拉,并不會實時上傳所有數據,而是設置了一個AI觸發算法,通過算法判斷是否是想要的場景,并將觸發后采集的視頻片段上傳到特斯拉的服務器中。這些通過Triggers收集的數據已經在車端按照模型訓練的需求,通過自監督學習做了標注。
     
     
    特斯拉是從V9開始公布Triggers了,但實際上從前幾個版本,特斯拉已經開始這么做了。特斯拉目前共推送過221 個Triggers,覆蓋了不同場景的不同數據采集需求。
     
    業內人士告訴Dante Tech,特斯拉會隨著自己的版本迭代,向用戶推送不同的Triggers,回傳的數據類型也是不一樣的。該業內人士感嘆到,“我覺得沒有哪家企業,能像特斯拉一樣,已經把corner case收集到這樣一個程度了”。
     
    在車端做數據的打標簽并回傳,技術難度是很大的,這也就意味著,Triggers的做法雖然聽起來很美妙,但實際上采集到“稱心如意”數據的概率并不高。特斯拉會收到大量的數據,而這些數據中僅有一小部分是有價值的。
     
    如何提升挖掘corner case的效率,以及如何更高效處理采集的海量數據,成了特斯拉需要攀登的下座高峰。
     
    下座高峰:從技術落地到生產力革命
     
    Dojo超算中心是特斯拉AI Day的重頭戲,而Dojo的出現,或許是為了解決Triggers精度低,以及數據龐大帶來的新難題。那超算是如何提升Triggers精度的呢?
     
    舉個例子,假如特斯拉現在遇到的一個corner case,是無法識別一種特殊的標識牌,這種廣告牌在北美有300個,分布在不同的城市。特斯拉向車主推送了采集這種廣告牌的Triggers,希望采集完這300塊標識牌,用來訓練自己的算法模型。
     
    一開始的Triggers并不準確,后臺收到20000份數據中,僅有1份是目標廣告牌。特斯拉通過超算中心,使用超大模型來處理這些數據,超大模型的好處是,即便是數據量較少,也能保障輸出的效果好。簡單理解這如同一個你來描述我來猜的游戲,給到的描述越多,猜中的幾率概率越高,超大模型的參數量更多,如同描述越多,更能細化出目標標識牌牌的特征。
     
    通過大模型,可以優化Triggers,優化后的Triggers再部署到車上,可能返回的數據就成了1000份數據中有一份是目標標識牌,循環幾輪,就能實現收集到全部300個標識牌的目標,而這個corner case也將徹底被消滅。
     
     
    超算中心除了能提升數據采集的效率,加速消滅corner case,還可以通過超大模型提升AI算法模型訓練的效率。超大模型可以吸收更大的數據量,輸入更多的參數,表現出數據的更多特征,擁有更強的泛化能力?;诔竽P?,可以訓練出搭載在車端的小模型,通過超大模型訓練出來的AI模型,性能會優于普通AI模型。
     
    不光是特斯拉,近年來諸多科技公司都致力于開發超大模型,例如商湯的“AI大裝置”,華為的盤古大模型,Open AI的GPT-3模型等。大模型已經越來越被科技公司看做是,需要布局的核心生產力工具。通過大模型,可以降低應用端小模型的開發效率,也能提升應用端小模型的性能。
     
    但大模型除了需要大量數據之外,還必須借助超算中心才能完成。超大模型體量很大,它的計算同時需要在很多塊顯卡上并行處理,調用整個超算中心的計算能力。
     
    “現在為什么只有特斯拉一家車企建超算,因為它走到了這一步,數據量太大了,需要更好的方式來利用這些數據,但是國內任何一個車企暫時都還用不到,因為它沒有特斯拉這么大量的數據處理需求。”業內人士如此告訴Dante Tech。
     
    處理龐大的數據,是特斯拉跨過收集數據和模型架構設計之后,擺在面前的新難題。而除了Dojo和超大模型之外,特斯拉還將面臨軟件開發層面的生產力工具革新難題。
     
     
    隨著數據變得龐大,如何從海量數據中分揀出有效數據,分揀數據之后如何自標注,標注的數據如何協同開發共同完成模型訓練,以及完成模型訓練之后,如何快速部署上車,這些都需要生產力工具的革新。因為技術的飛輪已經轉動起來,特斯拉必須裝上齒比更合適的齒輪,才能確保每個環節都能穩定運轉。
     
    隨著特斯拉“車隊”規模逐漸龐大,依靠Triggers挖掘的數據會呈指數級增長,這如同一條流水線,上游的輸入逐步爆發,下游必須要有匹配的生產力工具升級,才能確保整條產線穩定產出。因此Dante Tech猜測,特斯拉這個時間節點迫切招人,大概是應對Dojo及軟件生產力工具優化的人才需求。
     
    而數據過大帶來的新壓力,對其他車企而言,或許是“甜蜜的煩惱”。
     
    特斯拉的“中國劫”
     
    對于特斯拉V9,消費者更關心的問題是,什么時候能夠在國內推送。但對特斯拉而言,可能更關心的是,V9到底還能不能在中國推送。
     
    網絡安全審查,已經成為影響國內自動駕駛產業發展的重要事件。從滴滴目前的處境來看,從嚴的概率會更大。
     
    目前涉及到影像信息及定位信息的回傳的輔助駕駛系統,只有特斯拉一家。雖然特斯拉也已經在國內建立了數據存儲中心,但這只是合規的第一步,從網絡安全角度來看,特斯拉需要解決的問題還非常多。
     
     
    一位接近有關部門的消息人士向Dante Tech透露,特斯拉的數據是實時采集的,路過軍區、政府等機要區域時,并沒有一個自動關閉的策略,這在中國本身就是不合規的。
     
    雖然特斯拉不依靠激光雷達,不使用高精地圖和高精定位,但視覺信息的回傳,以及用戶駕駛信息的使用,在當下同樣是很敏感的。國內的車企,對于視覺信息的回傳普遍很謹慎,都在等相關政策的落地,而這也是國內多數車企無法擁有如特斯拉一樣龐大數據量的原因。

     
    [ 新聞搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 違規舉報 ]  [ 關閉窗口 ]

     
    0條 [查看全部]  相關評論


    網站首頁 | 關于我們 | 聯系方式 | 使用協議 | 版權隱私 | 網站地圖 | 排名推廣 | 廣告服務 | 網站留言 | RSS訂閱 | 滬ICP備16055099號-3

    第一鋰電網 版權所有 © 2016-2018 咨詢熱線:021-6117 0511  郵箱:heli@heliexpo.com.cn 在線溝通:

    本網中文域名:第一鋰電網.中國本站網絡實名:第一鋰電網-中國最專業的鋰電池行業信息網站