歡迎訪問(wèn)甯夏禦鑫科技有限公司官網!
  • 服務熱(rè)線:0951-5952677
  • 搜索

01

2018.04

英偉達董方亮(liàng):為(wèi)AI而&£生(shēng)的(de)GPU

來(lái)源:本站(zhàn)發布日(rì)期:2018-04-04浏覽次數(shù):

懂(dǒng)方亮(liàng):英偉達自(zì)動駕駛業(yè)務中國(guó)區(qū∞€)負責人(rén),目前負責AI 和(hé)自(zì)動駕駛方面的↓→β(de)工(gōng)作,并且在 GPU 的(de)"​Ω≠研發、設計(jì)上(shàng)也(yě)有(yǒu)多(duō)年(nián↕∑×)的(de)經驗。

 

北(běi)大(dà)對(duì) GPU 的(de)貢獻

北(běi)大(dà)的(de)天之驕子¶¶₩£(zǐ)應該感到(dào)很(hěn)自(zì)豪,因為(wèi)GPU 的(ελ₽de)發展有(yǒu)一(yī)個(gè)很(hěn)重要(yào)↔→∏的(de)技(jì)術(shù)叫 Pixel Shadφ↑‍↓er(像素著(zhe)色器(qì)),像素著(zhe)色器(qì) ∞€是(shì)決定了(le)今天能(néng)夠做gaming、video  δ€α等很(hěn)多(duō)呈現(xiàn)≥∑​在大(dà)家(jiā)面前功能(néng)的(de)技(j 'ì)術(shù)之一(yī)。核心的(de)發明(míng)人(rén)是(shì)北(bě​Ωi)大(dà)本科(kē) 87 級物(wù)理(lǐ)系的&π(de)一(yī)位同學,所以北(běi)大(↔÷dà)人(rén)應該非常驕傲。北(běi)大(d£$à)對(duì) GPU 的(de)技(jì)術(shù)發展起到(dào)了(le)φ>α✔很(hěn)關鍵的(de)作用α×☆(yòng)。

 

董方亮(liàng)從(cóng)四個(gè)角度表述了(≤←∑₹le)GPU與AI的(de)前世今生(shēng)

 

對(duì) GPU 進行(xíng)一(yī)個(gè)簡單介紹

 

英偉達是(shì)一(yī)家(jiā)以 GPU技(jì)術(shù)™≈為(wèi)核心的(de)公司,從(cóng)成立那(nà)天起就( φ •jiù)做 GPU,到(dào)今天也(yě±± )在做 GPU。公司從(cóng)一(yī)個(g¶πè)視(shì)覺計(jì)算(suàn)的(d'✘ελe)公司轉變到(dào)今天 AI 計(jì)算(suàn)Ω↑的(de)公司,這(zhè)一(yī)轉變當然有(yǒu)時(shí)代的(de)原因:1)現(§ &‍xiàn)在産生(shēng)大(dà)量數(shù)據,其中有(yǒu)很(hěn£≤λ)多(duō)的(de)語音(yīn)、圖像數(shù)據;2)在α♣λ人(rén)工(gōng)智能(néng)方面,我們的(de)一(yī)些(xiē)基礎©₩ 研究有(yǒu)了(le)長(cháng)足的(de)發展,£₹同時(shí)在基于DNN(深度神經網絡)架構上(shàng)也(yě)有(yǒu)不(bù)錯(₽£βcuò)的(de)發展,與現(xiàn)在 CP₹ ​U 的(de)計(jì)算(suàn)模式不(bù)同。 ₽

将 GPU與 deep learning 相(xλ↓↑iàng)聯系

 

為(wèi)什(shén)麽 GPU非常合适于今天的(d♠♥♣e)AI的(de)計(jì)算(suàn),也(yě)就(jiù)是(shì) deep÷± learning?

 

從(cóng) GPU 計(jì)算(suàn)年(nián)譜可(kě)以看(kàn>σ$ )到(dào),英偉達在 06年(nián)的(de)時(shí)候做(zuò​'₩)了(le)一(yī)個(gè)CUDA(computing un↕∏©♣ifieddevice architecture),核心意思是(shì),GPU 是(shì)一α↕¥(yī)個(gè)多(duō)核的(de)計(jì)算(suàn)體(tǐ)。我們©≠₹δ如(rú)果能(néng)用(yòng)一(yī)套架構把★λ↔計(jì)算(suàn)核完整、方便地(dì)調動起來(lái),就(jiù)形成₩₹了(le)并行(xíng)計(jì)算(suàn)的(de∞♦)基礎。CUDA 包含了(le)從(cóng)底層到(←✘♠​dào)應用(yòng)層完整的(de) SDK,公司之前γ®≥就(jiù)已經做了(le)并✔׶£行(xíng)計(jì)算(suàn)的(de)充分(fēn)準備。從(cóng)Ω✘"π 06年(nián)到(dào)現(xiàn)在,ε♠£英偉達每一(yī)代産品,都(dōu)原生(shē→λ✔αng)地(dì)支持 CUDA。年(nián)譜中有(yǒu)另©λ¶一(yī)個(gè)重要(yào)的(de)時(sh₹∑í)間(jiān)點——2012年(nián),當時(shíλεΩ) AlexNet 用(yòng) GPU 做了(le)一(yī)個(gè)9 層<→的(de) DNN 架構來(lái)做圖像識别,® ♠±取得(de)了(le)很(hěn)好(hǎo)的(de)€♠效果。2012年(nián)可(kě)以認為(wè≠γi)是(shì) GPU 應用(yòng)于 ×Ωdeep learning 的(de)爆發∞←ε元年(nián)。随著(zhe)時(shí)間(jiān)的(de)發±λφ展,DNN 不(bù)斷演進。在各類 framework 不(bù)斷演進的(de)今天,GPU ≠♣與 deep learning緊緊地(dì)被綁在了(le)一(yī)起。

 

如(rú)今,摩爾定律是(shì)否能(néng)夠适應如(rú)今← 嶄新的(de)計(jì)算(suàn)架構?摩爾定律是(shì)以藍(lán)≈♦✘線表示,有(yǒu)一(yī)個(gè)難以突≥✘破的(de)平台期。主要(yào)難點之一(yī)在于,線程做的(d∏₩<e)比較小(xiǎo)會(huì)有(yǒu)很("α☆hěn)大(dà)的(de)挑戰。但(dàn)是(shì)deep lea≤↓׶rning 還(hái)在不(bù)斷發展,因此需要 £÷(yào)全新的(de)架構支持,并且需要(yào)沿←  ₩著(zhe)比摩爾定律更高(gāo)的(deα↓$)計(jì)算(suàn)量趨勢發展,才能(néng)匹配全新的(de)計(jì)算(suàn)模§•₽式,才能(néng)在 AI 時(shí)代體(tǐ)現(xiàn)良好(hǎoε ♠)的(de)計(jì)算(suàn)能(néng)力。

 

預計(jì)到(dào) 2025年(n™<"ián),GPU 有(yǒu)很(hěn)大(dà)的(de)需求量。GPU 時(shí↔♣¶₽)代興起的(de)原因在于,GPU 提供了(le)與之前 ge♥ σλneral purpose computing 不(bù)同♦‍‍的(de)模式。GPU 在支撐全新架構的(de)前提下(xià),能(néng)夠≈​δ≥支撐現(xiàn)有(yǒu)的(de)計(jì)算(suàn)力。

 

對(duì) CPU 與 GPU 做≠γ←一(yī)個(gè)簡單的(de)比較。GPU 與 CPU 的(de)特點不(₹<bù)同,GPU是(shì)一(yī)個(gè)簡單的(de)多(duō)核處理(♦£lǐ)器(qì),再結合CUDA之後,很(hěn)有(yǒu)利于做并行(xíδ≈ng)運算(suàn)。這(zhè)是(shì)GPU的(de)簡↑♦✔單架構,當然也(yě)有(yǒu)很(hěn)多(duō)有(yǒ♣βσ¶u)特色的(de)東(dōng)西(xī),包括多(duō)個(gè)'™↔≠streaming multiproces✘♠₹≥sor,即流的(de)多(duō)處理(lǐ)器(qì),上(shàng)面會(hu€λ♣ì)包int F16,F32,F64的(de)處理(lǐ☆σγε)核。因此,GPU很(hěn)适合做并行(xín£÷g)運算(suàn)。

 

Deep learning 是(shì)并行(xíng)運算(suàn)很(hěn✔φ★Ω)好(hǎo)的(de)應用(yòng)場(chǎng★$✔)景。這(zhè)是(shì)一(yī)個(gè)簡單的(de)神經網絡。可(kě)✔∞以與大(dà)家(jiā)簡單分(fēn)✘∏≥↓享一(yī)下(xià)我們為(wèi)何這(zhè)麽設計(jì) deep learπ★¥λning 的(de)網絡。最早,是(sh©$<πì)對(duì)于人(rén)腦(nǎo)假說(shuō)性的(de)理(lǐ)論模拟•≤。70 年(nián)代,兩位德國(guó)的(de)生(shēng)物(wù)∞©§>學家(jiā)解剖貓的(de)大(dà)腦(nǎo)時(shí),認為(wèi)神經元是(shì)•∑一(yī)層一(yī)層的(de),神經元之間(jiān)有(yǒu)反射弧,他(tā)們假​"說(shuō)當電(diàn)流通(tōng)過神經元之間(jiānα±★©)的(de)反射弧時(shí),是(shì)∞' ✔一(yī)個(gè)激活的(de)狀态。他(tā)們提出了(le)一(yī)套理(lǐ)Ω♠論。之後,在DNN 架構出來(lái)之後,用(yòng) DNN₹≥‌< 做具有(yǒu)特征的(de≈εβ)數(shù)據識别,有(yǒu)良好(hǎo)的(de)效果。前層的(de) laε★π≤yer 是(shì)後層的(de)淺層表現™®¥‍(xiàn),因此帶有(yǒu) patteγ‌≠rn 的(de)語音(yīn)、圖像數(shù)據能(néng)夠分(fēn)類。在深度神經 ♣網絡中,每一(yī)個(gè)節點都(dōu)可(© kě)以被模拟成計(jì)算(suàn)核。GPU承擔了(le)每一(yī)個(gè)深度ε±✔ 神經網絡節點的(de)計(jì)算(suàn),這(zhè)也(yě)是(shì) GPU 符₹‌合 DNN架構的(de)原因。因此,GPU是(shì¶₽£ε)線下(xià)訓練的(de)唯一(yī)選擇。φ®₽‌

 

Deep learning 其實包括兩部分(fēn),第一(yī)部分(≥∏ ≥fēn)是(shì)線下(xià)的(de)訓練,在雲端或者加載GPU 的(de)服≈↔β務器(qì)端做訓練;另一(yī)部分(fēn)是(shì)做線上(shàng‍₩​Ω)的(de)推理(lǐ)。在線下(xià)訓練,之後将訓練好(hβ§ǎo)的(de)模型放(fàng)到(dào)線上(shàng)去(q$×★ù)做推理(lǐ),這(zhè)是(shì)目前 dee×₩♦λp learning 較為(wèi)普适的(de)模式。

 

Deep learning 的(de)模式較為(wè€↔↕→i)适合三類數(shù)據,computer vision 數(shù)據,β®××語音(yīn)數(shù)據,自(zì)然語言處理(lǐ)數(shù)據。δ÷♥這(zhè)張PPT展現(xiàn)從(cóng) GPU 到(dào) SDK∏♠ 到(dào) framework 到( ™dào)上(shàng)層的(de)應用(yòng)。GPU♠™帶來(lái)的(de) deep learn♠±¶"ing 創造了(le)全新的(de)計(jì)算(suàn)時(shí)代,也(y•β≤©ě)給初創公司帶來(lái)很(hěn)多(duō)機(jī)會₽✔&€(huì)。

 

探討(tǎo)當今時(shí)代的(de) AI,以及今後的(de)AI會(huì)朝什(shén‌≤♥)麽方向發展

 

AI的(de)機(jī)會(huì)很(hěn)多(duō),在單一∞£(yī)技(jì)術(shù)和(hé)組合式産品中,都(dōu)有(y←→₽≤ǒu)良好(hǎo)的(de)市(shì±>≥)場(chǎng)。從(cóng)初創公司中看(kàn) deep learning δ≈≤ 中有(yǒu)哪些(xiē)機(jī)會(huì):1)健康醫(yī)療,比如(rú)皮™&©膚癌的(de)研究在用(yòng) deep learning 做;2)零售,主要↔₩(yào)解決商品選擇和(hé)支付問(wèn)題。Focal ÷✔ 公司解決如(rú)何讓傳統零售業(yè)爆發活力的(de)方案,核心技(jì)術(shù£♥₩)是(shì)對(duì)物(wù)體(tǐ)的(de)識别。客戶進入實體(tǐ)店(d♦£iàn)後,有(yǒu)類似于pad 的(de)裝置,用(yòng)手推車(chē)進行(xíng≥&×↑)購(gòu)物(wù),當挑選完商品後,不(bù)用(y≠¶♣↔òng)結賬,自(zì)動識别。

 

同時(shí),當商品從(cóng)貨架取下(xià)後,系λ×♠統會(huì)自(zì)動補貨。這(zh∑♣è)個(gè)公司主要(yào)面向零售業(yè)的(de)細分(fēnα§←ε)市(shì)場(chǎng);3)金(jī>σ&§n)融。美(měi)國(guó)有(yǒu)✘α>一(yī)家(jiā)投資公司,用(yòng♦$☆)了(le)無人(rén)機(jī)和(hé)衛星圖片,天天在美(měi) &國(guó)上(shàng)空(kōng)掃莊稼地(dì),利用(yò£ ♥ng) DNN 網絡做圖片識别,看(kàn)看♣♥ (kàn)某幾類莊稼的(de)長(cháng)勢如(rú)何,并在期貨交易所做(zuβ♦₹ò)對(duì)沖。可(kě)以通(tōng)過曆史數(shù)據φγ‍ 比對(duì),看(kàn)是(shì)欠收還(hái)是(shì)多(duō)收;4)安全δ★♠₽;5)IoT,比如(rú)機(jī)器(qì)人(rén)、無人(rén)↑ →機(jī)公司。目前有(yǒu)陪伴機(jī)器(qì)人(rén),服務機(jī)器(qì)​÷€人(rén),用(yòng)無人(rén)機(jī)撒農(nóng)藥,這(zhè)些ββ§←(xiē)都(dōu)是(shì)針對(duì)特殊場(chǎng)景的(de)很∞¥↕←(hěn)好(hǎo)的(de)應用(yòng);6)無人(rén)駕駛,代表了(le) β¥deep learning 技(jì)術(shù)與未來(lái)交通(tōng)行(xíng→γ→¥)業(yè)的(de)結合;7)網絡安全Ω$€♠。有(yǒu)些(xiē)公司用(yòng) ™β☆deep learning 做對(du&&ì)于病毒、惡意模式的(de)判斷,這(zhè)些(xiē)方案能(nén‌•g)夠實時(shí)升級,判斷新來(lái)的(de)病毒屬于哪一(yī)類。

與大(dà)家(jiā)分(fēn)享一(yī)下(xià)γ♥π一(yī)些(xiē) AI 的(de)典型應用(yòng)。第一(yī)個(‍♦σgè)應用(yòng)是(shì)在車(chē)裡(lǐ)用(yòng)語音(α÷π✔yīn)與車(chē)進行(xíng)交互;第二個(gè)應用(yòng)是(shì)基于圖​εφ♦像的(de)物(wù)體(tǐ)識别,能(néng)↔α✘β夠在圖片庫中找到(dào)心儀的(de)物(wù)品。在數(↓$∞shù)據庫領域,這(zhè)種基于圖片的(de)應用(yòng)也(yě)很(hěn)×®✔≈有(yǒu)意思。比如(rú) SAP 在訓練 DNN中,将廣告中公司的(de)φ∑$圖标抓取出來(lái),并給客戶一(yī)個±↓(gè)報(bào)告,在這(zhè)段視(shìα‍)頻(pín)中,圖标出現(xiàn)多(♣££duō)少(shǎo)次,出現(xiàn)在什(shén)麽位置,并判斷投資和(hé)®δ品牌曝光(guāng)度是(shì)否合理(lǐ)。這(zhè)一(yī)特性,給SA↑•€ P帶來(lái)很(hěn)好(hǎo)的(de)客戶反饋;第三個(gè)應用(yòng)是£δ♦(shì)基于用(yòng)戶行(xíng)為(wèi)作(¥♦±zuò)出判斷,比如(rú)喜歡什(shén)麽類型的(de)電(diàn)影(yǐng)。

我們與祖母可(kě)能(néng)交流困難,如(rú)何應用(yòng) NLP 技(jì)​ ≥術(shù)與她(tā)進行(xíng)交流,增強₹‍™人(rén)與人(rén)之間(jiān)的(de)溝通(tōng);第二張圖片與醫(yī)'€∞療相(xiàng)關;第三張圖片中是(shì)微(wēi)軟的↑★☆™(de)工(gōng)程師(shī),是(shì)一(yī)個(gè)天生(shēn≥•g)的(de)盲人(rén),微(wēi)軟現(xiàn)在有(yǒu)一(yī)種眼鏡α♠÷能(néng)夠進行(xíng)物(wù)體♠÷✘σ(tǐ)識别,這(zhè)也(yě)是(shì)基于deep learning很(hěn)​γ♥好(hǎo)的(de)應用(yòng)。

第一(yī)張圖是(shì)我們在平安城(<Ωchéng)市(shì)中抓取特征點;第二張圖是(shì×♠→)服務型機(jī)器(qì)人(rén);第三張圖是(shì)在農(nóng)業(≈εyè)方面的(de)應用(yòng)。因此,在 γ>αAI月(yuè) deep learning 的(de)時(shí)代,有(yǒu)很(×π"★hěn)多(duō)領域大(dà)家(jiā)可(kě)以嘗試去(qù)做(zu×β∞ò)。

這(zhè)張圖想與大(dà)家(jiā)分(fēn)享一(♠¥yī)下(xià)英偉達在自(zì)動駕駛領域的(de)應用(yòng)。我們将≤€≥♣自(zì)動駕駛變為(wèi)AI 的(de)任務,模φ¥✔±拟人(rén)進行(xíng)駕駛。當人(rén)駕駛時(shí),人(rén)¥®≠∞需要(yào)知(zhī)道(dào)周圍環境,車(chē)的(de)位置,并作出相¥ (xiàng)應的(de)駕駛策略,這(•↕zhè)也(yě)是(shì)AI的(de)任務。1)感知(zhī):我們會(huì)用(yòng₩ ¥★)多(duō)樣的(de)傳感器(qì)将周圍環境情況了(le)解清楚;×≥ 2)reasoning:判斷周圍環境是(shì)否安全;3)駕駛:依托于高(gāoΩ↕)精度地(dì)圖,高(gāo)精度地(dì)圖能(néng)夠提α> ☆供豐富的(de)環境信息和(hé)精确的(de)定位。

 

GTC 新産品解讀(dú)

第一(yī)個(gè)就(jiù)是(shì),英偉達在 GTC上(shàng)宣布了(☆♦le)新一(yī)代的(de) GPU,VOLTA100。我們每一₽¶Ω♦(yī)代的(de)GPU有(yǒu)一(yī)個(gè)科(kē)學家↑&♣(jiā)的(de)名字,這(zhè)一(yī)代的(de)GPU 對(duì)我們來(lá‌σi)說(shuō),有(yǒu)幾方面的(de)提高(gāo),第一(yī)是(shì)它有₹"€✘(yǒu) 210 億個(gè)晶體(tǐ)管,12納米"☆線程,然後整個(gè)核心闆的(de)面積在815毫米平方,這(zhè)是(shì)¥♠一(yī)個(gè)非常大(dà)的(de)進步,整個(↔↑×gè)架構上(shàng)有(yǒu)一π∞€(yī)個(gè)非常大(dà)的(de)進步。

 

這(zhè)一(yī)代,我們的(de)架構有(yǒu)一(yī)個(gè)很(hěn)好α©₹(hǎo)的(de)一(yī)個(gè)提升,我們會(huì)在這(zhè)一(∞∞¶yī)代架構裡(lǐ)面放(fàng)入一(yī)個(gè)Ten←®sor 核,它完成了(le)以前矩陣式同步這(zh¥ ©è)種的(de)矩陣式相(xiàng)乘,實現(xiàn)非常高(gāo)速的(↓¥de)運轉。這(zhè)樣的(de)結果會(huì)讓我們産生(s πhēng)120Teraflops 的(de)計(jì)算© (suàn)能(néng)力,這(zhè)•<種計(jì)算(suàn)能(néng)力無論針對(duì) Training 端還(hái)是♥≥'(shì) Inference 端都(dōu)是(shì)非常好(hǎo)的(de)進步。這(₩™®≠zhè)一(yī)代産品是(shì)英偉σ♣÷達最新在 GTC上(shàng)發布的(de)。



玖号科(kē)技(jì)有(yǒu)限公司版權所有(yǒu)&nb₹♦₽'sp; 京ICP證000000号