今年10月,英偉達發(fā)布了一款針對數(shù)據(jù)科學和機器學習的GPU加速平臺——RAPIDS,它能夠幫助超大規(guī)模的公司提高分析海量數(shù)據(jù)的速度,從而更加精準的預測業(yè)務(wù)。
在本屆GTC China 2018大會上,英偉達特別舉辦了媒體講解會,詳細介紹了RAPIDS的工作原理以及市場受眾。尤其值得一提的是DLI——深度學習學院,目前有12萬的開發(fā)者正在接受了英偉達人工智能的培訓。
揭秘英偉達RAPIDS平臺 數(shù)據(jù)科學在2010年變得非常興盛,正好是在那個節(jié)點摩爾定律不再像以前那么管用了。2010年CPU的速度足夠快的已經(jīng)可以支持人工智能和機器學習了,但是在那之后大數(shù)據(jù)發(fā)展的非常快,CPU卻沒有更快的速度發(fā)展,以至于到現(xiàn)在CPU能夠去處理的機器學習內(nèi)容和實際上所需要的數(shù)據(jù)科學家需要的算力,兩者有很大的鴻溝。
英偉達創(chuàng)始人兼CEO黃仁勛曾表示,“數(shù)據(jù)分析和機器學習是高性能計算市場中最大的細分市場,不過目前尚未實現(xiàn)加速。全球最大的行業(yè)均在海量服務(wù)器上運行機器學習算法,目的在于了解所在市場和環(huán)境中的復雜模式,同時迅速、精準地做出將直接影響其決策的預測。”
有了RAPIDS之后,就可以把深度學習的能力擴展到其它領(lǐng)域、大數(shù)據(jù)的領(lǐng)域。深度學習對于非結(jié)構(gòu)化數(shù)據(jù)比較好,比如:語音、視頻、圖片,但是機器學習是要用于結(jié)構(gòu)性的數(shù)據(jù)。
RAPIDS是什么?一個完全開源的軟件平臺。要用三個關(guān)鍵詞來概括,那就是面向數(shù)據(jù)科學和機器學習、開源和軟件平臺。人們使用RAPIDS一般出于兩個原因:一是數(shù)據(jù)科學家,希望自己的工作做得更快;二是不用學其他的軟件,利用已有軟件足矣。
RAPIDS希望幫助企業(yè)以“前所未有”的速度分析海量數(shù)據(jù)并進行精準的業(yè)務(wù)預測,用戶只需要進行非常小代碼的變化量,將典型訓練時間從數(shù)天減少到數(shù)小時,或者從數(shù)小時減少到數(shù)分鐘。這給數(shù)據(jù)科學家?guī)砹藰O大的信心。
據(jù)悉,RAPIDS首次為數(shù)據(jù)科學家提供了他們需要用來在GPU上運行整個數(shù)據(jù)科學管線的工具。最初的RAPIDS基準分析利用了XGBoost機器學習算法在NVIDIA DGX-2? 系統(tǒng)上進行訓練,結(jié)果表明,與僅有CPU的系統(tǒng)相比,其速度能加快50倍,大大提高效率,節(jié)省時間。
解決方案架構(gòu)與工程團隊副總裁Marc Hamilton在解答記者提問時特別舉了一個真實案例。在中國或者別的大的國家,政府的衛(wèi)生部門會從醫(yī)院、醫(yī)生和患者那里收取數(shù)據(jù),來探討“人是怎么樣可以生病的”。在冬天的時候,不管是人的流感,亦或是禽流感,它們的傳播速度都是非??斓?。在中國的挑戰(zhàn)就在于人口超過10億的國家,大家去醫(yī)院,醫(yī)院是不夠的。政府就可以用XGBoost,在去醫(yī)院的造訪人來尋找規(guī)律。如果去處理這些數(shù)據(jù)需要花4個月的時間就沒有用了,因為到夏天的話大家都很健康,“流感季”也結(jié)束了。所以如果用已有的機器學習改三行代碼,然后用數(shù)據(jù)跑一遍,只需要花4個小時而不是4個月的話,今天就可以給人發(fā)出警告,現(xiàn)在是很糟糕的流感季節(jié),大家盡量不要出去。
華大基因世界上最大的基因組也使用英偉達RAPIDS XGBoost對癌癥特異性肽和正常肽進行分類,比在CPU上快10倍。
目前,英偉達云上有600個應(yīng)用程序,它們都是基于GPU加速,并且加速有不同的方式。
深度學習學院助力AI開發(fā)者 在越來越多的領(lǐng)域中,深度學習方面的專長將成為核心技能。為了能夠?qū)⑹澜缟献顬轭I(lǐng)先的深度學習和AI技術(shù)帶給整個開發(fā)者群體,英偉達在2016年成立了深度學習學院。
英偉達深度學習學院通過培訓研究人員開發(fā)者以及數(shù)據(jù)科學家,用深度學習的方式來解決面臨最具挑戰(zhàn)性的問題。通過建立實驗室,開發(fā)課程,讓數(shù)據(jù)科學家、研究人員和開發(fā)者能夠用親身實踐的方式去學習深度學習。
英偉達開發(fā)者計劃全球副總裁Greg Estes 強調(diào),“GPU之上,如果沒有軟件、沒有應(yīng)用程序,那么沒人會買你的GPU。因此,在我的眼里,開發(fā)者是最重要的,所以我們花很大的力氣關(guān)注開發(fā)者的社區(qū)”。
英偉達的開發(fā)者計劃有四個方面,分別是“開發(fā)者計劃”、“深度學習學院”、“英偉達GPU云”和初創(chuàng)加速計劃。截至目前,開發(fā)者社區(qū)人數(shù)已經(jīng)超過100萬,有60萬個GPU相關(guān)的應(yīng)用程序。
除了人工智能,DLI還提供一些其他課程,包括無人駕駛汽車、健康、衛(wèi)生、金融服務(wù)、娛樂及安全城市。為了方便,他們把所有課程放在云端,開發(fā)者使用普通的筆記本電腦就能學習,并且DLI還提供親手操作的環(huán)境,讓所有開發(fā)者能夠從深度學習學院中學到的不同的技術(shù)、不同的工作、不同的數(shù)據(jù)。
Greg Estes介紹,“我們會教你怎樣利用數(shù)據(jù)、利用人工智能框架,讓它對圖像進行識別、分類,以及如何把這些學習知識,開發(fā)到一個應(yīng)用程序中。”他還提到,不同的人工智能應(yīng)用程序,它們會使用不同的神經(jīng)網(wǎng)絡(luò),例如圖像識別用CNN,機器人學動作會用到強化學習神經(jīng)網(wǎng)絡(luò)等。
英偉達越來越注重國內(nèi)的AI開發(fā)者,眾所周知中國是人工智能非常重要的一個市場。“初創(chuàng)加速計劃”就是針對開發(fā)者的“,目前已有將近四千人加入。
英偉達在國內(nèi)還有多家認證合作伙伴,訓練超過9000人,其中已有100個開發(fā)者獲得了認證。2019年在中國獲得培訓的開發(fā)者會超過10000人。
另外,英偉達還通過“DLI校園大使計劃”,通過認證的教職人員和研究者向?qū)W生人員和教學人員免費教授DLI課程。目前,中國已有11位“校園大使”,共培訓出500多名學生、教職人員和研究人員。
IDC的數(shù)據(jù)預測,兩年以后,也就是到2020年,80%的應(yīng)用里面都會含有AI的成分。不得不說,英偉達這盤棋下的真大!
質(zhì)檢
推薦