在线免费在线观看的a_久久国产晶品免费视频_亚洲最大视频偷拍网站_一级特级毛片一级黄色

您好,歡迎訪問上海意泓電子科技有限責任公司網站!
4新聞資訊
您的位置: 首頁 ->  新聞資訊 -> 嵌入式

?微軟AI芯片Brainwave開放云端試用版 比TPU快5倍

文章出處:嵌入式 責任編輯:上海意泓電子科技有限責任公司 發(fā)表時間:
2018
05-11

智東西5月8日消息,昨天,微軟在Build大會期間宣布,開發(fā)者現在可以接入微軟Azure云,試用由Project Brainwave芯片計算平臺提供的AI服務。同時還發(fā)布了可部署于邊緣設備平臺的Project Brainwave內測版。Project Brainwave計算平臺是微軟基于英特爾FPGA芯片打造的低延遲深度學習計算平臺。

微軟表示,與最流行的行業(yè)基準相比,Project Brainwave可以將實時AI計算的延遲時間降到最小,并且成本控制在可接受的范圍。

(微軟工程師道格·伯格舉著Project Brainwave芯片)

一、Project Brainwave是什么?

Project Brainwave項目在去年8月23日于芯片行業(yè)論壇HotChips被微軟提出。微軟表示Project Brainwave計算平臺的目標是:支持快速深度學習運算,并支持開發(fā)人員對芯片進行重構。

微軟將Project Brainwave計算平臺的架構分為三個層面:

1、高性能的分布式架構(架構層)

2、集成到FPGA中的硬件DNN引擎(硬件層)

3、針對訓練好的模型,支持平滑部署的一套編譯器及運行時環(huán)境(軟件環(huán)境)

去年提出Project Brainwave時,微軟表示,這個計算平臺將支持微軟Cognitive Toolkit和谷歌TensorFlow。。

今年3月,微軟為了測試Project Brainwave計算平臺的能力,讓自家的Bing搜索引擎接入了這個平臺,實驗結果表明,Bing搜索引擎的能力提升了十倍。

昨天發(fā)布Project Brainwave試用版,是微軟首次通過云端向外部用戶提供FPGA AI專用芯片的能力。

二、Project Brainwave中FPGA芯片的意義是什么?

AI芯片對于AI的意義,可以看作發(fā)動機對于汽車意義。所以Project Brainwave計算平臺的能力強弱,取決于這個平臺所使用的芯片。

微軟表示,Project Brainwave計算平臺使用的FPGA芯片將使AI數據處理速度很快,相比谷歌使用的TPU芯片,FPGA芯片的處理速度快上了5倍。微軟說道:“該芯片為實時AI而設計——這意味著,它能以極低的延遲在接收數據后立刻處理請求。由于云平臺需要處理實時數據流,不管是搜索請求、視頻、傳感器數據流還是用戶交互,實時AI正在變得越來越重要。”

這種芯片的另一個優(yōu)勢在于,客戶企業(yè)將能夠根據自己的需求重新對芯片系統(tǒng)進行設計,這是微軟為客戶提供更強靈活性服務策略的一部分。

三、FPGA芯片的優(yōu)劣勢

可見,在Project Brainwave項目中,微軟大力研發(fā)FPGA AI專用芯片,其他巨頭為了迎接即將到來的AI時代也進行著各自的努力,例如谷歌TPU、英偉達GPU等等。那么,他們各自都有何特點呢?

1.英偉達GPU

GPU并不是近期才出現的,其實它就是你電腦中顯卡的核心部件,名字是圖形處理器。

目前,GPU在AI領域的應用,都是采用“CPU+GPU”計算模型。

與CPU相比,CPU 由專為順序串行處理而優(yōu)化的幾個核心組成,GPU 擁有一個由數以千計的更小、更高效的核心(專為同時處理多重任務而設計)組成的大規(guī)模并行計算架構?!癈PU+GPU”計算模型能將應用程序計算密集部分的工作負載轉移到 GPU,同時仍由 CPU 運行其余程序代碼。從而提升運算速度。

(“CPU+GPU”運算示意圖)

但這種計算模型其實就是利用現有的成熟技術提供了一種通用級的解決方法來滿足AI深度學習的要求,而并不是一種針對性的專業(yè)解決方案。

2.谷歌TPU

TPU是谷歌專門為加速深層神經網絡運算能力而研發(fā)的一款芯片,目前主要運用于模型建立以及定點推測。

TPU其實是一個ASIC(專用集成電路),ASIC是應特定要求和特定電子系統(tǒng)的需要而設計、制造的集成電路。

通常而言,ASIC的開發(fā)需要耗時數年。但谷歌TPU從設計到驗證、構建和部署到數據中心里,只用了15個月。

除了開發(fā)部署時間短外,TPU在峰值性能上也較GPU有一定優(yōu)勢。GPU在單個時鐘周期內,可以處理數百到數千次運算。而TPU可以在單個時鐘周期內處理數十萬次運算。

同時,確定性是TPU專用用途帶來的另一個優(yōu)勢。CPU和GPU需要考慮各種任務上的性能優(yōu)化,因此會有越來越復雜的機制,帶來的副作用就是這些處理器的行為非常難以預測。而使用TPU能輕易預測運行一個神經網絡并得出模型與推測結果需要多長時間,這樣,就能讓芯片以吞吐量接近峰值的狀態(tài)運行,同時嚴格控制延遲。

不過,TPU的性能優(yōu)勢使得它的靈活性較弱,這也是ASIC芯片的常見屬性。

3.靈活的FPGA

FPGA全稱是Field Programmable Gate Array:現場可編程門陣列。FPGA內部集成大量的數字電路基本門電路和存儲器,用戶可以通過燒入配置文件來定義這些它們之間的連線,從而達到定制電路的目的。

通俗來說就是,對比TPU,TPU雖然也是基于特定需求設計的ASIC,但就好比是雕一尊雕像,雕好后不能再更改;而FPGA則是樂高積木,什么硬件電路都能模仿,而且能多次更改。

有了這個特點,FPGA的設計部署周期比TPU更短,只需要6個月左右,而且更加能靈活適應多種需求。

而且,FPGA不像GPU依賴于馮·諾依曼結構,一個計算得到的結果可以被直接饋送到下一個計算,無需在主存儲器臨時保存,因此不僅存儲器帶寬需求低,而且還具有流水處理的特點,大大減小了輸入與輸出的延時比。

FPGA的的架構固然帶來了應用上的靈活性,但是從執(zhí)行運算的效率上來說,它又遠遠比不上ASIC。FPGA的運算電路基于查找表,比如說,FPGA內部有1000萬個自定義邏輯部件,一個4輸入的查找表單元需要96個晶體管來支持,而在ASIC上來實現估計只需要10個左右。這些問題也導致了FPGA芯片的面積更大、功耗更多。

四、AI芯片熱潮

看完以上各個巨頭研發(fā)的AI芯片優(yōu)劣勢,我們可以感到,目前,尚未出現某種芯片“獨步天下”的態(tài)勢,各種芯片都有其優(yōu)劣勢。

AI是下一次科技革命的核心技術,全球企業(yè)都紛紛在AI芯片上發(fā)力,期待著自己成為這個行業(yè)的領頭羊。外國企業(yè)熱火朝天,中國企業(yè)也不甘人后,現在已經涌現地平線、寒武紀、深鑒科技、中天微等一批明星初創(chuàng)企業(yè)。數據顯示,僅去年下半年,在芯片制造巨頭臺積電的生產線上,就有超過30家AI芯片排隊等待流片。

眾多企業(yè)投身這個行業(yè),我們或許可以期待今后能有一款芯片,在GPU、ASIC、FPGA芯片的優(yōu)缺點之間,找到高靈活性、強運算能力、低能耗、低成本之間的平衡。


上海意泓電子科技有限責任公司 版權所有 未經授權禁止復制或鏡像

CopyRight 2020-2025 m.toastedesign.com All rights reserved   滬ICP備2021005866號