<var id="bljzh"><video id="bljzh"><thead id="bljzh"></thead></video></var>

<th id="bljzh"><noframes id="bljzh"><menuitem id="bljzh"></menuitem><menuitem id="bljzh"></menuitem>

<cite id="bljzh"><video id="bljzh"><menuitem id="bljzh"></menuitem></video></cite>

池州市億信網絡科技有限公司歡迎您

當前位置：首頁 > 新聞動態 > 公司動態

新聞動態News

聯系熱線

05662038848

微信號：ChizhouYixinNetwork
手　機：18956660320
郵　箱：120889080@qq.com
地　址：120889080

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷

發布時間：2023-10-25人氣：

中國芯片，再添一股新勢力——

國內首款存算一體智駕芯片，正式發布！

這款12nm芯片名叫鴻途?H30，從性能表現上來看，在功耗僅為35W的情況下，最高物理算力可達256TOPS。概括來說，就是芯片性能提升了2倍以上，但功耗卻減少了超50%。這一點，以Resnet50性能功耗為例，與國際芯片巨頭英偉達主流產品做對比即可一目了然。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖2)

不過有一說一，除了“國內首款存算一體智駕芯片”之外，圍繞鴻途?H30所體現的“業界第一”還不僅于此。

它的問世也成為了存算一體大算力芯片在國內的首次工程化落地。

而打造鴻途?H30背后的公司后摩智能（下文簡稱后摩），其自身也擁有著一個“業界第一”的標簽——

國內首家存算一體大算力AI芯片公司。

更重要的是，以上種種的成績，后摩是從自2020年底成立至今，僅僅花費2年多的時間“解鎖”。

如此速度和效能之下，也令活動現場掌聲不斷。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖3)

一、不只是一顆芯片這么簡單
我們進一步再來深入了解一下這款存算一體架構芯片。

許多了解芯片的小伙伴在看到“256TOPS”時，就會產生疑問：市面上不是已經有很多能夠達到這個算力值的芯片了嗎？

我們需要注意的是，鴻途?H30亮出來的是物理算力，并非是市面上常說的稀疏虛擬算力。

這也就意味著它一舉成為了國產智駕芯片里物理算力最大的那一個。

更難能可貴的是，在拿下最大算力的同時，功耗正如我們剛才提到的，僅為35W。

如此看下來，芯片的能效比便是幾倍于同類的產品了。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖4)

除此之外，在活動現場，后摩對鴻途?H30更多的細節參數做了展示：

12nm工藝
支持外擴Memory，寬帶達128GB/s
支持16路FHD Encoder/Decoder
支持PCIe 4.0，x8，x4，x2，RC&EP mode
……

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖5)

性能指標方面，鴻途?H30與英偉達產品相比，在Resnet50 Batch=1和Batch=8上，分別達到了5.7倍和2.3倍。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖6)

計算效率方面，鴻途?H30更是拿下了11.3倍和4.6倍的成績！

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖7)

那么具備如此高性能存算IP，如何能將其利用到位，便涉及到AI處理器架構和設計的問題了。

而在活動現場，后摩也是將其背后的架構設計毫無保留地展示了出來——IPU（Intelligence Processing Unit）。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖8)

從整體來看，后摩在架構設計上的規劃采用了“三步走”的策略。

首先便是第一代IPU天樞架構，這是專門為自動駕駛所打造的IPU，而剛才我們提到的鴻途?H30正是基于此。

談到這個架構是如何設計出來的，就不得不先提一下以往芯片的設計架構。

例如特斯拉FSD的集中式計算，就是非常典型的通過堆積大量計算資源來提高性能。它就像是一個四合院，院子里啥都有，主人們在院子里可以盡情溝通交流，但問題也非常明顯，就是四合院的面積就只有那么大，居住者數量就是有限的。后來也有人提出了分布式計算的方法，把算力很大的核拆分成若干個小核；這些小核可以獨立完成小任務，也可以共同完成大任務。這種方式像是現代高層公寓，每層樓都有獨立的基礎生活功能，也可以方便復制和擴展；但問題是每層樓之間的溝通比較困難。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖9)

因此，后摩智能的天樞架構所采用的便是二合一的思路——結合古典中式建筑和現代高層建筑。

簡單來說，每個芯片都包含4個IPU核；每個IPU核又有4個Tile；而每個Tile內部還有CPU、張量引擎、特殊功能單元、矢量處理器和多通道DMA等。這樣的架構使得AI計算不但不用在多個處理器（例如CPU，GPU，DSP）之間分配任務，甚至不用出AI核，就可以高效的完成全部端到端的計算。這種架構還可以說是像一個綜合辦事大樓，走進去，一站式完成各種業務，大幅提高了效率。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖10)

總結來說，天樞架構的特點之一就是多核/多硬件線程實現計算效率與算力靈活擴展的平衡。除此之外，它還可以擺脫系統總線的桎梏，其雙環拓撲專用總線可以實現靈活的數據直傳。就像在多層空中四合院之間，建了個直接入戶的電梯，可以快速做到傳輸。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖11)

至于后摩在未來要進一步研發的天璇架構和天璣架構，則將聚焦在擴大模型應用邊界和通用人工智能。

在現場，后摩也展示了搭載鴻途?H30后無人小車上路的實測。

但如果你覺得后摩僅僅是拿出來了一塊芯片，那就有點too simple了些。

在如此短促的研發時間里，它還一口氣發布了力馭?域控制器和后摩大道?軟件平臺。

力馭是后摩面向智能駕駛市場的大算力域控制器產品，據悉，只需要搭載單顆鴻途?H30，便可以滿足智能駕駛多種傳感器、從L2到L4所有AI計算的需求。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖13)

最后，還有一個后摩大道?軟件平臺，是為鴻途?H30芯片產品開發的AI軟件開發平臺。

它的作用便是可以讓客戶在使用后摩存算一體架構產品時，能夠將開發、調試和部署應用的效率大幅提高。

△注：后摩智能BEV模型實測

以上便是后摩第一次正式亮相所給出的主要“作業”了。通過各種數據和效果的對比展示，其在大算力國產智駕芯片的實力可見一斑。但更令人驚嘆的，還應當屬“后摩速度”——一切都在2年多時間完成。

二、如何在2年時間“煉”成的？
不同于美國創業公司從車庫、大學宿舍開始的那般浪漫與理想，后摩的創業起點非常出乎人們的意料——沙縣小吃。沒錯，正是在這種享受餛飩與熱湯之際，幾個人一拍即合，決定創業搞AI芯片。不過賽道鎖定在芯片，除了大環境的因素之外，也與小伙伴們每個人都向往“萬物智能”的生活相關。

例如有人家住得特別遠，若是自動駕駛成熟了，便可以邊通勤邊辦公；還有人非常顧家，希望有個機器人把家務全包了······

那么問題來了，到底什么樣的芯片才能做到無處不在、讓萬物實現智能？

極致的效率，毋庸置疑是非常關鍵的因素之一。

然而當時后摩的初創團隊從科技發展歷史看清的一個事實是，每1000倍的效率提升將造就一個計算時代。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖15)

若是想要達到他們理想的萬物智能世界，那么算力起碼也得是現今芯片計算效能的1000倍。

加之摩爾定律的逐步失效，他們便將目光聚焦到了另一種打法——換架構，搞存算一體。

團隊堅定認為，這就是后摩爾時代下的破局之道：

算力得大，功耗要低，面積要小，成本還得廉。

以至于CEO吳強在現場這般回憶道：我們太喜歡這個方向了，連公司名字都是從這而來——后摩智能。（雖然也有人會打電話問是不是做摩托車的……）

不過講真，存算一體這個技術在兩三年前并沒有像現在這般火爆?？梢哉f后摩成為了最早一批嘗到紅利的公司，也順理成章地使其成了國內第一個搞存算一體大算力AI芯片的公司。而之所以會將第一個落地場景放到自動駕駛，用吳強的話來說就是，“自動駕駛是萬物智能美好生活的重要組成部分，人們幾乎在花1/8清醒時間在開車”。并且自動駕駛作為“集AI技術大成者”的領域，能啃下這塊硬骨頭，那么再拓展到其它領域也就會輕松很多。

賽道、方向、技術，在創業初期三大最重要的關鍵因素定下來之后，接下來就是進入更煎熬的研發階段了。雖說是煎熬階段，但有一說一，對于后摩團隊來說，或許都已經是駕輕就熟的事情，因為公司聚集了一幫芯片“老手”。

例如創始人吳強，博士畢業于普林斯頓大學計算機博士學位，研究方向正是高能效比計算芯片及編譯器。

畢業之后，他還先后工作于Intel、AMD、Facebook等國外知名企業；值得一提的是，在AMD期間曾擔任GPGPU/OpenCL創始團隊核心成員。

吳強不僅擁有國外的工作經驗，在2017年回國之后，也是在國內AI知名獨角獸企業擔任技術副總裁和CTO等職務。

在學術方面，吳強曾獲第38屆計算機體系架構頂會MICRO-38 唯一的一個最佳論文獎；科研成果被美國業內雜志IEEE Micro 評選為年度最有影響的12 個科技成果之一。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖16)

△后摩智能創始人兼CEO，吳強

再如后摩智能聯合創始人、芯片研發副總裁陳亮，本碩博畢業于清華大學，曾任海思CPU芯片資深架構師、地平線AI芯片首席架構師。

在做產品上，后摩聯合創始人、產品副總裁信曉旭，具有15年以上計算芯片產品、市場和銷售經驗，曾任海思計算芯片產品總監。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖17)

△左：陳亮；右：信曉旭

而從后摩整體研發團隊構成來看，碩、博士占比70%以上；核心成員均主導過多顆世界級芯片的設計量產，類別涵蓋GPU、CPU、高性能車規級AI芯片等。

更重要的是，用吳強自己的話來說，后摩的研發團隊人員都是非常純粹的人，肯吃苦、夠努力。

如此來看，也就不難理解為什么能夠在2年多的時間里，將存算一體芯片從0到1開花結果了。

三、芯片的“后摩時刻”已至
雖然芯片產品已經發布、量產，但最后我們還需要對一個問題做深入的探討——存算一體，是否真的是正確的方向。

要回答這個問題，我們還需先得知道芯片算力的發展出了什么問題。

無論是計算機、手機，還是智能手環等產品，它們內部程序運行機制都繞不開一個著名的計算體系，馮·諾依曼體系結構。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖18)

它的一個特點，就是計算和存儲是分離的。

若是通俗一點理解，我們可以將這個過程視為在廚房炒菜：

存儲器：相當于廚房里的冰箱；
數據：相當于冰箱里的菜；
計算器：相當于洗菜、切菜和炒菜。

那么要完成一道菜，就需要先從冰箱里把菜取出來，再去廚房里洗、切、炒。

那么問題來了，這些菜需要在存儲器和計算器之間瘋狂地做搬運工作，這就無形之間產生了巨大的時間開銷，若是對于較低的計算量來說，馮·諾依曼體系結構尚且還可處理，但誰能想到，在信息數據量爆炸的當下，人們對算力的需求會變得如此之大。舉個例子，若是用全卷積網絡處理一張分辨率為224x224大約5萬像素的圖片，需要的計算量為5x109次的計算。這個任務若是放在一個CPU核心上處理，需要足足3秒鐘的時間，慢，著實太慢！

單單是這么簡單的任務尚是如此，近年來隨著AIGC熱潮的到來，大模型成為了產學界的香餑餑，而動輒需要對上千億參數做訓練推理，需要的算力之大可見一斑。

即便現代很多芯片開始設計更復雜的多級存儲結構，例如把SRAM（靜態隨機存儲器）作為距離計算單元最近的緩存，保證最高的讀寫速度，但容量還是非常的有限。

例如在下圖英偉達GA102 GPU中，藍色方塊區域便是緩存區域，即便看上去占了不少空間，但其實容量也就6MB而已。

這在當今主流AI任務面前，簡直是大巫見小巫了。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖20)

這，就是當下算力發展所遇到的致命瓶頸。

而且就過去二十年的發展來看，處理器性能以每年大約55%的速度提升，但內存性能的提升速度每年只有10%左右。

存儲速度長期滯后于計算速度，因此就導致了芯片性能難以滿足AI需求的情況。

不僅如此，近年來“摩爾定律即將失效”的聲音也是此起彼伏，很多人認為傳統的芯片無法再勝任新的大算力任務了。

雖然業界在后來提出了GPU、多核CPU等解決方案，但依舊是無法繞開馮·諾依曼體系結構最為致命的瓶頸問題。

在如此情況之下，業界便提出了更為大膽的想法——干脆把冰箱和廚房搞到一起，讓取菜、洗菜、切菜和炒菜都在一個空間里完成——即，存算一體。

對應到芯片設計，就意味著把分開的計算單元和SRAM單元重新設計，把乘加單元打散并插入到SRAM陣列當中，以此形成新的存算單元。

如此一來，每個存算單元既保留了SRAM本身的規則性，便于高速讀寫；又擴充了并行計算功能，實現高能效計算。

以后摩發布的鴻途?H30為例，在存算一體架構之下，便可以在每秒計算超過4x10^12次。

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖23)

和其它AI芯片相比，后摩存算一體的宏單元在同樣能耗下提供的算力，可以直接飆升10倍！

自主造芯新突破：256TOPS算力刷新國產性能榜，功耗低至35W，首個存算一體智駕芯片兩年交卷(圖24)

但其實存算一體技術早在2011年就引起學術界關注，而后在2016-2017年成為學術界熱議的話題。

到2019年逐漸開始受到工業界和資本的關注，彼時大家的討論主要集中在這項技術的可靠性上。

從2020年開始，越來越多的玩家進入這個市場，并且大公司都開始在存內計算上發力，此時的存內計算已成為產業界“不得不跟進”的技術之一，大家的討論聚焦在存內計算未來的市場空間上。

再從市場規模角度來看，量子位在《存算一體芯片深度產業報告》中曾經預測：2030年，基于存算一體技術的大算力芯片市場規模約為67億人民幣。

由此可見，不論是從技術亦或是市場的發展和預測來看，存算一體確實是解決算力瓶頸的一大利器。

而作為率先入局的后摩智能，也給出了自己的觀點：①存算一體的價值在于，它是一種比傳統架構更接近人腦的計算方式，能達到遠超傳統方式的高計算效率，和智能駕駛終局的需求天然吻合；②2023年，會是存算一體商業落地的元年。

至此，對于芯片算力的瓶頸，后摩智能已經給出了自己的一套打法，并且已經交出了一份高分作業。站在現今后摩爾時代的當下，或許芯片的“后摩時刻”已經到來。

文章來源：量子位

上一篇：Intel處理器品牌正式升級：推出旗艦級酷睿Ultra

下一篇：聯想小新Pro 24/27一體機開啟預售：12代酷睿、2.5

?

網站首頁新聞動態產品展示案例展示綜合視頻解決方案服務支持業務介紹網站地圖

池州市億信網絡科技有限公司

聯系方式

手機：18956660320　電話：05662038848
郵箱：120889080@qq.com　QQ：120889080
地址：安徽省池州市貴池區石臺路681號
備案號：皖ICP備17006007號　公安網備案號：34170202000374
申明：本站文章及視頻部分來自互聯網轉載，如有侵權請聯系我們立即刪除

掃描二維碼

訪問手機站

微信二維碼

<var id="bljzh"><video id="bljzh"><thead id="bljzh"></thead></video></var>

<th id="bljzh"><noframes id="bljzh"><menuitem id="bljzh"></menuitem><menuitem id="bljzh"></menuitem>

<cite id="bljzh"><video id="bljzh"><menuitem id="bljzh"></menuitem></video></cite>