國(guó)產(chǎn)AI大模型陸續(xù)上線(xiàn),智能算力需求井噴。
IDC預(yù)計(jì),國(guó)內(nèi)2026年智能算力規(guī)模有望進(jìn)入每秒十萬(wàn)億億次浮點(diǎn)計(jì)算級(jí)別,2021-2026年智能算力規(guī)模年復(fù)合增長(zhǎng)率有望達(dá)52.3%。
算力是集信息計(jì)算力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲(chǔ)力于一體的新型生產(chǎn)力,AI芯片是實(shí)現(xiàn)高算力的核心。當(dāng)前主流的AI算力芯片主要包括GPU、FPGA、ASIC、NPU等,其中GPU在訓(xùn)練負(fù)載中具有絕對(duì)優(yōu)勢(shì)。
GPU的核心競(jìng)爭(zhēng)力在于架構(gòu)等因素決定的性能先進(jìn)性和計(jì)算生態(tài)壁壘。目前全球GPU市場(chǎng)的絕對(duì)份額被英偉達(dá)和AMD占據(jù),國(guó)內(nèi)企業(yè)主要有華為海思、海光信息(688041.SH)等。
英偉達(dá)之所以能夠成為GPU全球頭號(hào)玩家,主要源于其在先發(fā)優(yōu)勢(shì)下建立的CUDA生態(tài)。CUDA架構(gòu)提供了GPU編程的簡(jiǎn)易接口,大大降低了開(kāi)發(fā)門(mén)檻,因此,CUDA推出后發(fā)展迅速,應(yīng)用廣泛。
同時(shí),由于CUDA的閉源特性和快速迭代,后來(lái)者很難通過(guò)指令翻譯等方式完美兼容,即使部分兼容也會(huì)有較大的性能損失,導(dǎo)致在性?xún)r(jià)比上持續(xù)落后英偉達(dá)。
業(yè)內(nèi)人士認(rèn)為,國(guó)產(chǎn)GPU在起步階段兼容現(xiàn)有生態(tài)更容易發(fā)展,先求生存,但長(zhǎng)期還是要擺脫兼容思路,站穩(wěn)腳跟后再求發(fā)展自有核心技術(shù)。
海光信息的DCU屬于GPU的一種,在生態(tài)、編程環(huán)境等方面與CUDA高度相似,CUDA用戶(hù)可以以較低代價(jià)快速遷移至海光信息的ROCm平臺(tái)。目前海光DCU主要部署在服務(wù)器集群或數(shù)據(jù)中心,為應(yīng)用程序提供高性能、高能效比的算力,支撐高復(fù)雜度和高吞吐量的數(shù)據(jù)處理任務(wù)。海光深算二號(hào)已經(jīng)發(fā)布,實(shí)現(xiàn)了在大數(shù)據(jù)處理、人工智能、商業(yè)計(jì)算等領(lǐng)域的商業(yè)化應(yīng)用。
華為針對(duì)AI場(chǎng)景,設(shè)計(jì)了功能類(lèi)似英偉達(dá)CUDA的異構(gòu)計(jì)算架構(gòu)CANN和幫助開(kāi)發(fā)者孵化各種AI創(chuàng)新算法和應(yīng)用的AI計(jì)算框架MindSpore,以及全流程開(kāi)發(fā)工具鏈MindStudio。
目前華為昇騰芯片包括昇騰310和昇騰910,前者的整數(shù)精度(INT8)算力可達(dá)16TOPS,主要應(yīng)用于邊緣計(jì)算產(chǎn)品和移動(dòng)端設(shè)備等低功耗領(lǐng)域;后者整數(shù)精度(INT8)算力可達(dá)640TOPS,性能水平接近英偉達(dá)A100。
同時(shí),基于昇騰系列處理器和基礎(chǔ)軟件構(gòu)建的全棧AI計(jì)算基礎(chǔ)設(shè)施、行業(yè)應(yīng)用及服務(wù),華為也在打造昇騰計(jì)算產(chǎn)業(yè)生態(tài),包括昇騰計(jì)算軟硬件體系、合作伙伴、行業(yè)應(yīng)用三層。
據(jù)了解,昇騰生態(tài)伙伴包含整機(jī)硬件伙伴、IHV硬件伙伴、應(yīng)用軟件伙伴、一體機(jī)解決方案伙伴以及生態(tài)運(yùn)營(yíng)伙伴五大類(lèi)。其中,整機(jī)硬件伙伴有13家、IHV硬件伙伴有6家、軟件伙伴約1200家。昇騰AI開(kāi)發(fā)者已超180萬(wàn),合作伙伴超過(guò)1200家,行業(yè)AI解決方案認(rèn)證超過(guò)2500個(gè)。