被禁售、閹割的A100
價(jià)格水漲船高
ChatGPT爆火,它超算集群背后用的英偉達(dá)高端GPU也火了。
OpenAI使用了約1萬顆英偉達(dá)GPU來訓(xùn)練GPT-3.5模型,為了進(jìn)一步滿足服務(wù)器需求,OpenAI 使用的英偉達(dá)GPU數(shù)量已經(jīng)增加到約2.5萬個(gè),機(jī)構(gòu)預(yù)計(jì)這個(gè)數(shù)量將超過3萬個(gè)。據(jù)外媒報(bào)道,如果谷歌需要將該技術(shù)應(yīng)用到每一次的搜索中,則需要部署超過410萬個(gè)英偉達(dá)GPU。就算是國內(nèi)初出茅廬的類ChatGPT系統(tǒng)MOSS,也采用了8個(gè)英偉達(dá)的A100 GPU。
ChatGPT帶來了A100等高端GPU需求的增長(zhǎng),而去年8月底,在這類芯片上我們又被“卡”了脖子。
美國通過一紙禁令,禁止英偉達(dá)向中國出售包括最新的H100和A100在內(nèi)的高端GPU。這些產(chǎn)品系當(dāng)前領(lǐng)先技術(shù)的新一代GPU芯片,國產(chǎn)替代難度大,而市面上現(xiàn)存的A100均是存貨,據(jù)說這些A100的剩余使用壽命還有約4-6年,如果上量,應(yīng)該很快會(huì)耗盡。
此前困于汽車芯片的小鵬汽車CEO何小鵬又為缺高端顯卡發(fā)聲,稱英偉達(dá) A100/H100的限制令“會(huì)對(duì)所有自動(dòng)駕駛云端訓(xùn)練帶來挑戰(zhàn)”,好消息是:小鵬汽車剛好已經(jīng)將未來幾年的需求提前買回來了。
小鵬汽車有提前備貨,但禁售令對(duì)自動(dòng)駕駛或其他AI領(lǐng)域的中國企業(yè)有多大影響,就不得而知了。在市面上,A100因?yàn)樽兂上∪逼罚瑑r(jià)格開始水漲船高,從官方的1萬美元/枚,約合人民幣7萬,漲至8萬、9萬元,快要到10萬一枚。即便去年年底英偉達(dá)推出A100“閹割版”(帶寬被限制)——A800顯卡,于2022年Q3投入生產(chǎn),在中國依然遭遇嚴(yán)重缺貨。
據(jù)了解,A800京東官網(wǎng)定價(jià)超過8萬元/枚,甚至超過A100官方定價(jià)。3月初,有云廠商人士接受財(cái)經(jīng)十一人采訪表示,A800實(shí)際售價(jià)甚至高于10萬元/枚,價(jià)格還在持續(xù)上漲。A800目前在浪潮、新華三等國內(nèi)服務(wù)器廠商手中是稀缺品,一次只能采購數(shù)百片。
A100和A800在中國如此缺貨,禁令對(duì)英偉達(dá)的潛在影響高達(dá)4億美元,英偉達(dá)沒閑著,一邊催上游代工廠發(fā)貨,增加訂單,一邊爭(zhēng)取美國禁令的寬限時(shí)間。
去年9月,傳英偉達(dá)為滿足大陸客戶激增的需求,對(duì)臺(tái)積電下了“超級(jí)急件”訂單,計(jì)劃在緩沖期之內(nèi)完成更多的交付。據(jù)悉,英偉達(dá)要求臺(tái)積電提前生產(chǎn)了原訂于2023年出貨的部分產(chǎn)品,總量約5000片晶圓,交期從5-6個(gè)月壓縮到了2-3個(gè)月,此前預(yù)計(jì)最快10月底至11月初開始陸續(xù)交貨。隨著近期ChatGPT大熱,3月有業(yè)內(nèi)人士透露,英偉達(dá)還向臺(tái)積電增加了A100、H100、A800 GPU訂單。
通過與美國官方斡旋,除了將出口限制寬限延后至2023年3月,在2023年9月1日前,可以通過英偉達(dá)的香港公司繼續(xù)履行和運(yùn)輸A100和H100芯片訂單。
英偉達(dá)此前靠“挖礦”賺得盆滿缽滿,如今“挖礦時(shí)代”終結(jié),英偉達(dá)又站在人工智能這一新風(fēng)口上,CEO黃仁勛宣稱人工智能的“iPhone時(shí)刻”已經(jīng)到來,或許在A100這樣的高端顯卡市場(chǎng),又會(huì)迎來和幾年前類似的需求暴漲?
A100作為H100的前代產(chǎn)品,雖然不是最新產(chǎn)品,但在人工智能領(lǐng)域依然能打。老黃在近期采訪中還多次推銷A100顯卡,在他看來,想要進(jìn)入人工智能領(lǐng)域,購買A100就是最好的選擇。
2020年5月14日晚,英偉達(dá)創(chuàng)始人CEO黃仁勛以線上發(fā)布的形式,從自家廚房中“搬”出了A100 GPU,黃仁勛表示這是英偉達(dá)8代GPU史上最大的一次性能飛躍。這款高端顯卡集AI訓(xùn)練和推理于一身,適用于自動(dòng)駕駛、高端制造、醫(yī)療制藥等場(chǎng)景,其AI訓(xùn)練和推理性能相比于前代V100提升了高達(dá)20倍。
ChatGPT主要就是用英偉達(dá)的A100進(jìn)行訓(xùn)練,這款顯卡也成為了最搶手的產(chǎn)品之一。某寶上關(guān)于A100 顯卡商品的問答中,就有購買者表示自己買來做深度學(xué)習(xí),訓(xùn)練模型。
在摩爾定律最好的十年,AI 處理速度提高了100萬倍,而到了黃仁勛提出的“黃氏定律”(Huang’s Law),從2012年的K20X到2020年的A100,英偉達(dá)的GPU推理性能提高到原來的317倍,遠(yuǎn)超摩爾定律的發(fā)展速度。
GPU或?qū)⑼苿?dòng)AI性能實(shí)現(xiàn)逐年翻倍。英偉達(dá)與數(shù)據(jù)科學(xué)家、AI 研究人員合作開發(fā)新模型,在整個(gè)跨度內(nèi),成功使大型語言模型處理速度提高了一百萬倍。
游戲、云計(jì)算、加密貨幣、元宇宙、ChatGPT……不管大家要挖金礦、銀礦還是鐵礦,站在什么樣的風(fēng)口上,如果說英偉達(dá)是產(chǎn)業(yè)上游的“賣鏟人” ,那么它的A100、H100等高端顯卡,對(duì)各大企業(yè)來說就是最高效,最省力的“鏟子”。