以小博大、修煉逆襲吊打,闖關(guān)曾是修煉修仙爽文、微短劇里讓人上頭卻略顯荒誕的闖關(guān)劇情,而今,修煉DeepSeek(深度求索)讓它在真實(shí)世界里發(fā)生了。闖關(guān)
火爆全球超過一個(gè)月,修煉DeepSeek掀起的闖關(guān)風(fēng)暴還在持續(xù),隨之而來的修煉還有一波三折的戲碼,同行的闖關(guān)圍剿、跨界的修煉爭(zhēng)議……正如影視作品中每一位“爽文大女主”升級(jí)打怪時(shí)所面對(duì)的關(guān)卡一樣。
譽(yù)滿天下,闖關(guān)謗亦隨之,修煉DeepSeek的闖關(guān)“修煉”之路,還要闖幾關(guān)?修煉
“爽文大女主”出三招
悄悄推出兩款模型,即引發(fā)硅谷與華爾街的劇烈震蕩,讓OpenAI接連推出競(jìng)爭(zhēng)產(chǎn)品并免費(fèi)開放搜索,谷歌一股腦兒發(fā)布“滿血版全家桶”,國內(nèi)大廠的旗艦?zāi)P鸵查_始免費(fèi)開放。
深有“天上掉餡餅”之感的萬千普通用戶,倒是想給DeepSeek送錦旗了,不過,大家也想知道,憑一己之力就把曾經(jīng)高不可攀的全球最頂級(jí)大模型的價(jià)格打下來了,究竟用了什么招?
——“亂”拳打傷老師傅。從架構(gòu)到工程,從算法到部署,DeepSeek悟透的是“四兩撥千斤”的中國武術(shù)古訓(xùn),不理會(huì)“參數(shù)規(guī)模決定論”,反倒是秀出了數(shù)據(jù)質(zhì)量優(yōu)化與算法架構(gòu)創(chuàng)新的乘數(shù)效應(yīng),在看似不可能的壁壘中突圍。
——拆掉半壁衛(wèi)城墻。一般來說,大模型開發(fā)者用了英偉達(dá)的GPU,也就得用他家的運(yùn)算平臺(tái)CUDA搞研發(fā)。畢竟CUDA已經(jīng)封裝好一些函數(shù),后來者使用時(shí)直接調(diào)用接口搞加工就行,這樣的低門檻當(dāng)然方便資源有限的開發(fā)者,但是,這也意味著深度研發(fā)執(zhí)行效率的折扣。
繞過CUDA,直接基于GPU的驅(qū)動(dòng)函數(shù)開發(fā),行不行?DeepSeek給出了肯定的答案。憑借獨(dú)到軟件算法優(yōu)化,拆掉英偉達(dá)“衛(wèi)城墻”,也就是不必仰賴其CUDA生態(tài)行事,DeepSeek走出了一條中國AI技術(shù)創(chuàng)新的新路子。
——小力也能出奇跡。自從OpenAI的ChatGPT發(fā)布以來,微軟、谷歌、Meta等科技巨頭一直在增加與人工智能相關(guān)的算力支出?!败妭涓?jìng)賽”式的投入,也催動(dòng)了美國AI芯片股價(jià)一路攀升。
就當(dāng)行業(yè)仍困囿于“算力軍備競(jìng)賽”的思維定式之際,DeepSeek憑借區(qū)區(qū)558萬美元訓(xùn)練成本就讓V3模型達(dá)到了GPT-4o九成功力,R1模型更實(shí)現(xiàn)以純強(qiáng)化學(xué)習(xí)突破推理能力邊界,向世界證明,AI大模型的革命,不一定要靠算力堆出來。
是幻覺還是“真香”
DeepSeek的小而精、強(qiáng)且美,是炒作出來的“幻覺”,還是厚積薄發(fā)而得的“真香”?
自從在AI江湖中亮出名號(hào),DeepSeek就不滿足于追隨者,這可以從其開發(fā)的一系列原創(chuàng)技術(shù)獲得證明。MLA、GRPO、R1-Zero……門外漢對(duì)著這些字母大概會(huì)如墜五里霧中,但是,這些技術(shù)合力激發(fā)的“聚變”,恐怕是DeepSeek獲得140多個(gè)國家用戶認(rèn)可的根本原因。
北京白領(lǐng)小游說,DeepSeek的回答不像GPT的回答那么干巴巴,像個(gè)只會(huì)寫材料的書呆子,按部就班安排任務(wù)步驟,而像個(gè)鬼馬精靈,只要你說明目的,她就能拆解和揣摩你的弦外之音、思考怎么實(shí)現(xiàn)你想要的:“甚至你可以問她一些你都沒有答案的大問題?!?/p>
當(dāng)然,DeepSeek依然在蓬勃的成長期。以最新的DeepSeek-R1為例,雖然其突破鼓舞人心,但學(xué)術(shù)界用起來還不免有點(diǎn)頭疼——面對(duì)悠遠(yuǎn)文明時(shí)間中的復(fù)雜因果,現(xiàn)代學(xué)術(shù)論述的復(fù)雜規(guī)范,DeepSeek的回答還不免左支右絀。
而且,DeepSeek暫時(shí)還不諳圖像處理,回應(yīng)大規(guī)模用戶需求也有“體力不支”的情況,這些困難都意味著,DeepSeek的修煉,“高原期”剛剛開始。
如何學(xué)習(xí)文明的智慧
技術(shù)革命的浪潮里,沒有永恒的王者,只有不斷的超越。具體到AI領(lǐng)域,大家的共識(shí)更是:充滿不確定性、一直充滿熱度、但不乏過度反應(yīng)。
無休止的波動(dòng),折射出的,其實(shí)是科技進(jìn)化的深層圖像——人工智能,就好像之前種種引發(fā)文明革命的重大科技進(jìn)展一樣,前進(jìn)路線并非筆直的線性軌跡,而是永恒的螺旋。
誰來驅(qū)動(dòng)這螺旋?不論DeepSeek參演的是爽劇還是正劇,角色與劇本背后的導(dǎo)演還是人類自己。
如果說AI是普羅米修斯之火,那么人類文明就是在自我顛覆中奔流不息、江聲浩蕩的赫拉克利特之河。我們最珍貴的不是回答和解決已有問題的能力,而是發(fā)現(xiàn)新問題的智慧、定義新問題的勇氣——這更需要?jiǎng)?chuàng)造性與想象力。
DeepSeek式創(chuàng)新的下一次突破,其通關(guān)密碼,就生成于回向文明深處尋求思考變革的努力中。以文明賦能人工智能,人工智能的“飛升”時(shí)刻,也許就會(huì)到來。
原標(biāo)題《DeepSeek的修煉之路》
半月談?dòng)浾撸簭埪?/p>
(半月談微信公眾號(hào))