1月最后一周,中國開(kāi)發(fā)的DeepSeek應用程序在蘋(píng)果應用商店的下載次數遠超美國Open AI 開(kāi)發(fā)的ChatGPT。圖片來(lái)源:英國《自然》網(wǎng)站
近期,外媒紛紛將聚光燈投向中國初創(chuàng )企業(yè)深度求索公司,其自主研發(fā)的人工智能(AI)大語(yǔ)言模型“深度求索”(DeepSeek)憑借“好用、開(kāi)源、免費”三大特點(diǎn),在全球范圍內引發(fā)熱烈反響。這一創(chuàng )新成果不僅在中國本土大放異彩,更是在大洋彼岸的美國乃至全球科技界激起了廣泛討論并受到高度評價(jià),被視為挑戰現有AI巨頭壟斷地位的“一股清流”。
多家外媒接連不斷的報道,讓DeepSeek這一出人意料的、高效而強大的AI模型席卷了科技行業(yè),這種“改變游戲規則”的大型語(yǔ)言模型,有望快速重塑AI格局。
低成本兼具高性能
西班牙《國家報》、澳大利亞《對話(huà)》雜志、美國《紐約時(shí)報》等多家外媒均關(guān)注到,DeepSeek的技術(shù)具有強大創(chuàng )新力,是因為它能在降低計算成本的同時(shí)實(shí)現尖端性能。
AI公司通常使用裝有1.6萬(wàn)枚或更多專(zhuān)用芯片的超級計算機來(lái)訓練聊天機器人,但深度求索公司表示,他們只用了大約2000枚芯片。同時(shí),他們僅花了不到600萬(wàn)美元就訓練了新模型,成功在兩方面把構建AI的價(jià)格“打了下來(lái)”。
首先,DeepSeek模型使用數據蒸餾技術(shù)生成高質(zhì)量數據,提升了訓練效率;其次,DeepSeek采用了一種稱(chēng)為“混合專(zhuān)家”的方法。當用戶(hù)提出一個(gè)問(wèn)題時(shí),模型會(huì )決定是否激活其醫療專(zhuān)家、翻譯、律師或物理學(xué)家。傳統模型會(huì )同時(shí)激活所有專(zhuān)家,這會(huì )浪費能源和計算能力。而DeepSeek則將這些小型“專(zhuān)家”系統與一個(gè)“通才”系統相結合,實(shí)現了相同的功能。通才系統對每個(gè)主題都有相當的了解,可幫助協(xié)調專(zhuān)家之間的互動(dòng)。
開(kāi)源策略打破技術(shù)壟斷
Deepseek的獨特之處還在于,其采取了開(kāi)源策略。這猶如在美國及少數幾個(gè)長(cháng)期主導AI技術(shù)領(lǐng)域的巨頭中投了一枚震撼彈,打破了既有格局。
如今,這項技術(shù)已向全世界敞開(kāi)大門(mén)。鑒于DeepSeek模型免費可得,其他公司或將不得不調整價(jià)格策略,以保持市場(chǎng)地位。當能夠以零成本獲得類(lèi)似技術(shù)時(shí),沒(méi)有人愿意支付額外費用。
《對話(huà)》雜志報道稱(chēng),與專(zhuān)有AI模型占主導地位的美國不同,中國AI新創(chuàng )企業(yè)擁抱開(kāi)源生態(tài)系統,以更快地擴大創(chuàng )新規模,并融入全球AI合作。
得益于人才培養與政策支持
在近日的法國人工智能峰會(huì )上,多名國際科技界高管均認為,DeepSeek 的出現表明,在A(yíng)I領(lǐng)域,中國企業(yè)的進(jìn)步不容小覷。
《自然》雜志報道,2017年,中國政府宣布,計劃到2030年將中國打造成為全球AI領(lǐng)域的領(lǐng)頭羊。政府要求相關(guān)行業(yè)在2025年前實(shí)現AI領(lǐng)域的重大突破,“使相關(guān)技術(shù)和應用達到世界領(lǐng)先水平”。
據美國喬治城大學(xué)安全與新興技術(shù)中心的一份報告,截至2022年,中國教育部已批準440所大學(xué)開(kāi)設AI專(zhuān)業(yè)本科學(xué)位。美國智庫MacroPolo數據顯示,同年,在全球頂尖AI研究人員中,華人幾乎占據了“半壁江山”,而美國人僅占18%。
澳大利亞悉尼科技大學(xué)科技政策研究員馬麗娜·張專(zhuān)注于中國的創(chuàng )新研究。她表示,DeepSeek公司的成功得益于政府對AI教育和人才培養的投資,這些投資包括眾多獎學(xué)金、研究經(jīng)費以及學(xué)術(shù)界與產(chǎn)業(yè)界的合作。
創(chuàng )新重塑全球AI格局
美國趣味工程網(wǎng)AI專(zhuān)欄作家塞賈爾·夏爾馬發(fā)表評論稱(chēng),如此強大的模型出自中國,讓美國感到“坐立不安”。英國廣播公司則直接在標題中稱(chēng),“中國的DeepSeek AI震撼行業(yè),削弱美國霸權”。
美國總統特朗普當地時(shí)間1月27日在佛羅里達州邁阿密發(fā)表講話(huà)時(shí),稱(chēng)DeepSeek的出現“給美國科技產(chǎn)業(yè)敲響了警鐘”。
美國《麻省理工技術(shù)評論》網(wǎng)站在報道中表示,考慮到中國AI企業(yè)面臨美國對尖端芯片出口管制日益收緊的制約,DeepSeek的成功“更顯非凡”。種種跡象表明,美國的制裁并未削弱中國的AI實(shí)力,反而似乎正驅使深度求索等初創(chuàng )企業(yè)以效率、資源整合和協(xié)作為優(yōu)先方向進(jìn)行創(chuàng )新。《國家報》報道也認為,美國制裁加速了中國AI創(chuàng )新。
美國消費者新聞與商業(yè)頻道網(wǎng)站援引專(zhuān)家觀(guān)點(diǎn)表示,美國自認為處于世界科技領(lǐng)袖的地位已不再被普遍接受。
中國人工智能發(fā)展的破局與擔當
◎張佳欣
今年春節前后,中國人工智能公司深度求索推出了AI模型DeepSeek。自其誕生之日起,便勢如破竹,連續多日穩居蘋(píng)果App Store與谷歌Play Store全球下載榜首。其引發(fā)的巨大波瀾絕非偶然,這背后是技術(shù)創(chuàng )新、開(kāi)源策略以及全球視野共同作用的必然結果。
長(cháng)久以來(lái),世界各地對AI的構建似乎形成了一些固有觀(guān)念,認為唯有那些擁有巨額投資和全球大規模應用前景的企業(yè),才能涉足這個(gè)領(lǐng)域。但是,DeepSeek卻以一種前所未有的姿態(tài),打破了這些固有認知。
工欲善其事,必先利其器。在外部技術(shù)封鎖與市場(chǎng)壓力的雙重夾擊下,DeepSeek團隊憑借卓越的技術(shù)實(shí)力與創(chuàng )新能力,成功使用2048塊英偉達H800 GPU芯片,在短短兩個(gè)月內訓練出了擁有6710億參數的開(kāi)源大模型,且成本僅為558萬(wàn)美元。要知道,在美國限制科技公司芯片出口中國的大背景下,H800是英偉達專(zhuān)門(mén)為中國市場(chǎng)設計的“閹割版”。這一效率與性?xún)r(jià)比的奇跡,是中國科技企業(yè)自立自強、勇攀科技高峰的生動(dòng)寫(xiě)照,也是對那些試圖通過(guò)技術(shù)封鎖遏制中國科技發(fā)展的有力回應。
謀定而后動(dòng),篤行而致遠。事實(shí)上,中國政府早期對AI領(lǐng)域的戰略布局為Deepseek等創(chuàng )新企業(yè)的崛起奠定了堅實(shí)基礎。中國政府高度重視AI發(fā)展,2017年更是明確了我國新一代AI發(fā)展的戰略目標,為企業(yè)提供了創(chuàng )新的沃土。如今,中國憑借強大的科研實(shí)力、豐富的應用場(chǎng)景和活躍的創(chuàng )新生態(tài),吸引著(zhù)全球目光。
開(kāi)源通四海,技術(shù)達八荒。DeepSeek采取的開(kāi)源策略,是其迅速走紅全球的另一大關(guān)鍵。在美國的技術(shù)“圍剿”、封閉源代碼成為常態(tài)背景下,DeepSeek在封鎖線(xiàn)上“鑿開(kāi)”了突破口,毅然選擇開(kāi)源,打破了AI領(lǐng)域的閉源模式,推動(dòng)了開(kāi)放生態(tài)的拓展。此舉不僅吸引了大量開(kāi)發(fā)者圍繞DeepSeek構建應用生態(tài),還提升了行業(yè)透明度和創(chuàng )新性,展現了中國AI科技企業(yè)的開(kāi)放態(tài)度和責任擔當。
DeepSeek的成功,是中國AI人才培養、技術(shù)創(chuàng )新、產(chǎn)業(yè)生態(tài)等方面全面崛起的縮影。這匹“黑馬”以實(shí)力證明,中國科技企業(yè)有能力在全球舞臺上與頂尖玩家同臺競技。AI行業(yè)正經(jīng)歷著(zhù)去中心化的深刻變革,在誰(shuí)有權開(kāi)發(fā)和控制AI的問(wèn)題上,“東方”與“西方”的傳統界限正逐漸模糊。未來(lái),科技的浪潮奔騰不息,而中國科技企業(yè)必將在其中書(shū)寫(xiě)濃墨重彩的一筆。(◎科技日報記者 張佳欣)