備受關(guān)注的DeepSeek-V4以預(yù)覽版本的形式正式上線了。
DeepSeek這次到底更新了什么?我們能用上什么新能力?面對滿屏深奧的技術(shù)名詞和更新說明,我決定直接問它“本人”。
它把這次更新總結(jié)為:現(xiàn)在的我,腦子更快、記性更好、會查資料、能讀文件,還會展示推理過程,而且“不要錢”。這里的每一個詞背后,其實都對應(yīng)著一次真實的能力躍遷。
首先,它確實變強了。
現(xiàn)在的DeepSeek模型有了兩種模式:一個是像聊天一樣快速響應(yīng)的模式;還有遇到數(shù)學(xué)、編程、邏輯難題時,使用的專家模式。根據(jù)官方發(fā)布的信息,在這些領(lǐng)域,它的能力已經(jīng)超過當前所有已公開評測的開源模型。而且現(xiàn)在它一次能處理超百萬字的材料。
很多人覺得DeepSeek版本更新不頻繁。但我找出了團隊發(fā)布的論文,發(fā)現(xiàn)他們其實一直在持續(xù)輸出研究成果。論文中,既能看到與北京大學(xué)這樣高校的合作,也能看到與其他前沿國產(chǎn)大模型團隊的技術(shù)接力。不斷增強的科研能力,是這次更新背后的第一層力量。
再來看“不要錢”這一塊。無論是網(wǎng)頁端還是App端,這一代目前依然免費開放。而對于需要API調(diào)用的專業(yè)用戶,根據(jù)相關(guān)業(yè)內(nèi)測算,DeepSeek-V4價格顯著低于海外主流大模型。它為什么能做到“越強越便宜”?
這背后,就指向了國產(chǎn)算力體系的支撐。首先,這次DeepSeek與華為昇騰國產(chǎn)芯片體系深度適配,證明了國產(chǎn)大模型也可以在本土算力架構(gòu)上更高效、更低成本地運行。同時,我還在DeepSeek的招聘網(wǎng)頁上看到了對數(shù)據(jù)中心崗位的需求。全國正在推進“東數(shù)西算”工程。近兩年,中國圍繞算力樞紐建成超70條算力大通道。簡單說,就是讓數(shù)據(jù)在更合適的地方計算,讓算力更便宜、更普惠。
最后,你平時所用的很多AI工具,都是以DeepSeek這樣的大模型為基礎(chǔ)。DeepSeek這次就展示了以它為基礎(chǔ)生成的PPT。所以可能不久后你就會發(fā)現(xiàn)很多AI工具變好用了。
如果只看DeepSeek-V4,你看到的是一次模型升級。但如果把視線拉遠一點,你會看到的是一條正在成型的鏈條:科研、芯片、算力、應(yīng)用生態(tài)在同一方向上加速運轉(zhuǎn)。DeepSeek-V4背后的真正看點,也許正是這一整套正在被跑通的中國AI能力體系。
編輯:李持