DeepSeek被稱為AI界拼多多，訓(xùn)練2個月僅花費了557.6萬美元！

來源：24直播網(wǎng) 2025-01-28 13:16:13

體育資訊1月28日報道宣稱據(jù)錢江晚報報道，此次DeepSeek-V3在AI行業(yè)引發(fā)關(guān)注，關(guān)鍵的原因在于——超低的預(yù)訓(xùn)練成本。

“預(yù)訓(xùn)練”是AI大模型學(xué)習中的一種方法，指的是通過海量的數(shù)據(jù)，訓(xùn)練一個大模型。訓(xùn)練時需要大量的數(shù)據(jù)和算力支持，每次迭代可能耗資數(shù)百萬至數(shù)億美元。

官方技術(shù)論文披露，DeepSeek-V3在預(yù)訓(xùn)練階段僅使用2048塊GPU訓(xùn)練了2個月，且只花費557.6萬美元。這個費用是什么概念？

據(jù)報道，GPT-4o的模型訓(xùn)練成本約為1億美元。簡單粗暴地說，這相當于DeepSeek-V3比同等性能的AI大模型，降了十幾倍的成本。

早在2024年5月，深度求索發(fā)布DeepSeek-V2時，就曾因給模型的定價太過于便宜，開啟了中國大模型的價格戰(zhàn)，被稱之為“AI界的拼多多”。

“相比于說它是‘拼多多’，它更像小米，貼近成本定價，并且自產(chǎn)自銷?！瘪R千里認為，訓(xùn)練成本比較低的原因，離不開深度求索團隊自研的架構(gòu)和算力，他們自身的算力儲備可以與大廠比肩，并且更注重底層的模型。

“ChatGPT走的是大參數(shù)、大算力、大投入的路子，DeepSeek-V3的路徑用了更多的巧思，依托數(shù)據(jù)與算法層面的優(yōu)化創(chuàng)新，從而高效利用算力，實現(xiàn)較好的模型效果。”馬千里說道。

nbazhiboba 臺灣體育臺意甲直播吧湖南衛(wèi)視直播吧東方衛(wèi)視直播平臺直播車cctv5

相關(guān)閱讀

Cube：感謝對我三板斧的認可往后每多玩好一個英雄就是驚喜

你在BLG、AL之后！拿到首勝后WE上單Cube賽后發(fā)文：我回來了

Vampire：今天我們減少了很多小失誤減少中期失誤葬送掉比賽

H4cker：本來希望調(diào)到明天下午三點，但某一方管理層不同意

wink：兄弟們集美們安全第一謝謝大家對我們的支持

Doran：Zeus和Kiin的共同點是對線強，每次打他們都很困難

Cryin：BLG不一定回來了有前車之鑒，北川開始也一直贏

scout：非常感謝今天來現(xiàn)場支持的粉絲們大家辛苦了！安全第一！

PEL解說吉祥曬照：最后一天沙特利雅得日記拜拜咯

余霜發(fā)布成都世運會Vlog：第一次主持國際轉(zhuǎn)播遇上了電競老鄉(xiāng)！

熱門標簽

熱門錄像

查看全部>

08月18日男籃亞洲杯決賽澳大利亞男籃中國男籃全場錄像

08月17日男籃非錦賽小組賽安哥拉男籃南蘇丹男籃全場錄像

08月17日男籃非錦賽小組賽幾內(nèi)亞男籃利比亞男籃全場錄像

08月16日男籃亞洲杯半決賽中國男籃新西蘭男籃全場錄像

08月16日CBA夏季聯(lián)賽庫爾勒站山西廣東全場錄像

08月15日CBA夏季聯(lián)賽庫爾勒站廣東青島全場錄像

08月14日NBL常規(guī)賽湖北文旅廣西威壯全場錄像

08月14日男籃亞洲杯14決賽中國男籃韓國男籃全場錄像

08月14日WNBA常規(guī)賽亞特蘭大夢想西雅圖風暴全場錄像

08月14日WNBA常規(guī)賽紐約自由人拉斯維加斯王牌全場錄像

国产日本欧美在线|国产无套粉嫩白浆在线|香蕉久久夜色精品国产|久久精品国产亚洲AV夜夜|国产av综合一区二区三区|国产精品久久久久jk制服|欧洲精品一区二区三区在线观看|国产内射爽爽大片视频社区在线

DeepSeek被稱為AI界拼多多，訓(xùn)練2個月僅花費了557.6萬美元！

相關(guān)閱讀

熱門標簽

熱門新聞

国产日本欧美在线|国产无套粉嫩白浆在线|香蕉久久夜色精品国产|久久精品国产亚洲AV夜夜|国产av综合一区二区三区|国产精品久久久久jk制服|欧洲精品一区二区三区在线观看|国产内射爽爽大片视频社区在线

DeepSeek被稱為AI界拼多多，訓(xùn)練2個月僅花費了557.6萬美元！

相關(guān)閱讀

熱門標簽

熱門新聞

DeepSeek被稱為AI界拼多多，訓(xùn)練2個月僅花費了557.6萬美元！