【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

28/01/2025

  「算力出奇跡」VS「螺絲殼裏做道場」,到底哪個技高一籌?AI股王英偉達輝周一(27日)市值蒸發5890億美元,如對前者的當頭棒喝,盛行多年的AI核心假設--資金多即是強、算力高即是好,遭奉行後者的DeepSeek徹底打破。

 

AI多年核心假設一朝打破

 

  Meta的朱克伯格上周拋出「2025年資本支出高達650億美元」、「年底擁有130萬顆GPU」的震撼彈,短短三天後,AI界的「大躍進」敘事即畫風驟變,皆因跟OpenAI O1大模型分庭抗禮的DeepSeek-R1大模型,被揭訓練成本低至560萬美元,使用的英偉達GPU數量僅2048顆,且型號是上一代H800。

 

【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

DeepSeek異軍突起,拖累英偉達輝周一(27日)市值蒸發5890億美元。

 

  OpenAI首席執行官Sam Altman周二最新表示,DeepSeek-R1大模型令人印象深刻,但堅稱「現在比以往任何時刻,都需要更強的算力來完成使命。」

 

強化學習+混合專家架構

 

  面對有「AI界拼多多」之稱的中國「黑馬」公司,何解Sam Altman仍執著算力?答案指向其大模型訓練路徑。據OpenAI創始成員Andrej Karpathy解釋,訓練分為4個階段:一,預訓練(「投喂」大量文字並設定權重),建立基礎LLM模型;二,監督微調(以少量高品質的資料提示完成特定任務),建立SFT模型;三,獎勵模型(對回應進行打分並相應調整權重);強化學習(在獎勵模型下不斷調整以獲得更高分數),最終獲得RLHF(人類反饋強化學習)模型。

 

【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

DeepSeek依賴大規模強化學習(RL)訓練大模型,並將論文公開發表。

 

  DeepSeek則選擇跳過監督微調,而依賴大規模強化學習(RL),而這種方法允許模型自行探索思維鏈(CoT) ,以直接獲得更好表現。此外,DeepSeek採用MoE(混合專家)架構,即每個任務只激活相應的「專家(參數)」,意味顯著減少計算時間和算力需求。

 

借分享突破邊界吸引人才

 

  令人尤為驚訝的是,這兩大「殺手鐧」,DeepSeek都將相關研究論文--19頁《通過強化學習激勵大模型的推理能力》、33頁《在MoE語言模型中邁向終極專家專業化》經Arxiv學術平台公開分享。

 

  如此「慷慨」的原因何在?據DeepSeek自己的回答:「在快速發展的AI領域,合作和開放式的思想交流對於快速創新至關重要」,「是否擔心他人『趕上』並非主要考量,相反,重點在於突破可能的邊界,並分享這些進步,讓所有人受惠」,「通過分享研究成果,DeepSeek也能建立自己的思想領袖地位,並吸引人才和合作夥伴,以進一步實現其目標。」

 

【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

鄭州連鎖餐廳靠免費派發低成本的氣球,做出了月租數萬元廣告牌沒有的效果。

 

  相比之下,名為「開放」的OpenAI拒絕如DeepSeek一樣開源,格局無疑小得多。聯想河南鄭州的一家連鎖餐廳,面對每月僅700元的廣告預算,靠免費派發每個成本僅幾毫子的氣球,做出了月租數萬元廣告牌沒有的效果,所謂「螺螄殼裏做道場」,即是不信邪、不拘泥地靈活變通,終能出奇制勝。

 

  那麼,Nvidia的神話有無結束?看看黃仁勳月初在「國際消費電子展CES 2025」上的展示,RTX 50 GPU、低價AI超級電腦Project Digits、人形機器人Cosmos……答案同樣是否。

 

撰文:金子安

送禮活動浪接浪!想緊貼著數活動消息?即Like etnet Facebook專頁!► 立即讚好

延伸閱讀

More
  • 道瓊斯工業平均指數
    跌 44,713.52
    -136.83 (-0.305%)
  • 標準普爾500指數
    跌 6,039.31
    -28.39 (-0.468%)
  • 納斯達克綜合指數
    跌 19,632.32
    -101.26 (-0.513%)
精選預託證券 More
02318 中國平安
按盤價(HKD)︰升44.061
變動率︰+0.712%
較港股︰+1.06%
03988 中國銀行
按盤價(HKD)︰升4.045
變動率︰+0.620%
較港股︰+0.62%
00016 新鴻基地產
按盤價(HKD)︰跌69.034
變動率︰-0.561%
較港股︰-1.10%
00001 長和
按盤價(HKD)︰跌38.802
變動率︰-1.386%
較港股︰-1.02%
精選中資美股 More
GDS 萬國數據
按盤價(USD)︰升22.660
變動率︰+3.188%
IQ 愛奇藝
按盤價(USD)︰跌2.160
變動率︰-3.139%
BILI 嗶哩嗶哩
按盤價(USD)︰跌16.780
變動率︰-3.230%
TAL 好未來
按盤價(USD)︰跌12.400
變動率︰-4.247%
精選美股 More
ASML
ASML Holding NV
按盤價(USD)︰升712.650
變動率︰+4.288%
NVDA
英偉達
按盤價(USD)︰跌123.700
變動率︰-4.101%
NVAX
Novavax
按盤價(USD)︰跌8.810
變動率︰-7.458%
MRNA
Moderna
按盤價(USD)︰跌40.720
變動率︰-9.390%
美國指數之報價延遲最少15分鐘。
美股之報價延遲最少15分鐘。
美國時間為 : 29/01/2025 18:04 EST
港股之報價延遲最少15分鐘,更新時間為:28/01/2025 17:59
美國指數之報價延遲最少15分鐘。
美國時間為 : 29/01/2025 18:04 EST
顯示更多
緊貼市況
  • 01010 天璽曜11
  • 0.285
  • 09890 中旭未來
  • 7.800
  • 01299 友邦保險
  • 54.250
  • 00984 永旺
  • 0.500
  • 01357 美圖公司
  • 4.200
  • 00874 白雲山
  • 17.480
  • 目標︰--
  • 02727 上海電氣
  • 2.640
  • 目標︰$4.30
  • 01057 浙江世寶
  • 2.970
  • 目標︰$3.50
  • 00005 滙豐控股
  • 79.950
  • 目標︰$86.00
  • 02020 安踏體育
  • 82.550
  • 目標︰$90.00
  • 02013 微盟集團
  • 2.290
  • 01725 洲際航天科技
  • 0.810
  • 00020 商湯-W
  • 1.610
  • 02015 理想汽車-W
  • 91.900
  • 02197 三葉草生物-B
  • 0.218
  • 06186 中國飛鶴
  • 5.330
  • 目標︰$6.20
  • 09888 百度集團-SW
  • 87.800
  • 目標︰--
  • 01288 農業銀行
  • 4.280
  • 目標︰$5.00
  • 汽車 More
  • 01810 小米集團-W
  • 38.300
品味生活
備註: 本地指數之報價為即時更新,資料更新時間為 28/01/2025 17:59
中國指數之報價為即時更新,資料更新時間為 27/01/2025 16:29
期指之報價為即時更新,資料更新時間為 28/01/2025 17:59
緊貼市況之報價延遲最少15分鐘,資料更新時間為 28/01/2025 17:59
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
放大顯示
精選影片
人氣文章
財經新聞
評論
專題
  • 生活
  • DIVA
  • 健康好人生
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

【etnet 30周年】多重慶祝活動一浪接一浪,好禮連環賞!

【蛇年行大運 新年好賞「飾」】etnet賞太歲開運趨吉避凶神器

etnet榮獲HKEX Awards 2023 「最佳證券數據供應商」大獎

大國博弈

貨幣攻略

說說心理話

聖誕新年特輯

Watch Trends 2024

北上食買玩

Art Month 2024

秋天養生食療

山今養生智慧

輕鬆護老