DeepSeek | 從私募孵化的AI新星--DeepSeek崛起之路
28/01/2025
內地私募巨頭幻方量化孵化的AI初創企業DeepSeek異軍突起,一個月內接連發布兩個以低成本和強大性能震撼矽谷的開源大模型DeepSeek-V3和DeepSeek-R1後,今日凌晨乘勝追擊,再發布開源多模態AI模型Janus-Pro和JanusFlow,為用家提供極簡但強大的多模態解決方案。
DeepSeek一出手,科技界抖三抖。DeepSeek的V3和R1大模型開發成本以及所需的英偉達晶片據報遠少於ChatGPT等競爭對手,性能卻媲美OpenAI的o1,甚至超越Meta的Llama。已被冠以「AI界拼多多」之名的DeepSeek,儼然成為訓練成本動輒數十億美元AI大廠的最大「威脅」,也令市場憂慮AI企業未來將不需要大量晶片和數據中心資源。
幻方量化曾是唯一規模過千億量化私募
這家2023年7月才成立的AI企業,其崛起之路或許少不了幻方量化龐大資金支持。DeepSeek--杭州深度求索人工智能基礎技術研究有限公司實際控制人是現年40歲的幻方量化聯合創辦人梁文鋒,其本科、研究生均就讀於浙江大學,擁有信息與電子工程學系本科和碩士學位。2008年攻讀碩士期間,梁文鋒就與同學組建團隊收集金融市場等相關數據,並帶領團隊使用機器學習等技術探索全自動量化交易。
2015年,幻方量化正式成立。2016年10月,幻方量化推出第一個AI模型,第一份由深度學習生成的交易倉位上線執行,到2017年底,公司幾乎所有量化策略都採用AI模型計算。2019年,幻方量化管理規模突破百億,成為內地量化私募「四巨頭」之一。此後幻方量化甚至一度成為中國首家突破千億的私募量化大廠,也是迄今為止業內唯一規模曾邁過千億大關的量化私募。不過,2021年9月後,幻方量化的業績大倒退,管理規模亦逐漸縮水。
AI熱潮下進軍AGI領域,一年多發布多個強大模型
2023年,全球人工智能熱潮爆發,以強大的算力支持而聞名的幻方量化也宣布集中資源和力量成立DeepSeek,進軍通用人工智能(AGI)領域。同年11月,DeepSeek第一代大模型DeepSeek Coder面世,免費商用,完全開源。當時DeepSeek表示,這可能是最強開源代碼大模型。2024年5月,混合專家模型DeepSeek-V2面世;同年6月,基於DeepSeek-V2的DeepSeek-Coder-V2模型正式開源,相關評測榜單顯示這是全球首個在代碼、數學能力上超越GPT-4-Turbo、Claude3-Opus、Gemini-1.5Pro等的開源代碼大模型。同年12月26日,DeepSeek-V3發布。今年1月20日,DeepSeek-R1發布。
有內媒引述一名AI算法工程師指出,「在豆包和阿里雲之前,DeepSeek最先在全網降低了模型成本」,這讓他印象非常深刻。
多項政策支持國家建設科技強國、發展AI
DeepSeek光速發展相信也不乏政策支持。國家主席習近平提出要建設科技強國,並多次強調要加快實現高水平科技自立自強,又稱中國式現代化要由科學技術打頭陣,「科技創新是必由之路」。人民銀行、財政部、科技部等部門和各地地方政府對高新技術企業都有相關支持和補貼政策,包括科技創新再貸款、稅收優惠、人才補貼、研發費用補貼等。
值得留意的是,梁文鋒已經成為科技界代表人物之一。據官媒《新華社》等報道,國務院總理李強1月20日主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議,梁文鋒有份出席並發言。這一天正是DeepSeek-R1發布之日。
在2024年的《政府工作報告》中,3次提到了「人工智能」,還首次提出開展「人工智能+」行動。隨後中央陸續出台了一系列支持人工智能產業發展的政策。座談會上,李強提到,「要以科技創新推動新舊動能轉換,集中力量突破關鍵核心技術和前沿技術,加快推進科技成果產業化,努力培育更多經濟新增長點」。
撰文:經濟通中國組
【立即投票】今個農曆新年你會如何度過? ► 立即投票