人物關(guān)系
- 梁文鋒
- 中國
- 1985年 [1]
- 浙江大學(xué) [1]
- DeepSeek [2]
杭州幻方科技有限公司 [2] - DeepSeek創(chuàng)始人 [1-2]
- 男 [3]
- 廣東省湛江市 [7]
目錄
- 1早年經(jīng)歷
- 2創(chuàng)業(yè)經(jīng)歷
- 3家庭關(guān)系
- 4主要貢獻(xiàn)
- 5社會(huì)活動(dòng)
早年經(jīng)歷
創(chuàng)業(yè)經(jīng)歷
家庭關(guān)系
主要貢獻(xiàn)
社會(huì)活動(dòng)
梁文鋒,男,1985 年出生于廣東省湛江市,畢業(yè)于浙江大學(xué),信息與電子工程學(xué)碩士,研究方向?yàn)槿斯ぶ悄芊较。他是量化私募幻方量化?chuàng)始人、國產(chǎn)大模型企業(yè)深度求索(DeepSeek)創(chuàng)始人,是中國人工智能與量化投資領(lǐng)域的領(lǐng)軍人物,其職業(yè)生涯融合了技術(shù)創(chuàng)新與商業(yè)突破。
2008 年,在浙大讀研期間,梁文鋒開始帶領(lǐng)團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)等技術(shù)探索全自動(dòng)量化交易。2015 年,梁文鋒創(chuàng)立幻方量化,開始在量化投資領(lǐng)域嶄露頭角。2019 年,幻方量化管理規(guī)模已超 100 億,成為國內(nèi)量化私募“四巨頭”之一。2023 年 7 月,幻方量化宣布成立大模型公司 DeepSeek,正式進(jìn)軍通用人工智能領(lǐng)域。2024 年 12 月 26 日,DeepSeek 宣布上線并同步開源的 DeepSeek-V3 模型,采用 MLA(多頭潛在注意力)和 MoE 架構(gòu),訓(xùn)練成本僅為 GPT-4o 的十分之一,引發(fā)行業(yè)價(jià)格戰(zhàn)。2025 年 1 月 20 日,DeepSeek 正式發(fā)布 DeepSeek-R1 模型,該模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。
職業(yè)經(jīng)歷
2008 年,在浙大讀研期間,梁文鋒帶領(lǐng)團(tuán)隊(duì)探索全自動(dòng)量化交易,結(jié)合機(jī)器學(xué)習(xí)技術(shù)分析金融市場數(shù)據(jù),期間曾拒絕加入大疆創(chuàng)始人汪滔的創(chuàng)業(yè)邀請。 2013 年,與同學(xué)徐進(jìn)共同創(chuàng)立杭州雅克比投資管理公司,初步涉足量化投資領(lǐng)域。 2015 年,成立幻方量化,依托數(shù)學(xué)建模與 AI 技術(shù)進(jìn)行量化投資,2016 年上線首個(gè) AI 策略,2017 年全面實(shí)現(xiàn)投資策略 AI 化。 2019 年,管理規(guī)模突破百億,2021 年一度超千億,成為國內(nèi)量化私募“四大天王”之一。 2019 年,投資 2 億元自建“螢火一號”超算(1100 塊 GPU),2021 年斥資 10 億升級至“螢火二號”(萬卡級 A100 GPU 集群),算力規(guī)模媲美頭部科技公司。 2023 年,7 月成立深度求索(DeepSeek),專注于通用人工智能(AGI)與大模型研發(fā),初期資金由幻方量化支持。 2024 年,推出高性價(jià)比的 DeepSeek-V2(2024 年 5 月)和 V3(2024 年 12 月),采用 MLA(多頭潛在注意力)和 MoE 架構(gòu),訓(xùn)練成本僅為 GPT-4o 的十分之一,引發(fā)行業(yè)價(jià)格戰(zhàn)。 2025 年,1月正式發(fā)布 DeepSeek-R1,完全開源模型并公開技術(shù)細(xì)節(jié),推動(dòng) AI 技術(shù)普惠化。
核心理念
梁文鋒堅(jiān)信“AI 將改變世界”,主張從基礎(chǔ)研究切入,探索 AGI 本質(zhì),而非短期商業(yè)化。提出“普惠 AI”理念,通過低價(jià) API(如 V3 定價(jià)為 GPT-4 的 1%)推動(dòng)技術(shù)普及,被喻為“AI 界拼多多”。倡導(dǎo)開源技術(shù),認(rèn)為閉源護(hù)城河短暫,開放生態(tài)才能促進(jìn)全球協(xié)作與技術(shù)進(jìn)步。
行業(yè)影響
梁文鋒被硅谷稱為“來自東方的神秘力量”,其模型性能在數(shù)學(xué)、代碼等領(lǐng)域比肩 GPT-4o,獲 Meta 首席科學(xué)家 Yann LeCun 等國際認(rèn)可。
個(gè)人風(fēng)格
梁文鋒低調(diào)務(wù)實(shí),極少接受采訪,網(wǎng)上無公開照片,以“技術(shù)極客”形象著稱。崇尚長期主義,強(qiáng)調(diào)“用最長期的眼光回答最大的問題”,拒絕中庸,專注前沿探索。
總結(jié)
梁文鋒以量化投資積累的財(cái)力與算力,推動(dòng) DeepSeek 在 AI 大模型領(lǐng)域?qū)崿F(xiàn)低成本技術(shù)突破,其開源策略與普惠理念重塑行業(yè)格局。他的職業(yè)生涯體現(xiàn)了技術(shù)創(chuàng)新與商業(yè)理想的結(jié)合,被視為中國 AI 全球化競爭的關(guān)鍵人物。