梁文锋

梁文锋,男,1985年出生于广东省湛江市,量化私募幻方量化创始人、国产大模型企业深度求索(DeepSeek)创始人,本科、研究生都就读于浙江大学,拥有信息与电子工程学系本科和硕士学位。
2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。2015年,幻方量化正式成立。2019年,其资金管理规模就突破百亿元。2021年,幻方量化的资产管理规模突破千亿大关。2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。2024年5月,DeepSeek发布了DeepSeekV2,其因创新的模型架构和性价比而引发热议出圈。同年12月26日,DeepSeek宣布上线并同步开源DeepSeek-V3模型,并公布了长达53页的训练和技术细节。2025年1月20日, DeepSeek正式发布DeepSeek-R1模型。该模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。同日,梁文锋参加总理座谈会并发言。
人物经历编辑本段
教育经历
1985年,梁文锋出生于广东省湛江市,父亲是小学老师。2002年,他考入浙江大学电子信息工程专业,后在浙大继续深造,于2010年获得信息与通信工程硕士学位,论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。在校期间,他对金融市场产生了浓厚的兴趣。特别在2008年全球金融危机之际,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,这一经历为他日后的职业生涯奠定了基础。
工作经历
2013年,梁文锋与浙大同学徐进共同创立了杭州雅克比投资管理有限公司。2015年,创立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。在2015年的市场波动中,幻方依靠先进的高频量化策略取得了令人瞩目的成绩。
2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,幻方量化几乎所有的量化策略都采用AI模型计算。2018年,幻方正式确立了以AI为核心的发展战略。随着业务的快速扩展,算力瓶颈逐渐显现。2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。同年8月30日,梁文锋在金牛奖颁奖仪式上,发表主题演讲《一名程序员眼里中国量化投资的未来》,引发金融从业人士热议。两年后,梁文锋团队研发“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。
2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,幻方量化几乎所有的量化策略都采用AI模型计算。2018年,幻方正式确立了以AI为核心的发展战略。随着业务的快速扩展,算力瓶颈逐渐显现。2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。同年8月30日,梁文锋在金牛奖颁奖仪式上,发表主题演讲《一名程序员眼里中国量化投资的未来》,引发金融从业人士热议。两年后,梁文锋团队研发“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。

2023年5月,梁文锋宣布做通用人工智能(AGI),7月,他正式创办杭州深度求索人工智能基础技术研究有限公司(DeepSeek),专注于AI大模型的研究和开发。2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2,并宣布DeepSeek-V2的推理成本被降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一。随后国内排名靠前的大模型先后跟进降低成本,DeepSeek因此被称为“AI界的拼多多”。同年12月26日,DeepSeek宣布上线并同步开源的 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。模型测算数据显示,DeepSeek-V3虽然文字生成类任务较弱,但其代码、逻辑推理和数学推理能力均名列前茅。在DeepSeek研究团队同步公开的技术论文中,一个细节引发广泛关注:DeepSeek-V3整个训练过程仅用了不到280万个GPU小时,按每GPU小时2美元计算,模型全部训练成本仅为557.6万美元(约4000万元人民币),这一成本几乎是GPT-4o训练成本的二十分之一。
2023年5月,梁文锋宣布做通用人工智能(AGI),7月,他正式创办杭州深度求索人工智能基础技术研究有限公司(DeepSeek),专注于AI大模型的研究和开发。2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2,并宣布DeepSeek-V2的推理成本被降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一。随后国内排名靠前的大模型先后跟进降低成本,DeepSeek因此被称为“AI界的拼多多”。同年12月26日,DeepSeek宣布上线并同步开源的 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。模型测算数据显示,DeepSeek-V3虽然文字生成类任务较弱,但其代码、逻辑推理和数学推理能力均名列前茅。在DeepSeek研究团队同步公开的技术论文中,一个细节引发广泛关注:DeepSeek-V3整个训练过程仅用了不到280万个GPU小时,按每GPU小时2美元计算,模型全部训练成本仅为557.6万美元(约4000万元人民币),这一成本几乎是GPT-4o训练成本的二十分之一。

2023年5月,梁文锋宣布做通用人工智能(AGI),7月,他正式创办杭州深度求索人工智能基础技术研究有限公司(DeepSeek),专注于AI大模型的研究和开发。2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2,并宣布DeepSeek-V2的推理成本被降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一。随后国内排名靠前的大模型先后跟进降低成本,DeepSeek因此被称为“AI界的拼多多”。同年12月26日,DeepSeek宣布上线并同步开源的 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。模型测算数据显示,DeepSeek-V3虽然文字生成类任务较弱,但其代码、逻辑推理和数学推理能力均名列前茅。在DeepSeek研究团队同步公开的技术论文中,一个细节引发广泛关注:DeepSeek-V3整个训练过程仅用了不到280万个GPU小时,按每GPU小时2美元计算,模型全部训练成本仅为557.6万美元(约4000万元人民币),这一成本几乎是GPT-4o训练成本的二十分之一。


2025年1月20日晚,DeepSeek正式发布DeepSeek-R1,该模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。此外,DeepSeek同步开源模型权重,并表示将DeepSeek-R1训练技术全部公开,以期促进技术社区的充分交流与创新协作。
个人生活编辑本段
据梁文锋的初中班主任介绍,梁文锋出生在一个教师家庭,其父母都是小学语文老师。
社会活动编辑本段
2025年1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。梁文锋参加此次座谈会并进行了发言。在座谈会上,李强总理提到,“要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。”
2025年1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。梁文锋参加此次座谈会并进行了发言。在座谈会上,李强总理提到,“要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。”

人物言论编辑本段
DeepSeek的主要挑战
梁文锋曾表示DeepSeek在迈向“国产大模型之光”的路途上,主要挑战是“高端芯片的获取问题”,可能还有量化私募在国内所受的毁远大于誉的境况。
回应DeepSeek“爆火”
2025年1月20日,DeepSeek最新发布的R1模型不仅在性能上比肩甚至超越了OpenAI的 o1,并完全开源,且以极低的成本实现了这一突破。随着DeepSeek全球“爆火”,梁文锋表示,中国AI不可能永远处在跟随的位置,“我们经常说中国 AI 和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。