DeepSeek R2 或将发布,压力给到
梁文锋
原创 Mr.K 技术领导力 2025年05月06日 08:03
上海 171人
大约100天前,DeepSeek R1横空出世,火爆出圈,被一向傲慢的硅谷科技圈称为“神秘东方力量”,并忧心忡忡地高呼AI领域的“斯普尼克时刻”来了。这款由中国初创公司开发的大模型,用低至600万美元的训练成本,产生足以挑战OpenAI o1的极佳性能,7天内用户数破亿,登顶美国iOS App Store免费应用榜首,更要命的是它还开源……DeepSeek这种杀伤力叠加,难怪让硅谷AI圈觉得“天塌了”。
如今,R1发布已近百日,根据行业3 - 4个月的版本迭代惯例来看,距离DeepSeek再次“出手”的时刻应该不远了。这股神奇又神秘的“东方力量”,能否再次为行业带来惊喜和惊艳?相信全球都在期待中。显然,此刻的压力给到了梁文锋。
01 OpenAI,慌了
1、AI一哥,也乱了分寸
时间拨到2023年,当时的OpenAI创始人山姆奥特曼,可谓是风头无两、风光无限。彼时的OpenAI,坐拥全球最大最强的闭源大模型,GPT-4发布后,OpenAI几乎以一己之力带动数百家创业公司、数千个AI应用崛起,俨然是遥遥领先的AI界“王者”,拿着望远镜也找不到对手。
但奥特曼这种执AI之牛耳、人工智能唯我独尊的舒爽感,持续到2025年1月20日便戛然而止。原因就是来自中国的一家名不见经传的AI创业公司,石破天惊地发布了效果堪比OpenAI o1的DeepSeek R1开源大模型。
就在R1发布的当周,奥特曼在接受媒体采访时,就频频使用“令人印象深刻”、“是真正的威胁”等词语来形容对DeepSeek的感受。他的焦虑不仅因为DeepSeek用新技术、低成本,训练出性能卓越的大模型,更让他担心的是,DeepSeek的开源策略,将在AI生态开放性上形成新范式。
为了减少DeepSeek的冲击,OpenAI变得不再Open,还非常跌份地搞起了小动作。他们向美国政府偷偷提交了长达15页的“举报信”,声称DeepSeek R1会给美国带来“重大风险”,并呼吁美国政府对其采取封禁措施。堂堂AI一哥,竟然不顾体面,向一家新AI创业公司下黑手、使绊子,只能说DeepSeek确实足够强大,能让不可一世的OpenAI乱了分寸,慌了阵脚。
2、OpenAI更小更快了
面对来势汹汹的DeepSeek,回过神来的OpenAI除了背后捅刀子,还被逼着搞起了“应激性迭代”:此前一贯慢节奏迭代的OpenAI,以罕见的高密度先后发布了GPT-4o、O4-mini,以及包括GPT - 4.1、GPT - 4.1 Mini、GPT - 4.1 Nano在内的GPT - 4.1系列模型。
这些新模型几乎都有一个核心特征,就是参数规模更小、成本更低、速度更快。比如,GPT - 4.1 Mini在多个基准测试中表现超越GPT - 4o,大幅减少延迟并降低83%成本;而GPT - 4.1 Nano则是首个超小型模型,能支持100万token的上下文窗口,更适用于低延迟任务。
这一系列的高频更新,无疑是OpenAI在感受到DeepSeek这种兼具高性能与成本效益的开源大模型的竞争压力后,所采取的“防御性扩张”策略。DeepSeek不仅给整个AI行业带来了新的刺激,也让OpenAI第一次真正感受到了竞争对手“后发先至”的现实风险。
02 国内AI应用,只干了一件事
1、全面拥抱DeepSeek
在国内,自DeepSeek大模型问世以来的几个月内,AI应用领域几乎上演了一场集体转向、“追求”DeepSeek的大戏。但凡数得上号的AI应用,似乎都在不约而同地干一件事:想尽办法上线DeepSeek R1满血版。
在搜索引擎领域,百度率先宣布将DeepSeek R1深度集成至文心一言底层架构,实现了多模态生成效率的大幅度提升;腾讯元宝智能创作平台接入DeepSeek API后,使得短视频脚本生成成本大幅降低,日均处理请求量突破百万次;阿里云则推出基于DeepSeek的云原生解决方案,能够把企业大模型部署门槛从百万级降至万元级。甚至连知乎直答、纳米AI搜索等垂直领域玩家,也纷纷以“DeepSeek满血版”为卖点重构产品逻辑,形成了从通用技术到垂直场景的完整渗透。
这种对DeepSeek“众星捧月”般追捧背后的逻辑其实很简单:R1大模型效果更好、成本更低,而且开源透明。DeepSeek R1在多个权威评测榜单上展现出与国际顶尖闭源模型掰手腕的实力,甚至在某些特定任务上实现了超越。更关键的是,其开源的特性以及相对优越的性能功耗比,让大家用起来觉得更放心、更踏实。
2、DeepSeek治好了企业的“AI焦虑”
DeepSeek不仅成了国内各科技大厂的“心头好”,也成了不少企业面对AI,尤其是高性能大模型的AI应用费用“高攀不起”的现实顾虑。高昂的API调用费用、复杂的私有化部署要求、对算力资源的巨大渴求,都让AI技术的规模化应用显得遥不可及。
而DeepSeek的出现,很好的解决了他们“既担心错过技术*的浪潮,又苦于找不到合适的落地路径”的尴尬。DeepSeek通过开源的可控方式,将强大的基础模型能力释放出来,把AI公司,还是寻求AI赋能的传统行业,都有机会以更低的成本、更高的自主性来构建属于自己的AI应用。
DeepSeek将“技术普惠”的理念逐步转变为现实,将原本难以企及的大模型技术,转化为可复用、可负担的“数字基建”,不仅加速了国内AI应用的落地进程,也在很大程度上打消了企业使用AI的后顾之忧,让大家更有底气,从犹豫观望,转向积极尝试。
03 梁文锋的战略定力
1、专注基础大模型研发
在这波AI浪潮中,我们看到了无数AI创业公司,为了生存和发展各显神通。各种“尝tōu”市场的公司在基础模型和上层应用之间摇摆不定;有的公司热衷于追逐热点和流量,显得有些格格不入;他们选择了一条更为专注,也更为艰难的道路:持续深耕基础大模型研发。
相对于其他大模型创业公司的“多元化”尝试,他们展现出了超凡的战略定力。公司成立至今,从未涉足任何应用层产品开发,即便在R1火遍全球、获得“泼天流量”那段时间,面对多灾投资机构抛出的资金合作、流量合作、技术合作等各种橄榄枝,他们也都一一拒绝。
DeepSeek从一开始就将目标锁定在打造世界一流的基座模型上,而不是急于将自身的技术和影响力,转化为直接的应用层产品或商业模式。梁文锋接受媒体采访时说的这段话,也许是对DeepSeek一直以来专注的肯定,也是最好回答:“过去很多年,很多中国公司习惯了等摩尔定律‘从天而降’,躺在家里18个月就会出来更好的硬件和软件。我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。中国也要逐步成为贡献者,而不是直接便车。”
2、或将成为AI时代的科技巨头
梁文锋和DeepSeek这种心无旁骛、执着于将资源和精力,投入到模型的持续迭代和优化中的态度和精神,让K哥联想到了互联网时代的那些最终脱颖而出的科技巨头们。
无论是字节跳动的张一鸣,早期聚焦于推荐算法和信息流产品;还是美团的王兴,在“千团大战”中坚持深耕本地生活服务;亦或是拼多多的黄峥,瞄准下沉市场和社交电商模式持续发力……他们之所以成功的最重要共同点,就是在创业初期甚至相当长的一段时间内,都表现出了对他们认定的目标做到极致的专注,长期主义心态。他们抵制了多元化的诱惑,成为了在自己认定的“窄道”里,做到极致的“选择者”。
社会心理学中著名的“棉花糖实验”,曾为我们揭示了延迟满足的能力与未来成功的某种关联。而在商业世界,这种延迟满足则体现为一种能抵御短期诱惑、为更宏大的长期目标持续投入的战略定力。从这个角度来看,梁文锋所带领的DeepSeek,已经具备成为AI时代科技巨头的所有潜质。
04 梁文锋的主场时刻又到了
DeepSeek R1的成功出圈,无疑为这家公司注入了强大的发展动能。尽管梁文锋和他的团队仍保持一贯的低调,但一些微妙的变化,还是透露出公司正在为下一阶段的发展积蓄力量。
比如,DeepSeek开始在招聘市场上物色CFO、COO等关键高管职位。这也被外界解读为DeepSeek正在为更大规模的融资,甚至是未来的资本市场运作做准备。毕竟,对于任何一家技术驱动型公司而言,引入经验丰富的管理人才,完善公司治理结构,都是从野蛮生长走向成熟的必经之路。
不过遗憾的是,除了这些间接信息,关于DeepSeek R2的内部消息,目前还知之甚少。充满期待,根据市场预测和业内透露的某些零星信息,市场普遍预期这无疑是梁文锋和DeepSeek在5月份的一个“主场时刻”。
R1发布会为我们带来哪些颠覆的体验?让我们一边充满期待,一边祝福DeepSeek的梁文锋和他的团队,继续为中国的AI发展带来更多惊喜,做稳健前行、为中国的AI发展做出更大贡献。
精选好文:
1、
2、DeepSeek正在“杀死”智能小i?
4、软件是一门垃圾的生意吗?
——导主简介——
博士,曾担任海尔、「顿悟快速」、「纷网」技术高
。著有:《AI产业观察》《企业AI实用实践》
分享:技术人修炼之道》《技术管理之路》
领导者成长。
END -
成人本科大学
招生通知: 发布时间:2025年1月
招生名额有限,招满即止!
招生:面向低学历社会人员招生,2年制本科,
2年本科大学毕业,学费2180元, 查看详情
2年本科大学(招生)
作者已设置关注后可以留言
目录
DeepSeek R2 或将发布,压力给到
梁文锋
原创 Mr.K 技术领导力 2025年05月06日 08:03
上海 171人
大约100天前,DeepSeek R1横空出世,火爆出圈,被一向傲慢的硅谷科技圈称为“神秘东方力量”,并忧心忡忡地高呼AI领域的“斯普尼克时刻”来了。这款由中国初创公司开发的大模型,用低至600万美元的训练成本,产生足以挑战OpenAI o1的极佳性能,7天内用户数破亿,登顶美国iOS App Store免费应用榜首,更要命的是它还开源……DeepSeek这种杀伤力叠加,难怪让硅谷AI圈觉得“天塌了”。
如今,R1发布已近百日,根据行业3 - 4个月的版本迭代惯例来看,距离DeepSeek再次“出手”的时刻应该不远了。这股神奇又神秘的“东方力量”,能否再次为行业带来惊喜和惊艳?相信全球都在期待中。显然,此刻的压力给到了梁文锋。
01 OpenAI,慌了
1、AI一哥,也乱了分寸
时间拨到2023年,当时的OpenAI创始人山姆奥特曼,可谓是风头无两、风光无限。彼时的OpenAI,坐拥全球最大最强的闭源大模型,GPT-4发布后,OpenAI几乎以一己之力带动数百家创业公司、数千个AI应用崛起,俨然是遥遥领先的AI界“王者”,拿着望远镜也找不到对手。
但奥特曼这种执AI之牛耳、人工智能唯我独尊的舒爽感,持续到2025年1月20日便戛然而止。原因就是来自中国的一家名不见经传的AI创业公司,石破天惊地发布了效果堪比OpenAI o1的DeepSeek R1开源大模型。
就在R1发布的当周,奥特曼在接受媒体采访时,就频频使用“令人印象深刻”、“是真正的威胁”等词语来形容对DeepSeek的感受。他的焦虑不仅因为DeepSeek用新技术、低成本,训练出性能卓越的大模型,更让他担心的是,DeepSeek的开源策略,将在AI生态开放性上形成新范式。
为了减少DeepSeek的冲击,OpenAI变得不再Open,还非常跌份地搞起了小动作。他们向美国政府偷偷提交了长达15页的“举报信”,声称DeepSeek R1会给美国带来“重大风险”,并呼吁美国政府对其采取封禁措施。堂堂AI一哥,竟然不顾体面,向一家新AI创业公司下黑手、使绊子,只能说DeepSeek确实足够强大,能让不可一世的OpenAI乱了分寸,慌了阵脚。
2、OpenAI更小更快了
面对来势汹汹的DeepSeek,回过神来的OpenAI除了背后捅刀子,还被逼着搞起了“应激性迭代”:此前一贯慢节奏迭代的OpenAI,以罕见的高密度先后发布了GPT-4o、O4-mini,以及包括GPT - 4.1、GPT - 4.1 Mini、GPT - 4.1 Nano在内的GPT - 4.1系列模型。
这些新模型几乎都有一个核心特征,就是参数规模更小、成本更低、速度更快。比如,GPT - 4.1 Mini在多个基准测试中表现超越GPT - 4o,大幅减少延迟并降低83%成本;而GPT - 4.1 Nano则是首个超小型模型,能支持100万token的上下文窗口,更适用于低延迟任务。
这一系列的高频更新,无疑是OpenAI在感受到DeepSeek这种兼具高性能与成本效益的开源大模型的竞争压力后,所采取的“防御性扩张”策略。DeepSeek不仅给整个AI行业带来了新的刺激,也让OpenAI第一次真正感受到了竞争对手“后发先至”的现实风险。
02 国内AI应用,只干了一件事
1、全面拥抱DeepSeek
在国内,自DeepSeek大模型问世以来的几个月内,AI应用领域几乎上演了一场集体转向、“追求”DeepSeek的大戏。但凡数得上号的AI应用,似乎都在不约而同地干一件事:想尽办法上线DeepSeek R1满血版。
在搜索引擎领域,百度率先宣布将DeepSeek R1深度集成至文心一言底层架构,实现了多模态生成效率的大幅度提升;腾讯元宝智能创作平台接入DeepSeek API后,使得短视频脚本生成成本大幅降低,日均处理请求量突破百万次;阿里云则推出基于DeepSeek的云原生解决方案,能够把企业大模型部署门槛从百万级降至万元级。甚至连知乎直答、纳米AI搜索等垂直领域玩家,也纷纷以“DeepSeek满血版”为卖点重构产品逻辑,形成了从通用技术到垂直场景的完整渗透。
这种对DeepSeek“众星捧月”般追捧背后的逻辑其实很简单:R1大模型效果更好、成本更低,而且开源透明。DeepSeek R1在多个权威评测榜单上展现出与国际顶尖闭源模型掰手腕的实力,甚至在某些特定任务上实现了超越。更关键的是,其开源的特性以及相对优越的性能功耗比,让大家用起来觉得更放心、更踏实。
2、DeepSeek治好了企业的“AI焦虑”
DeepSeek不仅成了国内各科技大厂的“心头好”,也成了不少企业面对AI,尤其是高性能大模型的AI应用费用“高攀不起”的现实顾虑。高昂的API调用费用、复杂的私有化部署要求、对算力资源的巨大渴求,都让AI技术的规模化应用显得遥不可及。
而DeepSeek的出现,很好的解决了他们“既担心错过技术*的浪潮,又苦于找不到合适的落地路径”的尴尬。DeepSeek通过开源的可控方式,将强大的基础模型能力释放出来,把AI公司,还是寻求AI赋能的传统行业,都有机会以更低的成本、更高的自主性来构建属于自己的AI应用。
DeepSeek将“技术普惠”的理念逐步转变为现实,将原本难以企及的大模型技术,转化为可复用、可负担的“数字基建”,不仅加速了国内AI应用的落地进程,也在很大程度上打消了企业使用AI的后顾之忧,让大家更有底气,从犹豫观望,转向积极尝试。
03 梁文锋的战略定力
1、专注基础大模型研发
在这波AI浪潮中,我们看到了无数AI创业公司,为了生存和发展各显神通。各种“尝tōu”市场的公司在基础模型和上层应用之间摇摆不定;有的公司热衷于追逐热点和流量,显得有些格格不入;他们选择了一条更为专注,也更为艰难的道路:持续深耕基础大模型研发。
相对于其他大模型创业公司的“多元化”尝试,他们展现出了超凡的战略定力。公司成立至今,从未涉足任何应用层产品开发,即便在R1火遍全球、获得“泼天流量”那段时间,面对多灾投资机构抛出的资金合作、流量合作、技术合作等各种橄榄枝,他们也都一一拒绝。
DeepSeek从一开始就将目标锁定在打造世界一流的基座模型上,而不是急于将自身的技术和影响力,转化为直接的应用层产品或商业模式。梁文锋接受媒体采访时说的这段话,也许是对DeepSeek一直以来专注的肯定,也是最好回答:“过去很多年,很多中国公司习惯了等摩尔定律‘从天而降’,躺在家里18个月就会出来更好的硬件和软件。我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。中国也要逐步成为贡献者,而不是直接便车。”
2、或将成为AI时代的科技巨头
梁文锋和DeepSeek这种心无旁骛、执着于将资源和精力,投入到模型的持续迭代和优化中的态度和精神,让K哥联想到了互联网时代的那些最终脱颖而出的科技巨头们。
无论是字节跳动的张一鸣,早期聚焦于推荐算法和信息流产品;还是美团的王兴,在“千团大战”中坚持深耕本地生活服务;亦或是拼多多的黄峥,瞄准下沉市场和社交电商模式持续发力……他们之所以成功的最重要共同点,就是在创业初期甚至相当长的一段时间内,都表现出了对他们认定的目标做到极致的专注,长期主义心态。他们抵制了多元化的诱惑,成为了在自己认定的“窄道”里,做到极致的“选择者”。
社会心理学中著名的“棉花糖实验”,曾为我们揭示了延迟满足的能力与未来成功的某种关联。而在商业世界,这种延迟满足则体现为一种能抵御短期诱惑、为更宏大的长期目标持续投入的战略定力。从这个角度来看,梁文锋所带领的DeepSeek,已经具备成为AI时代科技巨头的所有潜质。
04 梁文锋的主场时刻又到了
DeepSeek R1的成功出圈,无疑为这家公司注入了强大的发展动能。尽管梁文锋和他的团队仍保持一贯的低调,但一些微妙的变化,还是透露出公司正在为下一阶段的发展积蓄力量。
比如,DeepSeek开始在招聘市场上物色CFO、COO等关键高管职位。这也被外界解读为DeepSeek正在为更大规模的融资,甚至是未来的资本市场运作做准备。毕竟,对于任何一家技术驱动型公司而言,引入经验丰富的管理人才,完善公司治理结构,都是从野蛮生长走向成熟的必经之路。
不过遗憾的是,除了这些间接信息,关于DeepSeek R2的内部消息,目前还知之甚少。充满期待,根据市场预测和业内透露的某些零星信息,市场普遍预期这无疑是梁文锋和DeepSeek在5月份的一个“主场时刻”。
R1发布会为我们带来哪些颠覆的体验?让我们一边充满期待,一边祝福DeepSeek的梁文锋和他的团队,继续为中国的AI发展带来更多惊喜,做稳健前行、为中国的AI发展做出更大贡献。
精选好文:
1、
2、DeepSeek正在“杀死”智能小i?
4、软件是一门垃圾的生意吗?
——导主简介——
博士,曾担任海尔、「顿悟快速」、「纷网」技术高
。著有:《AI产业观察》《企业AI实用实践》
分享:技术人修炼之道》《技术管理之路》
领导者成长。
END -
成人本科大学
成人本科大学
招生通知: 发布时间:2025年1月
招生名额有限,招满即止!
招生:面向低学历社会人员招生,2年制本科,
2年本科大学毕业,学费2180元, 查看详情
2年本科大学(招生)
作者已设置关注后可以留言