分类: IT业界
2025-03-25 18:02:55
昨晚,DeepSeek V3 低调升级为 DeepSeek V3-0324,登陆 HuggingFace 平台,新版本参数为685B,但目前暂未公布模型卡。同时,DeepSeek 也将 DeepSeek-V3 模型的开源协议更新为与 DeepSeek-R1 一致的 MIT 协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给了开发者更多的自主权。
DeepSeek 延续了一贯“闷声干大事”的风格,没有发布会、没有白皮书,而且 DeepSeek 官方称这只是一次“小版本升级”。然而,凭一个空白 README 文件和 641GB 的模型权重,V3-0324 的实力还是引爆了海外社交平台。
网友 karminsk-牙医 对写代码能力实测后表示,DeepSeek V3-0324 以 328.3 分的代码能力超越 Claude 3.7 Sonnet 普通版(322.3分),在KCORES 大模型竞技场排名第三,直逼其思维链版本(334.8分)310,编程能力已经逼近 AI 编程王者 Claude 3.7。网友调侃:“现在,一杯咖啡的钱就能雇一个AI全栈工程师。”
还有网友在输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”的提示词之后,DeepSeek V3-0324 只花了 2 分钟就生成 400 行代码的赛博朋克风格网站。
相比旧版,V3-0324 的代码生成量翻倍,且直接输出可运行的响应式网页,甚至支持粒子动画、悬浮光效等高级特性。更令人咋舌的是,开发者 Deepanshu Sharma 仅用一句指令便生成 800 多行无错代码,而 Claude 3.7 Sonnet 需付费且耗时更长。
硬刚 Claude 3.7 Sonnet,并不只是代码的较量。
数学博士 Jasper 用 2025 年 AIME 竞赛题测试,模型不仅给出正确答案,还附上了详细推导过程。而Claude 3.7 Sonnet 虽然答案简洁,却在关键步骤出错。
况且 V3-0324 的编程能力虽然还不能完全抗衡编程王者 Claude 3.7,但凭借免费开源这一点就足够 Anthropic 和 OpenAI 紧张了。
V3 新版本的突破不仅是技术性的,更是生态性的。
开源策略的持续加码,正在重塑全球 AI 生态格局。DeepSeek-V3-0324 不仅延续 MIT 开源协议,允许商业使用,还开放了模型蒸馏权限,这意味着中小企业可以直接基于该模型训练专属的轻量化版本。
这种开放性带来的效益显而易见。比如,开发者可以利用其底层架构搭建出面向医疗影像分析的垂直模型;创业团队则可以将其与本地语言模型结合,开发出支持多种语言的代码助手。这种生态活力与闭源阵营形成鲜明对比——当 OpenAI 仍在为 GPT 商店的分成比例与开发者博弈时,DeepSeek 的开源社区已自然生长出数百个衍生应用。
这场技术革命的影响早已超越单纯的性能竞赛。DeepSeek 的成功验证了中国式创新的独特路径,不仅缩小了中美 AI 技术差距,更重要的是为全球的普通开发者提供了“第三条道路”——既不必受制于闭源模型的高昂使用费,也无需重复投入天价训练成本。
V3 新版本的强大,让大家对 DeepSeek-R1 的升级更加期待。不过 DeepSeek V3 更新了,R2 应该不会太遥远。未来 R2 与 GPT-5 的终极对决或许将再次改写 AI 行业规则,让我们拭目以待。
大家有什么看法呢?欢迎在评论区留言讨论~