DeepSeek的一次小更新,堪比发布新模型。

一个好消息,时隔俩月, DeepSeek 终于更新了。

就在昨天晚上, DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。

模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。

根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟 R1 对齐,另外还有一些其他方面的小优化。

现在打开 DeepSeek 官网,把深度思考模式关掉就能直接用上 V3-0324 。

不过有一说一,虽然 V3-0324 仅仅只是 V3 的小版本升级,并不是大伙儿期待已久的 V4 或者 R2 ,且官方账号也没有发布任何跟模型有关的信息。

但也丝毫不妨碍, V3-0324 一上线,就有人说他的代码能力,直追克劳德。

新版本的模型刚一上传,就登上了 Hugging Face 的趋势榜单。

在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排名第三。

图源 @karminski 牙医

重点是,排名在前面的模型压根就没几个开源免费的, V3-0324 可谓是一枝独秀。

所以在 V3-0324 上线不到一天的时间里,就已经有很多老哥迫不及待上手测评了一波。

这么说吧, V3-0324 在这些人手里,已经成了拳打 o3-mini ,脚踢 Claude 3.7 Sonnet 的存在。

经典的小球弹跳测试中,这位老哥把 V3-0324 、 o3-mini 和 R1 拉了个横评。

o3-mini 刚开始看着还不赖,但估计物理没学好,外面的六边形都转到垂直的位置了,球还不知道往下掉。

R1 的表现,也是有些让人摸不着头脑。。

相对来说, V3-0324 生成的结果是表现最好的,这位老哥丝毫不吝啬对它的夸奖,说它 “ 表现得像唯一排名第一的非推理模型 ” 。

让 V3-0324 生成一个网页,模型一口气写了 800 多行代码,运行的时候还没有出错,这什么实力不用多说了吧。

在评论区底下,有人仅仅下达了编写登录页面的简单指令,并没有任何其他的附加提示,同样也生成了一个完整的登录页面。

还说 V3-0324 在编码上,能跟 Claude 3.7 Sonnet 掰一掰手腕。

更别提其他的模型,性价比各方面相比下来,现在 OpenAI 的 o1-pro 和 GPT-4.5 ,都已经不香了。

反正看了几个网友的测试案例之后,世超对 V3-0324 的前端代码生成能力,已经有了初步的判断。

但不管咋说,没亲自上过手的东西,咱硬夸也有点心虚。所以这次世超也打算简单试一试,看看 V3-0324 到底有多能打。

一上来,世超就让模型做了一个画板,提示词是 “ 帮我用 HTML 代码构建一个画板,支持鼠标绘制、橡皮擦功能和颜色选择 ” ,这次出战的模型是 V3-0324 和普通版 Claude 3.7 Sonnet 。

只能说,这把 Claude 3.7 Sonnet 赢得很彻底。光是有取色器这一点,就甩了 V3-0324 不知道几个车尾灯。

更别提 UI 设计了, V3-0324 做出来的画板让世超不是很有创作的欲望。。。

世超着实是没想到,这盆凉水来得这么快,都让我有点怀疑到底是我的提示词没写好,还是模型有问题了。。。

不过,我后面又继续把小球弹跳的提示词,分别喂给了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 还有 DeepSeek-V3 。

这下味儿终于对了。V3-0324 生成的结果确实牛叉,能很清楚地看到小球在下落触底的时候,产生了小幅度的弹跳。

就是吧,老版本的 V3 压根没运行起来。。。只能说两个版本之间的差距高下立判了。

再来看普通版 Claude 3.7 Sonnet 的结果,优点是底下的转速、重力和摩擦力都是可调节的,弹跳看起来也没什么大问题,但小球有点出画面了。。。

最后,世超又分别让 V3 和 V3-0324 生成一个 Saas 登录页面,提示词就一句话,没有任何的附加信息。

可以看到, V3 的页面倒是做出来了,但没什么设计可言。

反观 V3-0324 ,果然就跟官方的版本更新说明一样,生成的网页更美观了。

综合看下来, V3-0324 的代码能力相比 V3 确实有了比较大的提升,而且在一部分测试案例中,也能够比肩普通版 Claude 3.7 Sonnet 。

但如果要说完全超越 Claude 3.7 Sonnet ,那世超觉着暂时还不太行。

不过大伙儿也别忘了, V3-0324 在开源这个赛道里, V3-0324 已经算得上能打的了。

而且 DeepSeek 的 API 价格业主打的一个便宜。世超对比了 Claude 3.7 Sonnet 和 V3-0324 的 API 价格, V3-0324 百万 tokens 输入的价格是 2 元,百万 tokens 输出的价格是 8 元,而同样的 tokens 数, Claude 3.7 Sonnet 的输入和输出价格分别是 36.6 元和 108.9 元,价差最多有 18 倍。

所以在某种程度上, V3-0324 这个小更新,的确可以跟 Claude 3.7 Sonnet 媲美。

特别是今天晚上,DeepSeek官方还发文,正式介绍了这波小更新,在数学、代码类的相关评测上,V3-0324比OpenAI目前最厉害的非推理模型GPT-4.5都要更胜一筹。

去年 12 月底 V3 上线,紧接着 R1 就在过年的时候上桌吃饭了。如果按照 DeepSeek 之前发布模型的节奏,盲猜一波 R2 也快了。

总之,小版本更新的 V3-0324 就已经如此强悍了,就是不知道,在 DeepSeek 猛烈的开源炮弹下, “OpenAI 们 ” 还遭不遭得住了。

撰文:西西

编辑:江江&面线

美编:萱萱

图片、资料来源:

DeepSeek、X、Reddit

(0)
wd123_cnwd123_cn
上一篇 2025年3月26日 上午11:11
下一篇 2025年3月26日 上午11:14

相关文章

  • 企业SEO优化全攻略:技巧大揭秘与上海高效服务商推荐

    作为一名企业主,我深知SEO对于业务发展的重要性。在这篇文章中,我会详细分享企业SEO所需的关键技巧,并针对上海地区高效的服务商进行推荐,帮助你在竞争激烈的市场中脱颖而出。

    2025年3月31日
  • 一罐鹰嘴豆,变出14道美味晚餐:快速、健康、多变的餐桌魔法

    鹰嘴豆,又名鸡豆或埃及豆,是一种经济实惠、富含蛋白质、方便快捷且用途广泛的食材。只需一罐鹰嘴豆,就能轻松变出各种美味佳肴,例如口感细腻的鹰嘴豆泥、香脆可口的炸鹰嘴豆丸子、口感清爽的沙拉配料、以及暖心暖胃的炖菜等等。 本文精选了14道以鹰嘴豆为基础的简易晚餐食谱,所有菜品都可以在一小时内完成,并且保证美味、口感丰富,以及充足的植物蛋白。 香料鹰嘴豆咖喱 (Ch…

    2025年3月14日
  • 英超冠军悬念提前揭晓?利物浦或提前锁定冠军

    尽管距离本赛季英超联赛结束还有两个月的时间,但冠军的归属似乎已经尘埃落定。利物浦队在本赛季的表现堪称完美,目前以巨大的积分优势领跑积分榜,几乎锁定了本赛季的英超冠军。 利物浦的统治级表现 利物浦在本赛季的表现无可挑剔,他们在过去的28场比赛中取得了26胜1平1负的惊人战绩,积累了79个积分,领先第二名曼城多达22分。如此巨大的优势让利物浦的夺冠之路几乎没有任…

    2025年3月10日
  • 李镇浩曾说爆料是为了帮金赛纶,金父说“无数次背着她冲向急诊室”

    来源 | 潇湘晨报 记者 | 梁婷婷 日前,金赛纶爸爸接受韩媒采访时,指控李镇浩利用网络炒作金赛纶的私人生活,让女儿承受很大的痛苦。他表示:“我们家也经历了地狱般的折磨”,就连金赛纶逝世之后,李镇浩也不肯放过他们。 (李镇浩(右)曾说,爆料是为了帮金赛纶。) 金父表示,女儿知道自己犯错了,也努力打工反省。可是一直被说装可怜、搏关注,这让女儿非常痛苦…

    2025年3月17日
  • 45岁汤唯获卓越亚洲电影人大奖,一袭绿裙亮相惊艳众人

    来源 | 潇湘晨报综合极目新闻 3月16日晚,汤唯亮相第18届亚洲电影大奖颁奖典礼红毯,一袭柳叶绿裙惊艳亮相。汤唯荣获卓越亚洲电影人大奖,用粤语、普通话和英语三种语言发表获奖感言。 3月5日,亚洲电影大奖官方账号宣布,汤唯获得第18届亚洲电影大奖“卓越亚洲电影人”荣誉,与她一起收获这项大奖的还有韩国著名演员张东健。 作为亚洲电影大奖的重磅奖项之一,卓越亚洲电…

    2025年3月17日
  • 浙江00后女生在出租屋洗澡时玻璃门自爆!手筋被切断,全身多处割伤

    来源 | 钱江视频、都市现场 3月15日,浙江一00后女生在出租房洗完澡开门时玻璃门突然“自爆”,女生全身被割伤,右手筋被切断。 女生说,抓握能力是否受到影响还要看手术后的恢复情况。这位女博主告诉都市现场记者,事发当晚,博主被送医救治。“自己身上有多处2cm左右的伤口和一些皮外伤,其中右手手背处手筋断裂,已经进行手术治疗,目前仍在住院。” 据博主介绍,自己居…

    2025年3月20日