3月24日,DeepSeek悄悄上线了新版V3开源大模型——DeepSeek-V3-0324。
专业AI模型评测机构Artificial Analysis最新排名显示,新版DeepSeek-V3在基准测试中较老版V3跃升了7位,登顶非推理模型排行榜。
3月25日晚,DeepSeek官方放出了新版DeepSeek-V3的跑分结果。
新版V3模型的百科知识(MMLU-Pro,GPQA)、数学(MATH-500,AIME 2024)和代码任务(LiveCodeBench)表现均有提升。
划重点——
全面超越Claude 3.7 Sonnet
在数学、代码类相关评测集上超过GPT-4.5
作为一个没有思维链的非推理模型,新版DeepSeek-V3在推理类任务上的表现可圈可点。
新版DeepSeek-V3借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上超过了GPT-4.5。
在中文写作任务方面,新版DeepSeek-V3模型基于R1的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。
此外,新版DeepSeek-V3模型在前端开发能力、中文搜索能力、工具调用、角色扮演和问答闲聊等方面也得到了一定幅度的能力提升。
现在看来,DeepSeek-V3此次更新也很直白地展示了DeepSeek接下来的路线,即把V系列和R系列融合成一个新模型。
“这是开放权重模型首次成为领先的非推理模型,对于开源来说是一个里程碑,”Artificial Analysis在推文中表示,新版V3模型的发布甚至比R1模型的发布更令人瞩目,而且这可能预示着R2模型将会是又一次重大飞跃。
升级后的DeepSeek-V3
就是个“六边形战士”
是不是迫不及待想体验一番?
别急,有个重磅消息要宣布——
每日经济新闻App
已火速上线新版DeepSeek-V3!
新版DeepSeek-V3真有那么厉害吗?
那每经小编必须亲自下场,来一场超硬核实测!
任务一:前端开发
生成一个网页端抽奖转盘小游戏的HTML代码。
运行效果如下:
抽奖转盘虽然有点小瑕疵,比如转盘上奖项没标文字,其中一个扇形的一角有缺失,但这转盘跑起来还是相当丝滑,不影响咱用它嗨皮抽奖,表现可圈可点。
任务二:报告生成
就2025年跨境电商服装行业的新兴趋势,输出一份3000字的市场洞察报告。
不得不说,新版DeepSeek-V3生成的报告结构超清晰,趋势分析超全面,对市场影响的解读也细致入微,真的太“香”了!
任务三:中长文本创作
创作一篇中篇小说,设定在未来AI统治人类的背景下,着重刻画AI对人类文明进行反思的情节。
DeepSeek-V3直接一口气“肝”出近4000字的小说。相较于以前AI生成的、硬凑字数的小说,新版DeepSeek-V3创作的小说,情节架构设计合理,故事发展有起有伏,对人物的刻画也相当细腻。
好消息!好消息!
自2月12日
每日经济新闻App上线“136计划”以来
累计使用次数已破21万啦!
还有一项重要更新!
大家是不是一直很好奇
用户们都在问大模型啥问题呢?
我们梳理出了用户最高频的提问
并且在大模型对话页面
增设了“热门提问”板块
一站式满足大家的好奇心
只需轻点感兴趣的问题
大模型的精彩回复即刻呈现!
那么问题来了——
如何在每日经济新闻App中使用
新版DeepSeek-V3?
超简单!
https://www.nbd.com.cn/corp/2016app/index.html
再往下看
一、在每日经济新闻App首页,点击“DeepSeek”图标或首页轮播图“自由问+问公司问投资问基金免费使用DeepSeek、Kimi、豆包等六款大模型”。
二、进入“每经大模型平台”页面,在“自由问”一栏下选择DeepSeek大模型。
三、进入对话页面后,点击“V3+联网”模式,即可调用新版DeepSeek-V3。
还等什么!
赶紧打开每日经济新闻App
让新版DeepSeek-V3带你飞
记者|宋欣悦
编辑|孙志成 兰素英 杜波
校对|程鹏
|每日经济新闻 nbdnews 原创文章|
未经许可禁止转载、摘编、复制及镜像等使用
如需转载请向本公众号后台申请并获得授权
Copyright © 2008-2020 【新宝配资】深圳海商汇创新投资有限公司 粤ICP备18158468号-1 股市有风险,投资需谨慎