deepseek线上模型升级,DeepSeek-V3.1-Terminus有哪些升级点?

作者:科技狗 来源: ZNDS资讯 2025-09-23 17:47 阅读(

  9月22日晚,DeepSeek正式宣布线上模型完成重大升级,全新版本DeepSeek-V3.1-Terminus正式上线。此次升级在保持原有性能的基础上,针对用户反馈的核心问题进行了系统性优化,并进一步强化了模型在复杂任务场景中的处理能力。以下是该版本的核心升级点梳理:

全新版本DeepSeek-V3.1-Terminus正式上线

  1.语言一致性优化:缓解中英文混杂与异常字符问题

  针对此前版本中用户反馈的中英文混杂、偶发异常字符(如随机插入“极”字等干扰内容)等问题,新版本通过语义层降噪技术实现了显著改进。在社交媒体测试中,用户发现新模型在长文本生成时中英文切换更加自然,且异常字符出现频率降低。这一改进尤其提升了模型在编程、学术写作等对输出结构敏感场景中的可用性。

  2.Agent能力强化:工具调用与智能体任务表现提升

  新版本对Code Agent(代码智能体)与Search Agent(搜索智能体)进行了深度重构:

  Code Agent:语法解析精度提升,在LiveCodeBench编程测试中得分逼近OpenAI o3-high模型,可稳定生成符合规范的代码结构。

  Search Agent:信息检索召回率优化,在BrowseComp测评中得分从30.0提升至38.5,能更精准地定位关键信息。

  输出长度扩展:非思考模式默认输出4K tokens(最大8K),思考模式默认32K tokens(最大64K),满足从快速问答到深度分析的多场景需求。

  3.性能基准突破:复杂推理能力显著增强

  在权威测试集Humanity’s Last Exam(人类终极测试)中,新版本得分从15.9跃升至21.7,提升幅度达36.48%,超越Gemini 2.5 Pro(21.6分),仅次于Grok 4(25.4分)和GPT-5(25.3分)。此外,在AIME2025数学竞赛测试中准确率提升至87.5%,较旧版R1的70%大幅提升,成功解决“9.9-9.11=?”等曾难倒Claude 4、Gemini 2.5 Pro的经典陷阱题。

  4.工程化落地:全渠道同步与开源生态

  全平台覆盖:官方App、网页端、小程序及API均已完成升级,开发者无需调整代码即可无缝调用新功能。

  开源策略:新版本延续开源路线,模型已同步上传至Hugging Face与ModelScope平台,支持MIT许可协议下的自由商用与二次开发。

  成本优化:百万tokens输入费用为缓存命中0.5元、未命中4元,输出定价12元,为开发者提供高性价比选择。

  “Terminus”在拉丁语中意为“终点站”,这一命名引发行业对下一代模型的猜测。结合DeepSeek此前在《自然》杂志发布的强化学习推理论文,以及V3.1系列对混合推理架构的探索,新版本或标志着当前技术路线的阶段性成熟,为后续V4或R2大版本迭代奠定基础。

  从Manus刷屏引发对AI Agent的关注,到DeepSeek官宣其DeepSeek-V3.1-Terminus模型,人类对AI的想象已从调度工具跃迁至自主智能体。

  海外的imini Agent也一直在不断地迭代,最新消息其上周上线了很多现成的nano banana 指令模型,智能体功能又获得了新的精进。

iMini Agent 页面更新

页面链接:   https://news.znds.com/article/68713.html

下一篇
海信推出全球首款 100 英寸可卷曲激光影院 —— 江山画卷 R1。该产品遵循 “升是影院,隐是艺术” 的设计定位,即日起全国开启预售,首发价格 99999 元,全球限量 1000 台,每台拥有唯…