deepseek线上模型升级，DeepSeek-V3.1-Terminus有哪些升级点？

　　9月22日晚，DeepSeek正式宣布线上模型完成重大升级，全新版本DeepSeek-V3.1-Terminus正式上线。此次升级在保持原有性能的基础上，针对用户反馈的核心问题进行了系统性优化，并进一步强化了模型在复杂任务场景中的处理能力。以下是该版本的核心升级点梳理：

　　1.语言一致性优化：缓解中英文混杂与异常字符问题

　　针对此前版本中用户反馈的中英文混杂、偶发异常字符（如随机插入“极”字等干扰内容）等问题，新版本通过语义层降噪技术实现了显著改进。在社交媒体测试中，用户发现新模型在长文本生成时中英文切换更加自然，且异常字符出现频率降低。这一改进尤其提升了模型在编程、学术写作等对输出结构敏感场景中的可用性。

　　2.Agent能力强化：工具调用与智能体任务表现提升

　　新版本对Code Agent（代码智能体）与Search Agent（搜索智能体）进行了深度重构：

　　Code Agent：语法解析精度提升，在LiveCodeBench编程测试中得分逼近OpenAI o3-high模型，可稳定生成符合规范的代码结构。

　　Search Agent：信息检索召回率优化，在BrowseComp测评中得分从30.0提升至38.5，能更精准地定位关键信息。

　　输出长度扩展：非思考模式默认输出4K tokens（最大8K），思考模式默认32K tokens（最大64K），满足从快速问答到深度分析的多场景需求。

　　3.性能基准突破：复杂推理能力显著增强

　　在权威测试集Humanity’s Last Exam（人类终极测试）中，新版本得分从15.9跃升至21.7，提升幅度达36.48%，超越Gemini 2.5 Pro（21.6分），仅次于Grok 4（25.4分）和GPT-5（25.3分）。此外，在AIME2025数学竞赛测试中准确率提升至87.5%，较旧版R1的70%大幅提升，成功解决“9.9-9.11=？”等曾难倒Claude 4、Gemini 2.5 Pro的经典陷阱题。

　　4.工程化落地：全渠道同步与开源生态

　　全平台覆盖：官方App、网页端、小程序及API均已完成升级，开发者无需调整代码即可无缝调用新功能。

　　开源策略：新版本延续开源路线，模型已同步上传至Hugging Face与ModelScope平台，支持MIT许可协议下的自由商用与二次开发。

　　成本优化：百万tokens输入费用为缓存命中0.5元、未命中4元，输出定价12元，为开发者提供高性价比选择。

　　“Terminus”在拉丁语中意为“终点站”，这一命名引发行业对下一代模型的猜测。结合DeepSeek此前在《自然》杂志发布的强化学习推理论文，以及V3.1系列对混合推理架构的探索，新版本或标志着当前技术路线的阶段性成熟，为后续V4或R2大版本迭代奠定基础。

　　从Manus刷屏引发对AI Agent的关注，到DeepSeek官宣其DeepSeek-V3.1-Terminus模型，人类对AI的想象已从调度工具跃迁至自主智能体。

　　海外的imini Agent也一直在不断地迭代，最新消息其上周上线了很多现成的nano banana 指令模型，智能体功能又获得了新的精进。

iMini Agent 页面更新

页面链接： https://news.znds.com/article/68713.html