1638 字

8 分钟

DeepSeek V4正式发布：1.6万亿参数、百万上下文，开源最强模型来了

2026-04-27

AI前沿

DeepSeek

/

V4

/

开源模型

/

MoE

/

大模型

/

百万上下文

/

AI

DeepSeek V4正式发布：1.6万亿参数、百万上下文，开源最强模型来了#

引言#

2026年4月24日，在经历了数月的期待和传闻后，中国AI实验室DeepSeek终于正式发布了 DeepSeek V4 系列模型。

这不是一次常规的版本迭代。DeepSeek V4以1.6万亿总参数量、默认100万token上下文窗口、以及极具颠覆性的API定价，向整个行业投下了一枚重磅炸弹。

本文将基于官方技术报告和实测数据，全面解读这款可能改变行业格局的模型。

DeepSeek V4系列概览#

DeepSeek V4包含两个版本，均采用MoE（混合专家）架构：

版本	总参数量	激活参数量	定位	下载大小
V4-Pro	1.6万亿	490亿	顶级性能，对标闭源旗舰	865GB
V4-Flash	2840亿	130亿	快速、高效、经济	160GB

两个版本均已开源，采用 MIT许可证，这意味着你可以自由使用、修改甚至用于商业用途。

核心特性#

1. 混合注意力架构：100万上下文不再是负担#

DeepSeek V4最核心的技术突破在于其 混合注意力架构，结合了两种创新机制：

CSA（压缩稀疏注意力）：对大部分token进行稀疏采样
HCA（重度压缩注意力）：对关键信息进行深度压缩存储

这套架构带来的效果是惊人的：

在100万token的上下文场景中，V4-Pro的单token推理FLOPs仅为前代V3.2的27%，KV缓存占用仅为10%。

换句话说，100万上下文在V4上不再是”奢侈品”，而是标配。所有官方DeepSeek服务默认支持100万上下文。

2. 三种推理模式#

DeepSeek V4提供了三种推理力度控制：

模式	特点	适用场景
Non-Think	快速、直觉式响应	日常任务、低风险决策
Think High	深度逻辑分析，较慢但准确	复杂问题求解
Think Max	推理能力推到极致	探索模型能力边界

这种设计让开发者可以在延迟和性能之间做精细权衡。

3. 原生智能体能力#

DeepSeek V4在Agent场景的优化非常突出：

已无缝集成 Claude Code、OpenClaw、OpenCode 等主流AI编程助手
已在DeepSeek内部驱动自动编码基础设施
在SWE-bench Pro上达到 55.4%，Terminal-Bench 2.0达到 67.9%

4. 训练优化#

底层训练层面，DeepSeek引入了：

Manifold-Constrained Hyper-Connections (mHC)：强化残差连接，稳定信号传播
Muon Optimizer：更快的收敛速度和训练稳定性
在超过 32万亿 多样化token上进行预训练

基准测试表现#

知识与推理#

基准	V4-Pro-Max	GPT-5.4	Gemini-3.1-Pro	Claude Opus 4.7
MMLU-Pro	87.5%	~90%	~91%	~89%
GPQA Diamond	90.1%	~93%	~94%	~91%
GSM8K	92.6%	~95%	~96%	~93%

V4-Pro在知识和推理方面超越了所有开源模型，在部分指标上甚至超越了GPT-5.2。虽然与最前沿的GPT-5.4和Gemini-3.1-Pro仍有3-6个月的差距，但已经非常接近。

编程与智能体#

基准	V4-Pro-Max	GPT-5.5	Claude Opus 4.7
SWE-bench Pro	55.4%	58.6%	64.3%
Terminal-Bench 2.0	67.9%	82.7%	69.4%

在编程基准上，V4-Pro略逊于GPT-5.5和Opus 4.7，但DeepSeek内部测试显示它已经超越了Claude Sonnet 4.5，接近Opus 4.5水平。

长上下文#

这是V4的最大亮点：

MRCR 1M（MMR）检索测试：83.5%

这一成绩甚至 超越了Gemini-3.1-Pro 在学术长上下文基准上的表现。100万上下文不只是数字，而是实打实的能力。

V4-Pro vs V4-Flash#

Flash版本由于参数更少，在纯知识测试中自然低于Pro。但如果给它更大的”推理预算”，它的推理分数可以达到与旧版前沿模型相当的水平，使其成为高负载工作的极致性价比选择。

定价：真正的颠覆点#

如果说性能是V4的一半故事，那定价就是另一半。

模型	输入（每百万token）	输出（每百万token）
V4-Pro	$1.74	$3.48
V4-Flash	$0.14	$0.28
GPT-5.5	$5.00	$30.00
Claude Opus 4.7	$5.00	$25.00

V4-Pro的价格约为GPT-5.5和Opus 4.7的 三分之一。而V4-Flash更是低至 0.14美元/百万输入，甚至比GPT-5.4 Nano还便宜。

这不只是竞争，这是降维打击。

如何获取#

DeepSeek V4提供了多种访问方式：

网页端：chat.deepseek.com，Instant Mode对应Flash，Expert Mode对应Pro
API：将model参数更新为 deepseek-v4-pro 或 deepseek-v4-flash，兼容OpenAI和Anthropic API格式
开源权重：Hugging Face或ModelScope下载，MIT许可证

注意：旧版 deepseek-chat 和 deepseek-reasoner 模型将于2026年7月24日完全下线。

最佳应用场景#

基于V4的能力特点，以下场景最适合发挥其优势：

自动化软件工程#

强大的智能体编码能力使其成为自主代码重构和调试的理想选择，尤其是在集成Claude Code等工具后。

海量文档处理#

100万上下文窗口加上极低的计算成本，意味着金融分析师和法律团队可以以极低的价格处理大量PDF、财报和合同。

1
from openai import OpenAI
2

3
client = OpenAI(
4
    api_key="your-api-key",
5
    base_url="https://api.deepseek.com"
6
)
7

8
# 分析百万token级别的文档
9
response = client.chat.completions.create(
10
    model="deepseek-v4-pro",
11
    messages=[{
12
        "role": "user",
13
        "content": "请分析以下100页合同中的关键条款和风险点..."
14
    }],
15
    max_tokens=4000
16
)
17

18
print(response.choices[0].message.content)