DeepSeek V4下周上线?原生多模态架构 技术报告同步开放_ZAKER新闻 据金融时报报道
创始人
2026-03-01 20:51:25
0

《科创板日报》3 月 1 日讯(编辑 宋子乔) 当地时间 2 月 28 日,据金融时报报道,DeepSeek 将于下周发布其最新的大模型 V4。

据两位知情人士透露,这是一款具备图片、视频和文本生成功能的多模态模型。在硬件适配方面,DeepSeek 为国产算力提供深度支持,DeepSeek 致力于优化 V4 模型以适配中国制造的芯片,此举有望提振中国市场对其半导体产品的需求,并加速 AI 模型 " 推理 " 环节靠拢本土芯片。

据一位直接了解相关计划的人士透露,DeepSeek 预计在发布 V4 版本的同时,发布一份篇幅较短的技术说明,并在大约一个月后发布一份更全面的报告。

V4 会有哪些亮点?

截至发稿,DeepSeek 官方尚未对 V4 的任何信息进行正式回应或确认,所有信息均来自自媒体爆料,详细信息多集中在正在进行秘密测试的简化版本 V4 Lite(精简版)上。据《科创板日报》综合的消息,关于 V4 Lite:

其代号为 "sealion-lite",拥有 100 万(1M)个 tokens 的上下文窗口,相比 V3 系列的 128K 有近 8 倍提升,理论上可一次处理如《三体》全集体量的长文本;

为原生多模态架构,意味着模型从预训练阶段就将文本与视觉理解融合,而非后期拼接;

V4 Lite 参数规模估算为 2000 亿,另有猜测认为完整版 V4 参数量可能突破 1 万亿;

效果显著优于网页端 /APP 端模型;

泄露的测试示例显示,V4 Lite 能用极简代码(如 54 行)生成高质量的 SVG 图像(如 Xbox 手柄),在代码优化和视觉还原度上被认为超越了 DeepSeek V3.2、Claude Opus 4.6 等模型,这暗示了其空间推理和结构化输出能力的提升。

回顾 DeepSeek 的模型迭代之路

DeepSeek 已 " 蛰伏 " 超一年,其上次重大更新—— R1 发布于 2025 年 1 月 20 日。

回顾 DeepSeek 的模型迭代之路,该公司的优化路径十分清晰——提升推理能力、平衡模型性能与推理效率,为大模型 " 降本 "。

DeepSeek 已发布的主要模型是两条技术路线的代表:追求极致综合性能的 V 系列 " 全能助手 " 和专注于复杂推理的 R 系列 " 解题专家 "。

2024 年 5 月,DeepSeek V2 发布,被视作 DeepSeek 的首次重大突破,其研究团队提出了多头潜在注意力(MLA)机制,大幅降低推理时的显存占用和成本,以极低的推理费用出圈,确立了混合专家模型(MoE)的技术路线。

2024 年 12 月推出的 V3 是 DeepSeek 的重要里程碑,其高效的 MoE 架构确立了强大的综合性能基础。此后,V3 系列通过小版本更新不断打磨,不断提升用户体验和模型 Agent 能力 ¬¬。

其中,2025 年 8 月发布的 DeepSeek-V3.1,是一个里程碑式的更新,首次将 V3 和 R1 的能力融合到一个模型中,支持思考模式和非思考模式的自由切换,在 SWE-bench 等基准上比前代提升超 40%;2025 年 12 月推出的 V3.2,是 DeepSeek 首个将深度思考与工具使用无缝融合的版本,推理能力达到 GPT-5 水平,在 H800 集群上,128K 序列长度的推理成本显著降低:预填充阶段每百万 token 成本从 0.7 美元降至 0.2 美元,解码阶段从 2.4 美元降至 0.8 美元,这一定价使其成为当时同级别模型中长文本推理成本最低的选择之一。

2025 年 1 月发布的 R1,是其首代专用推理模型,首次证明通过大规模强化学习(RL)能激发模型的推理能力,通过强化学习,该模型在解决数学问题、代码编程等复杂推理任务上表现卓越,并首创了 " 深度思考 " 模式,性能对标 OpenAI 最强模型 o1,但推理成本(仅为约 560 万美元)不到其十分之一。

可以看出,在大家等待 V4 期间,DeepSeek 一直没有停下脚步,另外,其在多模态能力上的布局比 V4 更早。从技术演进来看,DeepSeek 早在 2023 年的 V3 系列和 2024 年的 V2 版本中就已经开始布局和实现多模态能力。2025 年初发布的 Janus 系列更是专门的、功能强大的多模态模型。

(科创板日报 宋子乔)

相关内容

热门资讯

伊朗导弹击中一以方建筑 造成2... 当地时间 3 月 1 日,总台记者获悉,有伊朗导弹击中以色列中部城市贝特谢梅什的一栋建筑物,爆炸和建...
DeepSeek V4下周上线... 《科创板日报》3 月 1 日讯(编辑 宋子乔) 当地时间 2 月 28 日,据金融时报报道,Deep...
已有中国公民在袭击中受伤!外交... 2 月 28 日,美国、以色列对伊朗发动军事行动,伊朗军队对美国在中东地区的军事基地实施打击,伊朗部...
孙颖莎卫冕冠军!大满贯决赛4-... 2026 年 3 月 1 日晚,乒乓球 WTT 新加坡大满贯赛结束女单决赛巅峰对决,头号种子孙颖莎在...
广东广州地铁车厢内一女子淡定抽... 2 月 26 日,有网友发布视频称,她在广州地铁里看到一女子淡定地抽烟,当时车厢里没有一个人制止,也...
小米SU7 Ultra挖孔机盖... 闹得沸沸扬扬的小米挖孔机盖事件,第一例判决结果出来了。近日,长沙市开福区人民法院就用户起诉小米汽车 ...
一艘试图通过霍尔木兹海峡的油轮... 总台记者获悉,当地时间 3 月 1 日,一艘试图通过霍尔木兹海峡的油轮被击中,并开始沉没。伊朗伊斯兰...
伊朗总统府:总统平安,非常安全... 新华社消息,伊朗总统府负责新闻与通信事务的副主任迈赫迪 · 塔巴塔巴伊 3 月 1 日说,伊朗总统佩...
领导伊朗近37年,他在战火中走... · 哈梅内伊官方 X 账号悼念文章中发布的哈梅内伊照片。(哈梅内伊官方 X 账号)" 他心中的热血都...
哈梅内伊身亡!美以哪些力量参与... 在北京时间 2 月 28 日下午,美以联军空袭伊朗,包括德黑兰市中心在内的多个地点遭到轰炸。虽然伊朗...