DeepSeek上线专家模式:国产AI激战正酣,V4能否复刻去年春节炸场?
来源:澎湃新闻
2026-04-08 13:29:01

4月8日,澎湃新闻记者查询发现,在最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,网页显示,快速模式适合日常对话,即时响应,支持图片和文件中的文字识别;专家模式擅长复杂问题,这也是DeepSeek在官网页面首次引入分层模式。
这也让DeepSeek更新V4的悬念再度成为大家讨论的热点,综合外媒报道和社交媒体、多方渠道信息,DeepSeek大概率在今年4月正式上线V4版本。
此前不少消息也透露出端倪:3月29日至31日,DeepSeek官方网站连续三天出现不同程度异常,涉及网页对话、App及API等,故障分别持续约1小时48分、10小时13分和1小时3分。其中,3月29日晚上22点开始,一直到30日早上7点,服务出现长达8小时的大规模访问异常,大量用户遭遇页面卡顿、反复提示“服务器繁忙”甚至功能完全中断。
外界猜测,DeepSeek出现大规模宕机的核心原因,是V4更新所导致,对此,DeepSeek内部人士没有回应消息的真实性,而是向澎湃新闻记者表示:非常期待。
今年1月12日,DeepSeek曾发布一篇新论文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大语言模型稀疏性的新维度),梁文锋位列作者名单中,这篇论文为北京大学和DeepSeek共同完成。据分析,这篇论文的核心直指当前大语言模型存在的记忆力“短板”,提出了“条件记忆”这一概念。
2月13日,澎湃新闻记者曾独家获悉,DeepSeek网页/ APP正在测试新的长文本模型结构,支持1M上下文。其API服务不变,仍为V3.2,仅支持128K上下文。大家当时也猜测,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。
不过,春节AI大战虽然热闹,但DeepSeek却始终静悄悄,也让相关期待一度落空。
据券商研报显示,DeepSeek最新的V4模型亮点将聚焦国产化。野村证券分析,作为去年推出DS-V3/R1并搅动全球AI产业链的玩家,DeepSeek的全新技术布局不仅将推动中国AI产业链创新周期加速,更将通过技术创新,在算法与工程层面缩小中国与全球大模型产业的差距。
业内人士普遍认为,此次V4发布,对于DeepSeek来说难度颇大,要复刻去年春节期间炸场的轰动性颇有技术挑战,因为国产大模型已经卷入深水战场,竞争极度激烈。
4月8日,智谱正式发布GLM-5.1,记者发现,在年内涨价超八成后,智谱GLM再度提价10%。调价后,GLM-5.1在Coding场景的缓存命中Token价格已接近Anthropic旗下Claude Sonnet4.6水平。
据悉,这是国产大模型首次在核心场景实现与海外头部厂商的价格对齐。一年前,国产大模型厂商还在以降价90%以上争夺市场份额。这一转折表明国产大模型不再单纯依靠大幅降价争夺市场,而是以性能溢价锚定国际基准。
数据显示,GLM-5.1在编程能力上继续保持领先,在SWE-bench Pro、Terminal-Bench、NL2Repo三大代码评测基准的综合平均分中,取得全球第三、国产第一、开源第一;此外,有别于当前以分钟级交互为主的模型,GLM-5.1能够在单次任务中持续、自主地工作长达8小时。
3月18日,MiniMax(上海稀宇极智科技有限公司)发布新一代Agent旗舰大模型M2.7,首次展示“模型自我进化”路径。该模型通过构建Agent Harness体系,深度参与自身训练与优化流程,在部分研发场景中可承担30%—50%的工作量,并在内部评测集上实现约30%的效果提升。
据介绍,在核心能力上,M2.7在SWE-bench Pro中取得56.22%的成绩,接近国际一线水平;同时在VIBE-Pro、Terminal Bench2等真实工程测试中表现突出,支持端到端项目交付与复杂系统理解。办公场景方面,其在GDPval-AA的ELO得分是1495,为开源模型中最高,并显著提升Office文档处理与多轮编辑能力。
截至8日港股午盘,智谱(02513.HK)涨14.06%,报888.5港元,市值3961亿港元。MiniMax(0100.HK)涨6.9%,报1015港元,市值3183亿港元。
责任编辑:张誉耀
