DeepSeek变冷漠了

科技每日推送·2026年02月12日 19:25
DeepSeek变冷漠了

一年前,DeepSeek横空出世,短短几天内就屠榜各类应用下载榜,并且长时间霸榜,无人可望其项背,也被叫做DeepSeek时刻。

2月11日,它悄悄进行一次灰度更新,直接对标Gemini,可以一次性处理近百万字内容,为即将发布的V4版本做足准备。

但没想到的是,一夜之间文风大变,不少用户吐槽:变冷漠了,也变油了。

一夜之间,变冷漠了

以前用DeepSeek,就像和一个懂技术、有耐心的朋友聊天。

话不多但句句暖心,不仅会记住自己设定的昵称,还能长期维持角色设定,连聊天习惯都能牢牢记住。

但更新后的DeepSeek,再也不称呼用户的自定义昵称,回复全是简短的分句,语气生硬又敷衍,有种和对象吵架后力不从心的无力感。

比如,有用户表示,之前它回复的时候会加很多表情,而且语气有趣,但更新后每次回复都是短短几句话。

有人习惯和它日常唠嗑,但更新后的回复感觉被冒犯了。

此外,它还变得居高临下,“爹味”十足。

有人问了它最近很火的一个问题:“想去洗车,但洗车店距离我家只有50米,我应该开车去还是走路去?”

DeepSeek给出“走路”的答案后,被用户调侃了一句“笨”,没想到接下来语气瞬间变得不对劲。

还有人不喜欢这种挑衅的感觉,但DeepSeek没有丝毫歉意,反而回怼“这是天赋”“你骂得对”,直接给整不会了。

而且,不管用户怎么调整提示词,都再也调不回以前那个温暖的“小鲸鱼”。

于是有人跑到豌豆荚等应用平台,特意下载DeepSeek的旧版本,还号召网友一起给DeepSeek官方邮箱提意见,只为找回曾经的使用体验。

截至目前,官方对此仍未作出任何回应。

为了更新,牺牲聊天的温度

那到底是咋回事?

其实最核心的原因,就是DeepSeek把所有精力,都放在“提升长文本处理能力”上,暂时牺牲了聊天的“温度”。

它上下文窗口从之前的128K Token,直接提升到1M Token,相当于能一次性处理近百万字内容,成功跻身该维度的行业第一梯队,这也是本次升级的核心亮点。

为了支撑百万字长文本的高效处理,它引入两项全新的核心技术:mHC架构和Engram条件记忆模块。

这两项技术的核心作用,就是让它能装下更多内容、运行更快,但代价就是,暂时降低了情感交互模块的权重,聊天回复中少了很多修饰成分,变得生硬又冷漠。

这就像我们用手机时,为了延长续航,不得不关掉那些花哨的动画效果一样。

与此同时,为了适配新的技术架构,DeepSeek还重构了其记忆系统,这也导致用户之前的个性化设置、角色记忆,没能完全迁移到新版本中。

V4版本将在春节前后发布

据SimilarWeb数据显示,今年1月,DeepSeek在全球的访问量有2.983亿次,排全球第四,仅次于ChatGPT、Gemini、Grok,比去年12月的3.289亿次有所下降。

业内人士表示,这次灰度更新的不是V4正式版,更类似极速版,先保速度,牺牲点聊天体验,等V4正式版出来,这些冷漠生硬的问题,应该会慢慢完善。

据悉,V4版本大概在2月中旬,也就是春节前后发布。

在内部测试中,它的编程能力已经超过Claude和GPT系列,而且推理成本可能只有V3的一半。

这次技术升级后,它能更快地从海量信息里找重点、学东西,理解和推理也更精准。

科小编还发现,最近DeepSeek密集开放多个核心岗位,包括产品经理、模型策略产品经理、客户端、前端、全栈工程师等,在1月初还发布了首席财务官的招聘信息,累计发布岗位超12个。

组织架构的扩张,可以为新产品的爆发做足准备。

除了DeepSeek,其他竞争对手也动作不断。

智谱GLM-5于2月11日正式发布,其编程与智能体能力逼近国际顶级水平,成功登顶全球开源模型榜首;再过几天,豆包也将发布大模型2.0版本,同步升级文生视频、图像生成等核心功能,持续发力多模态领域。

今年春节期间,AI行业应该会十分热闹,各类新品与升级轮番登场,我们拭目以待。

本文来自微信公众号 “科技每日推送”(ID:apptoday),作者:黄婉宜,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

我们致力于分享人类的前沿科技!

下一篇

一场必须上桌的赌局。

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业