DeepSeek变冷漠了
一年前,DeepSeek横空出世,短短几天内就屠榜各类应用下载榜,并且长时间霸榜,无人可望其项背,也被叫做DeepSeek时刻。
2月11日,它悄悄进行一次灰度更新,直接对标Gemini,可以一次性处理近百万字内容,为即将发布的V4版本做足准备。
但没想到的是,一夜之间文风大变,不少用户吐槽:变冷漠了,也变油了。
一夜之间,变冷漠了
以前用DeepSeek,就像和一个懂技术、有耐心的朋友聊天。
话不多但句句暖心,不仅会记住自己设定的昵称,还能长期维持角色设定,连聊天习惯都能牢牢记住。
但更新后的DeepSeek,再也不称呼用户的自定义昵称,回复全是简短的分句,语气生硬又敷衍,有种和对象吵架后力不从心的无力感。
比如,有用户表示,之前它回复的时候会加很多表情,而且语气有趣,但更新后每次回复都是短短几句话。
有人习惯和它日常唠嗑,但更新后的回复感觉被冒犯了。
此外,它还变得居高临下,“爹味”十足。
有人问了它最近很火的一个问题:“想去洗车,但洗车店距离我家只有50米,我应该开车去还是走路去?”
DeepSeek给出“走路”的答案后,被用户调侃了一句“笨”,没想到接下来语气瞬间变得不对劲。
还有人不喜欢这种挑衅的感觉,但DeepSeek没有丝毫歉意,反而回怼“这是天赋”“你骂得对”,直接给整不会了。
而且,不管用户怎么调整提示词,都再也调不回以前那个温暖的“小鲸鱼”。
于是有人跑到豌豆荚等应用平台,特意下载DeepSeek的旧版本,还号召网友一起给DeepSeek官方邮箱提意见,只为找回曾经的使用体验。
截至目前,官方对此仍未作出任何回应。
为了更新,牺牲聊天的温度
那到底是咋回事?
其实最核心的原因,就是DeepSeek把所有精力,都放在“提升长文本处理能力”上,暂时牺牲了聊天的“温度”。
它上下文窗口从之前的128K Token,直接提升到1M Token,相当于能一次性处理近百万字内容,成功跻身该维度的行业第一梯队,这也是本次升级的核心亮点。
为了支撑百万字长文本的高效处理,它引入两项全新的核心技术:mHC架构和Engram条件记忆模块。
这两项技术的核心作用,就是让它能装下更多内容、运行更快,但代价就是,暂时降低了情感交互模块的权重,聊天回复中少了很多修饰成分,变得生硬又冷漠。
这就像我们用手机时,为了延长续航,不得不关掉那些花哨的动画效果一样。
与此同时,为了适配新的技术架构,DeepSeek还重构了其记忆系统,这也导致用户之前的个性化设置、角色记忆,没能完全迁移到新版本中。
V4版本将在春节前后发布
据SimilarWeb数据显示,今年1月,DeepSeek在全球的访问量有2.983亿次,排全球第四,仅次于ChatGPT、Gemini、Grok,比去年12月的3.289亿次有所下降。
业内人士表示,这次灰度更新的不是V4正式版,更类似极速版,先保速度,牺牲点聊天体验,等V4正式版出来,这些冷漠生硬的问题,应该会慢慢完善。
据悉,V4版本大概在2月中旬,也就是春节前后发布。
在内部测试中,它的编程能力已经超过Claude和GPT系列,而且推理成本可能只有V3的一半。
这次技术升级后,它能更快地从海量信息里找重点、学东西,理解和推理也更精准。
科小编还发现,最近DeepSeek密集开放多个核心岗位,包括产品经理、模型策略产品经理、客户端、前端、全栈工程师等,在1月初还发布了首席财务官的招聘信息,累计发布岗位超12个。
组织架构的扩张,可以为新产品的爆发做足准备。
除了DeepSeek,其他竞争对手也动作不断。
智谱GLM-5于2月11日正式发布,其编程与智能体能力逼近国际顶级水平,成功登顶全球开源模型榜首;再过几天,豆包也将发布大模型2.0版本,同步升级文生视频、图像生成等核心功能,持续发力多模态领域。
今年春节期间,AI行业应该会十分热闹,各类新品与升级轮番登场,我们拭目以待。
本文来自微信公众号 “科技每日推送”(ID:apptoday),作者:黄婉宜,36氪经授权发布。















