大家好,我是冷逸。最近,不少朋友跟我抱怨:“OpenClaw这玩意儿,好用是真好用,但也是真的费钱啊!”在每一轮对话中,OpenClaw都会像搬家一样,拖家带口地携带大量背景信息(System Prompt和长期Memory)。这就导致,它的Token消耗高得离谱。基本上是Claude ...
今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。 相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。 一共两个模型,分别是 V3.1 和 V3.1 base。两个模型结构完全一致,V3.1 的 Base 模型在 V3 的基础上 ...
我们独家获悉,外界千呼万唤的DeepSeek-V4将于4月正式上线。作为梁文锋打磨已久的多模态大模型,DeepSeek-V4除了在Coding能力上跃升之外,还将在LTM(long term memory长期记忆)上取得突破。 一位接近DeepSeek的人士告诉我们,梁文锋近半年的主要工作是补齐DeepSeek此前在视觉内容处理,以及AI搜索等方面的短板。为了强化DeepSeek的AI搜索能力,D ...
最近的 AI 编程圈,实在是太卷了。 感觉我就是睡了一觉,起来天就变了: 前脚Anthropic刚把Claude Code 升级到 2.0、发布Claude sonnet 4.5,后脚 DeepSeek 就密集更新到了 v3.2-exp。 还没等我缓过神,昨晚刷 X,智谱的 GLM-4.6 已经悄悄干到了开源第一,把 DeepSeek 给超了。
只要99美元,DeepSeek教程带回家。 “DeepSeek是目前最强大的AI工具,但 99% 的人都用错了!” 海外社交平台“X(推特)”上,一位海外博主信誓旦旦表示,绝大多数人并不会使用DeepSeek,而自己将免费提供使用教程。 老道的语气,一度让人直接幻视中国各个社交平台上的“AI大师”们。他们一边喊着打工人“学不会AI迟早被淘汰”,一边在自己的博文或者评论区里表示可以教学——通过收取学 ...
在目前流行的预填充-解码分离系统中,命中token的KV缓存完全由预填充引擎直接从远程存储加载。这种设计将所有存储I/O压力集中在预填充端的网卡上,而解码引擎端的网卡则基本处于空闲状态。
DeepSeek引发的冲击波仍在持续:不仅多个平台宣布接入DeepSeek,各个行业也密集搭上这趟“快车”。尽管DeepSeek通过优化算法显著降低算力需求,但因其高性价比助推AI普及,使得算力需求反而呈现指数级膨胀。对于国内算力产业而言,DeepSeek的创新带来了一个可以 ...
嘿!刚刚,DeepSeek 又更新了! 这次是更新了十月份推出的 DeepSeek-OCR 模型。 当时 DeepSeek-OCR 的出世,引起了大家对视觉压缩的关注与讨论,而这一次,DeepSeek 对视觉编码下手了。 可以说,刚刚发布的 DeepSeek-OCR 2 通过引入 DeepEncoder V2 架构,实现了视觉编码从「 ...
我在AI圈的朋友对DeepSeek V4仍然抱有很大希望,原因有二。 上个周末,包括英国《金融时报》在内的一些外媒报道称:DeepSeek V4将在本周一(3月2日)发布。还有报道宣称,V4将针对国产芯片进行优化,是该系列大模型当中第一个完全基于国产算力生态的云云。这一消息很快被大量国内媒体转载,大家都期待着V4早日露出真容——可是什么都没有发生。 大家盼望DeepSeek V4发布,已经有一个多 ...
近日,国内通用大模型DeepSeek以燎原之势在全球各个领域迅猛发展,也为教育行业的高质量发展带来了新的巨大机遇。 目前,清华大学、浙江大学、上海交通大学、华中科技大学、武汉大学、北京航空航天大学等国内多所高校纷纷宣布,已经完成DeepSeek系列大 ...
随着DeepSeek的大火,其背后的联网搜索支持方也受到关注。2025年世界移动通信大会期间,博查CTO翁柔莹接受每经记者专访时表示,DeepSeek爆火前已接入其搜索API。目前,博查Search API的日调用量已达3000万次,承接着国内AI应用60%的联网搜索请求。 每经记者|宋欣悦 ...
蛇年春节前后,中国人工智能企业深度求索(DeepSeek)以其开源模型DeepSeek-R1在全球掀起一场“惊叹风暴”。 爆火的速度令人惊叹。1月20日,DeepSeek正式发布DeepSeek-R1。一周之内,DeepSeek便登顶中美两国苹果手机应用商店免费榜榜首,不久又在约140个国家的手机 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果