研究团队表示,三款模型基于相同的基础训练数据集,高一致率的结果符合预期。真正具备研究价值的是模型间25%的分歧部分,这种差异大概率并非源于模型对工具质量的独立判断,而是由基于人类反馈的强化学习(RLHF)调优策略不同,以及生成环节的专属微调差异导致。
内容|Max编辑|Max北京时间2026年3月2日,周一,晚8点。这本该是一个平淡无奇的夜晚。在这个时间点,东八区的写字楼里灯火通明,正是程序员们处理工单的高峰期。而在地球另一端的纽约和旧金山,晨起的开发者们刚刚泡好第一杯咖啡,准备开始一天的构建。数 ...
2026年3月2日晚8点,一场毫无预兆的全球AI服务熔断,打破了数字世界的平静。Claude、Grok等主流AI工具接连停摆,跨国银行系统同步报错,冰冷的错误代码取代了原本流畅的人机交互,从东八区的写字楼到美西的科技园区,无数依赖AI的工作流瞬间停滞 ...
2026 年开年,技术圈真正的核爆点,不是某个新模型参数翻倍,而是全球第一播客一场 3 小时的深度对谈。 主角是 Peter Steinberger ——OpenClaw 的创始人。 主持人是 Lex Fridman ——技术播客顶流。
北京时间2026年3月2日,周一,晚8点。 这本该是一个平淡无奇的夜晚。 在这个时间点,东八区的写字楼里灯火通明,正是程序员们处理工单的高峰期。 而在地球另一端的纽约和旧金山,晨起的开发者们刚刚泡好第一杯咖啡,准备开始一天的构建。 数以百万计的对话框正在全球各地的屏幕上闪烁。 有人在请求优化一段 Python 代码,有人在试图让 AI 润色一篇即将提交的学术论文,还有人在寻求情感上的慰藉。 在这个 ...
文章发表后,学界的反应几乎是两极分裂。一批在特征工程和专家系统上耕耘多年的研究者,被迫重新审视自己工作的长期意义。争议至今没有平息,然而萨顿的判断,在接下来的七年里一再被反复验证。
Anthropic正在加速补齐其在 AI 智能体(Agent)领域的最后一块短板。2026年2月26日,据报道,Anthropic已正式完成对西雅图 AI 初创公司 Vercept 的收购。 这次收购的核心目标非常明确:通过 Vercept 顶级的视觉理解技术,让Claude能够像人类一样,真正“看懂”屏幕并精准操控各类软件。
知名 AI 编程软件 Windsurf在发布 4个月内用户数破百万、年度经常性收入 (ARR) 超过1亿美元、企业客户数量超过1000家。Windsurf的团队仅有不到160人,最终以30亿美元的估值卖身OpenAI,这也成为OpenAI史上规模最大的收购 [1] 。