今天(2026年3月31日),Anthropic 再次因为打包流程的低级失误,将其最新版 Claude Code(v2.1.88)的完整前端与客户端源码暴露在了 npm 仓库中。 网友发布了一个未被剔除的 cli.js.map 文件,直接还原出了约 ...
最容易被低估的一块。Claude Code 的权限控制,大概是五层:静态规则、用户自定义 Hook、工具自身声明(只读 / 写)、LLM 判断(是的,用模型管模型)、熔断机制。
Harness 应由业务驱动。 作者:青年王大米 编辑:Jason Hu, William Jin 排版: NCon本文来自 Nexad 团队的大米(作者)、Jason(编辑)、William(编辑),Nexad 是一家 base 湾区和上海的 ...
第三方行为审计、跨模型成本归因、合规检查引擎:这些产品的价值不在技术难度,而在独立性和垂直领域的专业性本身。Agent 越自主,缰绳(Harness)的价格越贵,但缰绳不能由被驾驭者自己打造,必须由第三方掌握。
华人学者Jenny Zhang在Meta实习期间,联合Meta AI、UBC、纽约大学等机构研究者,提出了一种新的智能体框架:HyperAgents(DGM-H)。 HyperAgents做的关键一步,是把「执行任务的 agent」和「负责改进 ...
「此话当真」是一档泛商业类播客,我们希望搭建这样一个分享和交流的平台,让每一个对商业、科技、创投充满好奇的人都能在这里有所收获。每期播客将会由不同的真格投资人担任主持,和各领域的领军人物一起带大家深入了解科技趋势,以及创新技术的 ...
2026 年初 AI 领域的一个重大事件就是 MiniMax 这家模型公司成功上市港股,到现在市值已经 1100 亿港币了。 说实话我还挺期待 MiniMax 发布新模型的,之前的 M2.1 确实能打。不过,今天看到消息,MiniMax 上市之后发布了第一个开源项目:OctoCodingBench。 这个选择其实挺 ...
面向 professional developer,我们期待的是 coding 能比其他垂直方向更快地从 copilot 进化到 agent,并且两者共存。现阶段 Cursor 、Windsurf 等产品体验非常优秀的 copilot 对独立开发者的工作体验和生产力已经带来了巨大提升。而企业中有庞大的 codebase、复杂的 engineering context,以及严格的安全合规要求,这些 ...
但泄露出去的代码也证明了 Claude Code 是真正的生产级系统:512,000 行代码、六层权限防线、企业级遥测系统、完整的多代理编排。这些不是一个玩具项目应该有的复杂度。对于那些本来不确定 Anthropic 工程能力的潜在投资者,这或许反而是一次意外的技术背书。
解构罗福莉在X上的发言,你能发现和南洋理工这份研究的契合之处。罗福莉发现,在OpenClaw的一个用户请求里,往往会发起多轮低价值的工具调用,带来了巨大的模型调用量的浪费。
这个曾仅用3小时复刻出Manus的团队,现在想用一整支Multi-Agent团队,帮用户做出可以直接赚钱的产品。 2025年2月,OpenAI联合创始人Andrej Karpathy金口一开,他提出的“Vibe Coding(氛围编程)”就成了AI创业最性感的赛道。 在这个主打“忘却代码存在,靠与AI对话创作 ...
编程智能体最尴尬的一件事儿就是它确实很厉害,厉害到让数家公司都发起了比例超过 60% 的外包团队裁员,但是它没有厉害到你在完全不懂技术和数据结构的情况下,也能徒手做出一个能够用的商业级产品。或者说也能够在它的加持下成为一位合格的工程师,来为企业的软件生产提供对应的价值。 我们要从第一性原理出发,思考一下学生时代要手搓代码的目的到底是为了什么?
一些您可能无法访问的结果已被隐去。
显示无法访问的结果