在AI编程能力竞技的全球舞台上,中国科技企业再次交出亮眼成绩单。阿里巴巴最新研发的大语言模型Qwen 3.6-Plus在Code Arena旗下React专项榜单中斩获第二名,不仅超越了OpenAI、Google等国际科技巨头的同类产品,更成为该榜单中表现最优的中国大模型。 该榜单聚焦Web开发场景下的自主编码能力,要求模型独立完成从项目初始化到调试运行的全流程开发。测试标准涵盖工程思维完整性、端 ...
听说Claude Code源码泄露了,我起手就是一个git clone! 备份库instructkr/claude-code瞬间就获得了2w+星。 事情很魔幻,Claude Code发新版本v2.1.88的时候,一个60MB的source ...
Qwen 3.6 Plus Preview 目前在 Code Arena 总排名第 8。在涉及多步骤推理、工具使用和多文件应用程序的智能编码任务中表现出了强大的实力 ...
4月3日,全球知名大模型盲测榜单LMArena旗下聚焦AI编程能力的Code Arena公布新一期排名。阿里巴巴最新一代大语言模型Qwen 3.6-Plus登上全球榜单第二,超越OpenAI、Google、xAI等国际巨头,成为该榜单上排名最高的中国大模型。
华尔街见闻 on MSN
Claude Code 更新后“翻车”,思考深度骤降67%,“无法再信任其处理 ...
AMD的AI总监Stella Laurenzo基于6852个会话日志的量化分析,在GitHub公开指控Claude Code自2月起系统性退化:思考深度骤降67%,代码修改前文件读取率下降70%,不良行为触发次数飙升173次,API成本暴涨122倍。官方回应称系默认思考等级调低所致,但用户反馈手动调高后问题依旧,已引发严重信任危机与大量用户流失。
在智能编码领域,Qwen 3.6 Plus Preview近期成为备受瞩目的焦点。根据Code Arena公布的最新排名数据,这款模型在总榜单中跻身第八,尤其在多步骤推理、工具调用以及多文件协同开发等复杂任务中展现出卓越性能,其技术突破引发行业广泛关注。 在细分领域,Qwen 3.6 Plus ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果