如今,Test-Time Scaling(测试时扩展)已成为提升模型推理能力的关键路径。而在这一浪潮中,块扩散语言模型(Block Diffusion Language Models, BDLMs) 凭借其独特的并行解码能力,被视为超越传统自回归(AR)模型推理效率的有力竞争者。然而,现有的 BDLMs 在面对长链推理时,陷入了一个两难的效率 - ...
在过去几年里,大语言模型(large language ...
传统的动态解码往往依赖固定的置信度阈值,这在长链推理中极易导致 “一步错,步步错”。研究团队提出了有界自适应置信度解码(BACD)算法,该算法利用已生成 token 的平均置信度作为信号,动态调整当前的去噪阈值。同时,为了实现效率和效果的兼顾,增加了双重边界保护机制:上限(Upper Bound)负责在模型自信时激进加速,下限(Lower ...
近两年,视觉语言模型(Vision-Language Models, VLMs)在自动驾驶领域可谓是大放异彩。凭借强大的推理能力和丰富的世界知识,它们让车辆不仅能“看到”路,还能“理解”场景。但说实话,现有的 VLM 方案一直有个挺让人头疼的短板:它们虽然聪明,却往往是个“空间感”极差的“路痴”。在面对多摄像头覆盖的复杂 3D 物理世界时,VLM 很难建立起精确的跨视图几何关联。
自ChatGPT发布以来,大型语言模型(LLM)成为了推动人工智能发展的关键技术之一。著名机器学习和AI研究员、畅销书《Python 机器学习》的作者Sebastian Raschka近日发布了新书《Build a Large Language Model (From Scratch)》,为广大读者揭示了从零开始构建大型语言模型的全过程 ...
我国研发的全球首个多模态地理科学大模型“坤元”近日在京发布。“坤元”由中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发。 A geographic sciences multi-modal Large Language Model, the first of its kind in the world, was ...
在汽车电子、工业控制、智能设备等场景中,温度、压力、电压、速度这些物理世界的「模拟信号」,如何精准转化为CAN/CAN FD总线上可传输的「数字报文」?这是很多工程技术人员都会遇到的核心问题。本期答疑,我们结合虹科数采模块方案,从原理到实操一 ...
最近一篇论文让我反复观看,那就是李飞飞联合西北大学教授做了一个测试,将ChatGPT、Claude、DEEPSEEK等主流一线模型做了一个基线测试。”“Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall ...