不久前,NVIDIA研究员Jim Fan提出一个很有代表性的判断:AI正在经历第二次预训练范式转移。第一次是next word prediction,第二次则是world modeling,也就是“预测下一个物理状态”。在这个视角下,模型学习的不再只是token与token的接续关系,而是世界在给定条件和动作之后,会如何继续演化。
这确实是个比较取巧的方法,可以同时达成高质量(FID 1.54)+ 高速(1-NFE),不过 No Free Lunch Theorem 就要发问了,那么代价是什么呢? 所有生成模型都有四个评价维度,生成质量、推理速度、训练稳定性、泛化度。 1 肯定是必选的,Diffusion 是 2 不行,GAN 是 3 不行,Drifting 是 4 不行。
近期,国际顶级学术会议The Web Conference 2025(简称WWW 2025)在澳大利亚悉尼召开,华东师范大学陈岑副教授实验室与魔搭社区合作的论文Responsible Diffusion Models via Constraining Text Embeddings within Safe Regions在该会议中荣获唯一最佳学生论文奖(Best Student Paper ...
传统的医学图像分类模型只学习“边界”——比如这张细胞更像 A 类还是 B 类。但在真实临床中,显微镜、染色方式和医院设备各不相同,细胞形态本身也会有巨大差异,甚至会出现罕见的异常细胞。只学边界的模型在这些情况下往往会失灵。11月19日的《自然· ...