谁杀死了那篇好论文？AI顶会乱象：好文被刷，低分论文捧上天

日期：2025-11-03 17:07:32 / 人气：44

AAAI 2026审稿乱象

审稿人经历

一位AAAI 2026的匿名评审在Reddit上分享经历，称这是最混乱的审稿流程。他虽未投稿，但负责评审几篇论文，第一轮审了四篇，分别打3、4、5和5分，本打算讨论后调高分数，结果全被拒；进入第二轮的论文打分仅3和4，质量却比第一轮更差，好论文被刷下，弱论文晋级，评审体系失去逻辑。其中一篇论文，他认真写上千字评论指出问题打3分，另一位评审给7分还试图提至8分，且忽略他的关键质疑，这让他怀疑是“关系稿”，甚至考虑上报，该帖子在r/MachineLearning热门，评论区反映类似问题，引发对学术公正的质疑。

评审机制问题

AAAI 2026采用Phase 1与Phase 2双阶段评审制度。Phase 1（初筛阶段）每篇论文分配两位审稿人，两人都打低分论文直接淘汰；Phase 2（复审阶段）在两人意见不一致或论文“有潜力”时进入，由新评审和领域主席做最终决策。但实际操作中，第一阶段评审人评论可能被AI归纳，程序委员会依赖摘要决定去留，第一阶段的两人有“一票否决”权，主观偏激的评审可能导致有价值论文提前被淘汰。且AAAI 2026启用AI辅助审稿系统，AI参与分配稿件、生成评审总结供领域主席决策参考，虽官方称仅辅助，但审稿人怀疑其语气和倾向影响最终结果，人类判断被AI间接取代，评审更加不可控。双阶段制问题被放大，第一阶段依赖个人判断，第二阶段新审稿人缺乏背景，出现好论文被拒、弱稿入选的情况，审稿结果像运气游戏，人类评审边界模糊，学术评审变成算法与人类共同运作的黑箱，权力集中、过程不透明。

同行评审信任塌陷

学术圈问题

在AI学术圈，同行评审曾是质量守门人，但如今这道门难守。Reddit上AAAI评审的帖子引发舆论，很多研究者有似曾相识的无力感。过去几年AI顶会常出现争议，某些热门领域被少数团队垄断，互相引用、互相评审，新研究者难进入或被打低分。随着研究碎片化、投稿量暴涨、专家资源反复调用，系统难保持平衡。

AI介入的影响

AI介入本应缓解负担，却在效率和理解之间制造新缝隙。AI能总结评论，但无法判断“真正重要的问题”，不能感受“偏见”，不知外交辞令背后的含义。结果论文增多、审稿加快，但学术公信力变薄，同行评审的信任逐渐崩塌，不仅是某个会议口碑问题，更影响一代研究者对学术规则的信仰，“Reviewer 2”梗图体现科研人的无奈。

对学术体系的质疑

这场围绕AAAI的争议虽无确凿证据，但暴露普遍焦虑。当AI技术深入学术生产各环节，人类判断被算法稀释。AAAI的AI辅助审稿机制本意是提高效率，却引发新问题：若AI总结比人工阅读权威，人类评审责任还剩多少？这种结构性不透明侵蚀学术体系最宝贵的信任。研究者质疑会议接收结果是学术实力体现，还是多种因素计算的“概率事件”。当AI成为评审一部分，它既是工具也是镜子，照出学术世界论文增多、周期缩短、真正思考稀缺的加速状态。最后审稿人的叹息，反映出其失去对整个学术体系的信任，当AI替我们审稿，我们该思考是否还相信它。

作者：天狮娱乐

谁杀死了那篇好论文？AI顶会乱象：好文被刷，低分论文捧上天

新闻资讯 News

案例展示 Case

现在致电 xylmwohu OR 查看更多联系方式 →

现在致电 xylmwohu OR 查看更多联系方式 →