谁杀死了那篇好论文?AI顶会乱象:好文被刷,低分论文捧上天
日期:2025-11-03 17:07:32 / 人气:7

AAAI 2026审稿乱象
审稿人经历
一位AAAI 2026的匿名评审在Reddit上分享经历,称这是最混乱的审稿流程。他虽未投稿,但负责评审几篇论文,第一轮审了四篇,分别打3、4、5和5分,本打算讨论后调高分数,结果全被拒;进入第二轮的论文打分仅3和4,质量却比第一轮更差,好论文被刷下,弱论文晋级,评审体系失去逻辑。其中一篇论文,他认真写上千字评论指出问题打3分,另一位评审给7分还试图提至8分,且忽略他的关键质疑,这让他怀疑是“关系稿”,甚至考虑上报,该帖子在r/MachineLearning热门,评论区反映类似问题,引发对学术公正的质疑。
评审机制问题
AAAI 2026采用Phase 1与Phase 2双阶段评审制度。Phase 1(初筛阶段)每篇论文分配两位审稿人,两人都打低分论文直接淘汰;Phase 2(复审阶段)在两人意见不一致或论文“有潜力”时进入,由新评审和领域主席做最终决策。但实际操作中,第一阶段评审人评论可能被AI归纳,程序委员会依赖摘要决定去留,第一阶段的两人有“一票否决”权,主观偏激的评审可能导致有价值论文提前被淘汰。且AAAI 2026启用AI辅助审稿系统,AI参与分配稿件、生成评审总结供领域主席决策参考,虽官方称仅辅助,但审稿人怀疑其语气和倾向影响最终结果,人类判断被AI间接取代,评审更加不可控。双阶段制问题被放大,第一阶段依赖个人判断,第二阶段新审稿人缺乏背景,出现好论文被拒、弱稿入选的情况,审稿结果像运气游戏,人类评审边界模糊,学术评审变成算法与人类共同运作的黑箱,权力集中、过程不透明。
同行评审信任塌陷
学术圈问题
在AI学术圈,同行评审曾是质量守门人,但如今这道门难守。Reddit上AAAI评审的帖子引发舆论,很多研究者有似曾相识的无力感。过去几年AI顶会常出现争议,某些热门领域被少数团队垄断,互相引用、互相评审,新研究者难进入或被打低分。随着研究碎片化、投稿量暴涨、专家资源反复调用,系统难保持平衡。
AI介入的影响
AI介入本应缓解负担,却在效率和理解之间制造新缝隙。AI能总结评论,但无法判断“真正重要的问题”,不能感受“偏见”,不知外交辞令背后的含义。结果论文增多、审稿加快,但学术公信力变薄,同行评审的信任逐渐崩塌,不仅是某个会议口碑问题,更影响一代研究者对学术规则的信仰,“Reviewer 2”梗图体现科研人的无奈。
对学术体系的质疑
这场围绕AAAI的争议虽无确凿证据,但暴露普遍焦虑。当AI技术深入学术生产各环节,人类判断被算法稀释。AAAI的AI辅助审稿机制本意是提高效率,却引发新问题:若AI总结比人工阅读权威,人类评审责任还剩多少?这种结构性不透明侵蚀学术体系最宝贵的信任。研究者质疑会议接收结果是学术实力体现,还是多种因素计算的“概率事件”。当AI成为评审一部分,它既是工具也是镜子,照出学术世界论文增多、周期缩短、真正思考稀缺的加速状态。最后审稿人的叹息,反映出其失去对整个学术体系的信任,当AI替我们审稿,我们该思考是否还相信它。
作者:天狮娱乐
新闻资讯 News
- 资本市场,被潮玩“坑”怕了11-03
- 谁杀死了那篇好论文?AI顶会乱...11-03
- 安世“之乱”,搅动全球汽车芯片...11-03
- 从40+公司三季报看IP市场11-03

