AI帮宇宙学省90%算力，却因太熟悉旧知识，系统错过新物理信号!

2026-06-17 15:54:47 | 一点资讯

宇宙学家们遇到了一个有点哭笑不得的问题：他们用来加速研究的AI，有时候会因为"知道得太多"而错过真正的新发现。

普林斯顿大学和弗拉蒂隆研究所的研究团队本月在《宇宙学与天体粒子物理学杂志》发表了一项研究，系统检验了"迁移学习"这一机器学习策略在宇宙学研究中的实际表现。结论是双面的：这项技术在削减计算成本方面效果显著，但它同时引入了一种结构性偏见，在某些关键场景下会让AI系统性地错过暗示新物理的信号。

理解这项研究的价值，首先要理解宇宙学家日常工作的代价。

为了验证超出标准宇宙学模型（ΛCDM）的新理论，比如大质量中微子的效应、演化暗能量或修正引力模型，科学家需要生成大量精密计算机模拟，每一组代表一个基于不同物理假设构建的虚拟宇宙，这些模拟极度耗费算力。暗能量光谱仪项目发言人威尔·珀西瓦尔曾表示，仅仅是准备用于科学分析的数据集，就需要创建模拟宇宙并反复运行合理性检验，耗时可达数月之久。

研究团队提出的策略是迁移学习。具体做法是先用廉价的标准ΛCDM模拟对神经网络进行大量预训练，让它充分掌握宇宙的"常规运作方式"，再用少量包含潜在新物理的复杂模拟做微调。

结果相当亮眼。在多个测试场景中，这一策略将所需的高成本模拟次数削减了十倍以上。研究合著者、弗拉蒂隆研究所宇宙学家阿德里安·拜尔将其描述为"一种强大的先发优势"，让研究者得以在算力有限的条件下检验"比以往更加实际可行的关于宇宙的各种想法"。

然而，真正引人深思的是研究发现的另一面。

研究团队在测试包含大质量中微子的场景时，观察到一种被命名为"负迁移"的现象。中微子质量对宇宙结构形成的影响，在观测特征上与标准模型参数σ8（衡量宇宙物质聚集程度的指标）的变化高度相似，两者留下了几乎难以区分的宇宙学"指纹"。经过ΛCDM预训练的神经网络，遇到中微子效应时会不由自主地将其归因于σ8的波动，而非识别出这是一种新的物理机制。

这不是随机的技术故障，而是一种有规律的系统性失误。拜尔明确指出："负迁移结果非常有趣，因为它表明模型的失效并非随机发生，而是由潜在的物理相似性所驱动。"不同的物理过程恰好产生了相似的可观测效果，这让AI陷入了分辨困境。

换一个更直白的比喻：一位只读过标准教科书的医学生，遇到罕见疾病时，会因为其症状酷似常见病而给出错误诊断。AI在这里犯的，是一模一样的错误，只不过发生在宇宙学的尺度上。

Bioengineer网站援引研究的核心结论指出，这一发现揭示了将预训练模型应用于物理学的深层悖论：先验知识在帮助AI更快理解已知领域的同时，也会在它最需要保持开放性的时刻关上感知新事物的大门。

拜尔对此态度审慎而务实："如果一个模型将知识从一种情境迁移到另一种情境，我们需要了解它究竟迁移了什么，这些知识何时有用，何时可能产生误导。"他强调，"加速发展和理解必须齐头并进"，这句话几乎可以视为整个AI辅助科学研究领域的核心警示。

下一步，研究团队计划将迁移学习框架引入更接近真实巡天数据的环境进行测试，包括引入星系形成的不确定性、巡天掩膜和噪声干扰等真实条件的模拟。随着未来几年新一代大型巡天望远镜陆续投入运行，如何让AI在海量真实数据中可靠地识别新物理信号，将成为宇宙学方法论上最紧迫的课题之一。

AI或许是宇宙学家最强大的新工具，但前提是，人类要比AI更清楚地知道：它在什么时候其实什么都不知道。