KAN:基于 Kolmogorov-Arnold 定理的新型神经网络架构

2025.12.30

KAN:重塑神经网络范式与可解释性探索

1. 任务简介

本次汇报聚焦于一种名为 KAN (Kolmogorov-Arnold Networks) 的新型神经网络架构 。 该工作基于 Kolmogorov-Arnold 表示定理,旨在打破传统多层感知机(MLP)的架构限制,构建一种既能保证高精度拟合,又具备“白盒”可解释性的模型,该成果已入选 ICLR 2025 。

2. 研究动机

尽管 MLP 基于通用逼近定理可以拟合任意连续函数,但在实际科学任务中面临三大核心痛点:

  1. 黑箱模型: 学到的知识难以解释,无法“阅读”网络内部逻辑 。

  2. 参数爆炸: 在科学计算任务中往往精度较低,需要海量参数才能达到预期效果 。

  3. 科学发现难: 难以从模型中提取新的物理定律或数学公式 。

3. 方法设计

报告深入解析了 KAN 的核心理论与架构创新:

1)理论基础:K-A 定理 vs. UAT

2)关键技术实现

4. 实施细节

训练与优化策略:

5. 实验与结论

主要实验结果:

本次组会内容下载链接