Implicit Neural Representation

分类: 网络架构

Implicit Neural Representation

定义

用神经网络将输入坐标映射到对应信号值(如像素 RGB、体素密度等)的连续函数参数化方法,以网络权重隐式编码整个信号

数学形式

fθ:xRdyRmf_\theta: \mathbf{x} \in \mathbb{R}^d \rightarrow \mathbf{y} \in \mathbb{R}^m

其中 x\mathbf{x} 为坐标(如像素位置 (i,j)(i, j)),y\mathbf{y} 为信号值(如 RGB)。

核心要点

将离散信号(图像、3D 形状、音频)表示为连续函数,支持任意分辨率查询

关键突破:SIREN(正弦激活)和 WIRE(小波激活)解决了 ReLU 网络难以捕捉高频细节的问题

Positional Encoding(Fourier features)通过将输入投射到高维频率空间缓解频谱偏差

存储效率:网络参数量远小于原始信号的像素/体素数

代表工作

SIREN: 使用正弦激活函数 sin(ω0(Wx+b))\sin(\omega_0 (Wx + b)),自然适配信号的各阶导数

NeRF: 用 INR 表示 3D 场景的辐射场,实现新视角合成

Big2Small: 首次将 INR 从数据域迁移到网络参数域,用紧凑 INR 编码大模型权重实现 data-free 压缩

相关概念

SIREN

Positional Encoding

低秩分解