Implicit Neural Representation

分类: 网络架构

定义

用神经网络将输入坐标映射到对应信号值（如像素 RGB、体素密度等）的连续函数参数化方法，以网络权重隐式编码整个信号

f_\theta: \mathbf{x} \in \mathbb{R}^d \rightarrow \mathbf{y} \in \mathbb{R}^m

其中 $\mathbf{x}$ 为坐标（如像素位置 $(i, j)$ ）， $\mathbf{y}$ 为信号值（如 RGB）。

将离散信号（图像、3D 形状、音频）表示为连续函数，支持任意分辨率查询

关键突破：SIREN（正弦激活）和 WIRE（小波激活）解决了 ReLU 网络难以捕捉高频细节的问题

Positional Encoding（Fourier features）通过将输入投射到高维频率空间缓解频谱偏差

存储效率：网络参数量远小于原始信号的像素/体素数

SIREN: 使用正弦激活函数 $\sin(\omega_0 (Wx + b))$ ，自然适配信号的各阶导数

NeRF: 用 INR 表示 3D 场景的辐射场，实现新视角合成

Big2Small: 首次将 INR 从数据域迁移到网络参数域，用紧凑 INR 编码大模型权重实现 data-free 压缩