split computing
分类: 高效推理与部署
split computing
定义
分裂计算(Split Computing)是将 DNN 模型在某一层处切割,前半部分在边缘设备执行,后半部分在云端执行的推理范式。核心问题是找到最优分割点(split point),使端到端延迟或能耗最小。
核心要点
分割点选择是一个优化问题:需权衡本地计算、数据传输、云端计算三部分开销
瓶颈层(bottleneck layer)设计可以减小中间特征体积,降低传输成本
与 early exit 互补:early exit 在浅层直接输出结果,split computing 在浅层传输特征
隐私保护是额外考量——中间特征是否可逆?
代表工作
Matsubara et al. “Split Computing and Early Exiting for Deep Neural Networks: A Survey” (ACM Computing Surveys 2023)
Eshratifar et al. “BottleNet: A Deep Learning Architecture for Intelligent Mobile Cloud Computing Services” (ISCAS 2019)