MILP

分类: 基础理论

MILP

定义

数学优化问题的一类,目标函数和约束均为线性,但部分决策变量被约束为整数,其余为连续实数变量。

数学形式

minx,ycTx+dTys.t. Ax+Byb, xZp, yRq\min_{x, y} \mathbf{c}^T x + \mathbf{d}^T y \quad \text{s.t. } \mathbf{A}x + \mathbf{B}y \leq \mathbf{b},\ x \in \mathbb{Z}^p,\ y \in \mathbb{R}^q 整数变量 xx 使问题变为 NP-hard,通常用 Branch-and-Bound 或割平面法求解。

核心要点

可精确建模 ON/OFF 决策、调度分配、组合优化等离散问题

工业中常用 Gurobi、CPLEX、SCIP 等商业/开源求解器

在能源管理、调度优化中是传统方法的标准工具(对比 RL 方法时的 baseline)

对小规模问题(变量数 < 1000)通常能找到最优解;大规模问题需近似

代表工作

KD-DecisionTransformer-Energy — 以 MILP 作为住宅能源管理的理论最优 baseline,对比 DT 和 KD-DT 方法

相关概念

Decision Transformer — 用 RL 方式替代 MILP 进行能源调度

DDPG — 同为传统 RL 方法,与 MILP 对比