MILP
分类: 基础理论
MILP
定义
数学优化问题的一类,目标函数和约束均为线性,但部分决策变量被约束为整数,其余为连续实数变量。
数学形式
整数变量 使问题变为 NP-hard,通常用 Branch-and-Bound 或割平面法求解。
核心要点
可精确建模 ON/OFF 决策、调度分配、组合优化等离散问题
工业中常用 Gurobi、CPLEX、SCIP 等商业/开源求解器
在能源管理、调度优化中是传统方法的标准工具(对比 RL 方法时的 baseline)
对小规模问题(变量数 < 1000)通常能找到最优解;大规模问题需近似
代表工作
KD-DecisionTransformer-Energy — 以 MILP 作为住宅能源管理的理论最优 baseline,对比 DT 和 KD-DT 方法
相关概念
Decision Transformer — 用 RL 方式替代 MILP 进行能源调度
DDPG — 同为传统 RL 方法,与 MILP 对比