#混合精度 共 1 个条目 论文 (1) RAMP: Reinforcement Adaptive Mixed-Precision Quantization for Efficient On-Device LLM Inference