基于样本高效批量贝叶斯优化的先进制造工艺配置

1. 引言与概述

由于评估成本高昂、输出参数相互关联且质量测量通常具有破坏性，配置增材制造等先进制造工艺具有挑战性。实验设计等传统方法需要大量样本。本文提出了一种基于贝叶斯优化的数据驱动框架，旨在以样本高效的方式寻找最优工艺参数。其核心贡献在于：一种新颖、可调节的采集函数；一种并行状态感知优化程序；以及在真实制造工艺上的验证。

2. 方法论

2.1 贝叶斯优化框架

贝叶斯优化是一种基于序列模型的优化方法，用于优化评估成本高昂的黑箱函数。它使用概率代理模型（通常是高斯过程）来近似目标函数，并使用采集函数来决定下一个采样点，从而在探索与利用之间取得平衡。

2.2 新颖的采集函数

作者引入了一种为样本效率设计的新采集函数。其关键特性是一个可调节的“激进性”参数，允许根据先验知识或风险承受能力，将优化行为从谨慎探索调整为更具利用性。这解决了对标准采集函数（如期望改进或上置信界）的一个常见批评，即它们具有固定的探索-利用权衡。

2.3 并行与状态感知程序

该框架支持对多个参数集进行批量/并行评估，这对于可以同时运行多个实验的工业环境至关重要。它是“状态感知”的，意味着可以将实时工艺信息和上下文数据（例如，机器状态、传感器读数）纳入优化循环，使其能够适应动态实验场景。

3. 技术细节与数学公式

所提出的采集函数 $\alpha(\mathbf{x})$ 建立在改进概念之上，但引入了一个可调参数 $\beta$ 来控制激进性。其广义形式可概念化为：

$\alpha(\mathbf{x}) = \mathbb{E}[I(\mathbf{x})] \cdot \Phi\left(\frac{\mu(\mathbf{x}) - f(\mathbf{x}^+) - \xi}{\sigma(\mathbf{x})}\right)^{\beta}$

其中：
- $\mathbb{E}[I(\mathbf{x})]$ 是期望改进。
- $\mu(\mathbf{x})$ 和 $\sigma(\mathbf{x})$ 是由高斯过程代理模型预测的均值和标准差。
- $f(\mathbf{x}^+)$ 是当前最佳观测值。
- $\xi$ 是一个小的权衡参数。
- $\Phi(\cdot)$ 是标准正态分布的累积分布函数。
- $\beta$ 是新颖的激进性调节参数。当 $\beta = 1$ 时，它类似于标准期望改进。当 $\beta > 1$ 时，函数变得更激进，倾向于预测均值更高的点；而 $\beta < 1$ 则使其更保守，倾向于探索。

并行程序结合了恒定说谎者策略和局部惩罚方法，以选择一组多样化的有前景的点 $\{\mathbf{x}_1, ..., \mathbf{x}_q\}$ 进行同步评估。

4. 实验结果与基准测试

新颖的采集函数首先在合成基准函数（例如，Branin、Hartmann 6D）上进行了测试。关键结果显示：

卓越的样本效率：与标准期望改进和GP-UCB相比，可调采集函数在更少的评估次数内持续找到接近最优的解，尤其是在激进性参数 $\beta$ 校准良好时。
鲁棒性：在不同函数景观上性能稳健，证明了其普适性。
可调性的权衡：分析表明，在多模态设置中，过于激进的设置（$\beta$ 过高）可能导致过早收敛，而过于保守的设置则会减慢进度。这强调了基于领域知识进行调参或对 $\beta$ 进行元学习的重要性。

图表描述： 一个假设的性能图将显示中位数最佳目标值与函数评估次数的关系。所提出方法（针对最优 $\beta$）的曲线将比期望改进、GP-UCB和随机搜索的曲线下降更快，并达到更低的最终值。

5. 应用案例研究

5.1 大气等离子喷涂

目标： 通过调节等离子体气体流量、功率和喷涂距离等工艺参数，优化涂层性能（例如，孔隙率、硬度）。
挑战： 每次实验成本高昂（材料、能源、涂层后分析）。
结果： 贝叶斯优化框架在20-30次实验的有限预算内，成功识别出能最小化孔隙率（关键质量指标）的参数集，性能优于传统的网格搜索方法。

5.2 熔融沉积成型

目标： 通过调节喷嘴温度、打印速度和层高等参数，优化打印部件的机械强度。
挑战： 强度测量需要进行破坏性测试。
结果： 状态感知程序整合了实时打印稳定性数据。该框架找到了稳健的参数集，在保持打印可靠性的同时最大化拉伸强度，展示了整合工艺上下文的价值。

6. 分析框架与示例案例

场景： 优化通过激光粉末床熔融生产的金属零件的表面光洁度。
目标： 最小化表面粗糙度 $R_a$。
参数： 激光功率 ($P$)、扫描速度 ($v$)、扫描间距 ($h$)。
框架应用：

初始化： 定义搜索空间：$P \in [100, 300]$ W，$v \in [500, 1500]$ mm/s，$h \in [0.05, 0.15]$ mm。使用空间填充设计（例如，拉丁超立方）进行5次初始实验。
代理建模： 将高斯过程模型拟合到观测到的 $(P, v, h, R_a)$ 数据。
采集与调节： 鉴于激光粉末床熔融的高成本，将激进性 $\beta$ 设置为中等值（例如，1.5），以倾向于有前景的区域而不冒过度风险。使用新颖的采集函数提出下一批3个参数集用于并行打印。
状态感知更新： 打印前，检查机器传感器数据（例如，激光稳定性）。如果检测到某个提议的高功率设置不稳定，则在采集函数中惩罚该点并重新选择。
迭代： 重复步骤2-4，直到评估预算（例如，25次打印）耗尽或达到满意的 $R_a$ 目标。

此案例说明了该框架的各个组成部分——可调采集、批量选择和上下文整合——如何协同工作以解决实际的工业问题。

7. 原创分析与专家评论

核心见解： 本文不仅仅是另一个贝叶斯优化应用；它是一个实用的工程工具包，直接解决了工业优化中的两大痛点：高昂的样本成本和物理实验的复杂现实。带有“激进性旋钮”（$\beta$）的新颖采集函数是对经典期望改进或上置信界“一刀切”局限性的一个巧妙（尽管有些启发式）回应。它承认探索与利用之间的最佳平衡并非普适，而是取决于失败成本和先验工艺知识。

逻辑脉络： 论证坚实有力。从工业问题（昂贵、破坏性测试）出发，指出传统实验设计乃至标准贝叶斯优化的局限性，然后引入定制化解决方案：一个更灵活的采集函数和一个并行、上下文感知的程序。在基准测试和真实工艺（大气等离子喷涂、熔融沉积成型）上的验证完成了从理论到实践的闭环。这反映了其他机器学习用于控制的研究中成功的应用模式，例如OpenAI和伯克利RAIL实验室引用的将强化学习用于机器人操作，其中仿真到现实的迁移和安全约束至关重要。

优势与不足： 主要优势在于实用性。“状态感知”功能尤为突出，将贝叶斯优化从洁净室算法转变为适用于车间现场的工具。然而，该框架的阿喀琉斯之踵是新的超参数 $\beta$。本文展示了其在良好调参时的价值，但几乎没有提供如何先验设置它的指导。这可能会将负担从设计实验转移到调优优化器——一个重要的元问题。与熵搜索或组合方法等更具理论依据的方法相比，激进性参数显得临时性。此外，虽然解决了批量选择问题，但高斯过程在高维参数空间（现代制造中常见）的可扩展性仍然是一个未解决的挑战，这一点在关于贝叶斯优化可扩展性的综述中已被强调。

可操作的见解： 对于制造工程师：首先在非关键工艺上试点该框架，以培养设置 $\beta$ 的直觉。将其视为一个旋钮——从保守开始，随着信心增长再增加激进性。对于研究人员：下一步很明确——自动化 $\beta$ 的调参，或许可以通过元学习或多臂老虎机算法，正如超参数优化研究中探索的那样。针对极高维问题，研究用更具可扩展性的代理模型（例如，贝叶斯神经网络、随机森林）替代高斯过程。将基于物理的模型先验整合到高斯过程中，正如一些科学机器学习工作所做的那样，可以进一步提高样本效率。

8. 未来应用与研究展望

多目标与约束优化： 将框架扩展到处理多个相互竞争的质量目标（例如，强度 vs. 速度）和硬性安全约束（例如，最高温度）。
迁移学习与热启动： 利用来自类似历史工艺或仿真的数据来预训练代理模型，大幅减少所需的真实世界实验次数。
与数字孪生集成： 将贝叶斯优化框架用作工艺数字孪生的主动学习引擎，持续优化孪生模型的准确性并推荐最优设定点。
自主自优化机器： 将框架嵌入机器的PLC或边缘控制器，实现生产过程中工艺参数的实时闭环优化。
人在回路的贝叶斯优化： 将定性专家反馈纳入采集函数，允许工程师基于无形经验指导或覆盖算法的建议。

9. 参考文献

Frazier, P. I. (2018). A Tutorial on Bayesian Optimization. arXiv preprint arXiv:1807.02811.
Shahriari, B., Swersky, K., Wang, Z., Adams, R. P., & de Freitas, N. (2015). Taking the Human Out of the Loop: A Review of Bayesian Optimization. Proceedings of the IEEE, 104(1), 148-175.
Garnett, R. (2022). Bayesian Optimization. Cambridge University Press.
OpenAI, et al. (2018). Learning Dexterous In-Hand Manipulation. The International Journal of Robotics Research.
Levine, S., et al. (2016). End-to-End Training of Deep Visuomotor Policies. Journal of Machine Learning Research, 17(39), 1-40.
Wang, Z., et al. (2016). Bayesian Optimization in a Billion Dimensions via Random Embeddings. Journal of Artificial Intelligence Research, 55, 361-387.
Gramacy, R. B. (2020). Surrogates: Gaussian Process Modeling, Design, and Optimization for the Applied Sciences. Chapman and Hall/CRC.
Oerlikon Metco. (2022). Advanced Coating Solutions. [制造商网站].

目录