基於樣本高效批次貝葉斯最佳化的先進製造製程配置

1. 簡介與概述

配置先進製造製程（例如積層製造）具有挑戰性，原因在於高昂的評估成本、相互關聯的輸出參數，以及通常具有破壞性的品質量測。傳統方法如實驗設計需要大量樣本。本文提出一個基於貝葉斯最佳化的資料驅動框架，以樣本高效的方式尋找最佳製程參數。其核心貢獻在於一個新穎、侵略性可調的採集函數、一個平行狀態感知最佳化程序，以及在真實世界製造製程上的驗證。

2. 方法論

2.1 貝葉斯最佳化框架

貝葉斯最佳化是一種基於序列模型的優化方法，用於優化評估成本高昂的黑箱函數。它使用一個機率代理模型（通常是高斯過程）來近似目標函數，並使用一個採集函數來決定下一個取樣點，在探索與利用之間取得平衡。

2.2 新穎的採集函數

作者引入了一個為樣本效率設計的新採集函數。其關鍵特點是一個可調的「侵略性」參數，允許根據先驗知識或風險承受度，將最佳化行為從謹慎探索調整為更具利用性。這解決了對標準採集函數（如期望改進或上信賴區界）的一個常見批評，即它們具有固定的探索-利用權衡。

2.3 平行與狀態感知程序

該框架支援多個參數集的批次/平行評估，這對於可以同時執行多個實驗的工業環境至關重要。它是「狀態感知」的，意味著它可以將即時製程資訊和情境資料（例如機器狀態、感測器讀數）整合到最佳化迴路中，使其能夠適應動態的實驗情境。

3. 技術細節與數學公式

所提出的採集函數 $\alpha(\mathbf{x})$ 建立在改進的概念之上，但引入了一個可調參數 $\beta$ 來控制侵略性。其一般化形式可以概念化為：

$\alpha(\mathbf{x}) = \mathbb{E}[I(\mathbf{x})] \cdot \Phi\left(\frac{\mu(\mathbf{x}) - f(\mathbf{x}^+) - \xi}{\sigma(\mathbf{x})}\right)^{\beta}$

其中：
- $\mathbb{E}[I(\mathbf{x})]$ 是期望改進。
- $\mu(\mathbf{x})$ 和 $\sigma(\mathbf{x})$ 是由高斯過程代理模型預測的平均值和標準差。
- $f(\mathbf{x}^+)$ 是當前最佳觀測值。
- $\xi$ 是一個小的權衡參數。
- $\Phi(\cdot)$ 是標準常態分配的累積分佈函數。
- $\beta$ 是新穎的侵略性調整參數。當 $\beta = 1$ 時，它類似於標準的期望改進。當 $\beta > 1$ 時，函數變得更具侵略性，偏好預測平均值較高的點；而 $\beta < 1$ 則使其更保守，偏好探索。

平行程序結合了常數謊言策略和局部懲罰，來選擇一組多樣化的有潛力點 $\{\mathbf{x}_1, ..., \mathbf{x}_q\}$ 進行同步評估。

4. 實驗結果與基準測試

新穎的採集函數首先在合成基準函數（例如 Branin、Hartmann 6D）上進行測試。關鍵結果顯示：

卓越的樣本效率： 與標準的期望改進和 GP-UCB 相比，可調採集函數在更少的評估次數內，持續找到接近最佳的解決方案，尤其是在侵略性參數 $\beta$ 校準良好的情況下。
穩健性： 在不同函數景觀上的表現都很穩健，證明了其普遍適用性。
可調性的權衡： 分析顯示，過於侵略性的設定（$\beta$ 過高）可能導致在多峰設定中過早收斂，而過於保守的設定則會減緩進度。這凸顯了基於領域知識調整或對 $\beta$ 進行元學習的重要性。

圖表說明： 一個假設的性能圖會顯示中位數最佳找到的目標值與函數評估次數的關係。所提出方法的曲線（針對最佳 $\beta$）將比期望改進、GP-UCB 和隨機搜尋的曲線下降得更快，並達到更低的最終值。

5. 應用案例研究

5.1 大氣電漿噴塗

目標： 透過調整電漿氣體流量、功率和噴塗距離等製程參數，來優化塗層特性（例如孔隙率、硬度）。
挑戰： 每個實驗成本高昂（材料、能源、塗層後分析）。
結果： 貝葉斯最佳化框架在 20-30 次實驗的有限預算內，成功識別出能最小化孔隙率（一個關鍵品質指標）的參數集，其表現優於傳統的網格搜尋方法。

5.2 熔融沉積成型

目標： 透過調整噴嘴溫度、列印速度和層高等參數，來優化列印零件的機械強度。
挑戰： 強度量測需要破壞性測試。
結果： 狀態感知程序整合了即時列印穩定性數據。該框架找到了能最大化拉伸強度同時保持列印可靠性的穩健參數集，展示了整合製程情境的價值。

6. 分析框架與範例案例

情境： 優化透過雷射粉末床熔融製造的金屬零件表面光潔度。
目標： 最小化表面粗糙度 $R_a$。
參數： 雷射功率 ($P$)、掃描速度 ($v$)、掃描間距 ($h$)。
框架應用：

初始化： 定義搜尋空間：$P \in [100, 300]$ W，$v \in [500, 1500]$ mm/s，$h \in [0.05, 0.15]$ mm。使用空間填充設計（例如拉丁超立方）執行 5 個初始實驗。
代理建模： 將高斯過程模型擬合到觀測到的 $(P, v, h, R_a)$ 數據。
採集與調整： 考慮到雷射粉末床熔融的高成本，將侵略性 $\beta$ 設定為中等值（例如 1.5），以在不承擔過度風險的情況下，偏好有潛力的區域。使用新穎的採集函數來提議下一批 3 個參數集進行平行列印。
狀態感知更新： 在列印前，檢查機器感測器數據（例如雷射穩定性）。如果檢測到某個提議的高功率設定不穩定，則在採集函數中懲罰該點並重新選擇。
迭代： 重複步驟 2-4，直到評估預算（例如 25 次列印）耗盡或達到滿意的 $R_a$ 目標。

此案例說明了框架的各個組件——可調採集、批次選擇和情境整合——如何協同工作，以解決實際的工業問題。

7. 原創分析與專家評論

核心洞見： 本文不僅僅是另一個貝葉斯最佳化應用；它是一個實用的工程工具包，直接解決了工業最佳化中兩個最大的痛點：高昂的樣本成本和物理實驗的混亂現實。帶有「侵略性旋鈕」($\beta$) 的新穎採集函數，是對經典期望改進或上信賴區界「一體適用」限制的一個巧妙（儘管有些啟發式）回應。它承認探索與利用之間的最佳平衡並非通用，而是取決於失敗成本和先驗製程知識。

邏輯流程： 論證是紮實的。從工業問題（昂貴、破壞性的測試）開始，識別傳統實驗設計甚至標準貝葉斯最佳化的局限性，然後引入量身定制的解決方案：一個更靈活的採集函數和一個平行、情境感知的程序。在基準測試和真實製程（大氣電漿噴塗、熔融沉積成型）上的驗證，完成了從理論到實踐的閉環。這反映了在其他機器學習用於控制的工作中看到的成功應用模式，例如 OpenAI 和 Berkeley 的 RAIL 實驗室引用的將強化學習用於機器人操作，其中從模擬到現實的轉移和安全約束至關重要。

優點與缺點： 主要優點是實用性。「狀態感知」功能是一個亮點，將貝葉斯最佳化從一個潔淨室演算法轉變為一個適合車間使用的工具。然而，該框架的阿基里斯腱是新的超參數 $\beta$。本文展示了其在良好調整時的價值，但對於如何先驗地設定它幾乎沒有提供指導。這可能將負擔從設計實驗轉移到調整最佳化器——這是一個非平凡的元問題。與更具理論基礎的方法（如熵搜尋或投資組合方法）相比，侵略性參數感覺是臨時性的。此外，雖然解決了批次選擇問題，但高斯過程在高維參數空間（現代製造中常見）的可擴展性仍然是一個未解決的挑戰，這一點在關於貝葉斯最佳化可擴展性的評論中有所強調。

可操作的見解： 對於製造工程師：首先在非關鍵製程上試行此框架，以培養設定 $\beta$ 的直覺。將其視為一個旋鈕——從保守開始，然後隨著信心增長增加侵略性。對於研究人員：下一步很明確——自動化 $\beta$ 的調整，或許可以透過元學習或多臂老虎機演算法來實現，正如超參數最佳化研究中所探索的那樣。針對極高維度問題，研究用更具可擴展性的代理模型（例如貝葉斯神經網路、隨機森林）替代高斯過程。將基於物理的模型先驗整合到高斯過程中，正如一些科學機器學習工作中所做的那樣，可以進一步提升樣本效率。

8. 未來應用與研究方向

多目標與約束最佳化： 將框架擴展到處理多個相互競爭的品質目標（例如強度 vs. 速度）和硬性安全約束（例如最高溫度）。
遷移學習與熱啟動： 利用來自過去類似製程或模擬的數據來預訓練代理模型，大幅減少所需真實世界實驗的數量。
與數位孿生整合： 將貝葉斯最佳化框架用作製程數位孿生的主動學習引擎，持續精煉孿生模型的準確性並推薦最佳設定點。
自主自優化機器： 將框架嵌入機器的可程式邏輯控制器或邊緣控制器中，實現生產過程中製程參數的即時閉迴路最佳化。
人在迴路貝葉斯最佳化： 將專家的定性回饋整合到採集函數中，允許工程師根據無形的經驗來引導或覆蓋演算法的建議。

9. 參考文獻

Frazier, P. I. (2018). A Tutorial on Bayesian Optimization. arXiv preprint arXiv:1807.02811.
Shahriari, B., Swersky, K., Wang, Z., Adams, R. P., & de Freitas, N. (2015). Taking the Human Out of the Loop: A Review of Bayesian Optimization. Proceedings of the IEEE, 104(1), 148-175.
Garnett, R. (2022). Bayesian Optimization. Cambridge University Press.
OpenAI, et al. (2018). Learning Dexterous In-Hand Manipulation. The International Journal of Robotics Research.
Levine, S., et al. (2016). End-to-End Training of Deep Visuomotor Policies. Journal of Machine Learning Research, 17(39), 1-40.
Wang, Z., et al. (2016). Bayesian Optimization in a Billion Dimensions via Random Embeddings. Journal of Artificial Intelligence Research, 55, 361-387.
Gramacy, R. B. (2020). Surrogates: Gaussian Process Modeling, Design, and Optimization for the Applied Sciences. Chapman and Hall/CRC.
Oerlikon Metco. (2022). Advanced Coating Solutions. [製造商網站].

目錄