在實際的質量改進、產品研發、工藝優化、六西格瑪和科學研究工作中,我們經常需要通過建立定量的模型來研究輸入因素和輸出因素之間、或者自變量和響應變量之間的關系,例如研究太陽能電池板的光電特性和其光電轉換率之間的關系,化學材料的成分和加工工藝對其化學特性如溶解度、抗氧化性的影響等等。研究這類問題最好的方法就是我們特意地改變輸入因素或者自變量,然后觀察輸出因素或者響應變量發生了怎樣的變化,而如果對輸入因素或自變量的改變是根據一個事先設計的科學方案(而不是盲目操作或僅憑經驗)來積極地進行的,那將是幫助我們獲得和理解有用信息的最好方法。
然而,在大多數實際問題中都存在兩個或以上個輸入因素或自變量,那種一次只改變一個變量的試驗方案本質上是沒有任何用處的。為了用合適的方法揭示多個輸入因素或自變量是如何共同對輸出因素或響應變量產生影響的,我們就需要使用試驗設計方法(DOE: Design Of Experiments)。試驗設計方法就是以合適的方案來科學地規劃試驗,在盡可能節省試驗成本的情況下獲得關于輸入變量如何影響輸出變量的盡量多的信息。它通常包括試驗方案設計和試驗結果分析兩個部分。
下面,我們以SAS公司的JMP軟件為例,簡單介紹一下試驗設計方法及其關鍵工具。JMP軟件的試驗設計平臺堪稱目前最先進、最全面、最靈活的試驗設計方案,它集成了下述所有試驗設計方法。關于JMP的具體情況可以參考JMP官方網站: www.jmp.com/china,這里不再贅述。
試驗設計方法群中有多種經典試驗設計方法,但同時也具備多種創新的試驗設計方法,最重要的是需要在不浪費寶貴資源的情況下,能按照特定的實際問題定制試驗設計方案。一旦試驗和數據采集工作得以完成,工程技術人員需要能夠非常便利地開展數據分析和建模工作,了解響應變量的模式、鎖定活躍的關鍵因子并對響應變量進行優化,進而預測優化的效果和穩健性。
經典試驗設計(Classical Design)
Ronald Fisher最早提出了試驗設計的四個基本原則:階乘原則、隨機化、重復試驗和劃分區組。但直到不久以前,生成和分析一個試驗并拓展這些原則的應用主要還依賴手工計算。盡管如此,實踐者80多年的智慧結晶已經創造了一系列廣泛使用的試驗設計方法,它們可以滿足特定的試驗條件和試驗目標的要求。這些經典的試驗設計方法主要包括完全因子設計、篩選設計、響應表面設計、混料設計和田口設計等。如果決定選用經典試驗設計方法,各種試驗評估工具(例如預測方差刻畫器和FDS圖等)也是不可缺少的,它們可以幫助在開始消耗試驗資源之前對所選擇的試驗方案進行評估。
定制試驗設計(Custom Design)
舉個簡單的例子,當有兩個因子的時候,完全因子試驗設計會在一個正方形區域內安排試驗點,但有的時候我們可能已經知道需要探索的區域并不是正方形的。這種情況下,如果工程技術人員仍然需要使用完全因子試驗設計,就必須讓實際問題向這種方法本身做出妥協,必要時需要對實際問題做一定的修正。定制試驗設計(Custom Design)可以說是JMP軟件的獨創,在這種設計中類似的妥協不存在,它可以根據實際問題的需要創新地構建出合適的試驗設計方案,這樣就能最有效地利用試驗資源。這種方法可以在統一的試驗設計框架中應付各種各樣的試驗挑戰:可以在同一個試驗中既包含過程變量、又包含混料因子;可以用“難改變”或“極難改變”的因子來應付隨機性受到限制的情形;可以定義只在“如果可能”的情況下才能被估計的模型變量;可以進行樣本量計算,以確保在試驗上的投資是有值得的。
其他試驗設計(Other Design)
即使響應變量沒有固有變異性,試驗設計方法仍然能夠幫助技術人員高效地探索高維因子空間,JMP中的空間填充設計(Space-Filling Design)就是其中的一種方法,這種方法一般用高斯過程平滑器(Gaussian Process smoother)進行分析,以獲得一個具備較低的預測偏倚和方差的替代模型。
選擇設計(Choice Design)是另外的一種試驗設計方法,這種方法被廣泛地用于消費者偏好研究;在選擇設計中,消費者將被問及他們對可選商品的偏好情況,而且如果需要的話,價格也可以作為其中的因子之一。選擇設計能構建科學的向消費者提問的方案,以使得消費者能夠真實、準確地反映他們的心聲(偏好情況),這對于指導企業開發出受市場歡迎您的產品非常重要。
加速壽命試驗(Accelerated Life Tests)是可靠性(Reliability)研究中非常有效、也十分常用的一種方法。它可以幫助合理地安排試驗,以獲得關于產品可靠性的關鍵信息,可以對失效和保修風險進行預測。
優化和模擬(Optimization an d Simulation)
試驗方案的設計雖然至關重要,但還只是試驗設計工作的一半。
不論使用何種試驗設計方法,在獲得實際的試驗結果后,我們都需要對試驗結果進行分析,以建立輸入因素(或自變量)和輸出因素(或響應變量)之間的關系模型——有時輸出因素(或響應變量)可能不止一個,這種情況下可以通過設定的停止規則用逐步求精法擬合不同的模型。建立好有用的模型后,就需要利用這個模型來對輸出因素(或響應變量)進行優化,以確立可行的操作模式和因子水平。這時要用到的工具包括多種刻畫器(Profiler)工具以及其他相關的多種數據可視化工具等。以JMP軟件的優化器為例,不論是簡單還是復雜的問題,JMP內置的優化器(Optimizer)都可以在多個響應變量之間進行不可避免的權衡以尋找最優的方案。
分析到這里還沒有結束,通過試驗設計方法分析得到的最優方案是否在現實的執行環境中可行呢?或者它在具體實施的時候穩健性如何呢?這是兩個非常重要的問題,因為方案的試驗性實施往往會伴隨不少的資源投入,如果失敗就可能造成很多資源浪費。要解決這兩個問題就需要使用另外一種方法:模擬(Simulation)。這種方法可以考察和預測獲得的方案在實施時候的穩健性,以及預測其實際的實施效果——原則上,不論方案是否已經“最優”,都能借助模擬(如JMP的模擬器)方法對其穩健性和實施效果進行模擬和預測。