??? 摘??要: 分析了基于規則推理" title="規則推理">規則推理和案例推理" title="案例推理">案例推理的人工智能推理技術存在的一些問題及推理過程,提出了技術優勢互補的集成推理方案,設計了集成推理的系統結構和工作流程,并引入到疫情預警" title="疫情預警">疫情預警信息系統中,對疫情案例的表示、案例庫組織結構、案例檢索、案例適配與系統學習等部分關鍵技術進行了探討,最后在湛江市城市公共衛生" title="公共衛生">公共衛生疫情預警系統" title="預警系統">預警系統中得以驗證。
????關鍵詞: 疫情預警? 規則推理? 案例推理? 公共衛生
?
??? 現實世界中存在的大量不確定因素(如自然災害、恐怖事件、交通事故、疫情爆發等)引起的突發事件對人們正常的生活構成了嚴重的威脅,如2003年的SARS疫情危機和2004的高致病性禽流感H5N1疫情給我國的經濟建設、社會穩定造成了極大的損害。所以,預警系統的建設得到各國政府組織的高度重視,如日本常設了部一級的危機管理中心;印度專門設有危機管理小組。我國針對地震、臺風、公共衛生等已建立了應急系統。這些系統大多數是基于規則推理RBR(Rule-Based Reasoning)的系統。這種模式存在知識獲取的“瓶頸”問題,系統建立和維護困難,不具有自動的學習能力,而且不能利用另一重要的知識資源——以往的成功經驗或典型案例數據。而基于案例推理CBR(Case-Based Reasoning)是一種類比推理方法,它可以方便地利用過去的成功經驗或案例數據來求解與之相似的新的問題。對于很少或不能形成通用規則的問題領域,采用CBR最為有效。然而,CBR雖然克服了RBR知識獲取的“瓶頸”問題,但CBR不適用于當前存在的領域知識,并且決策過程有時顯得過于牽強(intuitively)[1-2]。
本文將基于規則與基于案例集成推理技術、專家系統和數據挖掘等技術結合起來,構造一套RBR與CBR集成的決策推理方案,并應用于公共衛生疫情預警系統中。利用兩種推理各自的推理優勢,形成優勢互補系統,消除了RBR和CBR結果之間的沖突,提高了系統求解問題的效率,增強了系統對不良結構問題的適應性,實現了經驗豐富領域的推理。針對疫情爆發,建立一套科學高效的公共衛生疫情預警系統,增強突發事件中實施疫情控制和醫療救治工作的快速反應能力,減輕突發公共衛生事件對居民健康、生命安全造成的威脅和財產損失,具有重要的經濟價值和社會意義。
1 基于案例與規則集成推理的技術概述
1.1 基于規則推理技術
??? ?RBR適合應用于對領域有充分認識,能以完備和健全的形式表示領域理論的場合,它是一種鏈式推理,其簡單的推理可能觸發多條規則[3]。許多成功的專家系統都采用產生式系統的典型結構,用產生式規則表達知識。通常,產生式系統由下面幾個基本部分組成:
????(1)事實庫(也稱綜合數據庫):存儲有關問題的狀態、性質等事實的敘述性知識。
??? (2)規則集(或稱“規則庫”):存儲有關問題的狀態轉移、性質變化等規則的過程性知識,可描述成:IF條件THEN結論。條件可以是任意子句的邏輯組合,結論可以是多個子結論或操作的組合。
??? (3)控制器:根據有關問題的控制性知識,選擇控制策略,將規則與事實進行匹配,控制利用知識推理求解問題的過程。
???? 產生式規則的優點是知識表示自然、通用靈活,易于模塊化和結構化,但這種模式存在知識獲取的“瓶頸”問題。
1.2 基于案例推理技術
??? ?CBR是一種類比推理方法,它可以方便地利用過去的成功經驗或案例數據來求解與之相似的新問題?;诎咐评淼南到y設計技術可以被歸納為五個部分:案例檢索、案例匹配、案例修改、案例學習和案例維護?;窘忸}步驟如下:
??? (1)案例檢索:根據當前的問題通過一系列的搜索和相似度的計算,將案例庫中的案例過濾,取出與目標案例相似的若干案例組成相關案例集。
(2)案例匹配:從檢索出的案例集中提取最佳案例,即從已檢索出的相關案例集中抽取特征最為相似的案例或案例片斷,用相似度表征待解問題和相關案例集中案例的相似程度。根據相似度,判斷已經存在的解決方案是否符合當前問題的求解需要,以便調整案例集的解決方案,從而獲得待解問題的建議方案。
(3)案例修改:根據案例庫中已存案例與待解問題之間的差異,若用戶對系統給出的方案不滿意,推理系統將就此方案進行修改或重新設計后再提交給用戶。如果用戶認為差異太大,則求解過程終止。
(4)案例學習:對當前問題的解進行評價分析,若認為求解結果有價值,則將新解保存到案例庫中,擴充案例庫的案例種類與數量,并進一步地從新問題的解中提取淺層規則知識或修改深層模型知識;否則,重新匹配和修正。
(5)案例維護:求解方案經過實際應用后,根據實際應用效果和一定的策略,分析新案例的經驗和知識是否有保留的價值,若有則按一定的存儲策略將其納入案例庫中,實現案例庫的不斷更新、完善。
案例推理技術借鑒以往的經驗,更符合領域專家和設計人員的設計思維過程。它也存在前面所講的優缺點。
1.3 以CBR和RBR集成推理的系統結構?
? 由于CBR與RBR各有缺陷,它們無論是作為兩種推理方式還是作為知識表示方式都不能相互替代。這是因為案例集合無法充分表達編碼歸納后的規則,案例中包含的分布廣泛的粗知識也極難或不可能提取歸納為規則。如果將CBR和RBR集成在一起,就能夠克服兩種推理體系各自的缺點,增強系統的靈活性和綜合推理能力[4]。CBR和RBR集成的最通用方式有二種:第一種是以RBR為主導,CBR后置補充的(RC)混合模型;第二種是以CBR為前導,RBR后置補充的(CR)混合模型。其他的組合方式都是以這兩種方式為基礎組成的。
對于已經在相關領域建立了較完善的RBR系統,由于對該領域知識的理解仍是很不充足的弱理論領域,使用第一種方式有較好的效果。而對于領域知識模型、案例和RBR系統己充分建立但還要求系統有很高實時性和效率的情況,則宜采用第二種方式[2]。在實際應用中,應該根據領域的不同特點和實際情況,靈活地選擇不同的集成方式。根據公共衛生疫情的特征,本文選擇以CBR為前導,RBR后置補充的(CR)推理模式,實現在豐富而精確的知識庫基礎上的高效推理。其集成推理的系統結構如圖1所示。圖中,規則庫和案例庫共同構成了專家系統的知識庫。
????????????????????????????
(1)人機交互界面:完成人機交互、問題表示、結果顯示和和系統的總體控制,即分析用戶提交的問題并加以分解綜合后轉化成系統可以理解的知識表示形式送至學習機。
(2)案例庫:是CBR的核心。提供支持問題求解的一組案例,它是問題求解經驗的集合。案例源的豐富程度是問題求解的關鍵。因此,必須利用豐富領域知識建立較為完善的案例庫。在組織案例庫時本文采用兩層結構,第一層為典型案例庫,第二層為被分類的子案例庫,且第二層中的每一個子案例庫對應著典型案例庫中的一個典型案例。這樣可有效提高案例檢索效率。
(3)規則庫:用于存儲領域專家認可的各應用領域的主要規則知識和技術指標,是以規則的形式表示的、正確的、能夠完全表達領域的知識,相當于傳統產生式系統中的知識庫,是系統綜合數據庫的基礎。對問題定義和案例適配提供背景知識,同時也提供查詢和咨詢服務。
(4)學習機:主要負責創建和維護案例庫,包括啟用解釋模塊調用RBR來完成由規則到案例的實際的推理過程。
(5)推理機:根據問題,利用知識庫中的知識,用集成的CBR和RBR推理規則進行推理,求得問題的解。推理機是本系統的核心模塊之一。
1.4 以CBR和RBR集成推理的系統模塊協同工作過程
采用集成推理的系統各模塊協同工作過程如下:在推理時,通常把人們以往的經驗儲存成一個個案例形成的案例庫。當新問題出現時,通過搜索算法可直接在案例庫中搜索,找到合適案例作為新問題處理的參考,即實案例重用;如果找到的案例不滿意或沒有結果,此時就啟動學習機內部的解釋模塊到規則庫中檢索相關知識,得到基于規則推理的結果以備進行間接匹配。若經過修改后的案例間接匹配成功,得到問題的解,經過案例評價機構評價后,認為問題的解有價值,便可保存在案例庫中以備下次使用,即實現了案例自學習。若在推理過程中有不止一個舊案例與新的輸入案例相匹配,此時還要啟用評價機構,以便于對匹配情況做出裁決,從中選出最佳匹配。案例集成推理的控制流程圖如圖2所示。
?????????????????????????
2 基于CBR和RBR集成推理的公共衛生疫情預警系統主要實現技術
2.1案例的表示
案例的表示過程即是將權威領域專家的知識轉化為計算機系統可以識別的信息過程。案例是知識表示的一種模式,它將專家的知識與經驗用描述案例的數據結構和眾多的案例表示出來,實際上它就是專家求解問題的一個具體例子[2]。適當的知識表示方法有助于提高在案例庫中檢索到與當前欲求解問題相似案例的精度和速度。本文采用面向對象的基于框架法的知識表示方法來表示疫情預警案例,因為框架法的知識表示方法適合于將某特定時期的疫情預警指標、行為知識和專家經驗等有機地結合起來。而且采用框架法的知識結構描述方法,將所搜集到的疫情案例存放到一系列相互關聯的數據庫中,利用關系數據庫的索引技術,可以方便地建立案例索引。借鑒相關參考文獻所建立的疫情預警案例結構框架如表1所示。
???????????????????????????????
2.2 案例庫的組織
對案例庫進行組織索引是為了方便案例庫的檢索,因此如何組織案例庫取決于系統所采取的檢索策略。如果在設計時不采取有效的檢索策略,將直接影響案例檢索效率和系統響應時間。本系統對案例庫組織時采用兩層結構,第一層為典型案例庫,第二層為被分類的子案例庫,且第二層中的每一個子案例庫對應著典型案例庫中的一個典型案例。具體地說,首先對案例進行分類,每一類組成一個較小的子案例庫并在其中選出一個典型案例,作為對該類案例的索引,所有類的典型案例構成一個典型案例庫。檢索時,先在典型案例庫中找到最相近的典型案例(此步驟相當于對新問題進行分類,看它屬于哪一類案例),然后在最相似的典型案例所對應的那類案例中進行進一步的檢索,案例庫的兩層結構可以更方便地檢索案例。
2.3 案例的檢索和匹配
案例檢索是指從案例庫中尋找與新問題相似的案例的過程,案例的匹配檢索是實現案例推理的關鍵步驟。查找以案例類別為第一檢索條件,以案例特征為第二檢索條件,在案例庫中查找出可能與新問題有關的舊案例,形成候選案例集合,使以后匹配過程僅在候選案例集中進行。可提高案例檢索效率的常用檢索方法有:最近相鄰策略、歸納推理策略、知識引導策略和模板檢索策略[2],這些方法可以單獨或聯合地運用。本文檢索采用的策略為目前常用的最近相鄰策略[5]對案例進行匹配。
2.4 案例適配
從檢索出的案例集中提取最佳案例,即從已檢索出的相關案例集中抽取特征最為相似的案例或案例片斷,用相似度表征待解問題和相關案例集中案例的相似程度。根據相似度,判斷已經存在的解決方案是否符合當前問題的求解需要,以便調整案例集的解決方案,從而獲得待解問題的建議方案。然而,大多數情況因為系統知識不夠豐富,檢索到的案例并不能滿足問題的求解,這就需要學習機進行學習。本系統采用轉換型的適配策略(transformational adaptation)和參數調整(parameter adjustment)適配技術。其基本思想是:比較檢索到的案例與新問題所關心屬性的差異,從而將解決方案適當地調整。
2.5 集成推理系統自學習
集成推理系統的優點在于其自學習的能力,即系統在運行過程中能夠不斷地將新問題及解決方案作為新的案例加入到案例庫中豐富系統。但如果這種行為不加以控制,案例庫中的案例質量就會下降;同時案例庫的規模就會膨脹,降低系統的推理效率[6]。故本系統采用相似度δ進行評價控制:δ=(δ1t,δ2t,δ3t,…,δnt)式中,n為舊案例數,δit為新案例與舊案例的相似度。如果所有δit均小于某一設定閥門時,則認為有價值,送入案例庫;否則,被認為是無價值案例,將該案例丟棄。
3 基于CBR和RBR集成推理的公共衛生疫情預警系統應用
下面以湛江市城市公共衛生預警系統為例闡述該系統的應用,案例和規則放在SQL數據庫中?,F在取其中疫情預測分析模塊為例,工作過程描述如下:
把在湛江市石頭村2005年7~11月各月份的鼠疫調查數據,如疫情地區、疫情名稱、疫情癥狀、起始時間、發病人數等,經過特征抽取轉換成機器可以識別的案例輸入系統,點擊預測按鈕,可在2005年份7~11月各個月份的發病數基礎上進行預測計算,便可得到鼠疫在2005年12月份的發病數預測值。疫情預測分析界面圖如圖3所示。
????????????????????
??? 此外,系統還可根據疫情的屬性與空間數據庫相關聯,實現疫情預警信息分布地圖呈現給用戶,并及時通報疫情信息,做好應對方案,可有效防止疫情的蔓延。
目前國內已建立起為數不多的公共衛生疫情預警系統,多數是基于規則推理的系統,系統建立和維護困難,并且不具有自學習能力。本文將基于案例推理與基于規則推理的兩種技術相結合,研究出智能高效的公共衛生疫情預警系統,這不僅使系統的建立和維護變得容易,且提高了系統的運行效率,呈現出更強的智能化特征。提高對公共衛生疫情的預防能力、增強在疫情爆發中的組織搶險和快速反應能力以及推進公共衛生疫情預警系統的科學化和智能化具有重要意義。該系統已投入使用,有一定的應用推廣價值。
參考文獻
[1]?YANG Hao, WEN Flu, ALAN Clin. Procase: A casedbased process planning system for machining of rotational
?parts[J]. Journal of Intelligent Manufacturing.1994,(5):441-430.
[2]?CSER L. Three kinds of case-based learning sheet rnanufacturin[J]. Computer in Industry,1991,(17):195-206.
[3]?蔡自興,徐光祐.人工智能及其應用[M]. 北京:清華大學出版社,2003.
[4]?張建華,劉仲英.案例推理和規則推理結合的緊急預案信息系統[J]. 同濟大學學報,2002,30(7):890-894.
[5]?SCHAAF J W. Fish and shrink: A next step towards efficient case retrieval in large scaled case bases[A].
?Advances in Case-based Reasoning[C].Lausanne: Third?European Workshop, 1996:362-376.