發(fā)表：一類基于分級聚類的可解釋性模糊建模方法的研究(一)

時(shí)間：2024-10-09 01:53:39 通信工程畢業(yè)論文

摘要提出了一種基于兩級聚類算法的可解釋性模糊建模方法。首先指出模糊模型可解釋性的重要地位，分析影響可解釋性的主要因素；然后利用減法聚類和加權(quán)模糊C均值聚類算法辨識初始模糊模型，緊密/分離性函數(shù)確定最優(yōu)劃分和模糊集合的相似性融合約簡初始模糊模型，從而提高其可解釋性；最后采用約束優(yōu)化算法整體優(yōu)化模型，提高其精度。通過對Box-Jenkins火爐數(shù)據(jù)的模糊建模，驗(yàn)證了該方法的有效性。

發(fā)表：一類基于分級聚類的可解釋性模糊建模方法的研究(一)

關(guān)鍵詞模糊建模，可解釋性，減法聚類，加權(quán)模糊C均值聚類

Key words fuzzy modeling, interpretability, subtraction clustering, weighted fuzzy c-means algorithm

引言
近些年來，基于規(guī)則的模糊建模以其眾多優(yōu)點(diǎn)成為一個(gè)活躍研究的領(lǐng)域，并在仿真、分類、數(shù)據(jù)挖掘、模式識別、預(yù)測及控制等方面得到廣泛的應(yīng)用。與神經(jīng)網(wǎng)絡(luò)等模型不同，模糊模型的知識表達(dá)形式和推理機(jī)制符合人的思維習(xí)慣，可為人們所理解，成為模糊模型最顯著的特征。
在模糊建模中，一般要求所建立的模型既要有較好的擬合精度，又要有較簡單的模糊結(jié)構(gòu)。目前，眾多聚類算法在模糊邏輯系統(tǒng)的結(jié)構(gòu)辨識中得到了廣泛的應(yīng)用，據(jù)此而得到的模糊結(jié)構(gòu)往往以擬合精度作為指標(biāo)，從而得到的模糊模型含有大量的冗余信息，泛化能力差，不具備可解釋性。
為了提高模糊模型的可解釋性，諸多學(xué)者進(jìn)行了相關(guān)研究．文獻(xiàn)[7-11]給出了模糊模型可解釋性的一些必要條件。文獻(xiàn)[12-18]給出了提高模糊模型可解釋性的一些具體方法，包括模糊集合的相似性度量、正交變換和遺傳算法的規(guī)則約簡，全局與局部學(xué)習(xí)算法等。文獻(xiàn)[6]利用模糊聚類辨識含有冗余的模型，然后利用模糊集合相似性度量和相似性獎(jiǎng)勵(lì)遺傳算法對模型進(jìn)行迭代簡化，最后利用相似性懲罰遺傳算法整體優(yōu)化模型。文獻(xiàn)[19]提出了一種新分級聚類算法，利用最近領(lǐng)域聚類算法和加權(quán)模糊C均值聚類算法辨識出較少的模糊規(guī)則，但沒有考慮模糊集合的相似性融合，同時(shí)最近領(lǐng)域聚類算法對于高維系統(tǒng)易產(chǎn)生維數(shù)災(zāi)難。
本文提出了一種基于兩級聚類的可解釋性模糊建模方法。首先利用減法聚類算法對輸入輸出數(shù)據(jù)進(jìn)行預(yù)處理；然后將一次聚類的聚類中心作為二次FCM聚類的樣本，并由緊密/分離性函數(shù)（XB）確定最優(yōu)劃分，模糊集合的相似性融合約簡所得的初始模糊模型；提高其可解釋性；最后采用梯度下降算法整體優(yōu)化模型。Box-Jenkins火爐數(shù)據(jù)的模糊建模，驗(yàn)證了該方法的有效性。
預(yù)備知識
TS模型
Takagi和Sugeno[22]于1985 年提出了著名的TS模糊模型，是一種被廣泛使用的模糊模型，其典型規(guī)則形式如下：
                (1)
其中Ri表示第i條模糊規(guī)則，xj為輸入變量，Aij為定義在輸入論域中的隸屬函數(shù)，可以取三角形、高斯型、梯形或者鐘型等．本文采用高斯型隸屬函數(shù)：
          (2)
其中分別代表函數(shù)的中心和方差．
TS模型的輸出為所有規(guī)則輸出的加權(quán)平均：
          (3)
其中pi是第i條規(guī)則的激勵(lì)強(qiáng)度：
         (4)
對于數(shù)據(jù){xk, yk | k=1, …, N}，式（3）可以寫為線性回歸方程：
                                     (5)
其中為規(guī)則后件參數(shù)矩陣，e為誤差矩陣．
TS模糊模型規(guī)則前件是模糊變量，而規(guī)則后件是輸入輸出線性函數(shù)，它以局部線性化為基礎(chǔ)，通過模糊建模實(shí)現(xiàn)了全局的非線性，能克服以往模糊模型的高維問題，已經(jīng)成為一種被廣泛使用的模糊模型．
模糊模型的可解釋性
模糊模型的可解釋性問題在九十年代末期，開始得到部分研究學(xué)者的重視[7-21]。2000年4月，在ERUDIT“關(guān)于模糊系統(tǒng)與技術(shù)的未來”專題學(xué)術(shù)討論會上，Babuska R等人建議將模糊建模研究的焦點(diǎn)由精確性轉(zhuǎn)移到可解釋性上，標(biāo)志著模糊模型可解釋性研究的重要里程碑[24]。
模糊模型的可解釋性是指模型的輸入輸出接口形式、模型結(jié)構(gòu)形式、數(shù)據(jù)處理形式等符合人的思維，可以直接或者通過簡單分析來表達(dá)和洞察系統(tǒng)內(nèi)部的運(yùn)行機(jī)理，從而獲得對系統(tǒng)深入的認(rèn)識。
一般認(rèn)為，模糊模型的可解釋性，與模型結(jié)構(gòu)、輸入變量和模糊規(guī)則數(shù)目、隸屬函數(shù)特性等密切相關(guān)，現(xiàn)將主要因素陳述如下[7-11]：
1) 輸入變量數(shù)目：人們很難通過高維模糊模型來分析系統(tǒng)行為，因此模糊模型應(yīng)該采用盡可能少的輸入變量．
2) 模糊規(guī)則數(shù)目：模型的規(guī)則數(shù)目越多，其可解釋性越低．經(jīng)驗(yàn)認(rèn)為，可解釋的模糊模型，其規(guī)則數(shù)目不超過10個(gè)，這是由人在理解、推理時(shí)的思維能力所決定的．
3) 模糊規(guī)則庫的完整性、一致性和精簡性：模糊規(guī)則要完整覆蓋輸入論域，對每一有效的輸入變量組合，至少有一條模糊規(guī)則被激勵(lì)，即完整性。模糊規(guī)則之間必須相容而不能有任何兩條規(guī)則相互矛盾，即一致性。在規(guī)則數(shù)目盡可能小的前提下，不能包含冗余規(guī)則，如某規(guī)則的前件是另一規(guī)則的子集等，即精簡性。
4) 隸屬函數(shù)的特性：隸屬函數(shù)必須是凸和正規(guī)的，常用的三角函數(shù)、高斯函數(shù)等都滿足這兩個(gè)要求。隸屬函數(shù)劃分必須是完備的，即對于任何的輸入變量，在其論域內(nèi)的任何值，至少有一個(gè)隸屬函數(shù)相對應(yīng)，在形式上表現(xiàn)為隸屬函數(shù)之間存在位置的交叉隸屬函數(shù)劃分必須是可區(qū)分的，即對于同一變量，隸屬函數(shù)之間存在明顯的位置區(qū)別，以便賦予一定的語義項(xiàng)。
可解釋性模糊建模
一次聚類
本文提出了一種基于兩級聚類的可解釋性模糊建模方法。首先利用減法聚類算法對輸入輸出數(shù)據(jù)進(jìn)行預(yù)處理，起到精簡樣本，濾去樣本中重復(fù)信息的作用，減少了二次聚類算法中的迭代次數(shù)；然后將一次聚類的聚類中心作為二次加權(quán)FCM聚類的樣本，并由緊密/分離性函數(shù)（XB）確定最優(yōu)劃分，模糊集合的相似性融合約簡所得的初始模糊模型；提高其可解釋性；最后采用梯度下降算法整體優(yōu)化模型。
減法聚類算法思想為:考慮維空間的個(gè)數(shù)據(jù)點(diǎn),不失一般性，假定數(shù)據(jù)點(diǎn)已歸一化到一個(gè)超立方體中。每個(gè)數(shù)據(jù)點(diǎn)都是聚類中心的候選者,則數(shù)據(jù)點(diǎn)處的密度指標(biāo)定義為:
                    (6)
如果一個(gè)數(shù)據(jù)點(diǎn)有多個(gè)鄰近的數(shù)據(jù)點(diǎn),則該數(shù)據(jù)點(diǎn)具有高密度值,半徑定義了該點(diǎn)的一個(gè)鄰域,半徑以外的數(shù)據(jù)點(diǎn)對該點(diǎn)的密度指標(biāo)貢獻(xiàn)甚微。在計(jì)算每個(gè)數(shù)據(jù)點(diǎn)指標(biāo)后,選擇具有最高密度指標(biāo)的數(shù)據(jù)點(diǎn)為第一個(gè)聚類中心,令為選中的點(diǎn),為其密度指標(biāo)。的密度指標(biāo)可用下式修正:
                 (7)
顯然,靠近第一個(gè)聚類中心的數(shù)據(jù)點(diǎn)的密度指標(biāo)將明顯減少，從而使這些點(diǎn)不太可能選為下一個(gè)聚類中心。修正了每個(gè)數(shù)據(jù)點(diǎn)的密度指標(biāo)后，選定下一個(gè)聚類中心，再次修正數(shù)據(jù)點(diǎn)的所有密度指標(biāo)。當(dāng)新聚類中心對應(yīng)的密度指標(biāo)與相比小于某個(gè)給定值時(shí)
                           (8)
則聚類過程結(jié)束，提取聚類中心聚相應(yīng)的密度指標(biāo)。
二次聚類
使用模糊C均值聚類算法進(jìn)一步處理由一次聚類產(chǎn)生的聚類中心，因?yàn)檫@些聚類中心是由相應(yīng)的密度指標(biāo)所決定，所以在最后的模糊分區(qū)劃分時(shí)應(yīng)考慮到相應(yīng)樣本的密度指標(biāo)的不同，為解決這個(gè)問題，使用加權(quán)模糊C均值聚類算法處理由一次聚類產(chǎn)生的聚類中心，相應(yīng)的加權(quán)模糊C均值的目標(biāo)函數(shù)為：
                  (9)
其中為最終的聚類數(shù)，為分區(qū)矩陣，是最后的聚類中心矢量，為模糊加權(quán)指數(shù)，是與初始聚類中心相關(guān)的加權(quán)量，由下式表示：
                          (10)
聚類的準(zhǔn)則為取的極小值且約束條件為，最后所求的聚類中心和相應(yīng)的隸屬度函數(shù)可用下式表示：
                (11)
      (12)
高斯型隸屬函數(shù)的方差可以通過計(jì)算模糊協(xié)方差矩陣來獲得：
                    (13)
                                         (14)
一旦確定了模糊模型前件的參數(shù)，即可利用最小二乘法估計(jì)模糊模型的后件參數(shù)。
加權(quán)FCM算法：
Step1：選擇聚類數(shù)，加權(quán)指數(shù)，和聚類中心的初始值。
Step2：使用公式(12)計(jì)算隸屬度函數(shù)值。
Step3：利用公式(11)計(jì)算更新聚類中心的值。
Step4：如果，則停止，否則轉(zhuǎn)到Step2。
模糊規(guī)則數(shù)目的確定，即在模糊聚類中確定聚類的數(shù)目，是模糊建模的一個(gè)首要問題。聚類有效性分析就是尋找最優(yōu)的聚類數(shù)目，文獻(xiàn)[30]提出的緊密/分離性函數(shù)（XB：Xie-Beni index）利用了隸屬函數(shù)信息和數(shù)據(jù)本身的信息，本文使用加權(quán)緊密/分離性函數(shù)，其最小值對應(yīng)最優(yōu)的聚類數(shù)目，對模糊指數(shù)m的魯棒性強(qiáng)，融合了數(shù)據(jù)的幾何結(jié)構(gòu)信息：
         (15)
模糊集合的相似性融合
經(jīng)過兩級聚類算法和最小二乘估計(jì)得到的初始模糊模型，其隸屬函數(shù)（模糊集合）可能存在冗余，表現(xiàn)為模糊集合間存在過度的交叉或重疊，從而難以賦予相應(yīng)的語義值，降低了模型的可解釋性，因此需要對每個(gè)變量的隸屬函數(shù)進(jìn)行相似性分析和融合．
模糊模型的隸屬函數(shù)存在三種類型的冗余：第一種是兩個(gè)隸屬函數(shù)相似，這是最常見的模糊集合冗余形式；第二種是隸屬函數(shù)以較大值覆蓋整個(gè)論域；第三種是隸屬函數(shù)接近于單點(diǎn)集合。
第三種的隸屬函數(shù)冗余，由于其不存在可解釋的實(shí)際意義，一般在對應(yīng)的規(guī)則前件中直接去除即可。對于第二種的隸屬函數(shù)冗余，在去除該規(guī)則后，建模誤差在允許范圍內(nèi)，則為了提高可解釋性，可將該規(guī)則刪除，實(shí)現(xiàn)規(guī)則約簡，否則保留該規(guī)則。
第一種冗余，本文采用相似性測度來評判兩個(gè)隸屬函數(shù)的相似性。對模糊集合A和B，其相似性測度定義如下[34]：
                                                             (8)
其中表示集合的基數(shù)，和算子分別表示集合的交和并。
對于離散論域X={xk | k=1, …, N}，式（22）表述如下：
                           (9)
其中和分別為最小最大算子。S為定義在[0,1]間的相似性測度，S=1表示兩個(gè)集合完全相等，而S=0意味著兩個(gè)集合沒有交叉或重疊．
如果兩個(gè)模糊集合A和B的相似性測度大于預(yù)先設(shè)定的閾值，那么集合A和B可以融合為新的集合C．對于不同形式的隸屬函數(shù)，確定集合C的具體方法不同，但其共同遵循的原則是集合C的支集是集合A與B的并集，集合C的核是集合A與B核的加減聚合．如對于梯形隸屬函數(shù)A(a1,a2,a3,a4)和B(b1,b2,b3,b4)，融合生成的新的模糊集合為C(c1,c2,c3,c4)：c1=min(a1,b1)，c2=0.5(a2+b2)，c3=0.5(a3+b3)，c4=max(a4+b4) ．
對于本文所采用的高斯型隸屬函數(shù)，由集合A和B融合生成的新集合C的參數(shù)如下：
               (10)
閾值的大小直接影響模糊模型的性能，閾值越小，得到的模型的精度越低而可解釋性越高，一般閾值取[0.4 – 0.7]，具體可根據(jù)實(shí)際系統(tǒng)的要求選擇。
模糊集合融合過程需要反復(fù)迭代進(jìn)行．在每一次迭代過程中，對每一個(gè)變量的所有模糊集合進(jìn)行兩兩相似性分析，相似性測度大于閾值的兩個(gè)模糊集合融合為新的集合．迭代反復(fù)進(jìn)行，直到?jīng)]有任何兩個(gè)模糊集合的形似性測度大于閾值，然后再將第二類和第三類模糊集合刪除，從而完成整個(gè)模糊集合的相似性融合過程。
模糊模型的整體優(yōu)化
初始模糊模型集合相似性融合，提高了模型的可解釋性，但同時(shí)降低了模型的精確性，因此采用梯度下降優(yōu)化算法，提高模型的精度，為保持模型的可解釋性，對梯度下降優(yōu)化算法施加搜索空間約束。前件參數(shù)的變化范圍為，以保證隸屬函數(shù)的可區(qū)分性，后件參數(shù)變化范圍為，以保證模型的局部可解釋性不變。在優(yōu)化過程中，當(dāng)模型的參數(shù)大于其最大值（或小于其最小值）時(shí)，則將該參數(shù)強(qiáng)迫限定為其最大值（或最小值）．參數(shù)變化范圍的確定，根據(jù)經(jīng)驗(yàn)，一般取4-15％之間。

【發(fā)表：一類基于分級聚類的可解釋性模糊建模方法的研究(一)】相關(guān)文章：

基于解釋性和精確性的模糊建模方法研究研究的目的與意義(一)03-07

基于網(wǎng)格的聚類方法研究03-13

發(fā)表化學(xué)教學(xué)類論文的方法12-11

基于內(nèi)容的模糊圖像檢索技術(shù)研究03-18

基于NURBS曲面建模的UTD方法的方向圖求解11-22

基于模糊綜合評價(jià)的企業(yè)危機(jī)評價(jià)及決策研究02-27

品牌權(quán)益綜合模糊測評研究方法探討03-07

基于GSM網(wǎng)絡(luò)的一機(jī)多號類業(yè)務(wù)研究03-07

2013年護(hù)理類職稱論文發(fā)表的方法11-28

亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

發(fā)表：一類基于分級聚類的可解釋性模糊建模方法的研究(一)