- 相關推薦
研究聚類分析的甘肅省工業(yè)行業(yè)結構
關鍵詞:因子分析;聚類分析;甘肅省;工業(yè)行業(yè)結構
摘 要:一般的聚類分析方法的應用,在確定指標體系的同時,忽視了指標間相關性及權重問題的存在,論文擬結合因子分析法來進行聚類分析,以解決相關性和權重分配的問題。同時,本文利用基于因子分析的層次聚類分析法來對甘肅省工業(yè)行業(yè)結構進行研究,將甘肅省工業(yè)行業(yè)劃分為4類,并根據(jù)4類行業(yè)的指標數(shù)據(jù)得分指出其行業(yè)結構存在的特點及相應問題。
一、引言
聚類分析是研究指標(或樣品)分類問題的一類多元統(tǒng)計分析方法的總稱,其中心思想是將一些相似度較大的指標(或樣品)聚合為一類,同時把另外一些相似度較大的指標(或樣品)聚合為其他的類,然后再將這些小類依據(jù)其相似度聚合為一個大類,直至所有的指標(或樣品)都聚合完畢,以更直觀的顯示出研究對象的差異和聯(lián)系。
作為一種常用的多元統(tǒng)計方法,聚類分析從數(shù)據(jù)分析的角度,使同一分類過程中有了一個統(tǒng)一性的定量標準,避免了一般定性分類中的主觀性和隨意性的弊端,從而在經(jīng)濟學研究中也得到了廣泛的應用。例如,聚類分析法曾用于區(qū)域經(jīng)濟結構的分析(王強 2004),也曾有學者將聚類分析應用于城市競爭力的研究與比較(倪鵬飛 2003,吳慶軍 2005),也有一些學者將聚類分析應用于可持續(xù)發(fā)展模式研究(張德平 2003),在產(chǎn)業(yè)結構方面,許多學者也曾經(jīng)應用聚類分析法做了很多富有成效的研究工作,如:有學者應用聚類分析法研究了重慶市的產(chǎn)業(yè)結構(張春勛 2004),而灰色聚類分析法曾用于確定區(qū)域工業(yè)支柱產(chǎn)業(yè)(李勝 2000),在工業(yè)結構方面也有人應用聚類分析方法得過一定的研究成果(吳海建 2004),這些聚類方法的應用為分析研究對象提供了一個良好的途徑。
傳統(tǒng)的聚類方法的應用,一般要對所選用的原始數(shù)據(jù)首先進行定性分析,然后將原始數(shù)據(jù)進行無量綱化的處理,而后再利用具體的方法對相似性進行測度。如果采用層次聚類法我們還面臨著求取新類相似性的問題,計算新類與其它類之間的相似性,然后依相似程度遠近逐次進行合并,最終得出聚類結果。我們在傳統(tǒng)聚類方法中雖然解決了原始數(shù)據(jù)的量綱和量級問題,但是單一的聚類分析法也存在著一定的缺點,由于聚類分析首先是一種定量的分析方法,而我們所選定的指標又有可能存在著相互關聯(lián)的問題,即相關性問題,而采用這種具有相關性的指標就可能使分析結果產(chǎn)生偏差;從另一個方面來看,這種定量方法也忽略了指標間權重的問題,所以,如何減少各個指標之間的相關度,并分配給各個指標以科學合理的權重,同時又不損害聚類結構的精確度就成為聚類方法應用的一個亟待解決的問題。
因子分析起源于20世紀早期,其基本思想是通過研究眾多變量之間的內部依賴關系,需求這些數(shù)據(jù)的基本結構,并用少數(shù)幾個公因子來表示基本數(shù)據(jù)結構,使其既能夠反映原來眾多指標變量所代表的主要信息,同時又能夠簡化數(shù)據(jù)結構(侯景新 2004),使簡化后的數(shù)據(jù)之間的相關性問題得以解決,從而達到方便研究的目的,因此,在聚類分析中結合因子分析就可以有效地減少各個指標之間的相關性問題。本文擬在聚類分析法中應用因子分析法以祛除指標之間的相關性,主要結合對甘肅省工業(yè)行業(yè)結構實證研究來探討對這一方法的應用。
二、甘肅工業(yè)行業(yè)結構實證研究
甘肅省工業(yè)體系主要形成于前兩個“五年”計劃及國家“三線”建設時期,半個多世紀以來,甘肅工業(yè)取得了長足的進步,2005年實現(xiàn)工業(yè)增加值685.80億元,工業(yè)貢獻率達到42.21%。與此同時,甘肅省工業(yè)發(fā)展中也存在著嚴重的缺憾和扭曲,其中最突出的表現(xiàn)就是工業(yè)結構的不合理。黨的十六大提出要“堅持以信息化帶動工業(yè)化,以信息化促進工業(yè)化,走出一條科技含量高、經(jīng)濟效益好、資源消耗低、環(huán)境污染少、人力資源優(yōu)勢得到充分發(fā)揮的新型工業(yè)化道路。”因此,要完成新型工業(yè)化的任務,就要對甘肅省目前不合理的工業(yè)結構進行改善和優(yōu)化,使工業(yè)對甘肅省經(jīng)濟發(fā)展發(fā)揮更大的作用,就成為甘肅經(jīng)濟發(fā)展中一個緊迫的問題。工業(yè)行業(yè)結構是工業(yè)結構中的主體部分,優(yōu)化工業(yè)結構的重點就是對工業(yè)行業(yè)結構進行優(yōu)化和升級,在這種情況下,對工業(yè)行業(yè)結構的特征進行認識、分析和研究就顯得尤為重要,全面而準確的認識到甘肅省工業(yè)行業(yè)結構的特征,才能夠有的放矢,有針對性地提出優(yōu)化和升級甘肅省工業(yè)結構的具體方法。多年來,省內外許多學者也對甘肅省工業(yè)行業(yè)結構進行了分析,提出了不少有建設性的建議,如從產(chǎn)業(yè)技術戰(zhàn)略和產(chǎn)權制度等方面來對工業(yè)行業(yè)結構進行優(yōu)化(張克讓 2001);從行業(yè)的區(qū)域布局結構來對工業(yè)行業(yè)結構進行調整(倪國良 2002);提出發(fā)揮情報信息對調整工業(yè)行業(yè)結構的推動作用(白蒲英 2005)等等。但是綜觀這些研究成果可以發(fā)現(xiàn),他們對甘肅省工業(yè)行業(yè)結構的分析大多數(shù)是基于定性的觀察和思考,而這種分析往往容易產(chǎn)生主觀性的偏差,缺乏對研究對象的定量認識,因此,有必要采用一種合理的定量分析方法來分析和研究甘肅省的工業(yè)行業(yè)結構。
本文在應用聚類分析的時候加入了因子分析方法以驅除各指標之間的相關性及權重問題,總的原則是在選取指標進行聚類分析前,首先對指標運用因子分析方法進行處理,并運用處理過的公因子指標進行聚類分析,其過程如下:
1. 指標選取
指標的選擇是一個至關重要的前提性工作,既要結合研究目的,也要考慮指標數(shù)據(jù)的可得性,同時也要滿足科學性和全面性的要求。按照這一要求,我們選取了2006年《甘肅年鑒》中除“其他采礦業(yè)”、“化學纖維制造業(yè)”、“橡膠制造業(yè)”、“廢棄資源和廢舊材料回收加工業(yè)” 以外的甘肅省全部國有及限額以上非國有工業(yè)企業(yè)的以下指標構成指標體系:X1工業(yè)增加值、X2全部從業(yè)人員年平均人數(shù)、X3年末資產(chǎn)合計、X4產(chǎn)品銷售收入、X5產(chǎn)品銷售費用、X6利稅總額、X7總資產(chǎn)貢獻率、X8資產(chǎn)負債率、X9流動資產(chǎn)周轉次數(shù)、X10工業(yè)成本費用利潤率、X11全員勞動生產(chǎn)率、X12產(chǎn)品銷售率等12項指標組成指標體系。所選取的指標包括了工業(yè)行業(yè)規(guī)模、效益、就業(yè)等主要方面,能夠反映甘肅省工業(yè)行業(yè)的基本信息。
2.因子分析過程
因子分析的基本思路為:
(1) 根據(jù)相關數(shù)據(jù)建立原始矩陣,并對原始數(shù)據(jù)的標準化處理;
(2) 對數(shù)據(jù)間的相關性進行計算,確定是否可以運用因子分析;
(3) 運用主成分法對經(jīng)標準化處理后得矩陣進行初始因子求解,確定公因子數(shù)目;
(4) 運用Varimax旋轉法對初始因子進行旋轉,給予明確得因子解釋;
(5) 計算因子得分。
運行spss13.0 for windows,標準化數(shù)據(jù)(系統(tǒng)自動進行)后選擇KMO and Bartlett’s test of sphericity 計算相關性,隨后選擇Principal components(主成分分析)進行初始因子求解, Varimax(正交旋轉)進行因子旋轉。
經(jīng)計算,原始矩陣的KMO值為0.628,說明該指標矩陣適合于進行因子分析。對經(jīng)過處理后的數(shù)據(jù)進行因子分析共提取了3個公因子,其特征值、貢獻率、累積貢獻率及旋轉后的因子載荷矩陣如表1、表2所示:
表1:公因子相關數(shù)據(jù)表
公因子 特征值 貢獻率% 累積貢獻率
F1 5.075 37.542 37.542
F2 3.734 35.353 72.895
F3 1.159 10.180 83.075
表2:旋轉后因子載荷矩陣
F1 F2 F3
X1 0.966 0.188 -0.009
X2 0.980 -0.030 -0.001
X3 0.948 0.119 -0.057
X4 0.968 0.094 0.022
X5 0.766 -0.022 -0.161
X6 0.354 0.768 -0.105
X7 -0.093 0.922 0.000
X8 0.071 -0.565 -0.594
X9 0.205 0.855 0.098
X10 -0.031 0.930 0.053
X11 0.055 0.903 -0.026
X12 -0.074 -0.106 0.903
通過分析可以看出,3個公因子的累積貢獻率已經(jīng)達到83.075%,可以較為全面的反映整體情況,因此,我們就可以用這3個公因子來取代上述的12個指標來對甘肅省工業(yè)行業(yè)結構進行分析。從表2可以看出,公因子F1在X1、 X2、 X3、 X4、 X5上承擔了較大的載荷,它們主要是行業(yè)規(guī)模方面的指標,因此,公因子F1可以定義為規(guī)模因子;公因子F2在X6、X7、X9、X10、X11上承擔了較大的載荷,它們主要是行業(yè)效益方面的指標,因此,公因子F2可以定義為效益因子;公因子F3所承擔的載荷主要集中于X12即產(chǎn)品銷售率,反映了行業(yè)風險方面的信息,因此,公因子F3可以定義為風險因子;同時,根據(jù)表2中的數(shù)據(jù),就可以分別求出甘肅省35個工業(yè)行業(yè)的4個公因子的得分數(shù)值,如F1的計算公式如下:
F1=0.966X1+0.980X2+0.948X3+0.968X4+0.766X5+0.354X6-0.098X7+0.071X8+0.205 X9-0.031 X10+0.055 X11-0.074 X12
3.聚類分析過程
通過因子分析過程,得到了甘肅省36個工業(yè)行業(yè)的3個公因子,這3個公因子之間已經(jīng)驅除了相關性問題,同時,按照它們的貢獻率的不同,使3個公因子被賦予了各自的權重。如上所示,我們將得到的這36個工業(yè)行業(yè)的3個公因子的得分值作為指標對甘肅省的工業(yè)行業(yè)進行層次聚類處理,以探測出甘肅省工業(yè)行業(yè)內部結構的趨同性和差異性,按照規(guī)模、效益和風險來對其進行剖析,這一過程同樣使用統(tǒng)計軟件spss13.0 for windows來進行。
運行spss13.0 for windows,分別選用平方歐式距離對相似性進行測度;組間連接法求新類相似性,可以得出最終的聚類結果。通過聚類分析,我們可以把甘肅省的36個工業(yè)行業(yè)按照其公因子的總得分將其分為3類(表3)。
表3:甘肅省工業(yè)行業(yè)聚類結果表
第一類 石油加工、煉焦及核燃料加工業(yè);黑色金屬冶煉及壓延加工業(yè);
有色金屬冶煉及壓延加工業(yè);電力、熱力的生產(chǎn)和供應業(yè)
第二類 石油和天然氣開采業(yè);煙草制品業(yè)
第三類 其他29類工業(yè)行業(yè)
注:因子分析及聚類分析數(shù)據(jù)來源均為2006年《甘肅年鑒》
4、對聚類結果的分析
從聚類結果可以看出,處于第一類的石油加工、有色金屬冶煉及壓延加工業(yè)等行業(yè)在甘肅工業(yè)中無疑處于絕對的支柱產(chǎn)業(yè)的地位,2005 年,全部國有及限額以上非國有工業(yè)企業(yè)工業(yè)增加值中,這四個行業(yè)占據(jù)了57.18%的份額,可以說,它們是甘肅工業(yè)的大半壁江山,甘肅工業(yè)的發(fā)展,它們功不可沒。但是如果從效益指標來看,這四類行業(yè)的經(jīng)濟效益卻不容樂觀。公因子F2反映的主要是行業(yè)效益方面的信息,但在F2載荷較大的利稅總額、總資產(chǎn)貢獻率、流動資產(chǎn)周轉次數(shù)、全員勞動生產(chǎn)率、工業(yè)成本費用利潤率幾個指標來看,除黑色金屬冶煉及加工業(yè)和電力、熱水的生產(chǎn)和供應業(yè)以外,表現(xiàn)都不盡如人意,而電力、熱水的生產(chǎn)和供應業(yè)的相對高效益還得益于其產(chǎn)品對于滿足生產(chǎn)生活的必要性及其壟斷性。公因子F3主要反映了行業(yè)產(chǎn)品的銷售情況,通過這一指標也可以了解到其產(chǎn)品面臨的銷售風險,從幾類行業(yè)的表現(xiàn)來看,銷售情況比較良好,這應該歸結于幾類行業(yè)的資源型產(chǎn)品性質,同時,行業(yè)的壟斷性也占據(jù)著較大的因素。因此,從整體上來看,目前甘肅工業(yè)的發(fā)展還必須牢牢依靠這四類工業(yè)行業(yè)的發(fā)展,但是,由于這四類行業(yè)普遍具有的資源型特征,今后甘肅必須面對資源耗竭過程中如何轉變支柱產(chǎn)業(yè)方向,培育新的支柱產(chǎn)業(yè)這一嚴峻的問題。
第二類煙草制造業(yè)、石油和天然氣開采業(yè)可以歸類為甘肅省工業(yè)中的主導產(chǎn)業(yè),2005年,全部國有及限額以上非國有工業(yè)企業(yè)工業(yè)增加值中,這兩個行業(yè)占據(jù)了9.39%的份額,成為甘肅工業(yè)發(fā)展的重要增長點。從效益指標來看,這兩類行業(yè)尤其是石油和天然氣開采業(yè)表現(xiàn)都令人滿意,無論是總資產(chǎn)貢獻率、資產(chǎn)負債率還是全員勞動生產(chǎn)率,兩個行業(yè)的綜合效益指標表現(xiàn)在全部工業(yè)行業(yè)中都處于領先位置。而從銷售風險指標考慮,它們的表現(xiàn)也讓人滿意。因此,對于這兩個行業(yè),在今后可以考慮進一步培育,使他們發(fā)展更加壯大。
第三類行業(yè)在甘肅工業(yè)中總共占據(jù)了33.43%的份額,相對規(guī)模比較小,但是,這類行業(yè)中也不乏效益和風險指標都比較好的行業(yè),同時,這些行業(yè)中輕工業(yè)和高新技術工業(yè)行業(yè)占據(jù)了不小的份額,因此,甘肅省工業(yè)結構的調整和優(yōu)化,它們是不可忽視的力量,培育甘肅工業(yè)經(jīng)濟新的增長點,必須著重從這一類行中的入手。
三、小 結
運用基于因子分析的聚類分析方法,我們將甘肅省工業(yè)行業(yè)分為3類,對這一結果進行分析可以看出甘肅省工業(yè)行業(yè)結構所表現(xiàn)出來的一些特點與存在的問題:
1.多年來“重重輕輕”的工業(yè)結構仍未有根本改觀,輕重工業(yè)發(fā)展仍不協(xié)調
輕重工業(yè)發(fā)展不協(xié)調的問題是甘肅省工業(yè)一貫有之的問題,它起因于“三線”建設時期國家的產(chǎn)業(yè)布局,改革開放以來,輕重工業(yè)協(xié)調發(fā)展問題一直是甘肅省工業(yè)結構調整的首要問題,然而,經(jīng)過二十多年的發(fā)展,這一問題反而有加劇的趨勢,1978年,甘肅省輕重工業(yè)的比例為1:4.35, 2005年這一比例為1:6.23,同時,從聚類結果可以看出,構成甘肅省工業(yè)中支柱或主導產(chǎn)業(yè)的六種行業(yè)中,絕大多數(shù)是重工業(yè)行業(yè),雖然它一定程度上表現(xiàn)了甘肅的相對比較優(yōu)勢,但同時,由于這些重工業(yè)資源型的特點,使其無法應付資源耗竭的困境,缺乏可持續(xù)發(fā)展的能力。今后甘肅工業(yè)輕重協(xié)調發(fā)展問題仍然需要付出巨大的努力去解決。
2.國有經(jīng)濟比重仍然過大,市場化進程緩慢
從聚類結果來看,占據(jù)甘肅工業(yè)大半壁江山的支柱和主導產(chǎn)業(yè)絕大部分是重工業(yè),而同時,它們又都是以國有或國有控股性質為主,因此,造成甘肅省工業(yè)經(jīng)濟呈現(xiàn)出明顯的國有化特點,2005年,甘肅省全部國有及國有控股工業(yè)企業(yè)產(chǎn)值占到了全省工業(yè)總產(chǎn)值的69.15%,。由于國有及國有控股工業(yè)企業(yè)占據(jù)了全省工業(yè)的絕大多數(shù)份額,更由于它們更容易掌握較優(yōu)質的發(fā)展資源,造成甘肅市場化進程緩慢,使非公有制經(jīng)濟發(fā)展空間受到擠占,比重過小,活力不足,這就使全省工業(yè)結構調整和經(jīng)濟發(fā)展受到一定程度的制約,進度較慢。
【研究聚類分析的甘肅省工業(yè)行業(yè)結構】相關文章:
我國農(nóng)業(yè)上市公司資本結構聚類分析03-20
基于效率與優(yōu)勢的珠三角工業(yè)結構變動研究03-28
區(qū)域零售業(yè)競爭結構分析及策略研究-以甘肅省為例03-07
醫(yī)藥行業(yè)績效與渠道治理結構關系的實證研究03-01
中國鋼鐵行業(yè)上市公司資本結構的影響因素研究12-09
關于上市公司行業(yè)環(huán)境、資本結構與公司業(yè)績研究03-24
調整石油行業(yè)的產(chǎn)業(yè)結構03-19
資本結構的地區(qū)差異研究03-20