亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

基于聯(lián)結(jié)主義的連續(xù)記分IRT模型的項(xiàng)目參數(shù)和被試能力估計(jì)

  • 相關(guān)推薦

基于聯(lián)結(jié)主義的連續(xù)記分IRT模型的項(xiàng)目參數(shù)和被試能力估計(jì)

基于聯(lián)結(jié)主義的連續(xù)記分IRT模型的項(xiàng)目參數(shù)和被試能力估計(jì) 1 問題的提出
  與經(jīng)典測驗(yàn)理論相比,項(xiàng)目反應(yīng)理論(簡稱IRT)由于具有參數(shù)不變性、能進(jìn)行計(jì)算機(jī)化自適應(yīng)測驗(yàn)等優(yōu)點(diǎn)而受到歡迎,但是也存在著不少問題,首先是目前比較成熟的、得到廣泛應(yīng)用的IRT軟件,如BILOG、MicroCAT等,主要是運(yùn)用極大似然法或貝葉斯方法進(jìn)行項(xiàng)目參數(shù)和被試能力估計(jì),一般都只能處理二值記分的項(xiàng)目,也有少數(shù)軟件可以處理等級記分的項(xiàng)目,例如MULTILOG,但對于連續(xù)記分的項(xiàng)目還缺少估計(jì)方法和工具;其次是在運(yùn)用BILOG、MicroCAT和MULTILOG等軟件時(shí)往往需要數(shù)百人的大樣本,而對于小樣本則缺少有效的估計(jì)方法,因此需要另尋途徑來解決這些問題。
    2 聯(lián)結(jié)主義理論中的級連相關(guān)模型
  聯(lián)結(jié)主義理論(或稱人工神經(jīng)網(wǎng)絡(luò))是近年來得到廣泛關(guān)注的認(rèn)知心理學(xué)理論,它一方面可以用來模擬人的認(rèn)知活動,探討人類的信息加工機(jī)制,另一方面可以作為一種工具來分析系統(tǒng)的輸入和輸出之間的關(guān)系,特別是當(dāng)系統(tǒng)的輸入和輸出之間難以用顯性的數(shù)學(xué)方程表示時(shí),聯(lián)結(jié)主義模型就可以通過其本身的學(xué)習(xí)功能,在用一組已知的輸入和輸出數(shù)據(jù)對它進(jìn)行訓(xùn)練以后,就可以在一定程度上掌握了該系統(tǒng)內(nèi)部的輸入和輸出之間的關(guān)系,即建立了某種模型。如果我們再給這個(gè)經(jīng)過訓(xùn)練的網(wǎng)絡(luò)模型以新的輸入,那么它就可以給出相應(yīng)的輸出值。因此,人們可以利用聯(lián)結(jié)主義模型的這種性質(zhì)來進(jìn)行預(yù)測和參數(shù)估計(jì)等活動。
  聯(lián)結(jié)主義模型通常由一個(gè)輸入層、一個(gè)輸出層和若干個(gè)隱含層組成,每一層中含有若干個(gè)結(jié)點(diǎn),一個(gè)模型中所含的隱含層數(shù)目和各層所含結(jié)點(diǎn)數(shù)目,是由具體問題的性質(zhì)和復(fù)雜程度來確定的。各個(gè)結(jié)點(diǎn)之間的聯(lián)結(jié)具有一定的權(quán)重,它的大小反映了相鄰兩個(gè)結(jié)點(diǎn)之間相互影響的程度,在模型被訓(xùn)練的過程中,各結(jié)點(diǎn)間的權(quán)重得到了調(diào)整。
  聯(lián)結(jié)主義模型通?梢苑譃殪o態(tài)型和動態(tài)型兩種,靜態(tài)型模型的拓?fù)浣Y(jié)構(gòu)是實(shí)驗(yàn)者在一開始的時(shí)候就設(shè)計(jì)好的,它的訓(xùn)練過程就是調(diào)節(jié)各結(jié)點(diǎn)之間的權(quán)重。動態(tài)型模型的拓?fù)浣Y(jié)構(gòu)是在訓(xùn)練過程中不斷變化的,它能夠隨著訓(xùn)練的進(jìn)行,自動地加入新的隱含結(jié)點(diǎn),同時(shí)也調(diào)整各結(jié)點(diǎn)間的聯(lián)結(jié)權(quán)重,這樣就可以更快地減少訓(xùn)練誤差。
  級連相關(guān)模型是動態(tài)型聯(lián)結(jié)主義模型中的一種,它的計(jì)算精度較高,運(yùn)算速度較快。在開始訓(xùn)練時(shí),該模型只有輸入層和輸出層,處于最小拓?fù)浣Y(jié)構(gòu)。隨著訓(xùn)練過程的進(jìn)行,它能夠根據(jù)需要自動地逐個(gè)加入隱含結(jié)點(diǎn)。該模型的訓(xùn)練分為輸出和輸入兩個(gè)階段交替進(jìn)行,首先是輸出階段,在這一階段,模型對聯(lián)結(jié)隱含結(jié)點(diǎn)和輸出結(jié)點(diǎn)間的各權(quán)重進(jìn)行調(diào)整,直到誤差不再減少為止;然后轉(zhuǎn)至輸入階段,在這一階段,模型對于聯(lián)結(jié)輸入結(jié)點(diǎn)和候選隱含結(jié)點(diǎn)間的各個(gè)權(quán)重進(jìn)行調(diào)整,并從中選出其輸出變量和網(wǎng)絡(luò)的誤差變量間相關(guān)為最大的候選隱含結(jié)點(diǎn),把它裝入網(wǎng)絡(luò),這樣使得每次裝入的新隱含結(jié)點(diǎn)都能最大程度地影響誤差的變化。然后再轉(zhuǎn)至輸出階段,這個(gè)過程不斷重復(fù),直到達(dá)到預(yù)定的訓(xùn)練精度。在本研究中,由于無法事先確定模型的拓?fù)浣Y(jié)構(gòu),以及為了較快地對模型進(jìn)行訓(xùn)練和達(dá)到較好的訓(xùn)練和測試效果,采用了級連相關(guān)模型作為研究的工具。
    3 連續(xù)記分IRT模型
  連續(xù)記分IRT模型是二值記分IRT模型的擴(kuò)展,即它的記分不是按照二值邏輯的全對或全錯(cuò)的方式來進(jìn)行,而是根據(jù)被試答對項(xiàng)目的程度來進(jìn)行記分,如果全對該題目就得滿分。由于各題目的滿分值不一樣,有的是3分、5分、6分或更高的分?jǐn)?shù),為了統(tǒng)一起見,可以對它們進(jìn)行歸一化處理,全部轉(zhuǎn)化為0至1的值。這樣就可以和下面的三參數(shù)邏輯斯諦模型中的P(θ)相一致。Samejima、Muller和Mullenbergh等都對連續(xù)記分IRT模型進(jìn)行過研究,它和二值記分模型一樣,可以用正態(tài)卵形模型和邏輯斯諦模型表示。對于常用的三參數(shù)邏輯斯諦模型,它的表示式為:
  P(θ)=c (1-c)exp(θ-b)]/{1 exp(θ-bi)]}
  在該模型中,式中的ai、bi和ci分別為第i個(gè)項(xiàng)目的區(qū)分度、難度和猜測參數(shù),θ為某個(gè)被試的能力,P(θ)為該被試答對第i個(gè)項(xiàng)目的概率,它的值為0至1,這是一個(gè)連續(xù)的值。
  雖然有些學(xué)者對于該模型進(jìn)行了一些研究,但是他們的研究還只是涉及該模型的性質(zhì)、信息函數(shù)的定義、參數(shù)不變性等方面,在具有實(shí)用意義的參數(shù)和被試能力估計(jì)方面還沒有成熟的結(jié)果。
  為了對連續(xù)記分IRT模型的參數(shù)估計(jì)問題進(jìn)行研究,作者對目前常用的幾個(gè)IRT軟件的算法進(jìn)行分析,發(fā)現(xiàn)它們的共同特點(diǎn)都是運(yùn)用統(tǒng)計(jì)的方法來進(jìn)行參數(shù)估計(jì),都無法對小樣本情況下的IRT連續(xù)記分模型進(jìn)行參數(shù)估計(jì),于是作者就決定另辟捷徑,在本研究中采用了和常用統(tǒng)計(jì)技術(shù)完全不同的聯(lián)結(jié)主義模型(人工神經(jīng)網(wǎng)絡(luò))方法。運(yùn)用統(tǒng)計(jì)方法不能完全解決的問題,并不意味著用其它方法就不能解決,其關(guān)鍵問題是常用的統(tǒng)計(jì)參數(shù)估計(jì)方法大多是建立在線性模型的基礎(chǔ)上的,而被試的反應(yīng)和IRT中參數(shù)之間的關(guān)系是非線性的,因此在運(yùn)用統(tǒng)計(jì)方法進(jìn)行參數(shù)估計(jì)時(shí),要采用大樣本才能得到較好的結(jié)果。而人工神經(jīng)網(wǎng)絡(luò)的輸出和輸入之間的關(guān)系本身就是非線性的,特別值得一提的是,本研究把人工神經(jīng)網(wǎng)絡(luò)的激活函數(shù)設(shè)計(jì)為S型的Sigmoid函數(shù),它的表達(dá)式為
  f(x)=exp(x)/
  它和上述的三參數(shù)邏輯斯諦模型的表示式非常相似,仔細(xì)比較一下,就可以看出它實(shí)際上就是IRT模型在c=0,b=0,1.7a=1,θ=x時(shí)的特例,因此聯(lián)結(jié)主義模型(人工神經(jīng)網(wǎng)絡(luò))的這種輸出和輸入之間的非線性結(jié)構(gòu)就可以較好地處理IRT中相類似的數(shù)據(jù)關(guān)系。
    4 計(jì)算機(jī)模擬實(shí)驗(yàn)的設(shè)計(jì)和實(shí)施
  該實(shí)驗(yàn)的基本思想是:把一組被試對于一組項(xiàng)目的反應(yīng)矩陣作為級連相關(guān)模型(以下簡稱為神經(jīng)網(wǎng)絡(luò))的輸入,這組被試的能力θ或該組項(xiàng)目的參數(shù)a、b和c作為該模型的輸出,并且用這些輸入和對應(yīng)的輸出值對該神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,經(jīng)過訓(xùn)練的網(wǎng)絡(luò)就具備了估計(jì)θ,a,b或c的能力。當(dāng)輸入一組新的反應(yīng)矩陣時(shí),該網(wǎng)絡(luò)就可以輸出所需的被試能力或項(xiàng)目參數(shù)估計(jì)值。本實(shí)驗(yàn)是用計(jì)算機(jī)模擬方法來考察運(yùn)用這種方法得到的估計(jì)值和真實(shí)值之間的誤差是否能夠達(dá)到相當(dāng)小的程度。
    4.1 實(shí)驗(yàn)步驟的設(shè)計(jì)
    整個(gè)實(shí)驗(yàn)分以下幾個(gè)步驟進(jìn)行:
  (1)運(yùn)用蒙特卡羅方法產(chǎn)生一組均勻分布的被試能力值θ,一組均勻分布的項(xiàng)目參數(shù)值(包括項(xiàng)目區(qū)分度a、項(xiàng)目難度b和項(xiàng)目猜測參數(shù)c)。被試能力值θ的分布范圍為,項(xiàng)目區(qū)分度a的分布范圍為,項(xiàng)目難度b的分布范圍為,項(xiàng)目猜測參數(shù)c的分布范圍為。
  (2)根據(jù)項(xiàng)目反應(yīng)模型,讓各個(gè)模擬的被試回答各個(gè)模擬的項(xiàng)目,產(chǎn)生反應(yīng)矩陣。
  (3)將該反應(yīng)矩陣作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練模式的輸入部分,用所要學(xué)習(xí)的項(xiàng)目參數(shù)或被試能力作為訓(xùn)練模式的輸出部分。若要估計(jì)被試的能力,就把反應(yīng)矩陣中的每一行作為一個(gè)模式,因?yàn)樗『檬且粋(gè)被試對于一組項(xiàng)目的反應(yīng);若要估計(jì)項(xiàng)目參數(shù),就把反應(yīng)矩陣中的每一列作為一個(gè)模式,因?yàn)樗从沉嗣恳粋(gè)項(xiàng)目被解答的情況。
  (4)用上述訓(xùn)練模式對一組神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直至達(dá)到預(yù)定的精確度為止。在本研究中為了統(tǒng)計(jì)上的方便,對30個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行了訓(xùn)練,預(yù)定的精確度為網(wǎng)絡(luò)的目標(biāo)值和實(shí)際輸出值之間的誤差小于0.001。
  (5)用經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)來估計(jì)被試能力和項(xiàng)目參數(shù)。在本研究中需要估計(jì)的被試能力和項(xiàng)目參數(shù)的真實(shí)值實(shí)際上是用蒙特卡羅方法產(chǎn)生的,因此可以計(jì)算出估計(jì)值(實(shí)際輸出值)和真實(shí)值的誤差,稱為測試誤差,并用下式表示:
  附圖
  式中,T為每個(gè)測試模式的每個(gè)輸出結(jié)點(diǎn)的目標(biāo)值。N為每個(gè)測試模式的每個(gè)輸出結(jié)點(diǎn)的實(shí)際輸出值。p是測試模式的數(shù)目,o是輸出結(jié)點(diǎn)的數(shù)目。根據(jù)測試誤差E的大小,可以看出經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)是否真正可以對項(xiàng)目參數(shù)和被試能力進(jìn)行很好的估計(jì)。
    4.2 預(yù)備實(shí)驗(yàn)
  由于在正式對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練以前,對于要用什么樣的模式來訓(xùn)練沒有任何先驗(yàn)的知識,為此先進(jìn)行預(yù)備實(shí)驗(yàn)。和正式實(shí)驗(yàn)的步驟一樣,首先運(yùn)用蒙特卡羅方法產(chǎn)生25個(gè)被試對15個(gè)項(xiàng)目的反應(yīng)矩陣,用這一矩陣和相應(yīng)的被試能力或項(xiàng)目參數(shù)組成4組訓(xùn)練模式,分別用以估計(jì)θ,a,b和c。在對被試能力進(jìn)行估計(jì)時(shí),將矩陣的行作為一組神經(jīng)網(wǎng)絡(luò)訓(xùn)練模式的輸入部分,因?yàn)榫仃嚨囊恍袛?shù)據(jù)就代表了一個(gè)被試對所有項(xiàng)目的反應(yīng);相應(yīng)被試的θ值作為訓(xùn)練模式的輸出部分,因?yàn)樗砹吮辉嚨哪芰χ怠T趯?xiàng)目參數(shù)進(jìn)行估計(jì)時(shí),將矩陣的列作為一組神經(jīng)網(wǎng)絡(luò)訓(xùn)練模式的輸入部分,因?yàn)榫仃嚨囊涣袛?shù)據(jù)就代表了所有被試對一個(gè)項(xiàng)目的反應(yīng);相應(yīng)項(xiàng)目的a,b或c值作為訓(xùn)練模式的輸出部分,因?yàn)樗砹隧?xiàng)目的參數(shù)值。就用這些訓(xùn)練模式分別對4組神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,這4組神經(jīng)網(wǎng)絡(luò)分別對應(yīng)于被試能力和項(xiàng)目的三個(gè)參數(shù),每組有30個(gè)網(wǎng)絡(luò)。然后,再用蒙特卡羅方法產(chǎn)生另外25個(gè)被試對另外15個(gè)項(xiàng)目的反應(yīng)矩陣,并用已經(jīng)訓(xùn)練過的網(wǎng)絡(luò)對這個(gè)反應(yīng)矩陣估計(jì)θ,a,b和c,記錄下測試誤差。其結(jié)果表明,雖然可以進(jìn)行被試能力和項(xiàng)目參數(shù)的估計(jì),但誤差較大,無法達(dá)到實(shí)際應(yīng)用的精確度。根據(jù)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的一般規(guī)律,估計(jì)出現(xiàn)這一情況的原因有兩條,一是訓(xùn)練模式太少,二是訓(xùn)練模式和測試模式之間沒有任何聯(lián)系,即沒有用“錨題”或“錨人”把它們聯(lián)系起來,改進(jìn)的方法可以是增加訓(xùn)練模式,或運(yùn)用一定的“錨題”或“錨人”方法,在本研究中先用“錨題”的方法進(jìn)行試驗(yàn)(具體方法在進(jìn)行正式實(shí)驗(yàn)時(shí)詳述),試驗(yàn)的效果很好,然后進(jìn)行下面的正式實(shí)驗(yàn)。
    4.3 正式實(shí)驗(yàn)
    (1)步驟1:產(chǎn)生訓(xùn)練矩陣和測試矩陣
  運(yùn)用蒙特卡羅方法產(chǎn)生25個(gè)被試(稱為第一組被試)對45個(gè)項(xiàng)目(稱為第一組項(xiàng)目)的反應(yīng)矩陣(稱為第一矩陣),這一矩陣在下面的實(shí)驗(yàn)中將作為測試矩陣;從該45個(gè)項(xiàng)目中隨機(jī)取出15個(gè)項(xiàng)目(稱為第二組項(xiàng)目),再用蒙特卡羅方法產(chǎn)生另外25個(gè)被試(稱為第二組被試),令它們和上述隨機(jī)取出的第二組項(xiàng)目起反應(yīng),產(chǎn)生另一個(gè)反應(yīng)矩陣(稱為第二矩陣),用它作為訓(xùn)練模式的一部分,由此可見,訓(xùn)練矩陣和測試矩陣之間有15個(gè)項(xiàng)目作為“錨題”,如下面圖1所示。
  附圖
    圖1 被試、項(xiàng)目和反應(yīng)矩陣
  圖1中的第三組項(xiàng)目和第三矩陣將在下面作解釋。
    (2)步驟2:建立能力訓(xùn)練模式
  用“第二矩陣”中的每一行作為一個(gè)模式的輸入,其相應(yīng)的25個(gè)第二組被試的能力值作為輸出,組成能力訓(xùn)練模式,對一組神經(jīng)網(wǎng)絡(luò)(共30個(gè),稱為第一組神經(jīng)網(wǎng)絡(luò))進(jìn)行訓(xùn)練。
    (3)步驟3:建立能力測試模式并進(jìn)行測試
  將“第一矩陣”中的每一行作為一個(gè)模式的輸入,相應(yīng)的第一組被試的25個(gè)能力值作為輸出,組成能力測試模式,用上述經(jīng)過訓(xùn)練的第一組神經(jīng)網(wǎng)絡(luò)對其進(jìn)行測試。這時(shí),實(shí)際上是神經(jīng)網(wǎng)絡(luò)對第一組被試的能力值進(jìn)行估計(jì)。然后,將估計(jì)值和真實(shí)值進(jìn)行比較,記錄下測試誤差,如表1左邊第1列所示,要注意的是,表中記錄的是30個(gè)網(wǎng)絡(luò)的測試誤差實(shí)際值,根據(jù)公式可見,它是所有輸出結(jié)點(diǎn)和所有測試模式的誤差總和。由于本研究中只有一個(gè)輸出結(jié)點(diǎn),有25個(gè)測試模式(因?yàn)橛?5個(gè)被試),因此要將表中的測驗(yàn)誤差實(shí)際值除以25,得到對單個(gè)測試模式的測試誤差,然后,再計(jì)算其平均數(shù)M和標(biāo)準(zhǔn)差SD,結(jié)果如表2所示,可以看出測試誤差是比較小的。由此可見,當(dāng)測試模式中有部分項(xiàng)目(本例中為15個(gè)項(xiàng)目)和訓(xùn)練模式相同時(shí),經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以對被試的θ進(jìn)行很好的估計(jì)。應(yīng)該指出的是,測試模式和訓(xùn)練模式中沒有被試是重復(fù)相同的,這說明經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)確實(shí)可以對新的被試進(jìn)行能力估計(jì)。
    表1 測試誤差
θ        a       b         c
0.129     2.239     2.982       0.065
0.084     1.843     2.976       0.056
0.243     2.016     2.798       0.069
0.324     1.804     2.133       0.058
0.126     2.159     2.556       0.027
0.201     2.224     2.399       0.067
0.288     2.246     2.617       0.043
0.114     1.741     2.834       0.065
0.189     1.937     2.347       0.076
0.249     2.295     2.745       0.092
0.264     2.319     2.433       0.065
0.321     2.382     2.030       0.044
0.105     2.136     2.231       0.093
0.132     2.061     2.244       0.023
0.153     2.019     2.868       0.068
0.279     2.270     2.042       0.044
0.204     2.196     1.850       0.099
0.102     1.950     2.597       0.059
0.105     1.732     1.709       0.089
0.282     1.764     2.328       0.072
0.228     2.281     2.556       0.114
0.256     2.089     1.961       0.071
0.222     2.445     2.002       0.093
0.210     1.666     2.243       0.035
0.138     1.743     2.441       0.075
0.201     2.438     2.034       0.080
0.171     1.740     2.100       0.106
0.246     2.307     2.594       0.069
0.195     1.577     2.535       0.057
0.213     2.436     2.199       0.057

 

下一頁

【基于聯(lián)結(jié)主義的連續(xù)記分IRT模型的項(xiàng)目參數(shù)和被試能力估計(jì)】相關(guān)文章:

談基于勝任力模型的企業(yè)組織生涯管理策略08-22

彈性生產(chǎn)、全球資本主義和社會主義改革05-31

數(shù)控機(jī)床參數(shù)的分類06-16

經(jīng)驗(yàn)主義、實(shí)在論和因果知識05-28

基于業(yè)務(wù)和財(cái)務(wù)視域分析企業(yè)IT預(yù)算管理05-16

審計(jì)風(fēng)險(xiǎn)模型的演進(jìn)及應(yīng)用08-26

食油采購加工模型05-11

Home.Net模型/架構(gòu)研究06-01

如何控制地下連續(xù)墻施工質(zhì)量,地下連續(xù)墻監(jiān)控要點(diǎn)08-23

壓縮遞增年資的數(shù)量模型與分析06-07