基于組合分類器的生物命名實(shí)體識(shí)別
論文摘要: 生物命名實(shí)體識(shí)別是一項(xiàng)非常重要和基礎(chǔ)的生物醫(yī)學(xué)文本挖掘技(略)鍵的一個(gè)步驟,只有正確地識(shí)別出生物命名實(shí)體,才能有效地完成基因標(biāo)準(zhǔn)化、生物事件抽取以及蛋白質(zhì)-蛋白質(zhì)交互關(guān)系抽取等更加復(fù)雜的工作.生物醫(yī)學(xué)命名實(shí)體包括(略)、DNA、RNA等,通常有著復(fù)雜的結(jié)構(gòu),對(duì)于這些實(shí)體的鑒別和分類是非常富有挑戰(zhàn)性的.機(jī)器學(xué)習(xí)方法例如CRF、MEMM和SVM已經(jīng)廣泛的應(yīng)用于從已標(biāo)注的語(yǔ)料中學(xué)習(xí)識(shí)別出生物醫(yī)學(xué)命名實(shí)體.然而,生物命名實(shí)體識(shí)別系統(tǒng)的性能仍然沒有普通命名實(shí)體識(shí)別系統(tǒng)的好.(略)高生物命名實(shí)體識(shí)別的性能,研究者提出了合并多個(gè)分類器結(jié)果的多分類器方法. 本文主要研究基于組合分類器的生物命名實(shí)體識(shí)別方法,實(shí)驗(yàn)是在BioCreAtIvE 2GM的訓(xùn)練語(yǔ)料和測(cè)試語(yǔ)料上進(jìn)行的.本文主(略)下兩點(diǎn): ⒈構(gòu)建單一分類器模型 本文利用不同的分類模型、不同的分類方法和特征集構(gòu)建了六個(gè)不同的機(jī)器學(xué)習(xí)模型,并對(duì)每種模型采用的特征集,特征抽取方法,以及訓(xùn)練過程進(jìn)行了詳細(xì)介紹. (略)提高最大熵方法的識(shí)別性能,本文采用TBL方法對(duì)最大熵的標(biāo)注結(jié)果進(jìn)行了糾錯(cuò)處理.實(shí)驗(yàn)結(jié)果顯示糾錯(cuò)處理在很大程...
Biomedical Named Entity Recognition (Bio-NER) is (omitted)ly important and fundamental task of biomedical text mining, and is also a critical step for biomedical text mining, only when(omitted)ies are correctly i(omitted)could other more complex tasks, such as, gene normalization, biomedical eve(omitted)tion and protein-protein interaction extraction, be performed effectively. Biomedical named entities include mentions of proteins, genes, DNA, RNA, etc which oft(omitted)omplex structures, but it is cha...
目錄:
摘要 第4-5頁(yè)
Abstract 第5-6頁(yè)
1 緒論 第9-16頁(yè)
·研究背景與意義 第9-10頁(yè)
·研究現(xiàn)狀 第10-14頁(yè)
·本文主要研究?jī)?nèi)容 第14頁(yè)
·本文組織結(jié)構(gòu) 第14-16頁(yè)
2 機(jī)器學(xué)習(xí)模型 第16-25頁(yè)
·支持向量機(jī)模型 第16-18頁(yè)
·最優(yōu)分類超平面 第16頁(yè)
·核函數(shù) 第16-17頁(yè)
·SVM多分類問題擴(kuò)展方法 第17-18頁(yè)
·最大熵模型 第18-20頁(yè)
·條件隨機(jī)場(chǎng)模型 第20-24頁(yè)
·CRF的無(wú)向圖結(jié)構(gòu) 第21-22頁(yè)
·CRF與勢(shì)函數(shù) 第22-23頁(yè)
·CRF的參數(shù)估計(jì) 第23-24頁(yè)
·本章小結(jié) 第24-25頁(yè)
3 單一分類器的構(gòu)建 第25-40頁(yè)
·實(shí)驗(yàn)語(yǔ)料及語(yǔ)料的預(yù)處理方法 第25-26頁(yè)
·有效的特征信息 第26-28頁(yè)
·不同單一分類器的構(gòu)建 第28-38頁(yè)
·基于條件隨機(jī)場(chǎng)的生物命名實(shí)體識(shí)別 第29-32頁(yè)
·基于支持向量機(jī)的生物命名實(shí)體識(shí)別 第32-34頁(yè)
·最大熵方法的生物命名實(shí)體識(shí)別 第34-38頁(yè)
·本章小結(jié) 第38-40頁(yè)
4 基于組合分類器的生物命名實(shí)體識(shí)別方法 第40-46頁(yè)
·組合分類器方法 第40-43頁(yè)
·后處理 第43-45頁(yè)
·本章小結(jié) 第45-46頁(yè)
5 實(shí)驗(yàn)與結(jié)果分析 第46-54頁(yè)
·單個(gè)分類器實(shí)驗(yàn)結(jié)果 第46-47頁(yè)
·組合分類器方法的識(shí)別結(jié)果 第47-52頁(yè)
·集合并/交操作方法實(shí)驗(yàn)結(jié)果 第47-49頁(yè)
·投票方法實(shí)驗(yàn)結(jié)果 第49-50頁(yè)
·疊加方法實(shí)驗(yàn)結(jié)果 第50-51頁(yè)
·結(jié)果比較與分析 第51-52頁(yè)
·錯(cuò)誤分析與總結(jié) 第52頁(yè)
·本章小結(jié) 第52-54頁(yè)
結(jié)論 第54-55頁(yè)
參考文獻(xiàn) 第55-58頁(yè)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況 第58-59頁(yè)
致謝 第59-61頁(yè)
【基于組合分類器的生物命名實(shí)體識(shí)別】相關(guān)文章:
基于圖像識(shí)別技術(shù)的豆科牧草分類研究論文提綱11-24
探析基于VaR模型的證券投資組合風(fēng)險(xiǎn)12-05
基于SVM的P2P流量的識(shí)別系統(tǒng)12-07
基于簇的無(wú)線傳感器網(wǎng)絡(luò)能量平衡策略11-16
組合化學(xué)在生物醫(yī)學(xué)中的應(yīng)用分析11-14
基于傳輸半徑倍數(shù)的無(wú)線傳感器網(wǎng)絡(luò)交替路由11-16
試論基于計(jì)算機(jī)應(yīng)用能力分類的課程設(shè)置03-29
一種基于組件的無(wú)線傳感器網(wǎng)絡(luò)網(wǎng)關(guān)的建設(shè)策略03-28
- 相關(guān)推薦