對個(gè)性化新聞建模研究論文
1用戶興趣模型的表示
本文采用基于本體的加權(quán)關(guān)鍵詞興趣表示方法。用戶興趣模型是新聞?lì)I(lǐng)域本體的部分映射,由其中部分興趣類別和特征詞組成。用戶興趣的層次結(jié)構(gòu)如圖2所示。該方法通過不同組合的概念節(jié)點(diǎn)及其權(quán)值構(gòu)成用戶個(gè)體興趣本體來表示用戶的興趣概念。通過調(diào)整各個(gè)節(jié)點(diǎn)的權(quán)值或增加相應(yīng)的主題節(jié)點(diǎn)適應(yīng)用戶興趣的變化。
2用戶興趣模型的更新
用戶興趣分為長期興趣和短期興趣,興趣是不斷發(fā)生變化的。長期興趣反映出用戶長期的偏好特征,短期興趣隨著時(shí)間的推移發(fā)生改變。一般情況下,每個(gè)用戶都會對某種類型的新聞內(nèi)容有穩(wěn)定的興趣。比如某用戶喜歡足球新聞,且喜歡科技類新聞等類別,這屬于長期興趣,不易改變。除長期興趣外,用戶可能在某個(gè)特定時(shí)期臨時(shí)關(guān)注某些信息,這屬于短期興趣。比如某用戶某段時(shí)間想購買電腦,所以對關(guān)于電腦的信息特別關(guān)注,但購買之后關(guān)于這方面的'信息就不再關(guān)注了。還有些短期興趣是周期性的,比如每到五一假期,很多人對旅游產(chǎn)生興趣。識別用戶的短期興趣,只能通過統(tǒng)計(jì)用戶使用系統(tǒng)的記錄,但是用戶的短期興趣持續(xù)時(shí)間短,很難與用戶偶然性的瀏覽相區(qū)分。本文所建立的用戶模型將用戶的長期興趣和短期興趣相結(jié)合,能同時(shí)反映出用戶的長期興趣和短期興趣的變化,所以使推薦更加準(zhǔn)確有效。本文用戶興趣模型采用基于本體的加權(quán)關(guān)鍵詞興趣表示方法,它隨著用戶興趣的變化也進(jìn)行相應(yīng)的更新。從存儲的容量和運(yùn)行的效率考慮,需淘汰用戶次要的和過時(shí)的興趣特征。本文用戶興趣模型主要通過調(diào)整用戶興趣的特征詞及其權(quán)重,來體現(xiàn)用戶興趣的變更。用戶興趣模型的更新方法:當(dāng)系統(tǒng)發(fā)現(xiàn)用戶一個(gè)興趣特征時(shí),查詢該用戶現(xiàn)有的興趣特征。如果此興趣特征已經(jīng)包含在興趣模型中,則對該特征詞的權(quán)重和時(shí)間進(jìn)行修改。如果發(fā)現(xiàn)此興趣特征不在用戶興趣模型中,且用戶興趣模型有剩余的存儲空間,則直接在用戶興趣模型中生成一個(gè)新的興趣特征。如果用戶興趣模型的存儲空間已滿,則需淘汰權(quán)重低的興趣特征后,添加新的興趣特征【10】。特征詞權(quán)重的更新方法如式(4)所示,不是將TF/IDF值直接累加,而是將原模型中的所有特征詞的權(quán)重乘以一個(gè)衰減系數(shù)。新的特征詞的權(quán)重也不是直接歸并進(jìn)去,歸并的時(shí)候需要乘以用戶對該篇新聞的興趣度,興趣度在用戶興趣收集時(shí)已計(jì)算。
3相似度計(jì)算
前文提到新聞頁面的表示方法采用向量空間模型的方式。首先需要對新聞頁面內(nèi)容進(jìn)行分詞,特征詞提取以及對文本特征進(jìn)行表示,然后計(jì)算特征值的權(quán)重。特征詞按照其TF/IDF值降序排列,因?yàn)闄?quán)值高的特征詞能夠更好的反映該新聞文本的的內(nèi)容,而權(quán)值低的詞與新聞本身的內(nèi)容關(guān)系較弱。所以只需要使用最能夠代表新聞特征的前N個(gè)特征詞及其權(quán)值參與計(jì)算即可。在進(jìn)行新聞頁面的匹配時(shí),從用戶興趣模型除根節(jié)點(diǎn)外的第一層開始計(jì)算,取相似度最高的興趣子類作為該頁面的類別。同時(shí)該結(jié)點(diǎn)與新聞頁面的余弦相似度計(jì)算的值作為該頁面與用戶的興趣相似度,作為該頁面是否符合用戶的興趣的衡量標(biāo)準(zhǔn)。本文來自于《情報(bào)科學(xué)》雜志。情報(bào)科學(xué)雜志簡介詳見
4結(jié)語
本文研究了基于領(lǐng)域本體構(gòu)建用戶興趣模型。在模型中設(shè)置三層用戶興趣類別,子層與父層是從屬關(guān)系,子層興趣度的衰減能夠影響父層的興趣度。根據(jù)用戶行為,分析用戶對新聞頁面的偏好程度,反映到用戶興趣模型中,能夠及時(shí)反映出用戶興趣的變化。該模型提高了人性化程度,能夠更好的為個(gè)性化新聞服務(wù)提供基礎(chǔ)。
【對個(gè)性化新聞建模研究論文】相關(guān)文章:
1.公關(guān)在新聞傳播中的發(fā)展及個(gè)性化研究的論文
2.淺析公關(guān)在新聞傳播中的發(fā)展及個(gè)性化研究論文
3.對教師教學(xué)技能個(gè)性化發(fā)展培訓(xùn)方式的研究論文
4.高校數(shù)學(xué)建模教學(xué)策略研究論文
5.試析對教師教學(xué)技能個(gè)性化發(fā)展培訓(xùn)方式的研究的論文