亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

卡方技術在企業(yè)搜索引擎角色信息分析中的運用論文

時間:2024-06-14 20:20:45 其他類論文 我要投稿

卡方技術在企業(yè)搜索引擎角色信息分析中的運用論文

  對于少于 1 000 人的企業(yè)單位,60% 的員工認為在企業(yè)信息化平臺中找到自己想要的數(shù)據(jù)是非常困難的。

卡方技術在企業(yè)搜索引擎角色信息分析中的運用論文

  而在公司人數(shù)超過 1 000 人的情況下,認為獲取不到自己想要數(shù)據(jù)的員工竟然達到公司人數(shù)的 77%.因此,企業(yè)的規(guī)模越大,企業(yè)的人數(shù)越多,企業(yè)信息化平臺中產生的數(shù)據(jù)量就越多,員工查找信息就更加困難。根據(jù)調查顯示,對于少于 1 000 人的企業(yè)里,有 67% 的員工認為找到所需的信息對企業(yè)的發(fā)展是有影響的,而對于多于 1 000 人的企業(yè)中,這個數(shù)字竟然高達 89%.在大中型企業(yè)中,每天有 70% 的員工耗費 1 ~ 2 小時來查找所需要的信息,加大了企業(yè)的成本,尤其是用戶想要查看已經離職員工之前記錄的信息,由于人員已經離開,想要查找對應信息的難度加大,搜索耗費的時間就更長。

  傳統(tǒng)企業(yè)搜索引擎雖然在一定程度上已經解決該問題。然而,不同角色的用戶有著不同的需求,例如,財務角色的用戶和銷售角色的用戶對于相同的查詢詞會有不同的需求。本文提出采用卡方的方法進行角色信息的分析,使不同角色的用戶雖采用相同的查詢詞,但得到與其角色更相關的信息。

  1 基于卡方的角色分析理論

  企業(yè)內部每個用戶在不同系統(tǒng)中的職位不一樣,對于相同角色下的用戶,偏好可能相同,如角色 A 下的用戶關注財務信息,經常搜索和點擊財務方面的數(shù)據(jù)。當角色 A 下的其他用戶搜索時,如果查詢詞跟 A 輸入的查詢詞相關時,根據(jù) LUCENE,獲取文檔應排在后面,但根據(jù)角色信息,角色 A 下的用戶點擊過多的文檔應排在前面,這樣就隱含地為用戶推送了相關文檔。針對這個可能性,進行角色分析!1】

  其中,N 是一個定值,系統(tǒng)的數(shù)據(jù)條目數(shù);A 代表在某角色中文檔包含該詞的篇數(shù);B 代表在該角色中文檔沒有包含該詞的篇數(shù);C 代表的是不在該角色下有多少篇文檔包含該詞;D 代表的是不在該角色下有多少篇文檔沒有包含該詞;而 A+C 是一個定值,B+D 也是一個定值,因此公式(1)可以簡化,如下所示:【2】

  2 基于卡方的角色分析理論算法過程

  因為企業(yè)中有多個系統(tǒng),分系統(tǒng)考慮,統(tǒng)計一個系統(tǒng)下所有角色對應的特征詞。

  第一步獲取某系統(tǒng)下的所有數(shù)據(jù),獲取文檔對應的用戶以及角色,并對正文部分進行分詞。

  第二步獲取角色 A 在該系統(tǒng)下的所有數(shù)據(jù)并分詞。

  第三步對角色 A 下的每個詞 T,統(tǒng)計詞 T 在該角色下出現(xiàn)的樣本頻率,獲取詞 T 在該角色中沒有出現(xiàn)的樣本頻率,獲取詞 T 不在該角色下出現(xiàn)的樣本頻率,獲取詞 T 不在該角色下沒有出現(xiàn)的樣本頻率。

  第四步,根據(jù)公式(2)計算該系統(tǒng)下角色 A 中詞T 的權重;獲取每個系統(tǒng)下的每個角色對應的特征詞,并保存。

  第五步獲取用戶所能訪問系統(tǒng)中角色對應的特征詞,并根據(jù)特征詞進行全文檢索,獲取排名前300的文檔。

  當獲取某系統(tǒng)下角色 A 權重最大的 10 個詞時,需考慮特征詞在該系統(tǒng)下所有角色中出現(xiàn)的次數(shù),如果次數(shù)大于角色個數(shù)的一個比值時,則這樣的詞排除掉,因為這樣的詞不具有特性。

  當用戶查詢時,根據(jù)輸入查詢詞,得到搜索結果,分析前 300 篇文檔中是否包含該文檔,如果包含,則將文檔的分數(shù)提高。

  3 結 語

  針對目前企業(yè)搜索中存在的問題,不同角色的用戶有著不同的需求,本文提出基于卡方的角色分析方法,使不同角色的用戶雖采用相同的查詢詞,但得到與其角色更相關的信息。該方法已經應用在實際平臺中,進一步證明了該方法的有效性。

  參考文獻

  [1] 吳慶濤 . 個性化搜索引擎中的用戶興趣模型分析與研究 [J]. 研究與開發(fā) ,2010(10)。

  [2] 李紹華 , 高文宇 . 搜索引擎頁面排序算法研究綜述 [J]. 計算機應用研究 ,2007(24)。

【卡方技術在企業(yè)搜索引擎角色信息分析中的運用論文】相關文章:

財務分析在企業(yè)中的運用研究論文05-22

分析共好理念在企業(yè)團隊管理中的運用論文05-02

企業(yè)專利信息管理與運用論文02-21

信息技術在電力企業(yè)中的應用論文02-20

傳統(tǒng)紋樣在現(xiàn)代設計中的運用分析論文05-12

信息技術在作文教學的運用論文04-21

水文勘測技術在水污染環(huán)境地質中的運用分析論文03-09

目標管理在企業(yè)管理中運用分析11-14

管理會計在企業(yè)中的運用狀況調查與分析論文02-21

  • 相關推薦