- 相關(guān)推薦
淺議醫(yī)院病歷檔案數(shù)字化若干問題
[摘 要]本文根據(jù)作者多年在醫(yī)院信息化部門工作經(jīng)驗,對醫(yī)院病歷檔案數(shù)字化工作中涉及到的相關(guān)問題進行探討,主要涉及:數(shù)字化病歷檔案范圍的選擇、數(shù)據(jù)信息深度加工的內(nèi)容、相關(guān)掃描參數(shù)的設(shè)定、圖像處理的要點、數(shù)字化加工組織形式的優(yōu)劣分析、OCR識別效果的比較、PDF病歷檔案的命名方法及其他數(shù)字化工作中應(yīng)注意的問題等。
[關(guān)鍵詞]病歷數(shù)字化;掃描;識別;管理
近年來,隨著各級醫(yī)院信息化建設(shè)的發(fā)展和移動醫(yī)療等互聯(lián)網(wǎng)醫(yī)療方式的興起,醫(yī)院的病歷檔案數(shù)字化建設(shè)在不斷升溫。全國各級醫(yī)院的信息化部門都在積極推進醫(yī)院歷史病歷檔案的數(shù)字化工作,但是各單位病歷檔案數(shù)字化工作過程中遇到一些具體問題時往往做法有很大差別,筆者根據(jù)多年來在醫(yī)院信息化部門工作實踐工作中的一些經(jīng)驗,就病歷檔案數(shù)字化工作中的若干問題的觀點闡述如下:
一、正確把握病歷檔案數(shù)字化的范圍和深度
提供利用是病歷檔案數(shù)字化核心價值的重要體現(xiàn)之一,利用的前提是病歷檔案的數(shù)字化,但是病歷檔案數(shù)字化不能簡單的理解為掃描,不是所有的病歷組成材料都需要掃描,即病歷檔案信息的深度描述。圍繞如何全面、準確、深入地描述和加工檔案信息是檔案數(shù)字化最重要的原則。在開展檔案數(shù)字化工作之前,應(yīng)先對本單位的各科室病歷檔案分類及利用情況做到詳細了解,在此基礎(chǔ)上開展調(diào)研,從本單位的實際需求出發(fā),科學(xué)制定哪些分類進行數(shù)字化,哪些病歷檔案不進行數(shù)字化,哪些病歷檔案進行原文的掃描,哪些病歷檔案只進行到信息條目的著錄。
二、正確把握掃描圖像的相關(guān)參數(shù)
2.1圖像格式、分辨率的選擇
《檔案數(shù)字化技術(shù)規(guī)范》(DA/T31-2005)是各類檔案數(shù)字化的參考標準,規(guī)定采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般均選擇≥100dpi。如遇到文字偏小、密集、清晰度較差等特殊狀況,需要進行OCR漢字識別的檔案,掃描分辨率可以選擇≥200dpi。而近年來實際工作中,因為醫(yī)生手寫字跡清晰度的問題很多單位在近年來病歷檔案數(shù)字化中均采用300dpi全彩掃描,圖像格式采用JEPG2000無損壓縮。
2.2圖像命名與存儲路徑
病歷檔案數(shù)字化的最初成果是以病歷檔案夾命名的圖像病歷檔案,應(yīng)正確規(guī)定每一張圖片的命名,例如筆者曾經(jīng)在一次數(shù)字化中采用將總頁數(shù)放進病歷檔案命名中的錯誤,如將一份18頁的病歷檔案的每一個圖片命名:1-18、2-18……目的為了提醒檢查環(huán)節(jié)注意不要缺頁,但是這種命名會導(dǎo)致病歷檔案名稱為10-18、11-18等頁在排序中出現(xiàn)錯誤,這樣在生成PDF病歷檔案的時候就會頁碼出錯。建議圖片的命名選擇六位字符(位數(shù)不宜過長),如000001、000002以此類推。另外,根據(jù)數(shù)字化的工作模式,一般應(yīng)以病歷檔案的件號作為圖像存儲的最底層病歷檔案夾,且病歷檔案夾的命名位數(shù)要與檔案數(shù)據(jù)一致,比如病歷號為“15”,數(shù)據(jù)條目應(yīng)“病歷號”應(yīng)著錄“015”,存儲病歷檔案的病歷檔案夾命名也應(yīng)為“015”。
2.3掃描圖像的處理
掃描后的原始病歷圖像需要進行優(yōu)化處理,使得成品圖像清晰、端正。圖像處理后保證圖像信息與原病歷檔案內(nèi)容完全一致,不刪除頁面任何有用信息。根據(jù)檔案掃描后的具體情況,除常規(guī)處理外要特別進行如下圖像處理:
(1)圖像歪斜:采用自動或手動糾偏功能,調(diào)整圖像角度。方向不正確的圖像應(yīng)進行旋轉(zhuǎn)還原,以符合閱讀習(xí)慣。
(2)圖像臟點、臟斑:對圖像頁面中出現(xiàn)的影響圖像質(zhì)量的雜質(zhì)如黑點、黑線、黑框、黑邊等應(yīng)進行去污處理。處理過程中應(yīng)遵循保持檔案原貌的原則。
(3)字跡洇透:采用字跡銳化的功能,清晰字跡筆畫。
(4)圖像深淺不一:采用平衡功能,調(diào)整圖像深淺一致。
應(yīng)注意以下兩個誤區(qū):一是邊界的過分剪裁,有的單位在進行數(shù)字化工作中對于病歷檔案頁碼剪裁的過多,或者采用批量剪裁的方式,這種情況會對有領(lǐng)導(dǎo)批示及其他重要信息的病歷檔案造成損失;二是部分單位對病歷檔案的底色的過分漂白,力求頁面美觀,這種做法完全沒有必要,保持檔案病歷檔案的原始面貌是維護檔案真實、完整的重要內(nèi)容。
三、病歷檔案數(shù)字化加工組織形式的優(yōu)劣比較
3.1沒有數(shù)字化加工系統(tǒng),單兵作戰(zhàn)
有的數(shù)字化單位采用若干計算機組成局域網(wǎng),以病歷檔案共享的形式進行數(shù)字化工作,不同的計算機分別進行檔案條目信息著錄、圖像掃描、圖像處理、批量掛接等環(huán)節(jié),這種通過病歷檔案共享方式調(diào)取的形式容易出錯,不同的環(huán)節(jié)都有對數(shù)據(jù)的可操作性,容易修改或刪除圖像,影響正確率。
3.2采用數(shù)字化加工系統(tǒng),系統(tǒng)作戰(zhàn)
隨著檔案數(shù)字化工作的發(fā)展,專業(yè)性較強的單位為提高工作效率、加強質(zhì)量控制,一般都根據(jù)自身經(jīng)驗開發(fā)了應(yīng)用軟件,專門進行檔案數(shù)字化流程控制的專業(yè)檔案數(shù)字化加工系統(tǒng)應(yīng)運而生,將檔案數(shù)字化的全部工序納入系統(tǒng)管理中,環(huán)環(huán)相扣,將控制、檢驗納入數(shù)字化環(huán)節(jié)中,最終實現(xiàn)效率與質(zhì)量的同步提高。
筆者多次參與病歷檔案數(shù)字化加工管理工作,認為采用數(shù)字化加工系統(tǒng)進行的病歷檔案數(shù)字化加工項目,效率明顯優(yōu)于沒有數(shù)字化加工系統(tǒng)的項目,更為重要的是在檔案數(shù)字化加工項目中效率和最終的準確率之間存在著正比關(guān)系。
四、關(guān)于病歷檔案的OCR識別方式
病歷檔案數(shù)字化可以為全文檢索提供支持,重要的要應(yīng)用支持是OCR技術(shù),大多數(shù)字化廠商選擇國內(nèi)的漢王、文通的OCR程序進行二次開發(fā),通過API調(diào)用其程序完成識別。近年來使用俄羅斯ABBYY公司識別技術(shù)的單位越來越多,筆者對漢王和ABBYY兩者進行對比,漢王識別的速度要快,但是準確率比ABBYY要低;ABBYY識別速度很慢,但準確率相對較高,建議數(shù)字化中使用ABBYY的識別技術(shù),其接口簡單易用,可以選擇不同程度的設(shè)置來控制病歷檔案轉(zhuǎn)換的過程及結(jié)果。
【淺議醫(yī)院病歷檔案數(shù)字化若干問題】相關(guān)文章:
數(shù)字化檔案03-21
關(guān)于“中國哲學(xué)”的若干問題淺議03-18
淺議醫(yī)院人事檔案的電子信息化管理03-16
淺議醫(yī)院財務(wù)軟件特點及應(yīng)用中若干問題03-01
淺議綠色會計的若干問題03-20
淺議如何提升醫(yī)院財務(wù)檔案管理的質(zhì)量03-16
淺議大學(xué)英語口語教學(xué)中的若干問題及對策研究03-16
對數(shù)字化檔案館的初步研究02-28