淺談分行主機房的精細化管理論文
保障安全生產是銀行信息科技工作的重中之重,市分行主機房又是工商銀行全行信息系統(tǒng)的心臟,因此,一直以來主機房雖然是在各種信息技術的包圍之中,但很多機房管理還處于手工操作的粗放式管理模式階段,于是機房管理成為信息化的洼地。工商銀行紹興市分行(以下簡稱“紹興分行”)創(chuàng)新機房管理模式,努力促進信息技術與機房業(yè)務的融合,精心打造了適合市分行主機房業(yè)務的信息化操作和管理平臺,目前大量的機房操作和管理能通過該平臺一鍵點擊進行,使機房的操作流程固定,安全高效,工作效率得到大幅提升,工作出錯率大幅降低,實現了機房管理的信息化、精細化。
一、機房操作的精細化管理
機房的日常操作是機房的主要工作之一,為了使機房操作更加規(guī)范,減少工作中的差錯,紹興分行建立了機房電子化操作檔案與機房電子化操作確認單相結合的操作管理模式。
(1)建立機房電子化操作檔案。在電子化操作檔案中設置操作次序、班次、使用機器、業(yè)務種類、業(yè)務操作流程等基礎數據,當電子化操作檔案配置完成,即可在電子化操作確認單中體現。如果當天有新的工作需要操作,只需在電子化操作檔案中增加該項工作,電子化操作確認單就立即同步增加生效。
(2)每天根據電子化操作確認單對機房的工作流程進行操作確認。每天上午和下午兩班分別將各自的工作在電子化操作確認單上進行確認操作,在電子化操作確認單上操作完成后,由誰操作、操作的具體時間便可一清二楚,責任十分明確,以便于日后進行分析查詢匯總追責。有些工作每星期或每個月只需要做一次或幾次,電子化操作確認單能按日期自動判斷進行點亮或變灰。有些需要省行數據配合的工作,電子化操作確認單能夠自動判斷省行數據是否已經到達,一旦發(fā)現省行數據已到就立刻啟動報警提醒。對于一些對時間點要求苛刻的工作,到該時間點電子化操作確認單也會自動報警提醒。
(3)電子化操作確認單不僅可以進行操作確認,還可以雙擊進入相應的操作頁面去進行實際的操作,部分工作在電子化操作確認單上只需一鍵即可完成。此外,該電子化操作確認單還支持同一天同一班次的確認單多人并發(fā)同時操作而互不干擾。
(4)電子化操作確認單與電子化操作指南相關聯,點擊電子化操作確認單上的序號,即可打開對應的操作手冊,極大地方便了新手操作。
(5)電子化操作確認單與電子化運行日志相關聯。當天同一班次的電子化操作確認單保存后,就自動建立了該班次的電子化運行日志,相關的值班人員、操作時間便自動登記在電子化運行日志上,打開電子化運行日志,只需填入當天的運行情況即可。
二、機房巡檢的精細化管理
機房巡檢是機房的一項十分重要的工作,通過巡檢可以發(fā)現機房設備的故障或故障隱患,對保障安全生產運行起著至關重要的作用。為了使機房巡檢更加規(guī)范,減少巡檢中的漏洞,我們建立了機房條形碼掃描巡檢的管理模式。
(1)建立機房位置的條形碼檔案。在機房位置條形碼檔案中設置條形碼、巡檢位置、巡檢內容,并打印出該位置的條形碼,把該條形碼粘貼到相應的 UPS、服務器、網絡設備和機架,這些粘貼了條形碼的設備就必須進行掃描巡檢,否則將啟動報警提醒,這樣就避免了由于工作疏忽或責任心不強而導致應檢未檢事件的發(fā)生。
(2)通過無線掃描槍掃描巡檢。每天早上、中午、晚上機房工作人員分三次對機房內粘貼有條形碼的設備進行掃描巡檢,如果未在規(guī)定時間掃描巡檢,該巡檢系統(tǒng)將自動報警提醒。
(3)機房條形碼掃描巡檢系統(tǒng)與機房電子化事件單關聯,當發(fā)現有故障或故障隱患的設備時,點擊巡檢單界面的故障事件單,即可進入電子化故障事件單界面,輸入故障現象后即可把故障信息發(fā)送到軟硬件技術員或網絡技術員或相關領導的手機上,并啟動事件跟蹤處理流程,直至故障排除恢復正常。
(4)機房條形碼掃描巡檢系統(tǒng)詳細記錄了機房運行的各種數據和操作人員、操作時間,進行分析查詢匯總統(tǒng)計十分方便。還能根據巡檢記錄自動生成省行需要的各種報表,詳見下面的“機房報表的精細化管理”一節(jié)。2014 年上半年通過該巡檢系統(tǒng),已及時發(fā)現服務器故障 19 起、主機房 UPS 故障 1 起、主機房空調故障1起、溫濕度監(jiān)控模塊故障1起,對保障安全生產運行起到了十分重要的作用。
三、機房監(jiān)控報警的精細化管理
機房監(jiān)控也是機房的一項重要工作,通過監(jiān)控發(fā)現問題需要及時通知相關技術人員、網點進行處理,對于一時不能修復的故障需要進行跟蹤督促處理,直至故障排除。目前市分行主機房已經安裝有總省行的網絡、ATM、自助終端、網點UPS、服務器、機房UPS等監(jiān)控系統(tǒng),為了充分利用這些監(jiān)控系統(tǒng),及時準確地傳遞故障信息,盡快排除故障,紹興分行還建立了自動報警與電子化事件單相結合的管理模式。
(1)確保短信接口的運行正常。省行的短信接口已經廣泛應用于各種監(jiān)控系統(tǒng)的.自動報警和各類業(yè)務通知中,對全省生產運行特別是監(jiān)控報警的作用越來越重要。為了確保短信接口的正常運行,我們在每天上午的電子化操作確認單中增加了短信接口檢查的流程,只需在電子化操作確認單上點擊即可一鍵完成檢查。每次短信接口發(fā)生故障時,便會打電話給省行主機房,省行還不知情。事實上多年以來紹興分行每天一直默默承擔著全省短信接口的運行檢查工作。
(2)通過將截屏技術與多功能通訊錄相結合,母行開發(fā) ATM、自助終端、防病毒、機房 UPS 等故障報警程序,每一條報警信息都有詳細記錄,方便與網點核查。進入報警查詢界面點擊某行記錄,即可顯示當天該設備的所有報警信息,從故障開始時間到故障結束時間一目了然。通過調整統(tǒng)一的多功能通訊錄里的手機號即可同步調整多個報警程序的短信發(fā)送手機號,大幅減少了因網點自助設備維護人員調整而重新設置報警短信手機號的工作量。
(3)對于一時無法解決的報警問題,通過建立電子化事件單進行跟蹤處理,同時關聯報警記錄中的故障信息。
四、事件處理的精細化管理
工行信息科技部目前需要處理的事件比較繁多,主要有:notes 反饋事件、ttms 反饋事件、軟件故障事件、硬件故障事件、ATM 監(jiān)控事件、自助終端監(jiān)控事件、UPS 監(jiān)控事件、網絡 5 級事件、設備更改事件、各類報表上報事件、維護期事件、SD 反饋事件等等。有些事件由機房直接處理,有些由機房督促催辦。為了高效及時地處理這些繁雜的事件,建立了電子化公告欄、電子化事件單與事件報警相結合的管理模式。
(1)建立電子化公告欄。電子化公告欄可以快捷地顯示各類事件的要點、工作中需注意的事項和各類通知。該電子化公告欄能在未登錄系統(tǒng)時就顯示出及實現走廊式公告欄,并能按照不同的 IP 地 址 顯 示 不 同 的 內 容, 既滿足了快捷性的要求又保障了安全性。
(2)建立電子化事件單。登錄機房系統(tǒng)后首先彈出的界面就是電子化事件單,分別用紅色顯示所有未完成的事件、用黃色顯示當天須完成的事件。電子化事件單涵蓋了上述各項事件,并可以通過事件類型的設置增加事件種類。電子化事件單分別與 ATM 檔案、自助終端檔案、網點 UPS 檔案和多功能通訊錄關聯,當選擇某類事件后,相對應的行部、網點、供應商、維護人員、技術人員的信息全部自動顯示出來,需要發(fā)送短信的人員的手機全部自動做好發(fā)送標記,能夠自動填寫的都能自動填寫,最大限度地避免了像填寫 sd 單那樣的繁瑣勞動。電子化事件單保存后自動把事件信息發(fā)送到相關人員的手機上,在未處理完成關閉前,每天都會在機房系統(tǒng)首頁顯示,并有機房人員進行催辦。
(3)周期性事件處理。有些事件本月處理完成后下個月或以后還需處理,有些事件間隔一月或一季度或半年需要處理一次,這些事件都屬于周期性事件。周期性事件不能像一般事件那樣完成后直接關閉了事,否則同樣內容的事件需要重新輸入一遍,而且很容易忘記。紹興分行的做法是,對事件進行分類,當分類選周期性事件時,該事件就不允許關閉,該事件完成后只能通過增加日期的方式把事件下推到下一周期,這樣當下一周期的日期來臨時,該事件就會自動顯示并報警提示。
五、故障處理的精細化管理
保障安全生產是信息科技工作的重中之重,當生產系統(tǒng)發(fā)生故障時,機房人員必須快速地厘清故障類型、故障性質,能夠自行處理的(如重啟進程、重啟機器等)即刻進行處理,無法自行處理的須立即聯系相關技術人員或上報上級行,并對故障修復進行跟蹤處理直至故障排除。為了快速地進行故障處理、上報和跟蹤,紹興分行建立了技術支持系統(tǒng)、電子化故障事件單、電子化運行日志和電子化問題庫相結合的故障處理模式。
(1)網點發(fā)生生產系統(tǒng)故障時,可以通過電話、notes、技術支持系統(tǒng)向市分行主機房上報故障現象。其中通過技術支持系統(tǒng)可以附加截屏等附件,機房系統(tǒng)能以自動掃描技術支持系統(tǒng)的數據庫,一旦發(fā)現有故障上報立即發(fā)出報警聲提示機房人員予以處理。
(2)如果故障短時間內無法解決,需要建立故障電子化事件單進行跟蹤處理;如果故障是網點通過技術支持系統(tǒng)上報的,機房系統(tǒng)能自動把技術支持系統(tǒng)的故障信息關聯到機房系統(tǒng),直接進行跟蹤處理。
(3)對于發(fā)生的疑難故障,可以通過查找電子化問題庫搜索以前發(fā)生的類似故障處理方法,幫助快速地定位和處理故障。當故障排除系統(tǒng)恢復正常后,把相關的信息歸類到電子化問題庫,以便今后再次發(fā)生時迅速查找解決方法。
(4)對于比較重要的故障,需要歸類到電子化運行日志,自動生成相關的運行報表。
六、機房外來人員和設備進出的精細化管理
一直以來總省行對外來人員進出機房的管理要求十分嚴格,每次現場檢查都必查外來人員進出機房的各項手續(xù)是否齊全,并且特別單獨制定了“外來人員安全管理手冊”,同時內控部門對外來人員進出機房也有嚴格要求并經常對此進行檢查。為了加強外來人員和設備進出機房的管理,紹興分行建立了外來人員進出機房電子化審批單、外來人員進出機房電子化登記簿和設備進出機房電子化審批單,對此進行精細化管理。
(1)當外來人員需要進入機房時,由機房人員現場輸入外來人員進出機房電子化審批單,包括單位、姓名、手機、事由、證件號碼、進入區(qū)域、接待部門等等,其中的關鍵項目必須正確填寫才能保存,通過硬控制避免了手工制單時的誤填現象,保存后自動打印進出機房審批單交由信科部總經理審批,如果信科部總經理不在現場,也可通過系統(tǒng)進行電子化審批,總經理審批通過后外來人員在接待人員的陪同下進入機房,這時就自動生成了進出機房電子化登記簿和外來人員操作機房設備情況登記表,由于進出機房電子化審批單與進出機房電子化登記簿自動關聯,從而徹底避免了以前手工填寫時 2 項內容經常不一致現象的發(fā)生。當同一人再次到機房時(這種情況很普遍),相關內容就會全部自動跳出,只要檢查一下即可,再次填寫相當方便。后續(xù)需要聯系曾經進入機房的外來人員時,只要輸入關鍵字很快就能查到聯系方式,也十分便捷。
(2)當服務器或網絡設備需要進出機房時,由軟件人員或網絡人員輸入設備進出機房電子化審批單,該審批單自動與 ip 地址管理系統(tǒng)關聯,自動讀取相關設備信息,該審批單與外來人員進出機房電子化審批單一樣,其中的關鍵項目必須正確填寫才能保存,通過硬控制避免了手工制單時的誤填現象,保存后自動打印設備進出機房審批單交由信科部總經理審批,如果分行信科部總經理不在現場,也可通過系統(tǒng)進行電子化審批,總經理審批通過后由機房人員檢查設備才可進出機房。
七、機房數據和報表的精細化管理
目前每天仍有 120 多個大機數據文件由省行下發(fā)到市分行,同時市分行機房每天需要進行交換數據、社?劭顢祿、銀保通數據、住房公積金數據等等數據和報表的處理。為了確保數據接收、處理和報表處理的準確性,紹興分行建立了數據自動接收、通過操作確認單定時進行檢查、定時自動報警和充分利用各類系統(tǒng)自動生成報表的管理模式來有效地進行管理。
(1)開發(fā)全自動數據接收工具。由于 120 多個大機數據文件下發(fā)的時間并不確定,有些是上午下發(fā)有些是下午或晚上下發(fā),有些是T+1 天下發(fā)有些是 T+2 天甚至 T+40天后下發(fā),如何一個不漏且全部接收又不重復接收是個難題。為此紹興分行開發(fā)了全自動數據接收工具,該工具能自動比較已接收數據時間和省行下發(fā)文件的時間,當發(fā)現有省行下發(fā)文件時間大于已接收數據時間的文件時就自動接收這些文件。紹興分行把該工具放在 2 臺不同的數據接收電腦上進行自動接收,確保當某一臺數據接收電腦發(fā)生故障時,另一臺仍能正常工作。
(2)通過電子操作確認單定時進行檢查。電子操作確認單是機房操作人員每天都要操作的流程單,我們把需要進行數據檢查的工作每天或每星期定時在電子操作確認單上顯示,機房操作人員只需點擊電子操作確認單的檢查項目,即可一鍵完成相關檢查,既通過檢查保障了數據的正常又沒有增加太多的工作量。
(3)定時自動報警提醒數據處理。有些數據處理有一定的時間限制,不能太早也不能太遲,如住房公積金數據處理、銀保通數據處理等。為此我們在機房系統(tǒng)中加入了自動報警功能,當相關時間點來到時自動彈框并發(fā)出報警聲以提醒進行相應的數據處理。
(4)充分利用各類系統(tǒng)自動生成報表。手工填寫報表是一項十分繁瑣且容易出錯的工作,而建立了各種實用的系統(tǒng)后,我們就可以充分利用這些系統(tǒng)挖掘現成的數據自動生成所需要的報表。例如通過機房條形碼掃描巡檢系統(tǒng),就可以自動生成機房專用空調運行記錄表、UPS 設備運行記錄表;通過病毒監(jiān)控系統(tǒng)就可以自動生成病毒排行表、行部網點病毒考核表和防病毒監(jiān)控登記薄;通過導入 ATM 運行數據即可自動生成各下屬支行 ATM 考核表;通過電子運行日志即可自動生成主機房運行登記簿;通過 IP 地址管理系統(tǒng)即可自動生成服務器和網絡設備標簽等。
【淺談分行主機房的精細化管理論文】相關文章: