|
大數據時代下高校數字檔案資源 建設之路时间:2023-05-29 檔案管理工作具有社會性。高校是人才聚集地,其在發展中會 產生大量的檔案信息。信息化時代的到來使高校檔案信息具有大數 據特征,因此高校檔案資源極為關鍵。順利開展檔案資源建設工作 還有利于提升其他工作的效率,F主要研究如何在大數據時代背景 下高效開展高校數字檔案資源建設工作,提出高校數字檔案資源建 設的新思路,為后續相關工作的開展提供借鑒。 大數據時代的本質就是借助先進技術充分 挖掘各類數據,并實現對數據的合理利 用,高校檔案資源就是眾多數據中的一部分。高校 是人才聚集地,若是在發展中未及時有效地進行檔 案資源建設,將會影響相關工作的順利推進。因 此,高校和政府機構需要著重研究大數據時代高校 數字檔案資源建設工作的開展路徑,以提升高校各 項工作的效率。 高校數字檔案資源建設的優勢 高校數字檔案資源建設立足于現代信息技術, 因此為了順利完成高校數字檔案資源建設工作,高 校應積極引進信息技術專業人才,使其承擔主要的 建設工作。高校在完成數字檔案資源建設工作后, 會明確劃分各部門的職責。由于各部門的數據庫具 有緊密聯系,可以共享數字檔案資源,從而避免出 現“信息孤島”,這為各部門工作的開展提供了數 據支持,顯著提升了高校各項工作的效率。此外, 高校各部門會將豐富的數字檔案資源匯總到檔案館,為高校師生提供一站式服務。由此可見,高校 數字檔案資源建設工作的重要性,同時其也是高校 在大數據時代創新發展的必然選擇。 大數據時代高校數字檔案資源建設面臨的難題 資源方面存在的問題 高校數字檔案資源體量大、類型多 高校數字檔案館建設的核心是數字檔案資源。 但其來源廣泛,形式和種類復雜多樣。大數據時 代,高校的數據呈現出海量式增長的趨勢,如日常 信息服務、機房設備,學生選課、考試、借書等都 會產生大量數據。這些數據包括文本、視頻音頻、 圖片圖像、動態和靜態網頁等多種形式。其中,傳 統載體檔案的數字化轉換以及電子文件歸檔是數字 檔案資源最主要的兩大來源。如今,高校數字檔案 資源除了電子文件和數字化檔案外,還包括與高校 有關的各類網絡資源。 高校數字檔案資源分散,質量參差不齊 高校數字檔案資源來自高校不同部門的數據庫,各個數據庫自成體系,且建設標準不統一,這 導致各部門之間溝通不暢,存在數據異構的問題。 此外,巨大的數據量考驗著服務器的響應速度和吞 吐能力,非結構化、半結構化數據格式又考驗著數 據庫的性能。在海量的檔案資源中有許多重復、交 叉的內容,這對檔案工作人員的技術能力和個人素 養提出了新的要求。 檔案信息的挖掘不深入 信息化時代下,人們每日的工作和生活都離 不開網絡,會不斷產生各類信息,相關工作人員 應深入挖掘各類信息的潛在價值。高校數字檔案 資源建設工作也是如此,如果只是淺層次地利用 數字檔案資源開展工作,沒有深入挖掘數字檔案 資源的內在價值,就無法充分發揮出檔案資源的 作用。 技術方面存在的問題 數字檔案資源工作人員可以從采集、處理與 集成、分析、解釋四個階段入手處理數據。其中數 據分析是最核心的部分,也是深入挖掘數字檔案資 源價值的關鍵環節。由于高校數字檔案資源的大數 據特征顯著,所以,工作人員可以使用大數據技術 深入挖掘數字檔案資源的價值。過去,工作人員大 多采用隨機采樣分析法挖掘檔案資源的價值,但是 采樣分析的隨機性會直接影響檔案資源分析的準確 性。在數據處理和集成環節,工作人員需要提取、 重構、集成異構數據,并按照相關標準分門別類地 儲存,形成可供分析的原始數據,不僅可以保證數 據的質量與可靠性,也促使數字檔案得到精細化管 理。但是,當前高校各部門沒有建立統一的數據 標準,內部檔案信息管理系統在與外部信息系統進 行對接的過程中會產生許多錯誤數據,造成數據冗 余,這對數據清洗環節提出了嚴峻的考驗。此外, 因為離線冷數據和在線熱數據的數量眾多,所以可 以運用分布式計算法對檔案資源的價值進行深入挖 掘,而這對數字檔案資源整理和篩選工作提出了迫 切要求。 思維方面存在的問題 以往,高校在開展檔案資源管理工作的過 程中,大多是將業務作為關注重點,所以會出現 無法將檔案資源的利用需求和服務要求聯系起來 的情況。服務理念的落后導致資源建設和用戶建 設脫節的情況加劇,高校檔案館很少對用戶分類 進行深入研究。大數據時代,高校數字檔案資源 建設的意義并不在于存儲,而是應該以用戶為中心,借助現代化技術,深入挖掘數字檔案資源的隱 藏價值,為用戶提供個性化服務,真正有效地將數 字檔案信息轉變為檔案知識,實現高校數字檔案服 務的轉型與升級。 高校數字檔案資源建設內容 實體檔案數字化處理 高校檔案資源建設中實體檔案的作用顯著,且 地位極高。從載體和內容的角度來看,實體檔案除 了紙質檔案外,還有錄像帶、磁盤和照片等形式。 工作人員對高校實體檔案進行數字化處理,將紙質 檔案轉變為數字檔案,如此在進行基本的檔案資源 檢索時可以直接檢索文件的標題,大大提高了工作 效率。工作人員還可以采取數字化方式處理聲像檔 案,借助掃描儀并結合相關標準處理照片檔案等。 各個高校都有大量的檔案資料,而且存儲的實體檔 案資料內容復雜,因此對全部實體檔案進行數字化 處理,可以有效提高各項工作的效率,為后續高校 數字檔案資源建設工作的開展奠定基礎。 檔案資源數據庫的建設 高校數字檔案資源建設工作中數據庫具有顯著作 用。在不斷推進檔案數字化發展的過程中,以網絡數 據庫為基礎,有利于順利開展高校數字檔案資源建設 工作,全面反映高校的數字檔案資源建設現狀。 首先,在高校數字檔案資源建設的過程中,應 該將設置檢索功能作為工作的切入點,構建數字檔案 資源數據庫,方便師生快速檢索數據。其次,需要建 設特色專題數據庫。學校在開展管理工作的過程中, 可能會多次使用某些專題的檔案資源,相關工作人員 應根據學校的要求建立特色專題數據庫,精準對接用 戶的知識需求,這是高校數字檔案資源建設工作的突 破口,可以充分發揮出高校數字檔案資源的真正價 值,加快數字檔案資源建設的進程,方便高校各部門 實時共享專題檔案資料。不僅如此,建設特色專題數 據庫,還可以充分展示高校的辦學特色。因此,學校 各部門之間應緊密聯系起來,積極建設特色專題數據 庫,有效解決教學和科研工作中存在的檔案資源利用 不便的問題。 檔案信息網站建設 高校通過建設數字檔案資源網絡平臺,并在其中 設置導航服務,有利于用戶快速查找所需要的檔案信 息,學校也不需要花費更多的資金建設新的檔案館, 在降低成本的同時提高了信息檢索效率,使用戶的多 樣化需求得以滿足,為高校數字檔案資源建設工作的 開展做好了準備工作。因此,許多高校都開始積極建設數字檔案館,借助互聯網和信息技術,構建檔 案信息平臺。但是,在平臺的建設過程中還存在如 下問題。部分高校檔案信息平臺的信息不全面,很 多檔案資料都被封存,只有一小部分檔案資料是因 為超出三十年的存儲時間才公布在網絡平臺上,而 且只能通過內部局域網才能進行查閱。部分高校的 檔案網絡平臺信息只是對匯編活動內容的整合,尚 未深度挖掘檔案資料內容的價值,且更新不及時, 降低了數字檔案資源的實效性,難以突顯學校特 色。因此,在實際搭建網絡平臺的過程中,高校工 作人員應著重考慮檔案資源的運用方式,深度挖掘 數字檔案資源的潛在價值,及時更新檔案內容,以 滿足用戶的知識需求。 大數據時代高校數字檔案資源建設的路徑 整合高校數字檔案資源,建立統一的數字管理標準 數據在社會中具有重要作用,尤其是在大數 據背景下。在高校傳統檔案資源轉化為數字資源 的過程中,最主要的是數據資源。相關工作人員 應提高對大數據的重視程度,推動高校數字檔案 資源建設工作的順利開展。因此,高校需要及時 轉變數字資源建設思路,結合大數據時代的特征 樹立新型數字檔案資源建設理念,在數字檔案資 源建設中融入館藏數字資源和高校網絡資源。另 外,工作人員還可以借助云計算技術將資源虛擬 化,并集中整合在云平臺上,形成資源存儲池。 一方面,可以有效避免“信息孤島”的出現;另 一方面,方便工作人員對數字資源的統一管理和 利用,方便用戶快速獲取信息。因此,工作人員 要充分利用云計算技術開展高校數字檔案資源建 設工作,構建云平臺,將不同業務系統和網站中 分散的數字檔案資源整合起來,并按照標準檔案 格式和類型進行分類儲存,實現高校數字檔案資 源的優化配置。 基于云計算技術構建大數據挖掘體系架構 在大數據環境下,云計算技術的應用價值極 高,其所具備的并行處理能力和存儲能力是構建 數據挖掘體系架構的重要前提,可以最大程度地 發揮出高校數字檔案資源的真正價值。高校數字 檔案資源體系架構主要分為三層。第一層,云計 算平臺層。要想充分挖掘數據資源的價值,云計 算平臺層是重要的技術支撐,主要作用是存儲和 整合各類檔案數據。第二層,數據挖掘處理層。 其主要作用是預處理海量的檔案數據,并采取信 息化技術對檔案數據進行智能化分析,通過讀取數字檔案資源對數字檔案資源進行格式的轉化和統 一。而后經過數據清洗,利用算法數字檔案資源進 行識別和統計,分析其內在規律。第三層,展示服 務層。其是平臺與用戶互動的接口,可以通過可視 化界面向用戶展示數據處理結果。高校檔案工作人 員在借助云計算技術構建大數據挖掘體系架構的過 程中,還需要采取措施保護檔案數據的安全,如樹 立數據保護意識,對檔案數據進行定期檢查,及時 更新補丁,設置防火墻等。 以用戶為中心,高效利用數字檔案資源 在大數據時代,高校數字檔案資源建設應該以 用戶為中心,通過搭建集利用服務與知識共享為一 體的網絡化服務平臺,為其提供個性化知識服務。 首先,高校檔案工作者必須及時更新工作理念,重 視數字檔案資源知識服務在高校發展中的重要作 用,應從數字資源的管理者轉變為知識的提供者。 同時,數字檔案資源工作者還應該重視檔案資源的 開放和共享,主動且深入地挖掘用戶的知識需求, 以確保知識服務工作的開展具有針對性和科學性。 其次,工作人員應重視優化和完善知識服務技術, 學會運用數據挖掘技術,深層次挖掘和分析數字檔 案資源的潛在價值,使數字檔案資源中蘊含的隱性 知識顯性化。最后,工作人員還需要采集用戶的靜 態數據和動態數據,通過數據清洗,將與用戶特征 無關的數據刪除,然后利用數據挖掘技術對用戶數 據進行計算,分析不同用戶的利用需求特征,并在 此基礎上構建用戶分類數據庫,最后再借助可視化 方法描述用戶的需求。通過對用戶行為的動機與特 點進行分析,可以明確高校檔案數字資源建設的重 點,有針對性地優化高校數字檔案資源的配置,進 而向用戶提供精準個性化服務。 本文主要分析了大數據時代背景下,高校數字檔 案資源建設工作的現狀,對涉及的相關內容與在工作 過程中遇到的難題進行了詳細討論,明確了數字檔案 資源建設工作開展的新思路。要想提高檔案管理工作 的效率,高校數字檔案工作人員應以全新的方式建設 高校數字檔案資源,充分挖掘數字化檔案資源的潛在 價值,滿足高校師生的多元化需求,推動高校數字檔 案資源管理和建設工作的創新開展。 |