學(xué)籍檔案數(shù)據(jù)庫(kù)建立論文

時(shí)間:2022-02-22 03:47:00

導(dǎo)語(yǔ):學(xué)籍檔案數(shù)據(jù)庫(kù)建立論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。

學(xué)籍檔案數(shù)據(jù)庫(kù)建立論文

一建立學(xué)籍檔案數(shù)據(jù)庫(kù)的必要性

1.建立學(xué)籍檔案數(shù)據(jù)庫(kù)使學(xué)籍檔案的管理效率、檢索速度和查準(zhǔn)率有了明顯的提高。面對(duì)日積月累的檔案,沿用傳統(tǒng)的手工目錄查詢(xún)檔案已經(jīng)不能適應(yīng)形勢(shì)的要求,傳統(tǒng)的案卷目錄檢索點(diǎn)單一,不支持模糊查詢(xún),檢索起來(lái)費(fèi)勁費(fèi)時(shí),而且查全率和查準(zhǔn)率很難得到保障。以復(fù)旦大學(xué)1960年以后形成的學(xué)生學(xué)籍檔案為例,如本專(zhuān)科生的學(xué)生成績(jī)表、畢業(yè)生登記表,不以個(gè)人為單位立卷的,而是以年度、院系或?qū)I(yè)為單位裝訂成冊(cè),學(xué)生的學(xué)籍變更如休學(xué)、退學(xué)、復(fù)學(xué)、轉(zhuǎn)學(xué)不能在案卷目錄上體現(xiàn)出來(lái),這樣難免會(huì)降低檔案的查準(zhǔn)率。我們將學(xué)生的個(gè)人信息輸入計(jì)算機(jī),建立學(xué)生信息數(shù)據(jù)庫(kù),只要定義任一檢索條件或組合查詢(xún),即可迅速準(zhǔn)確地篩選出符合條件的記錄。

2.采用學(xué)籍檔案數(shù)據(jù)庫(kù)管理緩解了檔案保存與利用之間的矛盾。學(xué)籍檔案的形成年度跨度較大,尤其是具有百年歷史的高校,學(xué)籍檔案對(duì)于研究高校教育史具有重要的參考價(jià)值,而檔案不同于一般的歷史文物,具有記錄性和原始性的特點(diǎn),隨著社會(huì)的發(fā)展,學(xué)籍檔案的利用率在不斷提高,檔案的破損速度也在加快,這樣就產(chǎn)生了學(xué)籍檔案“保存”與“利用”之間的矛盾。將學(xué)籍檔案原文數(shù)字化,存入數(shù)據(jù)庫(kù),不僅可以解決“保存”與“利用”的矛盾,而且還大大提高了查檢速度。

3.學(xué)籍檔案數(shù)字化是檔案信息上網(wǎng)的基礎(chǔ)。網(wǎng)絡(luò)化已成為時(shí)代的主旋律,網(wǎng)絡(luò)技術(shù)的應(yīng)用更推動(dòng)了檔案事業(yè)邁上新的層次。檔案信息是重要的信息資源,檔案信息只有上網(wǎng)才能體現(xiàn)它的價(jià)值,才能為更多人所利用。大量的檔案信息寓于紙質(zhì)的案卷、文件之中,雖然電子文件已經(jīng)達(dá)到相當(dāng)程度的普及,但大量較早時(shí)期形成的檔案都還是紙質(zhì)的,這是檔案信息上網(wǎng)的一大障礙。只有將這些紙質(zhì)檔案轉(zhuǎn)化為電子文件,才能真正成為電子信息。

2、建設(shè)學(xué)籍檔案數(shù)據(jù)庫(kù)

1.學(xué)生信息數(shù)據(jù)庫(kù)的基本結(jié)構(gòu)

學(xué)生信息數(shù)據(jù)庫(kù)由10個(gè)輸入字段組成,分別是:學(xué)號(hào)、姓名、字、號(hào)、籍貫、院、系、專(zhuān)業(yè)、入學(xué)年月、畢業(yè)年月,同時(shí),這些字段又是多途徑組合查詢(xún)的檢索入口。

我們用Access2000來(lái)開(kāi)發(fā)學(xué)籍檔案信息管理系統(tǒng),Access是一種關(guān)系型數(shù)據(jù)庫(kù),它為用戶(hù)提供了數(shù)據(jù)庫(kù)管理的工具集和應(yīng)用程序開(kāi)發(fā)環(huán)境,是中小型數(shù)據(jù)庫(kù)應(yīng)用領(lǐng)域中最通用的數(shù)據(jù)庫(kù)軟件。由于Access數(shù)據(jù)庫(kù)和VB(VisualBasic)語(yǔ)言結(jié)合得比較好,對(duì)于數(shù)據(jù)庫(kù)開(kāi)發(fā)人員,利用VB語(yǔ)言以及Access數(shù)據(jù)庫(kù)提供的可視化工具和向?qū)?,便可以設(shè)計(jì)出具有一定規(guī)模、功能強(qiáng)大的數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)。Access還具有數(shù)據(jù)訪問(wèn)的功能,可以創(chuàng)建用來(lái)添加、編輯、查看、處理學(xué)籍檔案數(shù)據(jù)庫(kù)當(dāng)前記錄的Web頁(yè),也可以通過(guò)電子郵件發(fā)送數(shù)據(jù)。

2.制作掃描文件

采用掃描錄入方式將學(xué)籍檔案按原貌逐頁(yè)存儲(chǔ)為圖像文件,學(xué)籍檔案原件有5項(xiàng)基本內(nèi)容:畢業(yè)照、學(xué)生學(xué)籍表、分年課程學(xué)分表、畢業(yè)資格審查表、中學(xué)畢業(yè)證書(shū),以學(xué)號(hào)作為文件名標(biāo)識(shí),例如某人學(xué)號(hào)為13561,那么他的掃描文件分別為13561a、13561b、13561c、13561d、13561e,依次類(lèi)推。

計(jì)算機(jī)圖像文件的格式很多,常見(jiàn)的圖像格式有:BMP、JPEG、TIFF等,使用上各有長(zhǎng)短。不同的格式其文件大小、打開(kāi)速度、支持顏色、壓縮耗損等參數(shù)均不相同。BMP格式的圖像沒(méi)有壓縮、最能體現(xiàn)實(shí)物的原貌,大多數(shù)瀏覽器如IE、Netscape等都支持這種格式。然而其文件大,占用系統(tǒng)資源最多,打開(kāi)速度慢,特別是在網(wǎng)絡(luò)上傳輸時(shí),其打開(kāi)和下載速度更難適應(yīng)要求。因此在圖像格式的選擇上必須考慮Web圖像的要求。JPEG格式的圖像壓縮比例大,圖像文件做得小,網(wǎng)絡(luò)下載速度也最快,支持顏色也多。TIFF格式的文件適合做動(dòng)態(tài)圖形,但是色彩層次的還原性比較差。所以,建設(shè)大量圖片形式的掃描文件庫(kù)選擇以*.JPG格式保存比較好。

經(jīng)過(guò)比較和測(cè)試,用100dpi的掃描分辨率掃描的圖像在清晰度和文件大小之間達(dá)到較好的平衡。

3.學(xué)籍檔案數(shù)據(jù)庫(kù)系統(tǒng)的設(shè)計(jì)

對(duì)所有的掃描文件編制目錄索引,目錄索引用數(shù)據(jù)庫(kù)方式建立,每一圖像文件以其存儲(chǔ)地址與其在目錄索引中的記錄相鏈接。利用目錄索引可檢出所需檔案之圖像文件的存放地址,通過(guò)地址借助鏈接顯示該檔案原文的圖像。

我們?cè)O(shè)計(jì)的復(fù)旦大學(xué)學(xué)生學(xué)籍檔案信息管理系統(tǒng)由數(shù)據(jù)庫(kù)文件,掃描文件,超文本文件及程序文件組成。分別開(kāi)設(shè)四個(gè)子目錄存放這四部分的文件。

數(shù)據(jù)庫(kù)文件即學(xué)籍信息數(shù)據(jù)庫(kù),由手工錄入的學(xué)生信息組成,一人一條記錄,是檢索的依據(jù),也是鏈接的基礎(chǔ)。

掃描文件即學(xué)籍檔案的原文掃描件,由于數(shù)量多,必需用一個(gè)大容量的硬盤(pán)來(lái)存放,為了保證數(shù)據(jù)的安全,還應(yīng)分期分批進(jìn)行數(shù)據(jù)備份。

超文本文件即*.html文件,通過(guò)程序生成,通過(guò)學(xué)號(hào)建立超文本鏈接。

程序文件由輸入界面、查詢(xún)界面組成,并分別嵌入IE控件。程序啟動(dòng)后,歷讀學(xué)籍檔案文件夾中的掃描圖形文件,依學(xué)號(hào)自動(dòng)編寫(xiě)相應(yīng)的HTML文件,供輸入、查詢(xún)中的瀏覽器閱讀。

系統(tǒng)采用先掃描后輸入的方式。在輸入界面內(nèi),選擇學(xué)號(hào),程序調(diào)用對(duì)應(yīng)的HTML文件,瀏覽器顯示對(duì)應(yīng)學(xué)籍表,依據(jù)學(xué)籍表輸入相關(guān)信息,使數(shù)據(jù)庫(kù)的輸入工作簡(jiǎn)潔直觀,可方便完成數(shù)據(jù)的保存、編輯和打印等工作。

在查詢(xún)界面內(nèi),可按各字段進(jìn)行獨(dú)立或組合檢索,并在網(wǎng)頁(yè)內(nèi)給出結(jié)果集合。點(diǎn)擊學(xué)號(hào),瀏覽器給出該學(xué)生的全部檔案資料。并可直接打印,郵寄各文件。

3、建設(shè)學(xué)籍檔案數(shù)據(jù)庫(kù)的難點(diǎn)和解決辦法

1.學(xué)籍檔案具有原始性的特點(diǎn)。雖然文檔一體化管理在信息系統(tǒng)技術(shù)上已逐步走向成熟,但是大量歸檔后的文件卻不能做到全部數(shù)字化。自動(dòng)文字識(shí)別軟件OCR技術(shù)的應(yīng)用大大提高了數(shù)字化的效率,但是這種軟件要求印刷體的規(guī)范化文字,而對(duì)歷史檔案原始資料中大量形形色色的手寫(xiě)字體很難識(shí)別。由于時(shí)代所限,早期形成的歷史檔案都是紙質(zhì)的,這也是實(shí)現(xiàn)檔案數(shù)字化的瓶頸。所以,通過(guò)掃描技術(shù),將原始的學(xué)籍檔案材料,轉(zhuǎn)換為圖像文件存儲(chǔ)在計(jì)算機(jī)中,是一種比較現(xiàn)實(shí)可行的辦法。通過(guò)學(xué)籍檔案數(shù)據(jù)庫(kù)可以快速調(diào)用原文數(shù)據(jù)庫(kù)即掃描文件庫(kù)中的文件,也省卻了調(diào)卷的繁復(fù)。

2.學(xué)籍檔案材料不統(tǒng)一。學(xué)籍檔案是散頁(yè)的,各種材料大小不一,有些材料甚至有缺損,在掃描時(shí)需要對(duì)有殘缺和破損的照片在進(jìn)行修補(bǔ),我們可以用圖像處理技術(shù)對(duì)掃描的圖像文件進(jìn)行加工,使之達(dá)到滿(mǎn)意的效果。

3.建設(shè)學(xué)籍檔案數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)是一項(xiàng)費(fèi)時(shí)的工作。學(xué)籍檔案的原始性決定了它的數(shù)字化必須通過(guò)掃描來(lái)實(shí)現(xiàn),而學(xué)籍材料的不統(tǒng)一性又降低了掃描的效率。這樣,學(xué)籍檔案的全部數(shù)字化在短時(shí)間是不可能實(shí)現(xiàn)的。數(shù)據(jù)庫(kù)管理系統(tǒng)的功能完善需要測(cè)試,而系統(tǒng)測(cè)試需要一定數(shù)量的數(shù)據(jù),也就是學(xué)籍檔案的原件掃描件。短時(shí)間里,檔案的完全數(shù)字化很難實(shí)現(xiàn),因?yàn)閽呙枋且豁?xiàng)費(fèi)時(shí)的工作,而檔案數(shù)字化最基礎(chǔ)的工作也就是掃描。

建立學(xué)籍檔案數(shù)據(jù)庫(kù)是建設(shè)數(shù)字化檔案館的一種探索,按照辦公自動(dòng)化、檔案信息化、保管科學(xué)化、利用現(xiàn)代化的要求,通過(guò)建立學(xué)籍檔案數(shù)據(jù)庫(kù)可以實(shí)現(xiàn)檔案信息數(shù)字化,達(dá)到利用現(xiàn)代化的要求,并最終實(shí)現(xiàn)學(xué)生學(xué)籍檔案的信息共享和有效利用。檔案數(shù)據(jù)庫(kù)的建立是網(wǎng)絡(luò)時(shí)代的要求,也是檔案工作現(xiàn)代化的主要標(biāo)志。只有將檔案全文信息數(shù)字化了,才能在網(wǎng)上公布,構(gòu)建現(xiàn)代意義上的數(shù)字化檔案館,使檔案用戶(hù)在足不出戶(hù)的情況下借助網(wǎng)絡(luò)查閱檔案,獲取信息。