現(xiàn)代圖書館資源統(tǒng)計(jì)特征分析探究論文
時(shí)間:2022-12-03 11:07:00
導(dǎo)語(yǔ):現(xiàn)代圖書館資源統(tǒng)計(jì)特征分析探究論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
一、圖書館數(shù)字資源訪問(wèn)統(tǒng)計(jì)的現(xiàn)狀
1.1典型的研究計(jì)劃
美國(guó)和歐盟針對(duì)圖書館數(shù)字資源的訪問(wèn)統(tǒng)計(jì)已經(jīng)展開(kāi)了一些針對(duì)性的研究計(jì)劃,比如,由美國(guó)研究圖書館協(xié)會(huì)資助的E-Metric項(xiàng)目、美國(guó)多個(gè)機(jī)構(gòu)(包括ARL、JISC、NISO等)資助的COUNIER項(xiàng)目、歐盟TelematicsforLibrariesProgramme支持的EQUINOX項(xiàng)目等,這些項(xiàng)目多為研究制定描述電子信息服務(wù)和資源的統(tǒng)計(jì)指標(biāo)和績(jī)效測(cè)度及其方法。
1.2相關(guān)標(biāo)準(zhǔn)
在相關(guān)的標(biāo)準(zhǔn)方面,面對(duì)新的信息環(huán)境和圖書館形態(tài),一些組織開(kāi)始嘗試將新的電子資源績(jī)效評(píng)估標(biāo)準(zhǔn)融入原有相關(guān)標(biāo)準(zhǔn)/指南的框架。例如NISO在2004年批準(zhǔn)了圖書館和信息提供者信息服務(wù)和利用的測(cè)度和統(tǒng)計(jì)數(shù)據(jù)字典(NISOZ39.72004InformationServicesandUse:Metrics&statisticsforlibrariesandinfomationproviders--DataDictionary),該標(biāo)準(zhǔn)在傳統(tǒng)圖書館工作的基礎(chǔ)上,還特別增加了網(wǎng)絡(luò)服務(wù)、網(wǎng)絡(luò)資源、網(wǎng)絡(luò)運(yùn)行的新的測(cè)度方法,這套數(shù)據(jù)字典將逐漸納入美國(guó)圖書館統(tǒng)計(jì)工作,成為美國(guó)圖書館統(tǒng)計(jì)工作的參考依據(jù),
ICOLC1998年制定的《網(wǎng)上索引、文摘和全文資源使用統(tǒng)計(jì)測(cè)度指南》(GuidelinesforStatisticalMeaSuresofUsageofWeb-BasedIndexed,AbstractedandFullTextResources)提供了一套網(wǎng)絡(luò)化信息資源使用的績(jī)效測(cè)度指南。2001年的修訂版明確了網(wǎng)絡(luò)信息使用數(shù)據(jù)統(tǒng)計(jì)的最基本要求,并提供在隱私、保密、獲取、傳遞和報(bào)告形式方面的指導(dǎo)。
ISOISO/CD11620也在傳統(tǒng)服務(wù)統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,結(jié)合ICOLC和COUNTER的研究,進(jìn)行了圖書涫數(shù)字資源測(cè)度及其定義、方法的描述。
1.3國(guó)內(nèi)圖書館數(shù)字資源訪問(wèn)統(tǒng)計(jì)的研究和應(yīng)用
國(guó)內(nèi)隨著公共圖書館、大學(xué)圖書館、科學(xué)圖書館系統(tǒng)圖書館評(píng)估工作的進(jìn)行,圖書館界開(kāi)始逐步重視對(duì)圖書館數(shù)字館藏、圖書館數(shù)字化信息服務(wù)的評(píng)估。
參考文獻(xiàn)2中提出了數(shù)字資源后評(píng)估的概念,但是對(duì)圖書館數(shù)字資源訪問(wèn)統(tǒng)計(jì)等后評(píng)估的方法和指標(biāo)體系尚未全面展開(kāi)評(píng)論。一些圖書館自行開(kāi)發(fā)了基于jsp或者asp的圖書館網(wǎng)站訪問(wèn)統(tǒng)計(jì)軟件,一些數(shù)字圖書館系統(tǒng),如清華同方的TPI、北京拓爾思的TRS、浙江天宇的CGRS等等也提供了相應(yīng)的統(tǒng)計(jì)功能,但是尚沒(méi)有一款商業(yè)化的軟件針對(duì)圖書館的各種類型的數(shù)字資源提供一攬子的訪問(wèn)統(tǒng)計(jì)方案。
二、圖書館數(shù)字資源訪問(wèn)統(tǒng)計(jì)的方式
2.1WEB日志方式
web服務(wù)器在工作時(shí),時(shí)刻將WWW訪問(wèn)的結(jié)果記錄在一些log(日志)文件中,通過(guò)對(duì)服務(wù)器日志的分析可以得到以下信息。
(1)通過(guò)對(duì)訪問(wèn)時(shí)間進(jìn)行統(tǒng)計(jì),可以得到服務(wù)器在某些時(shí)段的訪問(wèn)情況;
(2)對(duì)訪問(wèn)者的IP進(jìn)行統(tǒng)計(jì),從中可以判斷主要是那些用戶在訪問(wèn)Web服務(wù)器;
(3)對(duì)訪問(wèn)請(qǐng)求的錯(cuò)誤進(jìn)行統(tǒng)計(jì)和分析,可以找出有問(wèn)題的頁(yè)面加以改正;
(4)對(duì)訪問(wèn)者清求的URL進(jìn)行統(tǒng)計(jì),就可以判斷出讀者對(duì)那些頁(yè)面的內(nèi)容最感興趣,對(duì)哪些頁(yè)面的內(nèi)容不感興趣。
各種web服務(wù)器日志文件的格式和內(nèi)容大致相同。根據(jù)W3C的際準(zhǔn),一般Web日志都包括諸如用戶的IP地址、請(qǐng)求時(shí)間、方法(GET/POST等)、被請(qǐng)求網(wǎng)頁(yè)或文件的URL、發(fā)送/接收字節(jié)數(shù)、協(xié)議版本等信息。表1列出了幾種不同類型的Web日志。
但這些日志文件信息量很大,用戶難以直接從log文件獲得直觀的結(jié)果。對(duì)日志文件的分析,可以借助一些商業(yè)性的或者源代碼開(kāi)放的軟件完成。其中比較好的開(kāi)放源代碼的日志分析軟件有:AWStats、webalizer等。
從日志文件提供的信息進(jìn)行統(tǒng)計(jì)和分析,就可以對(duì)整個(gè)網(wǎng)站有一個(gè)數(shù)字化、精確的認(rèn)識(shí),從而對(duì)網(wǎng)站的設(shè)計(jì)和內(nèi)容進(jìn)行改善和調(diào)整,使圖書館網(wǎng)站更好地為讀者提供服務(wù)。
2.2資源提供商提供
數(shù)據(jù)庫(kù)的使用情況屬于后評(píng)估指標(biāo),主要用于更新、續(xù)訂數(shù)據(jù)庫(kù)時(shí)使用,一般在圖書館購(gòu)買資源提供商的數(shù)字資源時(shí),應(yīng)該要求由出版商或數(shù)據(jù)庫(kù)商提供使用報(bào)告,再據(jù)此進(jìn)行各類分析。
目前出版商/數(shù)據(jù)庫(kù)商提供的統(tǒng)計(jì)報(bào)告常用的相關(guān)統(tǒng)計(jì)指標(biāo)有:
①檢索次數(shù)(searfh/query):用戶在某一個(gè)數(shù)據(jù)庫(kù)中提出檢索式的次數(shù)。
②登錄次數(shù)(session/signon):用戶打開(kāi)某個(gè)數(shù)據(jù)庫(kù)的次數(shù)。
③下載文摘/全文(abstract/fulltextpage/image):用戶在某一個(gè)數(shù)據(jù)庫(kù)中下載到本地客戶機(jī)中的文摘或全文篇數(shù)。
2.3通過(guò)網(wǎng)絡(luò)proxy
服務(wù)器(ProxyServer)是一種服務(wù)器軟件,它的主要功能有:設(shè)置用戶驗(yàn)證和記帳功能,可按用戶進(jìn)行記帳,沒(méi)有登記的用戶無(wú)權(quán)通過(guò)服務(wù)器訪問(wèn)Internet網(wǎng),可以對(duì)用戶的訪問(wèn)時(shí)間、訪問(wèn)地點(diǎn)、信息流量進(jìn)行統(tǒng)計(jì)。
目前服務(wù)器軟件產(chǎn)品十分成熟,功能也很強(qiáng)大,可供選擇的服務(wù)器軟件很多。主要的服務(wù)器軟件有WinGate公司的WinGatePro、微軟公司的MicrosoftProxy、Netscape的NetscapeProxy、SybergenNetworks公司的SyGate等,這些軟件不僅可以為局域網(wǎng)內(nèi)的PC機(jī)提供服務(wù),還可以為基于Novell網(wǎng)絡(luò)的用戶,甚至UNLX的用戶提供服務(wù)。目前絕大部分Intemet的應(yīng)用都可以通過(guò)方式實(shí)現(xiàn)。大多數(shù)服務(wù)器軟件產(chǎn)品具有登記內(nèi)部網(wǎng)用戶訪問(wèn)外部網(wǎng)的日志記錄,有些產(chǎn)品還可以直接將日志記錄到數(shù)據(jù)庫(kù)中。根據(jù)日志記錄文件或數(shù)據(jù)庫(kù),可以統(tǒng)計(jì)內(nèi)部網(wǎng)每個(gè)用戶的網(wǎng)絡(luò)流量以及上網(wǎng)時(shí)間,甚至可以按服務(wù)網(wǎng)絡(luò)類型(如:HTTP、SMTP、FTP等)分別進(jìn)行統(tǒng)計(jì)。
2.4利用腳本語(yǔ)言自行開(kāi)發(fā)
通過(guò)web服務(wù)器的日志可以獲得用戶訪問(wèn)圖書館網(wǎng)站信息的情況,但是,這種方式需要對(duì)日志的格式進(jìn)行了解,然后用相應(yīng)的工具軟件或者進(jìn)行一定的開(kāi)發(fā)來(lái)完成。還有一種獲取網(wǎng)站訪問(wèn)情況的方法是利用asp或者isp等網(wǎng)絡(luò)腳本語(yǔ)言,利用它們內(nèi)置的server、session、request對(duì)象等獲取相關(guān)的信息,獲取數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。比如:利用Jsp我們可以用Jsp的內(nèi)置request對(duì)象的獲取參數(shù)方法request.getParameter("userid"),獲取用戶名;用(request.getRemoteAddr)獲取訪問(wèn)者的IP地址;通過(guò)request.getHeader("User-Agent")獲取包含瀏覽器和操作系統(tǒng)的信息,然后用字符串分割substring()方法來(lái)分別得到瀏覽器和操作系統(tǒng);通過(guò)Jsp的內(nèi)置對(duì)象session的方法session,getCreation-Time()返回Session被創(chuàng)建的時(shí)間,而session.getLastAccessedTime()則返回當(dāng)前Session對(duì)象最后被客戶發(fā)送的時(shí)間,兩者之差為停留時(shí)間。
主要分以下幾個(gè)開(kāi)發(fā)步驟:公務(wù)員之家
(1)確定將要統(tǒng)計(jì)的信息;
(2)建立數(shù)據(jù)庫(kù);
(3)實(shí)時(shí)的訪問(wèn)信息紀(jì)錄,記錄每次點(diǎn)擊的信息,包括頁(yè)面信息、用戶信息、訪問(wèn)IP、訪問(wèn)時(shí)間;
(4)實(shí)時(shí)信息的分類存儲(chǔ);
(5)顯示方式的選擇??梢杂肳indows的表格系統(tǒng),也可以自行編制表格顯示。
利用這種方法相對(duì)比較簡(jiǎn)單,但是可獲得的統(tǒng)計(jì)指標(biāo)也有限。
除了上述幾種統(tǒng)計(jì)方式外,還有基于路由器的流量統(tǒng)計(jì)、基于防火墻的流量統(tǒng)計(jì)、基于以太網(wǎng)廣播特性的流量統(tǒng)計(jì)。但是這些方法所提供的簡(jiǎn)單流量的統(tǒng)計(jì)功能,不能完全滿足圖書館數(shù)字資源訪問(wèn)統(tǒng)計(jì)的目標(biāo)。