數(shù)據(jù)挖掘技術(shù)探討論文范文
時(shí)間:2023-03-20 03:27:15
導(dǎo)語:如何才能寫好一篇數(shù)據(jù)挖掘技術(shù)探討論文,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公文云整理的十篇范文,供你借鑒。

篇1
統(tǒng)計(jì)學(xué)論文2000字(一):影響民族院校統(tǒng)計(jì)學(xué)專業(yè)回歸分析成績因素的研究論文
摘要:學(xué)習(xí)成績是評(píng)價(jià)學(xué)生素質(zhì)的重要方面,也是教師檢驗(yàn)教學(xué)能力、反思教學(xué)成果的重要標(biāo)準(zhǔn)。利用大連民族大學(xué)統(tǒng)計(jì)學(xué)專業(yè)本科生有關(guān)數(shù)據(jù)(專業(yè)基礎(chǔ)課成績、平時(shí)成績和回歸分析期末成績),建立多元線性回歸模型,對(duì)影響回歸分析期末成績的因素進(jìn)行深入研究,其結(jié)果對(duì)今后的教學(xué)方法改進(jìn)和教學(xué)質(zhì)量提高具有十分重要的指導(dǎo)意義。
關(guān)鍵詞:多元線性回歸;專業(yè)基礎(chǔ)課成績;平時(shí)成績;期末成績
為了實(shí)現(xiàn)教學(xué)目標(biāo),提高教學(xué)質(zhì)量,有效提高學(xué)生學(xué)習(xí)成績是很有必要的。我們知道專業(yè)基礎(chǔ)課成績必定影響專業(yè)課成績,而且平時(shí)成績也會(huì)影響專業(yè)課成績,這兩類成績與專業(yè)課成績基本上是呈正相關(guān)的,但它們之間的關(guān)系密切程度有多大?它們之間又存在怎樣的內(nèi)在聯(lián)系呢?就這些問題,本文主要選取了2016級(jí)統(tǒng)計(jì)專業(yè)50名學(xué)生的四門專業(yè)基礎(chǔ)課成績以及回歸分析的平時(shí)成績和期末成績,運(yùn)用SPSS統(tǒng)計(jì)軟件進(jìn)行分析研究,尋求回歸分析期末成績影響因素的變化規(guī)律,擬合出關(guān)系式,從而為強(qiáng)化學(xué)生的后續(xù)學(xué)習(xí)和提高老師的教學(xué)質(zhì)量提供了有利依據(jù)。
一、數(shù)據(jù)選取
回歸分析是統(tǒng)計(jì)專業(yè)必修課,也是統(tǒng)計(jì)學(xué)中的一個(gè)非常重要的分支,它在自然科學(xué)、管理科學(xué)和社會(huì)、經(jīng)濟(jì)等領(lǐng)域應(yīng)用十分廣泛。因此研究影響統(tǒng)計(jì)學(xué)專業(yè)回歸分析成績的相關(guān)性是十分重要的。
選取了統(tǒng)計(jì)專業(yè)50名學(xué)生的專業(yè)基礎(chǔ)課成績(包括數(shù)學(xué)分析、高等代數(shù)、解析幾何和概率論)、回歸分析的平時(shí)成績和期末成績,結(jié)合多元線性回歸的基礎(chǔ)理論知識(shí)[1-2],建立多元回歸方程,進(jìn)行深入研究,可以直觀、高效、科學(xué)地分析各種因素對(duì)回歸分析期末成績?cè)斐傻挠绊憽?/p>
二、建立多元線性回歸模型1及數(shù)據(jù)分析
運(yùn)用SPSS統(tǒng)計(jì)軟件對(duì)回歸分析期末成績的影響因素進(jìn)行研究,可以得到準(zhǔn)確、科學(xué)合理的數(shù)據(jù)結(jié)果,全面分析評(píng)價(jià)學(xué)生考試成績,對(duì)教師以后的教學(xué)工作和學(xué)生的學(xué)習(xí)會(huì)有較大幫助。自變量x1表示數(shù)學(xué)分析成績,x2表示高等代數(shù)成績,x3表示解析幾何成績,x4表示概率論成績,x5表示平時(shí)成績;因變量y1表示回歸分析期末成績,根據(jù)經(jīng)驗(yàn)可知因變量y1和自變量xi,i=1,2,3,4,5之間大致成線性關(guān)系,可建立線性回歸模型:
(1)
線性回歸模型通常滿足以下幾個(gè)基本假設(shè),
1.隨機(jī)誤差項(xiàng)具有零均值和等方差,即
(2)
這個(gè)假定通常稱為高斯-馬爾柯夫條件。
2.正態(tài)分布假定條件
由多元正態(tài)分布的性質(zhì)和上述假定可知,隨機(jī)變量y1服從n維正態(tài)分布。
從表1描述性統(tǒng)計(jì)表中可看到各變量的平均值1=79.68,2=74.66,3=77.22,4=78.10,5=81.04,1=75.48;xi的標(biāo)準(zhǔn)差分別為10.847,11.531,8.929,9.018,9.221,y1的標(biāo)準(zhǔn)差為8.141;有效樣本量n=50。
回歸分析期末成績y1的多元回歸模型1為:
y1=-5.254+0.221x1-0.4x2+0.154x3
+0.334x4+0.347x5
從表2中可以看到各變量的|t|值,在給定顯著水平?琢=0.05的情況下,通過t分布表可以查出,自由度為44的臨界值t?琢/2(44)=2.015,由于高等代數(shù)x2的|t|值為0.651小于t?琢/2(44),因此x2對(duì)y1的影響不顯著,其他自變量對(duì)y1都是線性顯著的。下面利用后退法[3]剔除自變量x2。
三、后退法建立多元線性回歸模型2及數(shù)據(jù)分析
從模型1中剔除了x2變量,多元回歸模型2為:
y1=-5.459+0.204x1+0.149x3+0.377x4+0.293x5(5)
在表4中,F(xiàn)統(tǒng)計(jì)量為90.326,在給定顯著水平?琢=0.05的情況下,查F分布表可得,自由度為p=4和n-p-1=45的臨界值F0.05(4,45)=2.579,所以F>F0.05(4,45),在表5中,所有自變量的|t|值都大于t?琢/2(45)=2.014,因此,多元回歸模型2的線性關(guān)系是顯著的。
四、結(jié)束語
通過對(duì)上述模型進(jìn)行分析,即各個(gè)自變量對(duì)因變量的邊際影響,可以得到以下結(jié)論:在保持其他條件不變的情況下,當(dāng)數(shù)學(xué)分析成績提高一分,則回歸分析成績可提高0.242分[4-5];同理,當(dāng)解析幾何成績、概率論成績和平時(shí)成績每提高一分,則回歸分析成績分別提高0.149分、0.377分和0.293分。
通過對(duì)學(xué)生專業(yè)基礎(chǔ)課成績、平時(shí)成績與回歸分析期末成績之間相關(guān)關(guān)系的研究,一方面有利于教師把控回歸分析教學(xué)課堂,提高教師意識(shí),注重專業(yè)基礎(chǔ)課教學(xué)的重要性,同時(shí),當(dāng)學(xué)生平時(shí)成績不好時(shí),隨時(shí)調(diào)整教學(xué)進(jìn)度提高學(xué)生平時(shí)學(xué)習(xí)能力;另一方面使學(xué)生認(rèn)識(shí)到,為了更好地掌握回歸分析知識(shí),應(yīng)加強(qiáng)專業(yè)基礎(chǔ)課的學(xué)習(xí),提高平時(shí)學(xué)習(xí)的積極性。因此,通過對(duì)回歸分析期末成績影響因素的研究能有效的解決教師教學(xué)和學(xué)生學(xué)習(xí)中的許多問題。
統(tǒng)計(jì)學(xué)畢業(yè)論文范文模板(二):大數(shù)據(jù)背景下統(tǒng)計(jì)學(xué)專業(yè)“數(shù)據(jù)挖掘”課程的教學(xué)探討論文
摘要:互聯(lián)網(wǎng)技術(shù)、物聯(lián)網(wǎng)技術(shù)、云計(jì)算技術(shù)的蓬勃發(fā)展,造就了一個(gè)嶄新的大數(shù)據(jù)時(shí)代,這些變化對(duì)統(tǒng)計(jì)學(xué)專業(yè)人才培養(yǎng)模式的變革起到了助推器的作用,而數(shù)據(jù)挖掘作為拓展和提升大數(shù)據(jù)分析方法與思路的應(yīng)用型課程,被廣泛納入統(tǒng)計(jì)學(xué)本科專業(yè)人才培養(yǎng)方案。本文基于數(shù)據(jù)挖掘課程的特點(diǎn),結(jié)合實(shí)際教學(xué)經(jīng)驗(yàn),對(duì)統(tǒng)計(jì)學(xué)本科專業(yè)開設(shè)數(shù)據(jù)挖掘課程進(jìn)行教學(xué)探討,以期達(dá)到更好的教學(xué)效果。
關(guān)鍵詞:統(tǒng)計(jì)學(xué)專業(yè);數(shù)據(jù)挖掘;大數(shù)據(jù);教學(xué)
一、引言
通常人們總結(jié)大數(shù)據(jù)有“4V”的特點(diǎn):Volume(體量大),Variety(多樣性),Velocity(速度快)和Value(價(jià)值密度低)。從這樣大量、多樣化的數(shù)據(jù)中挖掘和發(fā)現(xiàn)內(nèi)在的價(jià)值,是這個(gè)時(shí)代帶給我們的機(jī)遇與挑戰(zhàn),同時(shí)對(duì)數(shù)據(jù)分析技術(shù)的要求也相應(yīng)提高。傳統(tǒng)教學(xué)模式并不能適應(yīng)和滿足學(xué)生了解數(shù)據(jù)處理和分析最新技術(shù)與方法的迫切需要。對(duì)于常常和數(shù)據(jù)打交道的統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生來說,更是如此。
二、課程教學(xué)探討
針對(duì)統(tǒng)計(jì)學(xué)本科專業(yè)的學(xué)生而言,“數(shù)據(jù)挖掘”課程一般在他們?nèi)昙?jí)或者四年級(jí)所開設(shè),他們?cè)谇捌谝呀?jīng)學(xué)習(xí)完統(tǒng)計(jì)學(xué)、應(yīng)用回歸分析、多元統(tǒng)計(jì)分析、時(shí)間序列分析等課程,所以在“數(shù)據(jù)挖掘”課程的教學(xué)內(nèi)容選擇上要有所取舍,同時(shí)把握好難度。不能把“數(shù)據(jù)挖掘”課程涵蓋了的所有內(nèi)容不加選擇地要求學(xué)生全部掌握,對(duì)學(xué)生來說是不太現(xiàn)實(shí)的,需要為統(tǒng)計(jì)學(xué)專業(yè)本科生“個(gè)性化定制”教學(xué)內(nèi)容。
(1)“數(shù)據(jù)挖掘”課程的教學(xué)應(yīng)該偏重于應(yīng)用,更注重培養(yǎng)學(xué)生解決問題的能力。因此,教學(xué)目標(biāo)應(yīng)該是:使學(xué)生樹立數(shù)據(jù)挖掘的思維體系,掌握數(shù)據(jù)挖掘的基本方法,提高學(xué)生的實(shí)際動(dòng)手能力,為在大數(shù)據(jù)時(shí)代,進(jìn)一步學(xué)習(xí)各種數(shù)據(jù)處理和定量分析工具打下必要的基礎(chǔ)。按照這個(gè)目標(biāo),教學(xué)內(nèi)容應(yīng)以數(shù)據(jù)挖掘技術(shù)的基本原理講解為主,讓學(xué)生了解和掌握各種技術(shù)和方法的來龍去脈、功能及優(yōu)缺點(diǎn);以算法講解為輔,由于有R語言、python等軟件,學(xué)生了解典型的算法,能用軟件把算法實(shí)現(xiàn),對(duì)軟件的計(jì)算結(jié)果熟練解讀,對(duì)各種算法的改進(jìn)和深入研究則不作要求,有興趣的同學(xué)可以自行課下探討。
(2)對(duì)于已經(jīng)學(xué)過的內(nèi)容不再詳細(xì)講解,而是側(cè)重介紹它們?cè)跀?shù)據(jù)挖掘中的功能及綜合應(yīng)用。在新知識(shí)的講解過程中,注意和已學(xué)過知識(shí)的融匯貫通,既復(fù)習(xí)鞏固了原來學(xué)過的知識(shí),同時(shí)也無形中降低了新知識(shí)的難度。比如,在數(shù)據(jù)挖掘模型評(píng)估中,把混淆矩陣、ROC曲線、誤差平方和等知識(shí)點(diǎn)就能和之前學(xué)過的內(nèi)容有機(jī)聯(lián)系起來。
(3)結(jié)合現(xiàn)實(shí)數(shù)據(jù),讓學(xué)生由“被動(dòng)接收”式的學(xué)習(xí)變?yōu)椤爸鲃?dòng)探究”型的學(xué)習(xí)。在講解每種方法和技術(shù)之后,增加一個(gè)或幾個(gè)案例,以加強(qiáng)學(xué)生對(duì)知識(shí)的理解。除了充分利用已有的國內(nèi)外數(shù)據(jù)資源,還可以鼓勵(lì)學(xué)生去搜集自己感興趣的或者國家及社會(huì)大眾關(guān)注的問題進(jìn)行研究,提升學(xué)生學(xué)習(xí)的成就感。
(4)充分考慮前述提到的三點(diǎn),課程內(nèi)容計(jì)劃安排見表1。
(5)課程的考核方式既要一定的理論性,又不能失掉實(shí)踐應(yīng)用性,所以需要結(jié)合平時(shí)課堂表現(xiàn)、平時(shí)實(shí)驗(yàn)項(xiàng)目完成情況和期末考試來綜合評(píng)定成績。采取期末閉卷理論考試占50%,平時(shí)實(shí)驗(yàn)項(xiàng)目完成占40%,課堂表現(xiàn)占10%,這樣可以全方位的評(píng)價(jià)學(xué)生的表現(xiàn)。
三、教學(xué)效果評(píng)估
經(jīng)過幾輪的教學(xué)實(shí)踐后,取得了如下的教學(xué)效果:
(1)學(xué)生對(duì)課程的興趣度在提升,課下也會(huì)不停地去思考數(shù)據(jù)挖掘有關(guān)的方法和技巧,發(fā)現(xiàn)問題后會(huì)一起交流與討論。
(2)在大學(xué)生創(chuàng)新創(chuàng)業(yè)項(xiàng)目或者數(shù)據(jù)分析的有關(guān)競賽中,選用數(shù)據(jù)挖掘方法的人數(shù)也越來越多,部分同學(xué)的成果還能在期刊上正式發(fā)表,有的同學(xué)還能在競賽中取得優(yōu)秀的成績。
(3)統(tǒng)計(jì)學(xué)專業(yè)本科生畢業(yè)論文的選題中利用數(shù)據(jù)挖掘有關(guān)方法來完成的論文越來越多,論文的完成質(zhì)量也在不斷提高。
(4)本科畢業(yè)生的就業(yè)崗位中從事數(shù)據(jù)挖掘工作的人數(shù)有所提高,說明滿足企業(yè)需求技能的人數(shù)在增加。繼續(xù)深造的畢業(yè)生選擇數(shù)據(jù)挖掘研究方向的人數(shù)也在逐漸增多,表明學(xué)生的學(xué)習(xí)興趣得以激發(fā)。
教學(xué)實(shí)踐結(jié)果表明,通過數(shù)據(jù)挖掘課程的學(xué)習(xí),可以讓學(xué)生在掌握理論知識(shí)的基礎(chǔ)上,進(jìn)一步提升分析問題和解決實(shí)際問題的能力。
篇2
【摘要】
介紹了數(shù)據(jù)挖掘的意義和任務(wù),綜述了近幾年來數(shù)據(jù)挖掘在中醫(yī)各領(lǐng)域中的應(yīng)用,分析了目前存在的問題,并探討了今后的發(fā)展趨勢(shì)。
【關(guān)鍵詞】 數(shù)據(jù)挖掘 中醫(yī)
隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,在中醫(yī)藥的現(xiàn)代化過程中建立了很多的數(shù)據(jù)庫。堆積在數(shù)據(jù)庫中的信息呈超指數(shù)爆炸式增長。例如中醫(yī)藥科技信息數(shù)據(jù)庫就有50個(gè)子數(shù)據(jù)庫、110個(gè)表單及數(shù)百個(gè)自動(dòng)生成的中間表、800余個(gè)著錄項(xiàng)目,涵蓋所有中醫(yī)藥有關(guān)醫(yī)、藥及學(xué)術(shù)的內(nèi)容。而數(shù)據(jù)挖掘技術(shù)的發(fā)展使我們有可能從這些海量數(shù)據(jù)中發(fā)現(xiàn)新的知識(shí),發(fā)現(xiàn)數(shù)據(jù)背后隱藏的關(guān)系和規(guī)則,還可以對(duì)未知的情況進(jìn)行預(yù)測(cè)。多學(xué)科交叉目前正成為增強(qiáng)科技創(chuàng)新的重要途徑,數(shù)據(jù)挖掘正是從統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫、機(jī)器學(xué)習(xí)等多門學(xué)科中發(fā)展起來的。
1 數(shù)據(jù)挖掘介紹
1.1 數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘(datamining)也稱為數(shù)據(jù)庫知識(shí)發(fā)現(xiàn),為解決上述矛盾提供了強(qiáng)有力的工具[1]。數(shù)據(jù)挖掘這一術(shù)語出現(xiàn)于1989年,其定義幾經(jīng)變動(dòng),本研究中引用Frayyad UM等提出的對(duì)數(shù)據(jù)挖掘的定義[2]。
數(shù)據(jù)挖掘是從數(shù)據(jù)庫中識(shí)別出有效的、新穎的、潛在有用的并且最終可理解的模式的非平凡過程。其中:
① 有效性要求挖掘前要對(duì)被挖掘的數(shù)據(jù)進(jìn)行仔細(xì)檢查,具備該特性,才能保證挖掘出來信息的可靠性。
② 新穎性要求發(fā)現(xiàn)的模式應(yīng)該是從前未知的,甚至是違背直覺的信息或知識(shí),挖掘出的信息越是出乎意料,就可能越有價(jià)值。
③ 潛在有用性是指發(fā)現(xiàn)的知識(shí)將來有實(shí)際效用,即這些信息或知識(shí)對(duì)于所討論的業(yè)務(wù)或研究領(lǐng)域是有效的、是有實(shí)用價(jià)值和可實(shí)現(xiàn)的,常識(shí)性的結(jié)論或已被人們掌握的事實(shí)或無法實(shí)現(xiàn)的推測(cè)都是沒有意義的。
④ 最終可理解性要求發(fā)現(xiàn)的模式能被用戶理解,目前它主要是體現(xiàn)在簡潔性上。發(fā)現(xiàn)的知識(shí)要可接受、可理解、可運(yùn)用,最好能用自然語言表達(dá)所發(fā)現(xiàn)的結(jié)果。實(shí)際上,所有發(fā)現(xiàn)的知識(shí)都是相對(duì)的,是有特定前提和約束條件,面向特定領(lǐng)域的。
⑤ 非平凡是一個(gè)數(shù)學(xué)概念,即數(shù)據(jù)挖掘既不是把數(shù)據(jù)全部抽取,也不是一點(diǎn)兒也不抽取,而是抽取出隱含的、未知的、可能的有用的信息。要有一定程度的智能性、自動(dòng)性(僅僅給出所有數(shù)據(jù)的總和不能算作是一個(gè)發(fā)現(xiàn)過程)。
數(shù)據(jù)挖掘的結(jié)果通常表示為概念(concepts)、規(guī)則(rules)、規(guī)律(regularities)、模式(pattern)、約束(constraint)、可視化(visualization)等形式。這些知識(shí)可以直接提供給決策者,用于輔助決策過程;或者提供給領(lǐng)域?qū)<?,修正專家的已有的知識(shí)體系;也可以作為新的知識(shí)轉(zhuǎn)存到應(yīng)用系統(tǒng)中,作為實(shí)際事務(wù)處理中決策的依據(jù)[3]。
2 數(shù)據(jù)挖掘的任務(wù)
數(shù)據(jù)挖掘的任務(wù)主要是預(yù)測(cè)和描述。預(yù)測(cè)是指用一些變量或數(shù)據(jù)庫的若干已知字段預(yù)測(cè)其他感興趣的變量或字段的未知的或未來的值。描述是指找到描述數(shù)據(jù)的可理解模式。預(yù)測(cè)方法有統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則和決策樹預(yù)測(cè)、回歸樹預(yù)測(cè)等。其中關(guān)聯(lián)規(guī)則反映了一個(gè)事務(wù)與其他事務(wù)之間存在關(guān)聯(lián),那么就能根據(jù)其他已知事務(wù)預(yù)測(cè)到另一個(gè)事務(wù)。描述性方法主要有數(shù)據(jù)分類、回歸分析、聚類、變化和偏差分析、模式發(fā)現(xiàn)等。
3 數(shù)據(jù)挖掘在中醫(yī)藥中的應(yīng)用
中醫(yī)藥的發(fā)展也需要多門學(xué)科的交叉應(yīng)用。數(shù)據(jù)挖掘最初在生物醫(yī)學(xué)中的應(yīng)用是在對(duì)基因組測(cè)序數(shù)據(jù)的分析,因?yàn)槿祟惢蚪M計(jì)劃研究中產(chǎn)生了數(shù)十億的核苷酸和上百萬的氨基酸,傳統(tǒng)的統(tǒng)計(jì)方法無能為力。中醫(yī)學(xué)具有系統(tǒng)性、整體性、復(fù)雜性、不確定性等特點(diǎn),不適宜運(yùn)用傳統(tǒng)的還原論的方法研究,而適宜與數(shù)據(jù)挖掘類似的從整體觀上入手的研究方法。數(shù)據(jù)挖掘可以從海量數(shù)據(jù)中挖掘出潛在的規(guī)律,數(shù)據(jù)挖掘的結(jié)果一部分可能與傳統(tǒng)的診療規(guī)律相符,不符合的部分可能是潛在的新知,也可能是沒有意義的,這都需要在相應(yīng)目標(biāo)領(lǐng)域?qū)<业闹笇?dǎo)下進(jìn)行解釋和評(píng)價(jià)。將數(shù)據(jù)挖掘(DM)和知識(shí)發(fā)現(xiàn)(DMKD)應(yīng)用于中醫(yī)藥領(lǐng)域的研究,是中醫(yī)藥現(xiàn)代化研究的重要組成部分[1],必將促進(jìn)中醫(yī)藥的發(fā)展。而數(shù)據(jù)挖掘在中藥藥譜研究和新藥開發(fā)中取得了一定進(jìn)展,本研究主要對(duì)其在中醫(yī)以下領(lǐng)域的研究作一介紹。
3.1 證實(shí)質(zhì)的研究
中醫(yī)的“證”又稱“證候”,是疾病在某一階段病變的本質(zhì)反映,是由一組能反映疾病本質(zhì)的癥狀組成的,能揭示病因、病位、病性、病勢(shì),為論治提供依據(jù)。證候是中醫(yī)診斷的核心概念和理論精髓,具有整體性、抽象性、時(shí)間性和相對(duì)穩(wěn)定性的特點(diǎn)?,F(xiàn)在對(duì)證實(shí)質(zhì)的研究多從西醫(yī)的生理理化指標(biāo)來揭示證的實(shí)質(zhì),但實(shí)踐中卻發(fā)現(xiàn)缺少證的特異性指標(biāo)。如果從分子生物學(xué)的角度,利用數(shù)據(jù)挖掘技術(shù)對(duì)中醫(yī)證與相關(guān)基因的對(duì)應(yīng)關(guān)系,可能取得更好的結(jié)果。通過研究“證”和基因多態(tài)性之間的內(nèi)在聯(lián)系,從基因多態(tài)性所帶來的該基因功能上的變化,由此探尋“證”的相關(guān)基因表達(dá)譜。
3.2 中醫(yī)診斷
中醫(yī)診斷過程主要是對(duì)證的判定。而現(xiàn)在證的標(biāo)準(zhǔn)不太規(guī)范,缺乏定量的標(biāo)準(zhǔn),而且其分類與描述也存在不同的觀點(diǎn)。數(shù)據(jù)挖掘則可能完成證的規(guī)范化研究,也可輔助臨床醫(yī)生對(duì)病人進(jìn)行證的判定。
陳明等[5]嘗試運(yùn)用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)診斷模式,他把《傷寒論》中的病名、癥狀、舌脈分別作為數(shù)據(jù)表建立數(shù)據(jù)庫,挖掘得出規(guī)則:發(fā)熱、惡寒、脈浮太陽病(支持度65%,置信度5%),可以認(rèn)為發(fā)熱,惡寒的確是太陽病的診斷依據(jù)。
秦中廣等[6]運(yùn)用粗糙集進(jìn)行中醫(yī)類風(fēng)濕證候的診斷,共收集了224個(gè)病例,每個(gè)病例有81個(gè)屬性,并從這224個(gè)病例中隨機(jī)抽取學(xué)習(xí)樣本180例,進(jìn)行預(yù)測(cè)診斷44例。他們利用屬性約簡得到寒濕阻絡(luò)、濕熱阻絡(luò)、痰閼阻絡(luò)、氣陰兩虛、寒熱錯(cuò)雜5種證的必定規(guī)則和可能規(guī)則。在44例預(yù)測(cè)診斷中診斷正確率達(dá)到90%以上,高于傳統(tǒng)的模糊數(shù)學(xué)方法,并認(rèn)為粗糙集有可能是中醫(yī)診斷研究的動(dòng)態(tài)理想工具。
劉晉平[7]運(yùn)用數(shù)據(jù)挖掘的手段對(duì)中醫(yī)脈象進(jìn)行研究,并開發(fā)出初步的軟件。以明清、近現(xiàn)代3000余例病案為研究分析對(duì)象,將病案分為病名、證型、脈象、舌象及癥狀幾項(xiàng),然后進(jìn)行統(tǒng)一化及規(guī)范化處理,得出醫(yī)案中細(xì)脈出現(xiàn)頻率最高,占34.39%。其脈象軟件可以進(jìn)行脈象與病名,脈象與證型之間的相互關(guān)聯(lián)分析,發(fā)現(xiàn)其內(nèi)在的規(guī)律。
4 方劑配伍規(guī)律的研究
方劑配伍理論是中藥方劑理論的核心,也是研究方劑的關(guān)鍵問題。采用數(shù)據(jù)挖掘技術(shù)進(jìn)行基于中醫(yī)藥理論的方劑配伍規(guī)律研究,既能為中醫(yī)新藥的臨床和實(shí)驗(yàn)研究提供目標(biāo)和思路,減少盲目性,縮短研究周期;同時(shí)又為大量古今驗(yàn)方研究探索出一條有價(jià)值的研究途徑和方法[8]。
何前鋒等[9]運(yùn)用高頻集挖掘的方法,對(duì)中國方劑數(shù)據(jù)庫、中藥新藥品種數(shù)據(jù)庫、中藥成方制劑標(biāo)準(zhǔn)數(shù)據(jù)庫中各方劑藥物組成數(shù)據(jù)進(jìn)行了分析,分別得到3個(gè)庫的前20味高頻藥,可以看出古今用藥頻率的變化。并把高頻用藥組合與經(jīng)驗(yàn)藥對(duì)進(jìn)行比較分析,提示可能成為新藥對(duì)的組合。
姚美村等[10]應(yīng)用關(guān)聯(lián)規(guī)則分析技術(shù),以文獻(xiàn)中收錄的106個(gè)治療消渴病的中藥復(fù)方為對(duì)象,經(jīng)解析后建立復(fù)方特征數(shù)據(jù)庫,以數(shù)據(jù)挖掘系統(tǒng)Enterprise Miner為平臺(tái),關(guān)聯(lián)規(guī)則分析為工具,在單味藥層次上進(jìn)行消渴病復(fù)方組成藥味之間的關(guān)聯(lián)模式研究。得到了藥物與上中下三消的關(guān)聯(lián)以及藥物之間的關(guān)聯(lián),與中醫(yī)專家對(duì)于消渴病的治療在主要藥物的配伍方面基本一致,這在一定程度上反映出歷代中醫(yī)在消渴病治療方面認(rèn)識(shí)和治療的整體規(guī)律性。
陳波等[11]應(yīng)用關(guān)聯(lián)規(guī)則對(duì)李東垣的脾胃方從藥物間關(guān)聯(lián)、癥狀間關(guān)聯(lián)、處方結(jié)構(gòu)與癥狀關(guān)聯(lián)進(jìn)行分析,得出當(dāng)出現(xiàn)當(dāng)歸、黃芪、升麻時(shí),同時(shí)出現(xiàn)柴胡的次數(shù)為60次,支持度為10.91%,可信度為84.51%;當(dāng)出現(xiàn)當(dāng)歸、黃芪、柴胡時(shí),同時(shí)出現(xiàn)升麻的次數(shù)為60次,支持度為10.91%,可信度為84.51%。兩者的支持度和可信度都較高,提示他們常共同使用。此反映出李東垣補(bǔ)氣與升陽同用的學(xué)術(shù)思想,此藥組也是補(bǔ)中益氣湯的基本組成部分。
現(xiàn)在的研究中存在著方法比較簡單,頻繁模式、關(guān)聯(lián)規(guī)則為其主要方法。方劑配伍不僅是各藥味之間的組合,還包含著各藥劑量比例的搭配,這也是臨床組方的關(guān)鍵,但現(xiàn)在對(duì)其進(jìn)行數(shù)據(jù)挖掘的研究還很少。
數(shù)據(jù)挖掘的方法不僅可以運(yùn)用于中醫(yī)基礎(chǔ)理論中的傷寒、溫病等研究,也可用于臨床各科的研究。但高質(zhì)量的數(shù)據(jù)挖掘不僅需要有被處理數(shù)據(jù)的質(zhì)量,更要在中醫(yī)藥專業(yè)背景知識(shí)引導(dǎo)下,針對(duì)具體問題,選擇合適的數(shù)據(jù)挖掘方法,利用各種工具的效能和應(yīng)用的可能性,取長補(bǔ)短。
對(duì)中醫(yī)藥知識(shí)進(jìn)行規(guī)范化、數(shù)字化、信息化是促進(jìn)中醫(yī)藥國際化和現(xiàn)代化進(jìn)程的重要內(nèi)容[12]。通過數(shù)據(jù)挖掘,就可以對(duì)中醫(yī)藥發(fā)展過程中某些缺失的信息進(jìn)行預(yù)測(cè)完善并可以避免主觀性的干擾。數(shù)據(jù)挖掘還可以發(fā)現(xiàn)一些新的模式和規(guī)則,為中醫(yī)藥知識(shí)的創(chuàng)新和發(fā)展提供一條新途徑。
參考文獻(xiàn)
1 喬延江.中藥(復(fù)方)KDD研究開發(fā)的意義.北京中醫(yī)藥大學(xué)學(xué)報(bào),1998,21(3):15~17.
2 Frayyad UM, PiatetskyShapiro G,Smyth P, et al. Knowledge Discovery and Data mining:Towards a Unifying Framework ProcKDD96,Menlo park, CA:AAAIPress,1996,82~88.
3 胡文豐,張正國.生物醫(yī)學(xué)數(shù)據(jù)挖掘.國外醫(yī)學(xué)生物醫(yī)學(xué)工程分冊(cè),2003,26(1):11~15.
4 周雪忠,吳朝暉,劉保延.生物醫(yī)學(xué)文獻(xiàn)知識(shí)發(fā)現(xiàn)研究探討及展望.復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2004,1(3):45~55.
5 陳明,張書河.關(guān)聯(lián)規(guī)則在中醫(yī)疾病證候診斷中的應(yīng)用.中華醫(yī)學(xué)叢刊,2004,4(5):14~16.
6 秦中廣,毛宗源,鄧兆智.粗糙集在中醫(yī)類風(fēng)濕證候診斷中的應(yīng)用.中國生物醫(yī)學(xué)工程學(xué)報(bào),2001,20(4):354~363.
7 劉晉平.數(shù)據(jù)挖掘在中醫(yī)脈診研究中的應(yīng)用.天津中醫(yī)藥大學(xué)碩士論文,2002.
8 蔣永光,胡波,劉娟,等.方劑配伍的數(shù)據(jù)挖掘可行性探索.四川中醫(yī),2004,22(8):25~28.
9 何前鋒,崔蒙,吳朝暉,等.方劑中配伍知識(shí)的發(fā)現(xiàn).中國中醫(yī)藥信息雜志,2004,11(7):655~658.
10 姚美村,艾路,袁月梅,等.消渴病復(fù)方配伍規(guī)律的關(guān)聯(lián)規(guī)則分析.北京中醫(yī)藥大學(xué)學(xué)報(bào),2002,25(6):48~50.
11 陳波,蔣永光,胡波,等.東垣脾胃方配伍規(guī)律之關(guān)聯(lián)分析評(píng)述.中醫(yī)藥學(xué)刊,2004,22(4):611~612.
篇3
1知如何能夠投其所好,為用戶實(shí)現(xiàn)主動(dòng)推薦,提供個(gè)性化服務(wù);這些都是電子商務(wù)成敗的關(guān)鍵問題。在這種新型的商務(wù)模式下,如何對(duì)網(wǎng)絡(luò)上大量的信息進(jìn)行有效組織利用,幫助海量數(shù)據(jù)的擁有者們找出真正有價(jià)值的信息和知識(shí),以指導(dǎo)他們的商業(yè)決策行為,成為電子商務(wù)經(jīng)營者關(guān)注的問題。迅速發(fā)展的基于Web的數(shù)據(jù)挖掘技術(shù),為解決電子商務(wù)所面臨的問題提供了有效途徑。
2 Web數(shù)據(jù)挖掘
2.1 Web數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中提取人們事先不知道的、潛在有用的信息和知識(shí)的非平凡過程。
Web數(shù)據(jù)挖掘(Web Mining)是從Web文檔和Web活動(dòng)中抽取感興趣的、潛在的有用模式和隱藏的信息,是數(shù)據(jù)庫、數(shù)據(jù)挖掘、人工智能、信息檢索、自然語言理解等技術(shù)的綜合應(yīng)用,是在一定基礎(chǔ)上應(yīng)用數(shù)據(jù)挖掘的方法以發(fā)現(xiàn)有用的知識(shí)來幫助人們從WWW中提取知識(shí)。Web數(shù)據(jù)挖掘可以分為Web內(nèi)容挖掘(Web Content Mining)、Web結(jié)構(gòu)挖掘(Web Structure Mining)、Web使用記錄挖掘(Web Usage Mining)三類。Web內(nèi)容挖掘是指從文檔內(nèi)容或其描述中抽取知識(shí)的過程,又可以分為基于文本的挖掘和基于多媒體的挖掘兩種。Web文本挖掘可以對(duì)Web上大量文檔集合的內(nèi)容進(jìn)行總結(jié)、分類、聚類、關(guān)聯(lián)分析等。Web結(jié)構(gòu)挖掘是指從Web組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)知識(shí)。通過對(duì)Web結(jié)構(gòu)的挖掘,可以用來指導(dǎo)對(duì)頁面進(jìn)行分類和聚類,找到權(quán)威頁面,從而提高檢索的性能,同時(shí)還可以用來指導(dǎo)網(wǎng)頁采集工作,提高采集效率。Web使用記錄挖掘是指從服務(wù)器端記錄的客戶訪問日志或從客戶的瀏覽信息中抽取感興趣的模式。
基于Web的數(shù)據(jù)挖掘技術(shù)的出現(xiàn)不僅為商家做出正確的商業(yè)決策提供了強(qiáng)有力的工具,也為商家更加深入地了解客戶需求信息和購物行為的特征提供了可能性。
2.2 電子商務(wù)中Web數(shù)據(jù)挖掘的步驟
電子商務(wù)中Web數(shù)據(jù)挖掘的步驟如下:
① 明確數(shù)據(jù)挖掘的對(duì)象—業(yè)務(wù)對(duì)象,確定商業(yè)應(yīng)用主題,不能盲目地進(jìn)行挖掘;
② 將與業(yè)務(wù)對(duì)象的各類原始數(shù)據(jù)收集起來作為挖掘的數(shù)據(jù)源泉;
③ 對(duì)收集的數(shù)據(jù)進(jìn)行預(yù)處理,一般包括數(shù)據(jù)凈化、用戶識(shí)別、會(huì)話識(shí)別、路徑補(bǔ)充、事務(wù)識(shí)別和格式化等階段,以提高挖掘效率,剔除無用、無關(guān)信息并對(duì)信息進(jìn)行必要的整理。
④ 根據(jù)需要解決的問題建立合適的數(shù)據(jù)挖掘模型,然后利用已知數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練和測(cè)試,并應(yīng)用該模型得到挖掘結(jié)果;
⑤ 利用可視化技術(shù),驗(yàn)證、解釋挖掘的結(jié)果,并據(jù)此做出決策或豐富知識(shí),即進(jìn)行模式分析與應(yīng)用。
在整個(gè)Web數(shù)據(jù)挖掘的過程中,被明確的業(yè)務(wù)對(duì)象是挖掘過程的基礎(chǔ),它驅(qū)動(dòng)整個(gè)Web數(shù)據(jù)挖掘的全過程; 同時(shí),也是檢驗(yàn)挖掘結(jié)果和引導(dǎo)分析人員完成挖掘的依據(jù)。
2.3 電子商務(wù)中Web數(shù)據(jù)挖掘的數(shù)據(jù)源
在電子商務(wù)中,可以用來作為數(shù)據(jù)挖掘分析的數(shù)據(jù)量比較大,而且類型眾多,總結(jié)起來有以下幾種類型的數(shù)據(jù)可用于Web數(shù)據(jù)挖掘技術(shù)產(chǎn)生各種知識(shí)模式。
① 服務(wù)器數(shù)據(jù)??蛻粼L問站點(diǎn)時(shí)會(huì)在Web服務(wù)器上留下相應(yīng)的日志數(shù)據(jù),這些日志數(shù)據(jù)通常以文本文件的形式存儲(chǔ)在服務(wù)器上。一般包括servers logs、error logs、cookies logs等。
② 查詢數(shù)據(jù)。它是電子商務(wù)站點(diǎn)在服務(wù)器上產(chǎn)生的一種典型數(shù)據(jù)。例如,對(duì)于再現(xiàn)存儲(chǔ)的客戶也許會(huì)搜索一些產(chǎn)品或某些廣告信息,這些查詢信息就是通過cookie或是登記信息連接到服務(wù)器的訪問日志上。
③ 在線市場(chǎng)數(shù)據(jù)。這類數(shù)據(jù)主要是傳統(tǒng)關(guān)系數(shù)據(jù)庫里存儲(chǔ)的有關(guān)電子商務(wù)站點(diǎn)信息、用戶購買信息、商品信息等數(shù)據(jù)。
④ Web頁面。主要是指HTML和XML頁面的內(nèi)容,包括文本、圖片、語音、圖像等。
⑤ Web頁面超級(jí)鏈接關(guān)系。主要是指頁面之間存在的超級(jí)鏈接關(guān)系,這也是一種重要的資源。
⑥ 客戶登記信息??蛻舻怯浶畔⑹侵缚蛻敉ㄟ^Web頁輸入的、要提交給服務(wù)器的相關(guān)用戶信息,這些信息通常是關(guān)于用戶的人口特征。在Web的數(shù)據(jù)挖掘中,客戶登記信息需要和訪問日志集成,以提高數(shù)據(jù)挖掘的準(zhǔn)確度,使之能更進(jìn)一步的了解客戶。
2.4 Web數(shù)據(jù)挖掘能夠獲取的知識(shí)模式
運(yùn)用Web數(shù)據(jù)挖掘技術(shù)能夠?qū)φ军c(diǎn)上的各種數(shù)據(jù)源進(jìn)行挖掘,找到相關(guān)的一些知識(shí)模式,以指導(dǎo)站點(diǎn)人員更好地運(yùn)作站點(diǎn)和向客戶提供更好的服務(wù)。一般運(yùn)用Web數(shù)據(jù)挖掘可以在站點(diǎn)上挖掘出來的知識(shí)模式有以下幾個(gè):
① 路徑分析。它可以被用于判定在一個(gè)Web站點(diǎn)中最頻繁訪問的路徑。通過路徑分析,可以得到重要的頁面,可以改進(jìn)頁面及網(wǎng)站結(jié)構(gòu)的設(shè)計(jì)。
② 關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)。在電子商務(wù)中關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)可以找到客戶對(duì)網(wǎng)站上各種文件之間訪問的相互關(guān)系,可以找到用戶訪問的頁面與頁面之間的相關(guān)性和購買商品間的相關(guān)性。利用這些相關(guān)性,可以更好的組織站點(diǎn)的內(nèi)容,實(shí)施有效的市場(chǎng)策略,增加交叉銷售量,同時(shí)還可以減少用戶過濾信息的負(fù)擔(dān)。
③ 序列模式的發(fā)現(xiàn)。序列模式的發(fā)現(xiàn)就是在時(shí)間戳有序的事務(wù)集中,找到那些“一些項(xiàng)跟隨另一項(xiàng)”的內(nèi)部事務(wù)模式。它能夠便于進(jìn)行電子商務(wù)的組織預(yù)測(cè)客戶的訪問模式,對(duì)客戶開展有針對(duì)性的廣告服務(wù)。通過系列模式的發(fā)現(xiàn),能夠在服務(wù)器方選擇有針對(duì)性地頁面,以滿足訪問者的特定要求。
④ 分類和預(yù)測(cè)。分類發(fā)現(xiàn)就是給出識(shí)別一個(gè)特殊群體的公共屬性的描述,這個(gè)描述可以用來分類新的項(xiàng)。分類的目的是通過構(gòu)造分類模型或分類器,把數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到給定類別中的某一個(gè),以便用于預(yù)測(cè);也就是利用歷史數(shù)據(jù)記錄自動(dòng)推導(dǎo)出對(duì)給定數(shù)據(jù)的推廣描述,從而能對(duì)未來數(shù)據(jù)進(jìn)行預(yù)測(cè),進(jìn)行適合某一類客戶的商務(wù)活動(dòng)。
⑤ 聚類分析。聚類分析可以從Web訪問信息數(shù)據(jù)中聚集出具有相似特性的那些客戶。在Web事務(wù)日志中,聚類顧客信息或數(shù)據(jù)項(xiàng)能夠便于開發(fā)和執(zhí)行未來的市場(chǎng)策略。這種市場(chǎng)策略包括自動(dòng)給一個(gè)特定的顧客聚類發(fā)送銷售郵件、為屬于某一個(gè)顧客聚類中的顧客推薦特定的商品等。對(duì)電子商務(wù)來說,客戶聚類可以對(duì)市場(chǎng)細(xì)分理論提供有力的支持。通過對(duì)聚類客戶特征的提取,電子商務(wù)網(wǎng)站可以為客戶提供個(gè)性化的服務(wù)。
⑥ 異常檢測(cè)。異常檢測(cè)是對(duì)分析對(duì)象的少數(shù)的、極端的特例的描述,以揭示內(nèi)在的原因,從而減小經(jīng)營的風(fēng)險(xiǎn)。異常檢測(cè)在電子商務(wù)中的應(yīng)用可以體現(xiàn)在信用卡欺詐甄別、發(fā)現(xiàn)異??蛻艉途W(wǎng)絡(luò)入侵檢測(cè)等方面。
Web數(shù)據(jù)挖掘的各項(xiàng)功能不是獨(dú)立存在的,而是在挖掘過程中互相聯(lián)系,發(fā)揮作用。
3 Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用
3.1數(shù)據(jù)抽取方法在電子商務(wù)中的應(yīng)用
與傳統(tǒng)商務(wù)活動(dòng)相比,電子商務(wù)具有更多的虛擬和不確定的因素:如客戶購買的心理、動(dòng)機(jī)、能力、欲望等。Web數(shù)據(jù)挖掘要解決的問題就是如何從零散的無規(guī)則的網(wǎng)絡(luò)數(shù)據(jù)中找到有用的和有規(guī)則的數(shù)據(jù)和知識(shí),基本方法之一就是進(jìn)行數(shù)據(jù)抽取,以期對(duì)數(shù)據(jù)進(jìn)行濃縮,給出它的緊湊描述,如方差值等統(tǒng)計(jì)值或用直方圖等圖形方式表示,從數(shù)據(jù)泛化的角度討論數(shù)據(jù)總結(jié),把最原始、基本的信息數(shù)據(jù)從低層次抽象到高層次,以便于企業(yè)決策。
3.2 基于Web數(shù)據(jù)挖掘的智能化搜索引擎
電子商務(wù)企業(yè)在活動(dòng)過程中面臨的問題之一是如何通過Internet全面、準(zhǔn)確、及時(shí)地收集到企業(yè)內(nèi)、外部的環(huán)境信息,尤其是一些隱性的、關(guān)系到企業(yè)經(jīng)營成敗的關(guān)鍵信息,以提高競爭力。目前的搜索引擎存在著查準(zhǔn)率低、返回?zé)o用信息多的問題,使企業(yè)無法得到優(yōu)質(zhì)的信息。鑒于此,將Web數(shù)據(jù)挖掘技術(shù)應(yīng)用于搜索引擎,使之成為智能搜索引擎,從而提高性能,滿足電子商務(wù)企業(yè)的需要。Web挖掘技術(shù)主要在以下幾個(gè)方面對(duì)搜索引擎有借鑒作用:文檔的自動(dòng)分類、自動(dòng)摘要的形成、檢索結(jié)果的聯(lián)機(jī)聚類和相關(guān)度排序及實(shí)現(xiàn)個(gè)性化的搜索引擎。經(jīng)過文檔的分類處理,可以對(duì)搜索結(jié)果進(jìn)行分門別類,可以通過限制搜索范圍來使文本的查找更為容易,幫助用戶快速的對(duì)目標(biāo)知識(shí)進(jìn)行定位,從而提高用戶進(jìn)行網(wǎng)上信息搜索的效率;自動(dòng)摘要能夠解決大部分搜索引擎機(jī)械地截取文檔的前幾句和固定字?jǐn)?shù)的摘要使信息反映不完整的缺陷,使用戶能較準(zhǔn)確、快速、方便地了解檢索信息;通過對(duì)檢索結(jié)果的文檔集合進(jìn)行聚類,可以使得與用戶檢索結(jié)果相關(guān)的文檔集中在一起,從而遠(yuǎn)離那些不相關(guān)的文檔,將處理以后的信息以超鏈結(jié)構(gòu)組織的層次方式可視化地提供給用戶,由用戶選擇他所感興趣的那一簇,將大大縮小所需瀏覽的頁面數(shù)量;將Web使用挖掘中的個(gè)性化技術(shù)應(yīng)用在搜索引擎中,可以在大量訓(xùn)練樣本的基礎(chǔ)上,得到數(shù)據(jù)對(duì)象間的內(nèi)在特征,并以此為依據(jù)進(jìn)行有目的的信息提取,使得搜索引擎可以按照用戶的興趣偏好擴(kuò)充用戶搜索的關(guān)鍵詞,以使得檢索結(jié)果更接近用戶要求,或者根據(jù)用戶歷史瀏覽信息的分析獲得用戶興趣庫,調(diào)用個(gè)性化的搜索引擎可以提高用戶檢索的查全率與查準(zhǔn)率。通過借鑒Web挖掘技術(shù)可以提高查準(zhǔn)率與查全率,改善檢索結(jié)果的組織,從而使檢索效率得到改善。
3.3 Web數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用
① 客戶關(guān)系管理的核心
客戶關(guān)系管理(Customer Relationship Management,簡稱CRM)的核心是通過客戶和他們行為的有效數(shù)據(jù)收集,發(fā)現(xiàn)潛在的市場(chǎng)和客戶,從而獲得更高的商業(yè)利潤,通過完善的客戶服務(wù)和深入的客戶分析來滿足客戶的需求,保證實(shí)現(xiàn)客戶的終生價(jià)值??梢哉f CRM 能給傳統(tǒng)企業(yè)帶來在網(wǎng)絡(luò)經(jīng)濟(jì)時(shí)代謀取生存之道的管理制度和技術(shù)手段。它要求企業(yè)從“以產(chǎn)品為中心”的模式向“以客戶為中心”的模式轉(zhuǎn)移。
② Web數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用
Web數(shù)據(jù)挖掘能夠幫助企業(yè)確定客戶的特點(diǎn),使企業(yè)能夠?yàn)榭蛻籼峁┯嗅槍?duì)性的服務(wù)。將Web數(shù)據(jù)挖掘用在電子商務(wù)CRM中主要體現(xiàn)在客戶的獲取和保持、價(jià)值客戶鑒別、客戶滿意度分析及改善站點(diǎn)結(jié)構(gòu)等幾方面。
通過Web數(shù)據(jù)挖掘,可以理解訪問者的動(dòng)態(tài)行為,據(jù)此優(yōu)化電子商務(wù)網(wǎng)站的經(jīng)營模式。通過把所掌握的大量客戶分成不同的類,對(duì)不同類的客戶提供個(gè)性化服務(wù)來提高客戶的滿意度,從而保持老客戶;通過對(duì)新訪問者的網(wǎng)頁瀏覽記錄進(jìn)行分析,就可以判斷出該訪問者是屬于哪一類客戶,是有利可圖的潛在客戶還是毫無價(jià)值的過客,達(dá)到區(qū)別對(duì)待、節(jié)省銷售成本、提高訪問者到購買者的轉(zhuǎn)化率的目的,從而挖掘潛在客戶;通過對(duì)具有相似瀏覽行為的客戶進(jìn)行分組,提取組中客戶的共同特征,從而實(shí)現(xiàn)客戶的聚類,這可以幫助電子商務(wù)企業(yè)更好地了解客戶的興趣、消費(fèi)習(xí)慣和消費(fèi)傾向,預(yù)測(cè)他們的需求,有針對(duì)性地向他們推薦特定的商品并實(shí)現(xiàn)交叉銷售,可以提高交易成功率和交易量,提高營銷效果。
此外,站點(diǎn)的結(jié)構(gòu)和內(nèi)容是吸引客戶的關(guān)鍵。利用關(guān)聯(lián)規(guī)則的發(fā)現(xiàn),針對(duì)不同客戶動(dòng)態(tài)調(diào)整站點(diǎn)結(jié)構(gòu)和頁面內(nèi)容,把具有一定支持度和信任度的相關(guān)聯(lián)的物品放在一起以有助于銷售;通過路徑分析等技術(shù)可以判定出一類用戶對(duì)Web站點(diǎn)頻繁訪問的路徑,這些路徑反映這類用戶瀏覽站點(diǎn)頁面的順序和習(xí)慣,將客戶訪問的有關(guān)聯(lián)的文件實(shí)現(xiàn)直接鏈接,讓客戶容易地訪問到想要的頁面。這樣的網(wǎng)站會(huì)給客戶留下好印象,提高客戶忠誠度,吸引客戶,延長他們?cè)诰W(wǎng)站上的駐留時(shí)間以及提高再次訪問的機(jī)率。
通過挖掘客戶的行為記錄和反饋情況,進(jìn)一步優(yōu)化網(wǎng)站組織結(jié)構(gòu)和服務(wù)方式以提高網(wǎng)站的效率。通過Web數(shù)據(jù)挖掘,可以得到可靠的市場(chǎng)反饋信息,評(píng)測(cè)廣告的投資回報(bào)率,從而評(píng)估網(wǎng)絡(luò)營銷模式的成功與否;可以根據(jù)關(guān)心某產(chǎn)品的訪問者的瀏覽模式來決定廣告的位置,增加廣告針對(duì)性,提高廣告的投資回報(bào)率,降低公司的運(yùn)營成本。
③ 維護(hù)客戶的隱私權(quán)
維護(hù)客戶的隱私權(quán)是商家在商業(yè)運(yùn)作過程中不能忽視的一個(gè)基本組成部分。因此,作為電子商務(wù)企業(yè),應(yīng)該盡量避免對(duì)單個(gè)客戶數(shù)據(jù)進(jìn)行挖掘。企業(yè)管理客戶隱私權(quán)的保護(hù)應(yīng)該從技術(shù)和管理兩個(gè)方面來實(shí)現(xiàn):技術(shù)上,通常是采用加密標(biāo)志符,并且盡量避免對(duì)單個(gè)客戶數(shù)據(jù)進(jìn)行挖掘;管理上,很多電子商務(wù)企業(yè)現(xiàn)在已經(jīng)增設(shè)了首席隱私官(CPO,Chief Privacy Officer)職位,隱私官將能在個(gè)人對(duì)隱私的需求和公司以合理手段使用隱私材料的權(quán)利之間,建立適當(dāng)?shù)钠胶怅P(guān)系。這種平衡關(guān)系的大成,需要以長期的實(shí)踐和經(jīng)驗(yàn)為基礎(chǔ)。除了電子商務(wù)企業(yè)以單獨(dú)的主體身份進(jìn)行客戶隱私權(quán)保護(hù)的管理之外,行業(yè)自律也是保護(hù)客戶隱私權(quán)的一個(gè)行之有效的手段。目前,電子商務(wù)網(wǎng)站越來越傾向于通過行業(yè)自律的方式來樹立其在客戶心目中的形象,讓客戶放心地提交數(shù)據(jù)。
3.4 Web數(shù)據(jù)挖掘在個(gè)性化服務(wù)推薦系統(tǒng)中的應(yīng)用
電子商務(wù)個(gè)性化服務(wù)推薦系統(tǒng)是向站點(diǎn)企業(yè)提供在電子商務(wù)中更好地運(yùn)作CRM,建立良好客戶關(guān)系的一種解決方法,是“以客戶為中心”、“一對(duì)一”的行銷的堅(jiān)實(shí)執(zhí)行者。
該系統(tǒng)主要是將數(shù)據(jù)挖掘的思想和方法應(yīng)用到Web服務(wù)器日志及Web數(shù)據(jù)庫等資源上,挖掘出客戶的訪問規(guī)律;然后將在線訪問客戶歸結(jié)到某一類中去,根據(jù)該類用戶的訪問規(guī)律進(jìn)行Web頁面的推薦;并且系統(tǒng)還可以通過不斷地跟蹤用戶的當(dāng)前訪問,實(shí)時(shí)調(diào)整推薦集,為用戶提供個(gè)性化的訪問。該系統(tǒng)由五大模塊組成:數(shù)據(jù)收集模塊、數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)存儲(chǔ)模塊、離線挖掘模塊和在線推薦模塊。其系統(tǒng)結(jié)構(gòu)模型如圖1所示:
圖1 基于Web數(shù)據(jù)挖掘的個(gè)性化服務(wù)推薦系統(tǒng)結(jié)構(gòu)模型
數(shù)據(jù)收集模塊主要用于收集Web數(shù)據(jù)庫、使用日志等數(shù)據(jù),形成數(shù)據(jù)采集庫,為以后的挖掘做準(zhǔn)備;數(shù)據(jù)預(yù)處理模塊主要是對(duì)所收集的數(shù)據(jù)進(jìn)行預(yù)處理,數(shù)據(jù)預(yù)處理的質(zhì)量與挖掘的效率和結(jié)果緊密相關(guān);數(shù)據(jù)存儲(chǔ)模塊將預(yù)處理后的數(shù)據(jù)存入用戶事務(wù)庫;離線挖掘模塊中的挖掘引擎使用挖掘算法庫中的數(shù)據(jù)挖掘技術(shù)如統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則、聚類分析、序列模式等,來發(fā)現(xiàn)用戶瀏覽模式,并通過模式分析對(duì)其進(jìn)行分析與解釋,根據(jù)實(shí)際應(yīng)用,通過觀察和選擇,把發(fā)現(xiàn)的統(tǒng)計(jì)結(jié)果、規(guī)則和模型轉(zhuǎn)換為知識(shí),經(jīng)過篩選后得到有用的模式用來指導(dǎo)實(shí)際的電子商務(wù)行為;在線推薦模塊在Web服務(wù)器前端設(shè)置了推薦引擎,它將用戶當(dāng)前的瀏覽活動(dòng)與瀏覽出的頁面推薦集結(jié)合起來考慮,生成相應(yīng)推薦集,然后在用戶最新請(qǐng)求的頁面上添加推薦集的頁面,再通過Web服務(wù)器傳遞到用戶端的瀏覽器,為用戶實(shí)現(xiàn)實(shí)時(shí)個(gè)性化服務(wù);同時(shí)將推薦結(jié)果送往網(wǎng)站管理中心,以便調(diào)整網(wǎng)站設(shè)計(jì),優(yōu)化網(wǎng)站結(jié)構(gòu),提高網(wǎng)站效率。
總的來說,在個(gè)性化服務(wù)推薦系統(tǒng)中運(yùn)用數(shù)據(jù)挖掘技術(shù)有兩個(gè)階段:第一個(gè)階段是學(xué)習(xí)階段,離線進(jìn)行。第二個(gè)階段是模式的使用階段,在線進(jìn)行。挖掘和在線推薦的特征獲取和規(guī)則生成是離線處理的,而當(dāng)用戶訪問該網(wǎng)站時(shí)通過在線推薦引擎進(jìn)行在線服務(wù)。離線模塊和在線模塊相互聯(lián)系,在線模塊主要是利用離線模塊提供的規(guī)則模型對(duì)在線用戶推薦(推薦引擎);離線模塊主要是利用在線模塊積累的數(shù)據(jù)運(yùn)用系統(tǒng)推薦算法形成相應(yīng)的規(guī)則。挖掘算法和推薦策略可以根據(jù)不同類型站點(diǎn)的要求來具體選擇,挖掘結(jié)果和推薦集通過推薦引擎反饋給用戶。電子商務(wù)網(wǎng)站的客戶登錄網(wǎng)站以后,其訪問信息將會(huì)被記錄到服務(wù)器端。這些數(shù)據(jù)將在經(jīng)過預(yù)處理后,在專用的數(shù)據(jù)挖掘模塊中,通過具體的挖掘算法和推薦策略來進(jìn)行模式識(shí)別和模式分析。用戶訪問信息也會(huì)傳到推薦引擎,推薦引擎根據(jù)客戶的會(huì)員標(biāo)識(shí),向挖掘模塊抽取對(duì)應(yīng)客戶的挖掘結(jié)果和推薦集,將其可視化地反饋給用戶,達(dá)到個(gè)性化服務(wù)的目的。
3.5基于Web的數(shù)據(jù)挖掘在商業(yè)信用評(píng)估中的應(yīng)用
發(fā)達(dá)的社會(huì)信用水平是發(fā)展電子商務(wù)的重要基礎(chǔ),通過Web數(shù)據(jù)挖掘?qū)φ军c(diǎn)數(shù)據(jù)統(tǒng)計(jì)和歷史記錄之間的差別,結(jié)果與期望值的偏離以及反常實(shí)例進(jìn)行充分的分析,可以有效地防范投資和經(jīng)營風(fēng)險(xiǎn)。另外,通過數(shù)據(jù)挖掘技術(shù)對(duì)企業(yè)經(jīng)營進(jìn)行跟蹤,開展企業(yè)的資產(chǎn)評(píng)估、利潤收益分析和發(fā)展?jié)摿︻A(yù)測(cè),構(gòu)建完善的安全保障體系,實(shí)施網(wǎng)上全程監(jiān)控,監(jiān)督網(wǎng)上言論,維護(hù)企業(yè)信譽(yù),強(qiáng)化網(wǎng)上交易和在線支付的安全管理,利用數(shù)據(jù)挖掘的信用評(píng)估模型,對(duì)交易歷史數(shù)據(jù)進(jìn)行挖掘發(fā)現(xiàn)客戶的交易數(shù)據(jù)特征,建立客戶信譽(yù)度級(jí)別,有效地防范和化解信用風(fēng)險(xiǎn),提高企業(yè)信用甄別與風(fēng)險(xiǎn)管理的水平和能力。
4 結(jié)論
本文對(duì)Web挖掘技術(shù)進(jìn)行了綜述,介紹了其在電子商務(wù)中的典型應(yīng)用。Web數(shù)據(jù)挖掘高度自動(dòng)化地對(duì)電子商務(wù)中的大量信息進(jìn)行分析和推理,從中挖掘出潛在的模式,預(yù)測(cè)客戶行為,幫助企業(yè)的決策者調(diào)整市場(chǎng)策略,減少風(fēng)險(xiǎn),做出正確的決策。Web數(shù)據(jù)挖掘是近幾年來數(shù)據(jù)挖掘領(lǐng)域的探討熱點(diǎn),利用它的技術(shù)知識(shí)將它運(yùn)用到電子商務(wù),將會(huì)解決許多實(shí)際問題,具有豐富的學(xué)術(shù)價(jià)值。將Web數(shù)據(jù)挖掘技術(shù)和電子商務(wù)兩者有機(jī)結(jié)合,將會(huì)為企業(yè)更有效的確認(rèn)目標(biāo)市場(chǎng),改進(jìn)決策,獲得競爭優(yōu)勢(shì)提供幫助,有著很廣闊的應(yīng)用前景,使電子商務(wù)網(wǎng)站更具有競爭力,從而為企業(yè)帶來更多的效益。面向電子商務(wù)的Web數(shù)據(jù)挖掘能發(fā)現(xiàn)大量數(shù)據(jù)背后隱藏的知識(shí),指導(dǎo)商家提高銷售額,改善企業(yè)客戶關(guān)系,提高網(wǎng)站運(yùn)行效率,改進(jìn)系統(tǒng)性能,具有良好的發(fā)展和應(yīng)用前景,必將得到越來越多的關(guān)注。
參考文獻(xiàn)
[1] 毛國君.數(shù)據(jù)挖掘原理與算法[M].清華大學(xué)出版社.2005(07).
[2] 張冬青.數(shù)據(jù)挖掘在電子商務(wù)中應(yīng)用問題研究[J].現(xiàn)代情報(bào).2005(09).
[3] 李鳳慧.面向電子商務(wù)的Web數(shù)據(jù)挖據(jù)的研究[D].山東科技大學(xué)碩士學(xué)位論文. 2004(06).
[4] 楊風(fēng)召,白慧.異常檢測(cè)技術(shù)及其在電子商務(wù)中的應(yīng)用[J].情報(bào)雜志. 2005(12).
篇4
關(guān)鍵詞:區(qū)域發(fā)展;面板數(shù)據(jù)質(zhì)量;信息熵;FCM;可行性論證
中圖分類號(hào):F224.9
文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):
16721101(2015)02003605
Abstract: Based on information entropy from the perspective of data quantity under index system of regional development, this paper establishes the way of evaluation by the standard of information entropy, explores how to improve the information of data using fuzzy c-means algorithm, and validates the the proposed method from theoretical proof and empirical analysis.The paper makes improving experiments via panel data under comprehensive index system of regions of northern Anhui and along the Huaihe river.Its result suggests diversity in data by information entropy standard and marked improvement of information, which lays good basis of better data quality for consequent data mining.
Key words:regional development; quality of panel data; information entropy; fuzzy c-means algorithm; feasibility demonstration
在現(xiàn)代信息技術(shù)迅猛發(fā)展的背景下,越來越多的領(lǐng)域都采用數(shù)據(jù)驅(qū)動(dòng)的方式進(jìn)行研究。應(yīng)運(yùn)而生的數(shù)據(jù)技術(shù)從傳統(tǒng)的統(tǒng)計(jì)分析到數(shù)據(jù)挖掘,再到現(xiàn)今的云計(jì)算和大數(shù)據(jù)都很好的給生產(chǎn)生活帶來更多的價(jià)值。但是隨之而來的數(shù)據(jù)量度和尺度都變得紛繁復(fù)雜,再加上各行業(yè)所取觀測(cè)指標(biāo)的不同使得數(shù)據(jù)在單位、量綱和指標(biāo)含義等客觀情況下呈現(xiàn)很大差異性和不確定性,特別是經(jīng)濟(jì)數(shù)據(jù)指標(biāo)的數(shù)值差距過大,因此給數(shù)據(jù)技術(shù)方法本身的可行性以及所得結(jié)果的可靠性帶來很大挑戰(zhàn)。傳統(tǒng)的數(shù)據(jù)預(yù)處理中多采用清理、變換和規(guī)約等方法來提高數(shù)據(jù)質(zhì)量[1,2],在大多數(shù)文獻(xiàn)中多采用Min-Max標(biāo)準(zhǔn)化[3,4]、Z-score標(biāo)準(zhǔn)化[4]、Decimal scaling小數(shù)定標(biāo)標(biāo)準(zhǔn)化[5]以及Log和Atan函數(shù)轉(zhuǎn)化[6]來處理數(shù)據(jù),并不著重討論數(shù)據(jù)達(dá)到的質(zhì)量程度。但是由于標(biāo)準(zhǔn)化方法的一些理論局限性,容易在處理中降低數(shù)據(jù)的信息量。所以在研究中如何能夠判斷標(biāo)準(zhǔn)化后數(shù)據(jù)信息量的改變程度,這對(duì)采用的技術(shù)方法本身和后續(xù)結(jié)果分析將起到重要的作用。本文將嘗試探討數(shù)據(jù)信息量衡量熵標(biāo)準(zhǔn),并從理論層面和結(jié)合皖北沿淮區(qū)域經(jīng)濟(jì)發(fā)展數(shù)據(jù)做相應(yīng)的實(shí)證分析。
一、構(gòu)建熵標(biāo)準(zhǔn)下FCM分類改進(jìn)模型
(一)信息熵與FCM準(zhǔn)備
1.數(shù)據(jù)質(zhì)量的信息熵標(biāo)準(zhǔn)
熱力學(xué)第二定律表明孤立系統(tǒng)中任何變化都不可能減少熵值,1948年Shannon定義通信信號(hào)中平均信息量為熵[7],從此熵作為衡量信息量的一種方式被廣泛應(yīng)用。信息熵是數(shù)據(jù)含載信息程度的一種度量方式,當(dāng)信息熵越大時(shí)表明數(shù)據(jù)越無序,需要理清數(shù)據(jù)所需信息就越多,也說明數(shù)據(jù)的信息量越大。離散隨機(jī)變量的信息熵定義為自信息的平均值
H(X)=Ep(x)[I(x)]=-∑xp(x)logp(x)
其中I(x)為事件的自信息,Ep(x)表示對(duì)隨機(jī)變量的概率取平均運(yùn)算。其具有熵的非負(fù)性、對(duì)稱性、擴(kuò)展性和可加性等相關(guān)性質(zhì)。
2.模糊C均值聚類FCM
模糊C均值聚類[8,9](FCM)是由Bezdek在1981年提出的一種模糊分類方法,F(xiàn)CM需要根據(jù)類中距和類間距構(gòu)造分類準(zhǔn)則,利用預(yù)先給定的分類數(shù)C對(duì)所給樣本點(diǎn)進(jìn)行分類。即求解規(guī)劃問題:
minJm(U,Z,c)=∑ci=1∑Nk=1μhikd2ik,
s.t.∑ci=1μik=1,l≤k≤N;0≤μik≤1;
通過求解上面規(guī)劃問題,利用得到的隸屬矩陣Uik=∑cj=1(dikdjk)-2m-1和聚類中心
Ci=∑nk=1umikXk∑nk=1umik,進(jìn)行迭代運(yùn)算得到分類結(jié)果。
(二) 熵標(biāo)準(zhǔn)下FCM分類改進(jìn)模型
由于熵值代表了數(shù)據(jù)的信息量,而通過衡量信息量可以產(chǎn)生評(píng)價(jià)策略,陳衍泰等在綜合評(píng)價(jià)方法分類的研究中總結(jié)了信息熵方法應(yīng)用在評(píng)價(jià)領(lǐng)域的情況[10],張樹森等將熵與聚類算法結(jié)合提出改進(jìn)的模糊聚類算法EFC[11],韓宇平等將最大熵原理用于評(píng)價(jià)區(qū)域水資源短缺問題[12],劉紅琴等將信息熵應(yīng)用到能源消費(fèi)的分配衡量中[13],本文考慮將信息熵引入到數(shù)據(jù)質(zhì)量的評(píng)價(jià)中。
再由于區(qū)域發(fā)展數(shù)據(jù)在數(shù)值上差距過大,如果僅僅統(tǒng)一進(jìn)行z-score標(biāo)準(zhǔn)化處理則可能帶來信息損失,本文考慮利用FCM方法將數(shù)據(jù)進(jìn)行分類標(biāo)準(zhǔn)化,這樣也同時(shí)帶來數(shù)據(jù)扁平化特征,而由離散最大熵定理[7]可知,數(shù)據(jù)出現(xiàn)概率越相同,那么數(shù)據(jù)的信息熵越大。
設(shè)n維數(shù)據(jù)集{xi}ni=1進(jìn)行z-score標(biāo)準(zhǔn)化后{xi-μσ}ni=1在D段中出現(xiàn)的概率為{Pj(x)}Dj=1,利用FCM對(duì)數(shù)據(jù)分C類后原始數(shù)據(jù)重新組合變?yōu)閧xij}i=1,…C,j=1…ni,在每個(gè)數(shù)據(jù)集中表轉(zhuǎn)化得到數(shù)據(jù)集{xij-μiσ}i=1,…C,j=1…ni在D段中出現(xiàn)的概率為{Qj(x)}Dj=1,當(dāng)分段數(shù)D足夠體現(xiàn)數(shù)據(jù)概率分布時(shí)Q(x)比P(x)更加趨近相同概率。利用P(x)對(duì)Q(x)的散度D(P//Q)非負(fù)特征,有如下推導(dǎo):
D(P//Q)=∑xP(x)logP(x)Q(x)=
∑xP(x)logP(x)-
∑xP(x)logQ(x)≥0
Hp(x)=-
∑xP(x)logP(x)≤
-∑xP(x)logQ(x)≤-
∑xQ(x)logQ(x)=HQ(x)
因此在分類標(biāo)準(zhǔn)化后的數(shù)據(jù)信息量比直接標(biāo)準(zhǔn)化的信息量要大。從分類的角度來看,分類后數(shù)據(jù)標(biāo)準(zhǔn)化數(shù)值會(huì)產(chǎn)生比整體標(biāo)準(zhǔn)化更多的多樣性,從而帶來的信息量的增加,而數(shù)據(jù)信息量的增加也給后續(xù)的研究方法提供更好的數(shù)據(jù)質(zhì)量。
二、基于區(qū)域發(fā)展面板數(shù)據(jù)的實(shí)證分析
(一)指標(biāo)體系構(gòu)建與數(shù)據(jù)來源說明
1.區(qū)域發(fā)展指標(biāo)體系構(gòu)建
結(jié)合前期工作制定指標(biāo)體系[14]21,指標(biāo)的選取原則兼顧經(jīng)濟(jì)、生活、環(huán)境、社會(huì)、特征產(chǎn)業(yè)和可持續(xù)發(fā)展的指標(biāo)體系,構(gòu)建一級(jí)指標(biāo),細(xì)化二級(jí)指標(biāo)共選取5個(gè)一級(jí)指標(biāo)和69個(gè)二級(jí)指標(biāo)如圖1所示,并由此構(gòu)建整體指標(biāo)模型和各級(jí)別體系。
具體指標(biāo)表現(xiàn)為:(1)在經(jīng)濟(jì)發(fā)展與產(chǎn)業(yè)結(jié)構(gòu)方面:GDP;城鎮(zhèn)固定資產(chǎn)投資額;出口總額;進(jìn)口總額;農(nóng)業(yè)總產(chǎn)值;工業(yè)總產(chǎn)值;建筑業(yè)鄉(xiāng)村從業(yè)人員數(shù);交通運(yùn)輸、倉儲(chǔ)及郵政業(yè)鄉(xiāng)村從業(yè)人員數(shù);鄉(xiāng)村私營企業(yè)從業(yè)人員數(shù);農(nóng)、林、牧、漁業(yè)鄉(xiāng)村從業(yè)人員數(shù);鄉(xiāng)村個(gè)體從業(yè)人員數(shù);工業(yè)從業(yè)人員年平均人數(shù);城鎮(zhèn)房地產(chǎn)開發(fā)投資額;(2)民生能力與生活質(zhì)量:職工工資總額;總戶數(shù);農(nóng)民人均純收入;城鄉(xiāng)居民儲(chǔ)蓄存款余額;社會(huì)消費(fèi)品零售總額;城鎮(zhèn)居民最低生活保障人數(shù);新型農(nóng)村合作醫(yī)療參合率;建成區(qū)綠化覆蓋率;城市出租汽車數(shù);公共汽(電)車客運(yùn)總量(市轄區(qū));人口自然增長率;城市公共汽(電)車客運(yùn)總量;城市每萬人擁有公共交通車輛數(shù);城市人口密度;人口密度;基本養(yǎng)老保險(xiǎn)基金支出;基本醫(yī)療保險(xiǎn)參保人數(shù);人均公園綠地面積;(3)政府管理與社會(huì)服務(wù):財(cái)政收入;財(cái)政支出;財(cái)政用于教育的支出;財(cái)政支出中衛(wèi)生經(jīng)費(fèi);等級(jí)公路里程;公路貨物周轉(zhuǎn)量;公路旅客周轉(zhuǎn)量;公路客運(yùn)量;鐵路客運(yùn)量;城市道路長度;城市供水總量;城市清掃保潔面積;城市天然氣供氣量;地質(zhì)災(zāi)害防治投資;城市公園數(shù);街道辦事處數(shù)量;(4)資源實(shí)力與可持續(xù)發(fā)展:降水量;人均水資源量;土地面積;林業(yè)用地面積;水田耕地面積;城市污水排放量;生活垃圾無害化處理率;城市排水管道長度;城市污水處理率;工業(yè)廢氣排放量;工業(yè)廢水排放量;“三廢”綜合利用產(chǎn)品產(chǎn)值;(5)教育產(chǎn)業(yè)與創(chuàng)新科技:財(cái)政用于教育的支出;普通高等學(xué)校數(shù);普通高等學(xué)校在校學(xué)生數(shù);普通高中在校學(xué)生數(shù);普通小學(xué)在校生數(shù);發(fā)明專利申請(qǐng)受理量;發(fā)明專利授權(quán)量;科技活動(dòng)人員數(shù);
圖1綜合區(qū)域發(fā)展指標(biāo)結(jié)構(gòu)圖
基于以上初步指標(biāo)體系充分涵蓋從經(jīng)濟(jì)發(fā)展到人民生活,從政府能力到社會(huì)服務(wù),從可持續(xù)發(fā)展到特色產(chǎn)業(yè)的方方面面,兼顧發(fā)展的效率、速度、質(zhì)量、潛力和能力。但是在數(shù)據(jù)收集中往往遇到很多實(shí)際情況需要做修正,對(duì)于少部分的數(shù)據(jù)遺漏采用數(shù)據(jù)擬合回歸和缺省值補(bǔ)充等傳統(tǒng)數(shù)據(jù)預(yù)處理方法進(jìn)行修整[1],對(duì)于大部分的數(shù)據(jù)遺漏則采用指標(biāo)替換的方式進(jìn)行變通。
2.面板數(shù)據(jù)來源說明
本文依托皖北沿淮地區(qū)6市39縣區(qū)的區(qū)域發(fā)展研究,因?yàn)樵谕畋毖鼗吹貐^(qū)中蚌埠市和淮南市具有相同的地緣特征和相似生活特征,所以對(duì)兩個(gè)地區(qū)指標(biāo)的衡量具有很好的實(shí)際意義,故而采用2005年到2012年蚌埠市和淮南市數(shù)據(jù),數(shù)據(jù)來源于中國知網(wǎng)提供的《中國統(tǒng)計(jì)年鑒》、《中國城市統(tǒng)計(jì)年鑒》和各地區(qū)發(fā)展統(tǒng)計(jì)年鑒等。同時(shí)本文數(shù)據(jù)屬于面板數(shù)據(jù),可以克服時(shí)間序列分析受多重共線性的困擾,能夠提供更多信息、變化、自由度和估計(jì)效率。
(二)具體實(shí)證分析
本文的具體實(shí)證分析分為以下三個(gè)方面:(1)對(duì)于原始數(shù)據(jù)的處理過程:按照論文前面介紹的科學(xué)指標(biāo)模型和數(shù)據(jù)采集來源,將兩個(gè)城市69個(gè)屬性從2005年到2012年共8年的數(shù)據(jù)進(jìn)行矩陣化,得到一個(gè)138行8列的原始數(shù)據(jù)矩陣,對(duì)于原始數(shù)據(jù)矩陣中的缺省值采用外插和內(nèi)插法進(jìn)行相應(yīng)的差值擬合得到完整的使用數(shù)據(jù)。(2)對(duì)于使用數(shù)據(jù)的分析過程:第一步根據(jù)本文前期工作[14]22通過對(duì)數(shù)據(jù)進(jìn)行譜系聚類、HCM和FCM三種聚類方法,采用Matlab2012b進(jìn)行編程,比較從分2類到分10類的由R方統(tǒng)計(jì)量和偽F統(tǒng)計(jì)量得到的半偏相關(guān)統(tǒng)計(jì)量SPRSQ數(shù)值,發(fā)現(xiàn)當(dāng)分三類時(shí)譜系聚類方法和HCM的SPRSQ數(shù)值達(dá)到最高值分別為0.400 1和0.023 9,而FCM的SPRSQ數(shù)值在分四類時(shí)達(dá)到最高值0.027 0,因此在進(jìn)行分類構(gòu)建信息熵時(shí),將分三類和分四類的情況均予以考慮。第二步根據(jù)論文前面討論的信息熵構(gòu)建過程進(jìn)行分類信息熵構(gòu)建,首先將利用FCM對(duì)數(shù)據(jù)分三類和分四類得到的數(shù)據(jù)集
{xij}i=1,…C,j=1…ni(其中C=3或者4),在每個(gè)數(shù)據(jù)集進(jìn)行z-score標(biāo)準(zhǔn)化:{xij-μiσi}i=1,…C,j=1…ni;然后討論這些數(shù)據(jù)在分D段中出現(xiàn)的概率{Qj(x)}Dj=1,其中分段數(shù)D的大小要足夠體現(xiàn)數(shù)據(jù)概率分布特征 [7,11]取D分別為10和20兩種情況,計(jì)算相關(guān)信息熵?cái)?shù)值H(X)=
EQ(x)[I(x)]=-∑xQ(x)logQ(x)
;最后通過和沒有進(jìn)行分段改進(jìn)的原始數(shù)據(jù)集的未標(biāo)準(zhǔn)化和統(tǒng)一標(biāo)準(zhǔn)化兩種情況進(jìn)行比較得到相關(guān)結(jié)論。(3)對(duì)于數(shù)值比較的分析結(jié)果:通過比較未標(biāo)準(zhǔn)化、普通的列統(tǒng)一標(biāo)準(zhǔn)化和采用FCM分三類和四類的類標(biāo)準(zhǔn)化的三種方法在取分段數(shù)為10和20下的信息熵大小,得到了相關(guān)的數(shù)值結(jié)果表1。
對(duì)表1中的相關(guān)數(shù)值做圖進(jìn)行直觀的表達(dá),可以得到在分10段情況下的圖2和分20段情況下的圖3,其中橫坐標(biāo)為從2005年到2012年每一年的數(shù)據(jù)情況,從圖中可以發(fā)現(xiàn)不論哪一年的數(shù)據(jù)數(shù)值在分類標(biāo)準(zhǔn)化后的熵值都高于圖中最下面的線,即統(tǒng)一標(biāo)準(zhǔn)化的數(shù)據(jù)熵值。
從以上圖表的結(jié)果來看,采用FCM算法對(duì)于數(shù)據(jù)分類標(biāo)準(zhǔn)化后得到的信息熵提升效果是明顯的,具體可以概括為以下的一些結(jié)論:
1.未標(biāo)準(zhǔn)化和統(tǒng)一標(biāo)準(zhǔn)化的結(jié)果數(shù)值完全一樣,這是因?yàn)閦-score標(biāo)準(zhǔn)化過程并不改變數(shù)據(jù)分布特征,因此他們擁有相同的概率分布,則信息熵也完全一致,故而數(shù)據(jù)所含信息不變,因此在作圖階段就不體現(xiàn)未標(biāo)準(zhǔn)化的結(jié)果圖形。
2.分段標(biāo)準(zhǔn)化后所有的數(shù)據(jù)結(jié)果均大于統(tǒng)一標(biāo)準(zhǔn)化的數(shù)據(jù)值,即信息熵在分段標(biāo)準(zhǔn)化后都有顯著提高,這和理論推導(dǎo)的結(jié)果一致。故而分段標(biāo)準(zhǔn)化的方法可以有效消除量綱差異,同時(shí)還能有效的提高數(shù)據(jù)信息熵,從而使得數(shù)據(jù)含有更好的信息量。
3.就分段標(biāo)準(zhǔn)化而言從所有列信息熵的總和數(shù)值可以發(fā)現(xiàn),在兩種最佳聚類數(shù)時(shí)信息熵的總和情況分別可以表示為:分10段3類時(shí)的9.07高于4類時(shí)的7.8,分20段3類時(shí)的12.19高于4類時(shí)的11;同時(shí)數(shù)據(jù)信息熵隨著分段的增大數(shù)值也在增大,這是信息熵本身性質(zhì)所決定的,因?yàn)榉侄卧蕉喔怕史植荚浇咏鶆蚍植?,由離散最大熵定理以及本文理論推導(dǎo)可知數(shù)據(jù)信息熵在增加。但是如果分段過多,甚至達(dá)到數(shù)據(jù)總量的一定比例,此時(shí)再高的信息熵?cái)?shù)值也并不能夠說明很好的信息量,所以在分段數(shù)的選取需要與數(shù)據(jù)總量相互匹配。
三、結(jié)論
根據(jù)以上論證發(fā)現(xiàn),從理論角度和實(shí)證分析都驗(yàn)證了分類標(biāo)準(zhǔn)化可以有效的提高數(shù)據(jù)信息量。所以在相應(yīng)數(shù)據(jù)分析方法使用之前,對(duì)于數(shù)據(jù)標(biāo)準(zhǔn)化處理階段可以嘗試采用分類標(biāo)準(zhǔn)化的方式,這樣既可以消除數(shù)據(jù)量綱差異,也可以有效的提高數(shù)據(jù)含載信息,為進(jìn)一步使用數(shù)據(jù)挖掘方法得到更好的數(shù)據(jù)結(jié)論提供較好的前期準(zhǔn)備。
同時(shí)由于在數(shù)據(jù)集統(tǒng)一標(biāo)準(zhǔn)化中均值唯一,相當(dāng)于只有一個(gè)中心節(jié)點(diǎn)。但是在分類標(biāo)準(zhǔn)化后,在不同類中都有相應(yīng)的均值作為中心節(jié)點(diǎn),所以分類標(biāo)準(zhǔn)化比傳統(tǒng)的統(tǒng)一標(biāo)準(zhǔn)化更符合現(xiàn)代互聯(lián)網(wǎng)思維,那就是去中心化和多節(jié)點(diǎn)多分類,以及扁平化結(jié)構(gòu)體系的相關(guān)思想。參考文獻(xiàn):
[1]Jiawei Han.Data Mining Concepts and Techniques, Second Edition[M].BeiJing: China Machine Press,2008:30-65.
[2]韓京宇.數(shù)據(jù)質(zhì)量研究綜述[J].計(jì)算機(jī)科學(xué),2008(2):1-5.
[3]程惠芳,唐輝亮.開放條件下區(qū)域經(jīng)濟(jì)轉(zhuǎn)型升級(jí)綜合能力評(píng)價(jià)研究――中國31個(gè)省市轉(zhuǎn)型升級(jí)評(píng)價(jià)指標(biāo)體系分析[J].管理世界,2011(8):173-174.
[4]張鋼.長江三角洲16個(gè)城市政府能力的比較研究[J].管理世界,2004(8):18-27.
[5]安悅.基于微博客的手機(jī)供應(yīng)商排名推薦[J].數(shù)學(xué)的認(rèn)識(shí)與實(shí)踐,2013(10):23-29.
[6]汪冬華.我國滬深300股指期貨和現(xiàn)貨市場(chǎng)的交叉相關(guān)性及其風(fēng)險(xiǎn)[J].系統(tǒng)工程理論與實(shí)踐,2014(3):631-639.
[7]田寶玉.信息論基礎(chǔ)[M].北京:人民郵電出版社,2008:18-26.
[8]史小松,黃勇杰,劉永革.數(shù)據(jù)挖掘技術(shù)中聚類的幾種常用方法比較[J].中國科技信息,2009(20):99-105.
[9]諸克軍,蘇順華,黎金玲.模糊C均值中的最優(yōu)聚類與最佳聚類數(shù)[J].系統(tǒng)工程理論與實(shí)踐,2005(3):52-61.
[10]陳衍泰.綜合評(píng)價(jià)方法分類及研究進(jìn)展[J].管理科學(xué)學(xué)報(bào),2004(2):69-77.
[11]張樹森.改進(jìn)的基于熵的中心聚類算法[J].計(jì)算機(jī)與現(xiàn)代化,2014(3):53-56.
[12]韓宇平.基于最大熵原理的區(qū)域水資源短缺風(fēng)險(xiǎn)綜合評(píng)估[J].安徽農(nóng)業(yè)科學(xué),2011(1):397-399.
[13]劉紅琴.基于信息熵的省域內(nèi)能源消費(fèi)總量分配研究[J].長江流域資源與環(huán)境,2014(4):482-489.
篇5
關(guān)鍵詞 兩化融合 互聯(lián)網(wǎng)+ 現(xiàn)代電子商務(wù) 現(xiàn)代師徒制 項(xiàng)目實(shí)踐
中圖分類號(hào):G642 文獻(xiàn)標(biāo)識(shí)碼:A
1論文的提出及意義
以阿里巴巴、淘寶、京東商城等為代表的大型電子商務(wù)平臺(tái)逐漸成為現(xiàn)代企業(yè)產(chǎn)品銷售的重要渠道。同時(shí)生產(chǎn)者和消費(fèi)者借助互聯(lián)網(wǎng)這一現(xiàn)代化的信息溝通渠道實(shí)現(xiàn)C&B的零距離,傳統(tǒng)工業(yè)企業(yè)的生產(chǎn)及商務(wù)模式也在悄然發(fā)生變化。
傳統(tǒng)電子商務(wù)教學(xué)存在的問題:
1.1電子商務(wù)專業(yè)的師資隊(duì)伍有待壯大
電子商務(wù)是一個(gè)復(fù)合型的學(xué)科,這就需要一支具有復(fù)合型知識(shí)背景的師資隊(duì)伍。因此,電子商務(wù)的專業(yè)教師必須是既精通計(jì)算機(jī)和網(wǎng)絡(luò)信息知識(shí),又熟悉商務(wù)活動(dòng)的復(fù)合型教師,并且還需具有較強(qiáng)的研究創(chuàng)新能力。目前大多數(shù)高校的師資隊(duì)伍存在師資短缺、教師結(jié)構(gòu)不合理等問題。
1.2目前電子商務(wù)教學(xué)中缺乏實(shí)踐教學(xué)
目前,在電子商務(wù)教學(xué)中使用的教材大多存在重理論,輕實(shí)踐的問題。多數(shù)教材都是有關(guān)電子商務(wù)內(nèi)容的介紹,涉及的案例較少,對(duì)操作技能的培養(yǎng)的內(nèi)容則基本沒有,無疑這明顯不適應(yīng)現(xiàn)代互聯(lián)網(wǎng)+電子商務(wù)人才培養(yǎng)的需要。過多的理論知識(shí)既不適應(yīng)學(xué)生學(xué)習(xí)的需要,又難以激起學(xué)生的學(xué)習(xí)興趣,同時(shí)也給教師的教學(xué)增加了不少困難。
2論文研究內(nèi)容與實(shí)施方法
2.1創(chuàng)新課程體系建設(shè)
以兩化融合型電子商務(wù)人才培養(yǎng)目標(biāo)位導(dǎo)向,合理設(shè)置和建設(shè)相關(guān)課程體系,開設(shè)更多的創(chuàng)新型課程。從基礎(chǔ)、技能和實(shí)踐三個(gè)層次開設(shè)相關(guān)高職層次課程。
大一課程以基礎(chǔ)素養(yǎng)培養(yǎng)為核心,主要課程包括:《計(jì)算機(jī)操作基礎(chǔ)》、《實(shí)用英語》、《商務(wù)溝通禮儀》、《計(jì)算機(jī)綜合訓(xùn)練》、《Ruby或Python編程基礎(chǔ)》、《電子商務(wù)導(dǎo)論》、《大數(shù)據(jù)》。
大二課程以專業(yè)技能和網(wǎng)絡(luò)基礎(chǔ)知識(shí)培養(yǎng)為核心,主要課程包括:《互聯(lián)網(wǎng)基礎(chǔ)》、《網(wǎng)站制作》、《網(wǎng)絡(luò)營銷工具》、《兩化融合基礎(chǔ)知識(shí)》、《數(shù)據(jù)采集工具》、《數(shù)據(jù)加工工具》、《企業(yè)信息化發(fā)展概論》。
大三課程以實(shí)習(xí)、實(shí)踐為核心,培養(yǎng)學(xué)生職業(yè)技能,主要課程包括:《大數(shù)據(jù)挖掘與分析》、《網(wǎng)絡(luò)營銷實(shí)戰(zhàn)》、《互聯(lián)網(wǎng)思維》、《營銷的故事》、《大數(shù)據(jù)采集實(shí)習(xí)》、《大數(shù)據(jù)加工實(shí)習(xí)》、《比特能工廠實(shí)訓(xùn)》。
2.2以實(shí)踐為主導(dǎo)的教學(xué)模式研究
探索以實(shí)踐為主導(dǎo)的教學(xué)模式,不斷創(chuàng)新課堂教學(xué)形式,加大實(shí)踐教學(xué)的學(xué)時(shí)比例,充分借助兩化融合發(fā)展促進(jìn)中心企業(yè)服務(wù)的實(shí)踐基地為學(xué)生創(chuàng)造真實(shí)的教學(xué)環(huán)境。
(1)改變傳統(tǒng)單一式、枯燥式的教學(xué)模式,融入一些活動(dòng)、互動(dòng)、討論、溝通的多樣化教學(xué)模式,讓學(xué)生從快樂中學(xué)習(xí),在快樂中成長。
(2)融合網(wǎng)站設(shè)計(jì)、網(wǎng)絡(luò)營銷、情報(bào)檢索、大數(shù)據(jù)分析等技術(shù),用實(shí)際例子培養(yǎng)學(xué)生對(duì)電子商務(wù)相關(guān)技術(shù)的理解和掌握,鍛煉實(shí)戰(zhàn)技能。
(3)模擬業(yè)務(wù)團(tuán)隊(duì),以工業(yè)淘堡網(wǎng)商務(wù)平臺(tái)為基礎(chǔ),根據(jù)學(xué)生的特長、興趣等進(jìn)行分組、劃分成多個(gè)團(tuán)隊(duì),組件比特能工廠各類業(yè)務(wù)團(tuán)隊(duì),以實(shí)際企業(yè)服務(wù)需求為基礎(chǔ)開展實(shí)訓(xùn),增強(qiáng)團(tuán)隊(duì)協(xié)助意識(shí)。
3教學(xué)實(shí)施成果
根據(jù)目前企業(yè)互聯(lián)網(wǎng)建設(shè)、電子商務(wù)建設(shè)實(shí)際工作需求,我們開展了以“網(wǎng)”、“絡(luò)”、“營”、“銷”四大課程及實(shí)踐體系的核心教學(xué),在“網(wǎng)”方面,我們教授學(xué)生們掌握如何企業(yè)設(shè)計(jì)、搭建、運(yùn)營、維護(hù)企業(yè)網(wǎng)站與網(wǎng)店技術(shù);在“絡(luò)”方面,我們教授學(xué)生們掌握如何采集、挖掘互聯(lián)網(wǎng)大數(shù)據(jù)資源(供應(yīng)商、客戶、原材料、產(chǎn)品技術(shù)、市場(chǎng)商機(jī)…),為營銷提供數(shù)據(jù)基礎(chǔ);在“營”方面,我們教授學(xué)生們掌握現(xiàn)代最流行的微信營銷、QQ營銷、論壇營銷、郵件營銷、事件營銷、博客營銷、SEO優(yōu)化等實(shí)踐技能;在“銷”方面,我們教授學(xué)生們掌握溝通技巧、客戶服務(wù)、商務(wù)談判、軟文寫作等商務(wù)技能。學(xué)生們?cè)谡鎸?shí)項(xiàng)目中訓(xùn)練、成長,將項(xiàng)目成果轉(zhuǎn)換為快樂的教學(xué)成果,使學(xué)生們不再面對(duì)枯燥的學(xué)習(xí)氛圍,而在實(shí)踐中收獲、提高。
兩化融合型電子商務(wù)人才培養(yǎng)模式的構(gòu)建與實(shí)施的前提條件就是以企業(yè)互聯(lián)網(wǎng)+改革市場(chǎng)為導(dǎo)向,突出企業(yè)兩化融合需求+電子商務(wù)+計(jì)算機(jī)的優(yōu)勢(shì)。為了把握市場(chǎng)需求,在制定教學(xué)方案初期進(jìn)行深入的調(diào)查研究,在教學(xué)實(shí)施過程中持續(xù)調(diào)研,以保證專業(yè)教學(xué)方向的準(zhǔn)確性、超前性和科學(xué)性。
參考文獻(xiàn)
[1] 于春香.網(wǎng)絡(luò)環(huán)境下的電子商務(wù)教學(xué)模式分析[J].電子商務(wù),2014(04).
[2] 費(fèi)佳艷.基于市場(chǎng)發(fā)展趨勢(shì)看電子商務(wù)教學(xué)發(fā)展[J].青年與社會(huì),2013(11).
[3] 胡桃,堯舜.電子商務(wù)教學(xué)方法改革與實(shí)踐[J].中國大學(xué)教學(xué),2012(10).
篇6
1 統(tǒng)計(jì)學(xué)介紹
統(tǒng)計(jì)學(xué)是認(rèn)識(shí)現(xiàn)象規(guī)律的一種方法,它的特點(diǎn)是揭示現(xiàn)象量變到質(zhì)變的規(guī)律,具有普適性。對(duì)于高校學(xué)科體系來說,統(tǒng)計(jì)學(xué)已經(jīng)從經(jīng)濟(jì)學(xué)和數(shù)學(xué)中獨(dú)立出來作為一級(jí)學(xué)科,足以表明統(tǒng)計(jì)學(xué)在理論研究與實(shí)際應(yīng)用中的巨大作用。隨著數(shù)據(jù)時(shí)代到來,統(tǒng)計(jì)學(xué)作為一門工具學(xué)科,越來越廣地應(yīng)用到生物、醫(yī)藥、物理、水利、工程技術(shù)、人文社科等其他學(xué)科的研究中,統(tǒng)計(jì)學(xué)專業(yè)課程設(shè)置向多樣性發(fā)展,以期培養(yǎng)出能為社會(huì)所用的人才。
高校統(tǒng)計(jì)一般分為數(shù)理統(tǒng)計(jì)和經(jīng)濟(jì)統(tǒng)計(jì)兩個(gè)方向,部分高校在理學(xué)院和經(jīng)管學(xué)院分別設(shè)置統(tǒng)計(jì)學(xué)專業(yè),比如:暨南大學(xué)經(jīng)濟(jì)學(xué)院的統(tǒng)計(jì)學(xué)專業(yè)學(xué)生獲得的是經(jīng)濟(jì)學(xué)學(xué)位,信息科學(xué)技術(shù)學(xué)院的應(yīng)用統(tǒng)計(jì)專業(yè)學(xué)生獲得的是理學(xué)學(xué)位。雖然分為不同學(xué)院,設(shè)置的專業(yè)基礎(chǔ)課程卻有很大部分重疊。本文著重討論經(jīng)濟(jì)統(tǒng)計(jì)專業(yè)人才培養(yǎng)現(xiàn)狀。
2 人才培養(yǎng)目標(biāo)
目前統(tǒng)計(jì)學(xué)人才培養(yǎng)目標(biāo)是培養(yǎng)具有良好的數(shù)學(xué)基礎(chǔ)和統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)素養(yǎng),掌握統(tǒng)計(jì)學(xué)基本理論和方法,能熟練運(yùn)用統(tǒng)計(jì)軟件分析數(shù)據(jù),能在企事業(yè)單位從事統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)信息管理、數(shù)量分析等開發(fā)、應(yīng)用與管理工作,或在金融、貿(mào)易等領(lǐng)域從事統(tǒng)計(jì)分析工作的復(fù)合應(yīng)用型人才。
3 課程設(shè)置
高校統(tǒng)計(jì)學(xué)課程分為理論課程和實(shí)踐教學(xué)課程。理論課程包括思想道德修養(yǎng)、中國近代歷史、大學(xué)英語等通識(shí)課程,高等數(shù)學(xué)、概率論與數(shù)理統(tǒng)計(jì)、西方經(jīng)濟(jì)學(xué)等學(xué)科基礎(chǔ)必修課程,財(cái)務(wù)管理、國際金融等基礎(chǔ)選修課程,統(tǒng)計(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)、抽樣調(diào)查、時(shí)間序列分析等專業(yè)必修課程,博弈論、非參數(shù)統(tǒng)計(jì)、數(shù)據(jù)挖掘、市場(chǎng)調(diào)研等專業(yè)選修課程。實(shí)踐教學(xué)課程包括實(shí)習(xí)、學(xué)術(shù)活動(dòng)和課程設(shè)計(jì)等。其中理論課程學(xué)分占總學(xué)分的80%左右,實(shí)踐教學(xué)課程占總學(xué)分的20%左右。理論課程中通識(shí)課程和基礎(chǔ)課程一般安排在大一和大二上學(xué)期;大二到大三主修專業(yè)必修課程和選修課程,專業(yè)課程大部分是理論課和實(shí)驗(yàn)課相結(jié)合,理論課主要講授模型方法論,通過設(shè)計(jì)實(shí)驗(yàn)課,學(xué)習(xí)統(tǒng)計(jì)分析軟件,并實(shí)現(xiàn)模型案例實(shí)證分析;大四理論課程基本結(jié)束,主修教學(xué)實(shí)習(xí)和課程設(shè)計(jì)。
高等學(xué)校核心課程體系尚屬完善,大多數(shù)課程偏重理論教學(xué),忽視實(shí)踐教學(xué),人才培養(yǎng)計(jì)劃中未設(shè)置實(shí)踐教學(xué)環(huán)節(jié)或者實(shí)踐教學(xué)課時(shí)偏少。實(shí)踐教學(xué)是以實(shí)踐性知識(shí)為課程內(nèi)容,以生成實(shí)踐性知識(shí)為目標(biāo)的課程。以實(shí)踐過程和實(shí)踐性知識(shí)的掌握為課程結(jié)構(gòu)展開的起點(diǎn),讓學(xué)生在一定程度實(shí)踐的基礎(chǔ)上建構(gòu)所需的理論知識(shí),以教學(xué)實(shí)踐任務(wù)為中心來組織課程內(nèi)容,所需要的理論知識(shí)也圍繞實(shí)踐過程來選擇、組織和學(xué)習(xí),以實(shí)踐過程作為學(xué)生學(xué)習(xí)的主要形式,并通過實(shí)踐報(bào)告、實(shí)踐表現(xiàn)等來評(píng)價(jià)學(xué)生的學(xué)習(xí)結(jié)果。實(shí)踐課縮短了從理論向?qū)嵺`轉(zhuǎn)化的時(shí)空上的滯后,比如市場(chǎng)調(diào)查分析,通過學(xué)生親手設(shè)計(jì)調(diào)查問卷、選取合適的抽樣方法展開問卷調(diào)查、后期問卷數(shù)據(jù)匯總分析,最終生成調(diào)查分析報(bào)告,在實(shí)踐課程中加深統(tǒng)計(jì)專業(yè)知識(shí)的掌握和綜合運(yùn)用。因此,應(yīng)適當(dāng)提高實(shí)踐教學(xué)課時(shí)比例。課程設(shè)置上,專業(yè)選修課程安排相對(duì)獨(dú)立,忽視了與其他學(xué)科的交叉融合學(xué)習(xí),可適當(dāng)增加交叉學(xué)科基礎(chǔ)知識(shí)的課程設(shè)置。
4 理論教學(xué)分析
教學(xué)方式上,大部分教師采取傳統(tǒng)的課堂面對(duì)面教學(xué),仍停留在傳統(tǒng)統(tǒng)計(jì)專業(yè)教學(xué)模式。互聯(lián)網(wǎng)時(shí)代,隨著互聯(lián)網(wǎng)+教育的興起,由于網(wǎng)絡(luò)課程的低成本和便利性,其在大學(xué)教育中占據(jù)越來越大的比重。微課、慕課等互聯(lián)網(wǎng)教學(xué)模式,通過科學(xué)的設(shè)計(jì)將課程重點(diǎn)知識(shí)碎片化、網(wǎng)絡(luò)化,便于更多學(xué)生隨時(shí)隨地進(jìn)行學(xué)習(xí),而現(xiàn)今大部分高校形式上鮮有統(tǒng)計(jì)學(xué)的慕課、微課等網(wǎng)絡(luò)課程教學(xué)。教學(xué)手段上都是以理論講解為主,專業(yè)知識(shí)枯燥無味,不能最大程度激發(fā)學(xué)生的學(xué)習(xí)興趣,缺乏探討式、研究式、報(bào)告式等多樣化教學(xué)研討形式。
課程設(shè)計(jì)是教師形成具體教學(xué)方案的過程,特別是對(duì)于統(tǒng)計(jì)學(xué)這門應(yīng)用性、實(shí)踐性都很強(qiáng)的課程,不僅要求學(xué)生能夠熟悉和掌握統(tǒng)計(jì)學(xué)基本理論知識(shí)及常用的統(tǒng)計(jì)分析方法,更要求能夠結(jié)合實(shí)際問題,應(yīng)用最合適的統(tǒng)計(jì)方法,借助統(tǒng)計(jì)軟件,完成對(duì)問題的研究分析,真正達(dá)到學(xué)以致用的目的。統(tǒng)計(jì)學(xué)課程的教學(xué)設(shè)計(jì)尤為重要。課程設(shè)計(jì)需要綜合考慮教師自身教學(xué)技能、知識(shí)結(jié)構(gòu)和教學(xué)經(jīng)驗(yàn),學(xué)生的知識(shí)儲(chǔ)備情況和學(xué)習(xí)能力,課程本身所承載的信息技能。課程設(shè)計(jì)聯(lián)系經(jīng)濟(jì)生活中的實(shí)際問題,有助于開拓學(xué)生的思維空間,學(xué)以致用、觸類旁通,作為理論知識(shí)到實(shí)際應(yīng)用的橋梁工程,合理規(guī)范的課程設(shè)計(jì)起到將抽象理論具化到應(yīng)用的紐帶作用。
教學(xué)內(nèi)容上,統(tǒng)計(jì)軟件應(yīng)用教學(xué)大部分限于Excel、SPSS、Eviews等傳統(tǒng)老舊的軟件,以致大部分學(xué)生的畢業(yè)論文或者課程設(shè)計(jì)都是對(duì)照陳舊的教材生搬硬套,用SPSS或Eviews做一個(gè)簡單的因子分析、主成分分析或者多元回歸模型,而SAS、R語言、Python等功能強(qiáng)大兼具實(shí)用性的潮流軟件學(xué)習(xí)課程欠缺。使用的教材著重對(duì)統(tǒng)計(jì)基礎(chǔ)知識(shí)的講解,對(duì)于變量選取、文本分析、隨機(jī)森林等實(shí)用性強(qiáng)的模型講解欠缺。
考核形式上,課程大部分以閉卷、開卷形式考核,造成學(xué)生只會(huì)死讀書、讀死書的弊病,靈活跳躍的邏輯思維能力和分析表述能力都是卷面考試考查不到而對(duì)于統(tǒng)計(jì)分析人員至關(guān)重要的能力。課程考核模式方面可以考慮加入分組開展調(diào)研、總結(jié)報(bào)告等開放式考核形式,變革考核情境,激發(fā)學(xué)生主動(dòng)學(xué)習(xí)的積極性,在考核過程中塑造學(xué)生的統(tǒng)計(jì)思想。
5 實(shí)踐教學(xué)分析
大學(xué)生實(shí)踐學(xué)習(xí)分為實(shí)習(xí)和參加學(xué)術(shù)科研活動(dòng)兩方面。大學(xué)生實(shí)習(xí)課程一方面從傳統(tǒng)意義上提高實(shí)踐技能,另一方面轉(zhuǎn)變?yōu)閷ふ揖蜆I(yè)的試水,本科生實(shí)習(xí)已經(jīng)從過去的專業(yè)實(shí)踐直接指向就業(yè),學(xué)生可以在實(shí)習(xí)過程中對(duì)所學(xué)專業(yè)有客觀實(shí)際的認(rèn)識(shí),不再局限于書本上教條案例,有助于學(xué)生拓展眼界,找到自身發(fā)展的興趣點(diǎn)。對(duì)于應(yīng)用性較強(qiáng)的統(tǒng)計(jì)專業(yè),實(shí)習(xí)課程的開展、實(shí)習(xí)基地的選擇、實(shí)習(xí)任務(wù)與時(shí)間的安排等都起到很重要的作用。實(shí)習(xí)基地的建設(shè)使學(xué)生在政府部門、企事業(yè)單位中了解部門統(tǒng)計(jì)、不同行業(yè)工作的內(nèi)容和特點(diǎn),拓寬學(xué)生的就業(yè)渠道。
高校學(xué)生實(shí)習(xí)有兩種形式。一種是院系組織,建立校企合作實(shí)習(xí)基地,定期輸送學(xué)生到實(shí)習(xí)崗位實(shí)踐學(xué)習(xí)。大學(xué)中實(shí)習(xí)基地掛牌很多,但是限于學(xué)生和企業(yè)之間關(guān)于交通、住宿、實(shí)習(xí)時(shí)間等問題難以協(xié)調(diào),或者受其他因素影響,實(shí)習(xí)基地能夠提供給學(xué)生的實(shí)習(xí)機(jī)會(huì)較少。有待加強(qiáng)學(xué)校與企事業(yè)單位合作,建立友好長期的合作實(shí)習(xí)基地,為學(xué)生提供高質(zhì)量的實(shí)習(xí)機(jī)會(huì)。另一種是學(xué)生自主尋找興趣相關(guān)的實(shí)習(xí)機(jī)會(huì),這一類實(shí)習(xí)需要付出較多的時(shí)間成本,很難找到專業(yè)對(duì)口的實(shí)習(xí)崗位,學(xué)生實(shí)習(xí)期間的安全問題也難以得到保障。校方應(yīng)做好留底審核實(shí)習(xí)協(xié)議資料等工作,實(shí)時(shí)掌握校外實(shí)習(xí)的學(xué)生動(dòng)向,確保實(shí)習(xí)的合法合規(guī)。
高校大學(xué)生參加實(shí)踐競賽等科研活動(dòng)是培養(yǎng)創(chuàng)新型人才的有效途徑。本科生參加實(shí)踐競賽有利于培養(yǎng)團(tuán)隊(duì)協(xié)作精神和創(chuàng)新精神,了解學(xué)科前沿動(dòng)態(tài),了解國家產(chǎn)業(yè)政策及區(qū)域社會(huì)經(jīng)濟(jì)發(fā)展問題,提高創(chuàng)新實(shí)踐綜合素質(zhì)。另一方面也彌補(bǔ)了教師科研人員不足的問題。構(gòu)建基于實(shí)踐競賽等科研活動(dòng)的教學(xué)體系,對(duì)于學(xué)生明確學(xué)習(xí)目標(biāo)、提升自主學(xué)習(xí)熱情、培養(yǎng)科研興趣具有積極推動(dòng)作用。
科研競賽方面,學(xué)校會(huì)給參加科研競賽的學(xué)生學(xué)分獎(jiǎng)勵(lì),提升學(xué)生在學(xué)術(shù)競賽和科研活動(dòng)上的積極性。目前各種國家級(jí)、省級(jí)科研競賽有大創(chuàng)項(xiàng)目、挑戰(zhàn)杯、數(shù)學(xué)建模競賽、統(tǒng)計(jì)建模競賽、數(shù)據(jù)挖掘競賽、SAS數(shù)據(jù)分析大賽、市場(chǎng)調(diào)查大賽等。學(xué)生初期報(bào)名熱情高漲,但常常由于指導(dǎo)教師欠缺、教學(xué)軟件資源不足等原因,培訓(xùn)指導(dǎo)不能滿足學(xué)生參加競賽的知識(shí)需求,學(xué)生大部分是靠自學(xué)獲取相關(guān)知識(shí),競賽結(jié)果不盡如人意。實(shí)踐競賽項(xiàng)目報(bào)名、培訓(xùn)、參賽等組織過程起著重要輔助作用,實(shí)踐類競賽項(xiàng)目的組織迫在眉睫。
6 總結(jié)
統(tǒng)計(jì)學(xué)的產(chǎn)生發(fā)展來源于實(shí)踐,依賴于應(yīng)用,并在應(yīng)用過程中發(fā)展壯大,統(tǒng)計(jì)學(xué)的生命力就在于其能不斷滿足社會(huì)應(yīng)用的需要。我國設(shè)有統(tǒng)計(jì)學(xué)及相關(guān)專業(yè)的高校數(shù)量也在明顯增多。近些年來,隨著信息產(chǎn)業(yè)發(fā)展,大數(shù)據(jù)環(huán)境對(duì)統(tǒng)計(jì)學(xué)專業(yè)的教學(xué)理念和教學(xué)模式產(chǎn)生變革性影響,統(tǒng)計(jì)基礎(chǔ)的數(shù)據(jù)分析人才將是社會(huì)最需要的人才。針對(duì)當(dāng)前統(tǒng)計(jì)學(xué)教學(xué)中存在的問題,以及統(tǒng)計(jì)學(xué)與其他學(xué)科的交叉融合這一事實(shí),培養(yǎng)統(tǒng)計(jì)人才需要對(duì)高校統(tǒng)計(jì)學(xué)教學(xué)進(jìn)行改革。
隨著知識(shí)經(jīng)濟(jì)和信息時(shí)代的到來,信息量越來越大,統(tǒng)計(jì)工具越來越多地滲入其他學(xué)科的研究,信息處理技術(shù)愈加復(fù)雜。大數(shù)據(jù)時(shí)代的來臨和大數(shù)據(jù)處理技術(shù)的發(fā)展,深深影響著統(tǒng)計(jì)學(xué)的發(fā)展。如何改革統(tǒng)計(jì)學(xué)專業(yè)課程設(shè)置?能否利用傳統(tǒng)的統(tǒng)計(jì)理論和統(tǒng)計(jì)方法對(duì)海量數(shù)據(jù)做出快速、精準(zhǔn)的處理?如何在大數(shù)據(jù)時(shí)代背景下培養(yǎng)符合市場(chǎng)需求的統(tǒng)計(jì)分析師或數(shù)據(jù)分析師?如何實(shí)現(xiàn)統(tǒng)計(jì)學(xué)基礎(chǔ)方法論和數(shù)據(jù)挖掘的深度結(jié)合?如何將大數(shù)據(jù)處理技術(shù)融入相關(guān)統(tǒng)計(jì)學(xué)課程教學(xué),探索統(tǒng)計(jì)工具和不同學(xué)科的融合,培養(yǎng)出創(chuàng)新型人才,以促進(jìn)數(shù)據(jù)處理與分析技術(shù)的發(fā)展?這些都是在當(dāng)前大數(shù)據(jù)背景下,統(tǒng)計(jì)教育工作者必須認(rèn)真思考的問題。高校應(yīng)從課程設(shè)計(jì)的開展及考核方式、實(shí)踐性質(zhì)類課程選擇、實(shí)習(xí)課程調(diào)研、實(shí)踐競賽組織等方面改革完善統(tǒng)計(jì)學(xué)專業(yè)培養(yǎng)模式,做到與時(shí)俱進(jìn),合理設(shè)置專業(yè)課結(jié)構(gòu),平衡理論課與實(shí)踐課的時(shí)間,拓寬實(shí)習(xí)面,完善競賽組織工作,培養(yǎng)出創(chuàng)新型統(tǒng)計(jì)人才。
篇7
摘要:首先表述了空間數(shù)據(jù)倉庫的三個(gè)核心思想;其次設(shè)計(jì)出了空間數(shù)據(jù)倉庫的概念框架,著重描述了空間數(shù)據(jù)倉庫的外部結(jié)構(gòu)、內(nèi)部結(jié)構(gòu)以及各組成模塊的工作流程,設(shè)計(jì)出了空間數(shù)據(jù)倉庫認(rèn)知過程的概念框圖,并對(duì)認(rèn)知的基本概念進(jìn)行了描述,表述了認(rèn)知過程14個(gè)世界模型和13個(gè)轉(zhuǎn)換算子的基本內(nèi)容,并用代數(shù)系統(tǒng)給出了嚴(yán)格定義;最后得出的結(jié)論是,研制空間數(shù)據(jù)倉庫十分必要,以支持我國的空間數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)。
關(guān)鍵詞:地理信息系統(tǒng);空間數(shù)據(jù)倉庫;數(shù)據(jù)倉庫;認(rèn)知過程
進(jìn)入21世紀(jì)后,對(duì)空間數(shù)據(jù)倉庫的研究方興未艾,在許多次的國際學(xué)術(shù)會(huì)議上都有相關(guān)[1~3]。例如在泰國召開的ISPRS第三屆動(dòng)態(tài)與多維GIS會(huì)議暨CPGIS第十屆地理信息年會(huì)、北京召開的第20屆國際制圖協(xié)會(huì)國際學(xué)術(shù)會(huì)議、南非召開的第21屆國際制圖協(xié)會(huì)國際學(xué)術(shù)會(huì)議等。還有一些ESRI公司的白皮書、全球性用戶大會(huì)、SSD國際會(huì)議、數(shù)字地球國際會(huì)議、GIS國際會(huì)議等也開始討論空間數(shù)據(jù)倉庫問題[4~8]。將空間數(shù)據(jù)倉庫技術(shù)引入到我國大概是20世紀(jì)90年代末,文獻(xiàn)[9~14]的發(fā)表開創(chuàng)了我國空間數(shù)據(jù)倉庫理論與技術(shù)研究的新局面,此后又陸續(xù)出現(xiàn)了一些這方面的論文。
總體說來,上述工作對(duì)空間數(shù)據(jù)倉庫的理論和方法進(jìn)行了初步研究,在概念、原理、結(jié)構(gòu)、操作與算法等方面進(jìn)行了初步論述,已取得了卓有成效的成績。但是到目前為止,空間數(shù)據(jù)倉庫的概念框架和認(rèn)知過程等方面還是缺乏系統(tǒng)的論述,沒有形成一套比較完整的空間數(shù)據(jù)倉庫概念框架體系和認(rèn)知過程體系。
1概念框架
空間數(shù)據(jù)倉庫是GIS技術(shù)和數(shù)據(jù)倉庫技術(shù)相結(jié)合的產(chǎn)物,其定義很多,但中心思想包含三方面內(nèi)容:①空間數(shù)據(jù)倉庫是在網(wǎng)絡(luò)環(huán)境下,實(shí)現(xiàn)對(duì)異地、異質(zhì)、異構(gòu)不同源數(shù)據(jù)庫中地理空間數(shù)據(jù)、專題數(shù)據(jù)及時(shí)間數(shù)據(jù)的統(tǒng)一、整合、集成處理,形成用戶獲取數(shù)據(jù)的共享操作模式;②空間數(shù)據(jù)倉庫可根據(jù)需求對(duì)這些數(shù)據(jù)再進(jìn)行測(cè)繪專業(yè)處理,提供多種空間數(shù)據(jù)產(chǎn)品,滿足用戶更高層次——對(duì)數(shù)據(jù)產(chǎn)品的需求;③基于空間數(shù)據(jù)產(chǎn)品,空間數(shù)據(jù)倉庫可從多維的角度進(jìn)行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析,提供綜合的、多維的、面向分析的空間輔助決策支持信息,滿足用戶空間決策分析的需求。
空間數(shù)據(jù)倉庫的概念框架分為外部結(jié)構(gòu)、內(nèi)部結(jié)構(gòu)。外部結(jié)構(gòu)主要描述空間數(shù)據(jù)倉庫與外部系統(tǒng)的關(guān)系;內(nèi)部結(jié)構(gòu)主要描述空間數(shù)據(jù)倉庫的內(nèi)部功能模塊組成。
1.1外部結(jié)構(gòu)
數(shù)據(jù)庫系統(tǒng)處于空間數(shù)據(jù)倉庫系統(tǒng)的最底層,管理著若干種不同的地理空間數(shù)據(jù)庫和專題數(shù)據(jù)庫,它們各自獨(dú)立,形成了各式各樣的異地異質(zhì)異構(gòu)的數(shù)據(jù)庫系統(tǒng),它們主要為空間數(shù)據(jù)倉庫提供數(shù)據(jù)源。應(yīng)用系統(tǒng)處于空間數(shù)據(jù)倉庫系統(tǒng)的最上層,它通過一個(gè)標(biāo)準(zhǔn)的接口從空間數(shù)據(jù)倉庫中提取地理空間數(shù)據(jù)、空間數(shù)據(jù)產(chǎn)品和空間輔助決策分析信息,為應(yīng)用系統(tǒng)服務(wù)。
1.2內(nèi)部結(jié)構(gòu)
空間數(shù)據(jù)倉庫的內(nèi)部組成應(yīng)由八個(gè)獨(dú)立功能模塊構(gòu)成,分層次實(shí)現(xiàn)空間數(shù)據(jù)倉庫系統(tǒng)。其中,第一層次的功能模塊是空間數(shù)據(jù)倉庫的基礎(chǔ)處理模塊,由多源空間數(shù)據(jù)抽取、多源空間數(shù)據(jù)整合、多源空間數(shù)據(jù)統(tǒng)一、空間數(shù)據(jù)倉庫元數(shù)據(jù)組成;第二層次的功能模塊是空間數(shù)據(jù)倉庫的服務(wù)模塊,由空間數(shù)據(jù)產(chǎn)品服務(wù)、空間數(shù)據(jù)立方體分析、空間數(shù)據(jù)挖掘分析組成;第三層次的功能模塊是空間數(shù)據(jù)倉庫的對(duì)外數(shù)據(jù)接口模塊,由對(duì)外數(shù)據(jù)交換格式組成。第一層次的功能模塊為第二層次的功能模塊服務(wù),第二層次的功能模塊為第三層次的功能模塊服務(wù)。
當(dāng)應(yīng)用系統(tǒng)提出需求時(shí):①多源空間數(shù)據(jù)抽取功能模塊從各源數(shù)據(jù)庫系統(tǒng)中抽取出相應(yīng)地理范圍(矩形、多邊形、橢圓)的不同種類的地理空間數(shù)據(jù)、專題數(shù)據(jù);②多源空間數(shù)據(jù)整合功能模塊對(duì)這些由圖幅范圍組織的地理空間數(shù)據(jù)進(jìn)行相應(yīng)地理范圍的裁剪、拼接、接邊、圖形編輯、拓?fù)渲亟M等整合處理,形成裁剪拼接和接邊好的、具有完整拓?fù)潢P(guān)系的、物理上無縫的、按區(qū)域范圍組織的地理空間數(shù)據(jù);③多源空間數(shù)據(jù)統(tǒng)一功能模塊對(duì)這些整合處理好的地理空間數(shù)據(jù)進(jìn)行數(shù)學(xué)基礎(chǔ)、數(shù)據(jù)編碼、數(shù)據(jù)格式、數(shù)據(jù)精度等方面的統(tǒng)一處理,形成能相互疊加的地理空間數(shù)據(jù);④將經(jīng)抽取、整合、統(tǒng)一處理好的地理空間數(shù)據(jù)提交給空間數(shù)據(jù)產(chǎn)品服務(wù)功能模塊,經(jīng)過集成、融合、派生和關(guān)聯(lián)等測(cè)繪專業(yè)算法處理,生成應(yīng)用系統(tǒng)所需的各種空間數(shù)據(jù)產(chǎn)品;⑤基于已生成的空間數(shù)據(jù)產(chǎn)品,進(jìn)行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析,得到面向空間輔助決策分析的結(jié)果;⑥將這些空間數(shù)據(jù)產(chǎn)品和空間輔助決策分析結(jié)果,以對(duì)外數(shù)據(jù)交換格式的形式提交給應(yīng)用系統(tǒng)使用。
2認(rèn)知過程
2.1認(rèn)知過程概念圖
空間數(shù)據(jù)倉庫是描述地理現(xiàn)象的一個(gè)重要分支,其認(rèn)知過程應(yīng)與地理空間信息的認(rèn)知過程基本一致,不同之處在于其描述的內(nèi)容和范圍大小的區(qū)別。因此,建立空間數(shù)據(jù)倉庫的認(rèn)知過程,實(shí)際上是要經(jīng)過一個(gè)地理現(xiàn)象認(rèn)識(shí)、抽象、組織、分析和應(yīng)用的過程。
2.2認(rèn)知過程描述
這14個(gè)世界模型和13個(gè)轉(zhuǎn)換算子的組合構(gòu)成了三個(gè)層次世界,即實(shí)體世界、目標(biāo)世界和產(chǎn)品世界。其中,現(xiàn)實(shí)世界、地理現(xiàn)實(shí)世界、地理工程現(xiàn)實(shí)世界和地理工程概念世界這四個(gè)世界模型,以及命名、選擇、抽象這三個(gè)轉(zhuǎn)換算子,共同構(gòu)成實(shí)體世界;地理工程尺度世界、地理要素分類世界、地理要素編碼世界、地理要素幾何世界和地理要素集合世界這五個(gè)世界模型,以及度量、分層、編碼、測(cè)量和聚集這五個(gè)轉(zhuǎn)換算子,共同構(gòu)成目標(biāo)世界;地理空間抽取世界、地理空間整合世界、地理空間統(tǒng)一世界、地理空間產(chǎn)品世界、地理空間決策世界這五個(gè)世界模型,以及提取、處理、變換、計(jì)算、分析這五個(gè)轉(zhuǎn)換算子,共同構(gòu)成產(chǎn)品世界。
數(shù)據(jù)庫概念設(shè)計(jì)階段、地理空間數(shù)據(jù)庫實(shí)現(xiàn)階段和空間數(shù)據(jù)倉庫實(shí)現(xiàn)階段構(gòu)成了空間數(shù)據(jù)倉庫系統(tǒng)實(shí)現(xiàn)過程的三個(gè)階段,這三個(gè)階段分別對(duì)應(yīng)著三個(gè)層次世界,即實(shí)體世界、目標(biāo)世界和產(chǎn)品世界。其中,前兩個(gè)階段是為地理空間數(shù)據(jù)庫的建立服務(wù)的,由它們實(shí)現(xiàn)實(shí)體世界向目標(biāo)世界的轉(zhuǎn)換;后一個(gè)階段是為空間數(shù)據(jù)倉庫的建立服務(wù)的,由它們實(shí)現(xiàn)目標(biāo)世界向產(chǎn)品世界的轉(zhuǎn)換。
由此可見,空間數(shù)據(jù)倉庫的認(rèn)知過程主要就是這14個(gè)世界模型通過這13個(gè)轉(zhuǎn)換算子的轉(zhuǎn)換實(shí)現(xiàn)三個(gè)層次世界的過程。這個(gè)認(rèn)知過程指導(dǎo)了空間數(shù)據(jù)倉庫的實(shí)現(xiàn)。
3認(rèn)知的概念定義
3.1世界模型
實(shí)際上,這些世界模型主要是依靠具體的實(shí)體模型或數(shù)據(jù)模型描述來實(shí)現(xiàn)的。每個(gè)世界模型均有其描述的地理空間對(duì)象,因此這些世界模型描述的內(nèi)容大不相同,必須定義出這些世界模型。
3.1.1現(xiàn)實(shí)世界模型
現(xiàn)實(shí)世界中,人們能看到一系列物質(zhì)和現(xiàn)象,對(duì)于這些物質(zhì)和現(xiàn)象,不管是否能叫上名字,它們都是客觀存在的,并且相互之間通過它們的關(guān)系組成了自然界的千差萬別。由此可見,能將現(xiàn)實(shí)世界中所有物質(zhì)和現(xiàn)象集合以及它們之間的相互關(guān)系用一定的形式進(jìn)行描述就是現(xiàn)實(shí)世界模型。
現(xiàn)實(shí)世界的物質(zhì)和現(xiàn)象集合中,隱含著許多不同的地理現(xiàn)象類,如地質(zhì)、礦產(chǎn)、石油、自然地理等地理現(xiàn)象類。地理現(xiàn)象類是現(xiàn)實(shí)世界的一個(gè)子集。由此可見,能將現(xiàn)實(shí)世界中所有地理現(xiàn)象類集合以及它們之間的相互關(guān)系用一定的形式進(jìn)行描述就是地理現(xiàn)實(shí)世界模型。
3.1.3地理工程現(xiàn)實(shí)世界模型
地理現(xiàn)實(shí)世界的地理現(xiàn)象類集合中,特指一個(gè)或若干個(gè)地理現(xiàn)象就是地理工程現(xiàn)實(shí)世界,如自然地理等。地理工程現(xiàn)實(shí)世界是地理現(xiàn)實(shí)世界的一個(gè)子集。由此可見,能將地理現(xiàn)實(shí)世界指的地理現(xiàn)象以及它們之間的相互關(guān)系用一定的形式進(jìn)行描述就是地理工程現(xiàn)實(shí)世界模型。
3.1.4地理工程概念世界模型
要用計(jì)算機(jī)來描述地理工程現(xiàn)實(shí)世界中的地理現(xiàn)象,就必須對(duì)它們進(jìn)行抽象描述,形成地理現(xiàn)象在人們頭腦中的反映,生成概念模型。由此可見,能將地理工程現(xiàn)實(shí)世界指的地理現(xiàn)象以及它們的內(nèi)部關(guān)系用一定的形式進(jìn)行抽象的概念描述就是地理工程概念世界模型。
3.1.5地理工程尺度世界模型
將地理現(xiàn)象抽象成概念模型,僅有這些還遠(yuǎn)遠(yuǎn)不夠,因?yàn)楝F(xiàn)實(shí)世界中的所有地理現(xiàn)象均是有度量的,所以用計(jì)算機(jī)描述這些地理現(xiàn)象時(shí),也必須是可度量的。度量主要包括描述地理現(xiàn)象的歐幾里德幾何坐標(biāo)系和數(shù)學(xué)單位尺度。由此可見,對(duì)地理工程概念世界中的抽象地理現(xiàn)象進(jìn)行歐幾里德幾何坐標(biāo)系和數(shù)學(xué)單位尺度描述就是地理工程尺度世界模型。
3.1.6地理要素分類世界模型
按照GIS理論,概念中的地理現(xiàn)象最終都是通過多種地理要素來表達(dá)的,因此如何對(duì)地理要素進(jìn)行合理的設(shè)計(jì)和劃分就顯得十分重要。根據(jù)ARC/INFO的分層理論,只有將這些地理要素進(jìn)行分類分級(jí),才能高效地處理它們。由此可見,對(duì)地理工程尺度世界中具有尺度度量的地理現(xiàn)象進(jìn)行地理要素的分類分級(jí)描述就是地理要素分類世界模型。
3.1.7地理要素編碼世界模型
要使計(jì)算機(jī)能識(shí)別和處理地理要素,就必須給這些地理要素進(jìn)行分類分級(jí)編碼,即用一串?dāng)?shù)字來表示它們,該分類分級(jí)編碼就成為該地理要素在計(jì)算機(jī)中的唯一標(biāo)志符,以便計(jì)算機(jī)能識(shí)別和處理。由此可見,對(duì)地理要素分類世界中具有明確分類分級(jí)定義的地理要素進(jìn)行分類分級(jí)編碼描述就是地理要素編碼世界模型。
3.1.8地理要素幾何世界模型
為了便于計(jì)算機(jī)的存儲(chǔ)和管理,必須將地理要素細(xì)分為幾何目標(biāo)。地理要素幾何目標(biāo)包括基本目標(biāo)和復(fù)合目標(biāo)?;灸繕?biāo)按地理要素的空間特征劃分為點(diǎn)狀目標(biāo)、線狀目標(biāo)、面狀目標(biāo)、體狀目標(biāo)和表面狀目標(biāo)等五種;復(fù)合目標(biāo)由基本目標(biāo)集合嵌套構(gòu)成。由此可見,對(duì)地理要素編碼世界中具有明確分類分級(jí)編碼的地理要素進(jìn)行幾何目標(biāo)的劃分和描述就是地理要素幾何世界模型。
3.1.9地理要素集合世界模型
因?yàn)榈乩硪卦谝欢ǖ臈l件下由相同或不同的點(diǎn)、線、面、表面和體等五類空間目標(biāo)組合而成,所以在實(shí)際使用中,必須通過計(jì)算機(jī)系統(tǒng)把數(shù)據(jù)庫中存儲(chǔ)的基本目標(biāo)、復(fù)合目標(biāo)還原成地理要素。由此可見,對(duì)地理要素幾何世界中具有基本目標(biāo)、復(fù)合目標(biāo)描述的地理要素進(jìn)行數(shù)據(jù)庫的幾何目標(biāo)集合操作就是地理要素集合世界模型。
定義9地理要素集合世界模型。設(shè)Con中地理要素點(diǎn)狀目標(biāo)、線狀目標(biāo)、面狀目標(biāo)、體狀目標(biāo)、表面目標(biāo)集合分別表示為Po、Lo、Ao、To、So,Atr為地理要素的某一地理特征集合,則地理要素集合世界模型為Ent={e|(Po,Lo,Ao,To,So)∈Atr}。
3.1.10地理空間抽取世界模型
地理空間抽取的主要功能就是從源數(shù)據(jù)庫中按地理區(qū)域范圍(矩形、橢圓、多邊形等)抽取出滿足一定條件的不同種類的地理空間數(shù)據(jù)。由此可見,對(duì)地理要素集合世界中的地理空間數(shù)據(jù)按一定地理區(qū)域范圍和地理特征進(jìn)行抽取的操作描述就是地理空間抽取世界模型。
3.1.11地理空間整合世界模型
數(shù)據(jù)庫中存儲(chǔ)的地理空間數(shù)據(jù)是以圖幅為單位組織的,但應(yīng)用系統(tǒng)使用數(shù)據(jù)是無圖幅概念的,是以地理區(qū)域范圍為組織的。由此可見,對(duì)地理空間抽取世界中抽取出的地理空間數(shù)據(jù)進(jìn)行圖形裁剪、圖形拼接、圖形接邊、圖形編輯和拓?fù)渲亟M等整合處理,形成以地理區(qū)域范圍為組織的無縫數(shù)據(jù)集合操作就是地理空間整合世界模型。定義11地理空間整合世界模型。設(shè)Con中圖形裁剪、圖形拼接、圖形編輯、圖形接邊、拓?fù)渲亟M功能分別表示為Cut、Stitch、Meet、Edit和Topology,整合功能集合表示為Fun={Cut,Stitch,Meet,Edit,Topology},則地理空間整合世界模型Pro={e|(e∈Ext,e∈Fun)}。
3.1.12地理空間統(tǒng)一世界模型
實(shí)現(xiàn)地理空間數(shù)據(jù)整合后,必須對(duì)來自不同源數(shù)據(jù)庫中的地理空間數(shù)據(jù)進(jìn)行統(tǒng)一,因?yàn)榈乩砜臻g數(shù)據(jù)存在著差異。這些差異表現(xiàn)在如下方面,即數(shù)學(xué)基礎(chǔ)差異、數(shù)據(jù)編碼差異和數(shù)據(jù)格式差異、數(shù)據(jù)精度差異。由此可見,對(duì)地理空間整合世界中的地理空間數(shù)據(jù)進(jìn)行數(shù)學(xué)基礎(chǔ)、數(shù)據(jù)編碼、數(shù)據(jù)格式、數(shù)據(jù)精度的統(tǒng)一操作和描述就是地理空間統(tǒng)一世界模型。
3.1.13地理空間產(chǎn)品世界模型
隨著應(yīng)用的深入,單純的地理空間數(shù)據(jù)已越來越不能滿足用戶的需求,用戶更加希望使用的是經(jīng)過測(cè)繪專業(yè)處理的、經(jīng)過二次加工處理的地理空間數(shù)據(jù)產(chǎn)品,后者在實(shí)際中具有更大的應(yīng)用價(jià)值。由此可見,對(duì)地理空間統(tǒng)一世界中的地理空間數(shù)據(jù)進(jìn)行測(cè)繪專業(yè)處理生成空間數(shù)據(jù)產(chǎn)品的操作就是地理空間產(chǎn)品世界模型。
定義13地理空間產(chǎn)品世界模型。設(shè)Con中單一、集成、融合、派生和關(guān)聯(lián)的功能分別表示為Single、Integrate、Fuse、Derive和Relate,測(cè)繪專業(yè)處理算法集合為Fru={Single,Integrate,Fuse,Derive,Relate},則地理空間產(chǎn)品世界模型Pdu={e|(e∈Uni,e∈Fru}。
3.1.14地理空間決策世界模型
建立空間數(shù)據(jù)倉庫的最終目的是為空間決策支持服務(wù),為用戶提供大量的具有空間決策支持的信息,這可通過空間數(shù)據(jù)倉庫中的空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析來實(shí)現(xiàn)。由此可見,對(duì)地理空間產(chǎn)品世界中的空間數(shù)據(jù)產(chǎn)品進(jìn)行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析,生成空間決策支持信息的操作和描述就是地理空間決策世界模型。
定義14地理空間決策世界模型。設(shè)Con中的空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析分別表示為Scube、Smine,空間決策分析算法集合為Sdss={Scube,Smine},則地理空間決策世界模型Dss={e|(e∈Pdu,e∈Sdss)}。
3.2轉(zhuǎn)換算子
在空間數(shù)據(jù)倉庫的認(rèn)知過程中,14個(gè)世界模型的變換離不開13個(gè)轉(zhuǎn)換算子,即命名、選擇、抽象、度量、分層、編碼、測(cè)量、聚集、提取、處理、變換、計(jì)算和分析,由它們實(shí)現(xiàn)每兩個(gè)世界模型的轉(zhuǎn)換。這些轉(zhuǎn)換算子主要是依靠元數(shù)據(jù)來實(shí)現(xiàn)的,因?yàn)槊總€(gè)世界模型均有描述它的元數(shù)據(jù),要實(shí)現(xiàn)兩個(gè)世界模型的轉(zhuǎn)換,通曉這兩個(gè)世界的元數(shù)據(jù)是轉(zhuǎn)換的前提。雖然這些轉(zhuǎn)換算子的具體定義不同,但它們都是實(shí)現(xiàn)每兩個(gè)世界模型的轉(zhuǎn)換,從數(shù)學(xué)的定義上說就是由某個(gè)世界模型通過函數(shù)轉(zhuǎn)換到另一個(gè)世界模型上,因此這些轉(zhuǎn)換算子的宏觀數(shù)學(xué)定義是一致的。
篇8
關(guān)鍵詞:地理信息系統(tǒng);空間數(shù)據(jù)倉庫;數(shù)據(jù)倉庫;認(rèn)知過程
0引言
進(jìn)入21世紀(jì)后,對(duì)空間數(shù)據(jù)倉庫的研究方興未艾,在許多次的國際學(xué)術(shù)會(huì)議上都有相關(guān)[1~3]。例如在泰國召開的ISPRS第三屆動(dòng)態(tài)與多維GIS會(huì)議暨CPGIS第十屆地理信息年會(huì)、北京召開的第20屆國際制圖協(xié)會(huì)國際學(xué)術(shù)會(huì)議、南非召開的第21屆國際制圖協(xié)會(huì)國際學(xué)術(shù)會(huì)議等。還有一些ESRI公司的白皮書、全球性用戶大會(huì)、SSD國際會(huì)議、數(shù)字地球國際會(huì)議、GIS國際會(huì)議等也開始討論空間數(shù)據(jù)倉庫問題[4~8]。將空間數(shù)據(jù)倉庫技術(shù)引入到我國大概是20世紀(jì)90年代末,文獻(xiàn)[9~14]的發(fā)表開創(chuàng)了我國空間數(shù)據(jù)倉庫理論與技術(shù)研究的新局面,此后又陸續(xù)出現(xiàn)了一些這方面的論文。
總體說來,上述工作對(duì)空間數(shù)據(jù)倉庫的理論和方法進(jìn)行了初步研究,在概念、原理、結(jié)構(gòu)、操作與算法等方面進(jìn)行了初步論述,已取得了卓有成效的成績。但是到目前為止,空間數(shù)據(jù)倉庫的概念框架和認(rèn)知過程等方面還是缺乏系統(tǒng)的論述,沒有形成一套比較完整的空間數(shù)據(jù)倉庫概念框架體系和認(rèn)知過程體系。
1概念框架
空間數(shù)據(jù)倉庫是GIS技術(shù)和數(shù)據(jù)倉庫技術(shù)相結(jié)合的產(chǎn)物,其定義很多,但中心思想包含三方面內(nèi)容:①空間數(shù)據(jù)倉庫是在網(wǎng)絡(luò)環(huán)境下,實(shí)現(xiàn)對(duì)異地、異質(zhì)、異構(gòu)不同源數(shù)據(jù)庫中地理空間數(shù)據(jù)、專題數(shù)據(jù)及時(shí)間數(shù)據(jù)的統(tǒng)一、整合、集成處理,形成用戶獲取數(shù)據(jù)的共享操作模式;②空間數(shù)據(jù)倉庫可根據(jù)需求對(duì)這些數(shù)據(jù)再進(jìn)行測(cè)繪專業(yè)處理,提供多種空間數(shù)據(jù)產(chǎn)品,滿足用戶更高層次——對(duì)數(shù)據(jù)產(chǎn)品的需求;③基于空間數(shù)據(jù)產(chǎn)品,空間數(shù)據(jù)倉庫可從多維的角度進(jìn)行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析,提供綜合的、多維的、面向分析的空間輔助決策支持信息,滿足用戶空間決策分析的需求。
空間數(shù)據(jù)倉庫的概念框架分為外部結(jié)構(gòu)、內(nèi)部結(jié)構(gòu)。外部結(jié)構(gòu)主要描述空間數(shù)據(jù)倉庫與外部系統(tǒng)的關(guān)系;內(nèi)部結(jié)構(gòu)主要描述空間數(shù)據(jù)倉庫的內(nèi)部功能模塊組成。
1.1外部結(jié)構(gòu)
數(shù)據(jù)庫系統(tǒng)處于空間數(shù)據(jù)倉庫系統(tǒng)的最底層,管理著若干種不同的地理空間數(shù)據(jù)庫和專題數(shù)據(jù)庫,它們各自獨(dú)立,形成了各式各樣的異地異質(zhì)異構(gòu)的數(shù)據(jù)庫系統(tǒng),它們主要為空間數(shù)據(jù)倉庫提供數(shù)據(jù)源。應(yīng)用系統(tǒng)處于空間數(shù)據(jù)倉庫系統(tǒng)的最上層,它通過一個(gè)標(biāo)準(zhǔn)的接口從空間數(shù)據(jù)倉庫中提取地理空間數(shù)據(jù)、空間數(shù)據(jù)產(chǎn)品和空間輔助決策分析信息,為應(yīng)用系統(tǒng)服務(wù)。其具體外部結(jié)構(gòu)如圖1所示。
1.2內(nèi)部結(jié)構(gòu)
空間數(shù)據(jù)倉庫的內(nèi)部組成應(yīng)由八個(gè)獨(dú)立功能模塊構(gòu)成,分層次實(shí)現(xiàn)空間數(shù)據(jù)倉庫系統(tǒng)。其中,第一層次的功能模塊是空間數(shù)據(jù)倉庫的基礎(chǔ)處理模塊,由多源空間數(shù)據(jù)抽取、多源空間數(shù)據(jù)整合、多源空間數(shù)據(jù)統(tǒng)一、空間數(shù)據(jù)倉庫元數(shù)據(jù)組成;第二層次的功能模塊是空間數(shù)據(jù)倉庫的服務(wù)模塊,由空間數(shù)據(jù)產(chǎn)品服務(wù)、空間數(shù)據(jù)立方體分析、空間數(shù)據(jù)挖掘分析組成;第三層次的功能模塊是空間數(shù)據(jù)倉庫的對(duì)外數(shù)據(jù)接口模塊,由對(duì)外數(shù)據(jù)交換格式組成。第一層次的功能模塊為第二層次的功能模塊服務(wù),第二層次的功能模塊為第三層次的功能模塊服務(wù)。其具體內(nèi)部結(jié)構(gòu)圖如圖2所示。
當(dāng)應(yīng)用系統(tǒng)提出需求時(shí):①多源空間數(shù)據(jù)抽取功能模塊從各源數(shù)據(jù)庫系統(tǒng)中抽取出相應(yīng)地理范圍(矩形、多邊形、橢圓)的不同種類的地理空間數(shù)據(jù)、專題數(shù)據(jù);②多源空間數(shù)據(jù)整合功能模塊對(duì)這些由圖幅范圍組織的地理空間數(shù)據(jù)進(jìn)行相應(yīng)地理范圍的裁剪、拼接、接邊、圖形編輯、拓?fù)渲亟M等整合處理,形成裁剪拼接和接邊好的、具有完整拓?fù)潢P(guān)系的、物理上無縫的、按區(qū)域范圍組織的地理空間數(shù)據(jù);③多源空間數(shù)據(jù)統(tǒng)一功能模塊對(duì)這些整合處理好的地理空間數(shù)據(jù)進(jìn)行數(shù)學(xué)基礎(chǔ)、數(shù)據(jù)編碼、數(shù)據(jù)格式、數(shù)據(jù)精度等方面的統(tǒng)一處理,形成能相互疊加的地理空間數(shù)據(jù);④將經(jīng)抽取、整合、統(tǒng)一處理好的地理空間數(shù)據(jù)提交給空間數(shù)據(jù)產(chǎn)品服務(wù)功能模塊,經(jīng)過集成、融合、派生和關(guān)聯(lián)等測(cè)繪專業(yè)算法處理,生成應(yīng)用系統(tǒng)所需的各種空間數(shù)據(jù)產(chǎn)品;⑤基于已生成的空間數(shù)據(jù)產(chǎn)品,進(jìn)行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析,得到面向空間輔助決策分析的結(jié)果;⑥將這些空間數(shù)據(jù)產(chǎn)品和空間輔助決策分析結(jié)果,以對(duì)外數(shù)據(jù)交換格式的形式提交給應(yīng)用系統(tǒng)使用。
2認(rèn)知過程
2.1認(rèn)知過程概念圖
空間數(shù)據(jù)倉庫是描述地理現(xiàn)象的一個(gè)重要分支,其認(rèn)知過程應(yīng)與地理空間信息的認(rèn)知過程基本一致,不同之處在于其描述的內(nèi)容和范圍大小的區(qū)別。因此,建立空間數(shù)據(jù)倉庫的認(rèn)知過程,實(shí)際上是要經(jīng)過一個(gè)地理現(xiàn)象認(rèn)識(shí)、抽象、組織、分析和應(yīng)用的過程。其具體的認(rèn)知過程概念框圖如圖3所示。
2.2認(rèn)知過程描述
這14個(gè)世界模型和13個(gè)轉(zhuǎn)換算子的組合構(gòu)成了三個(gè)層次世界,即實(shí)體世界、目標(biāo)世界和產(chǎn)品世界。其中,現(xiàn)實(shí)世界、地理現(xiàn)實(shí)世界、地理工程現(xiàn)實(shí)世界和地理工程概念世界這四個(gè)世界模型,以及命名、選擇、抽象這三個(gè)轉(zhuǎn)換算子,共同構(gòu)成實(shí)體世界;地理工程尺度世界、地理要素分類世界、地理要素編碼世界、地理要素幾何世界和地理要素集合世界這五個(gè)世界模型,以及度量、分層、編碼、測(cè)量和聚集這五個(gè)轉(zhuǎn)換算子,共同構(gòu)成目標(biāo)世界;地理空間抽取世界、地理空間整合世界、地理空間統(tǒng)一世界、地理空間產(chǎn)品世界、地理空間決策世界這五個(gè)世界模型,以及提取、處理、變換、計(jì)算、分析這五個(gè)轉(zhuǎn)換算子,共同構(gòu)成產(chǎn)品世界。
數(shù)據(jù)庫概念設(shè)計(jì)階段、地理空間數(shù)據(jù)庫實(shí)現(xiàn)階段和空間數(shù)據(jù)倉庫實(shí)現(xiàn)階段構(gòu)成了空間數(shù)據(jù)倉庫系統(tǒng)實(shí)現(xiàn)過程的三個(gè)階段,這三個(gè)階段分別對(duì)應(yīng)著三個(gè)層次世界,即實(shí)體世界、目標(biāo)世界和產(chǎn)品世界。其中,前兩個(gè)階段是為地理空間數(shù)據(jù)庫的建立服務(wù)的,由它們實(shí)現(xiàn)實(shí)體世界向目標(biāo)世界的轉(zhuǎn)換;后一個(gè)階段是為空間數(shù)據(jù)倉庫的建立服務(wù)的,由它們實(shí)現(xiàn)目標(biāo)世界向產(chǎn)品世界的轉(zhuǎn)換。
由此可見,空間數(shù)據(jù)倉庫的認(rèn)知過程主要就是這14個(gè)世界模型通過這13個(gè)轉(zhuǎn)換算子的轉(zhuǎn)換實(shí)現(xiàn)三個(gè)層次世界的過程。這個(gè)認(rèn)知過程指導(dǎo)了空間數(shù)據(jù)倉庫的實(shí)現(xiàn)。
3認(rèn)知的概念定義
3.1世界模型
實(shí)際上,這些世界模型主要是依靠具體的實(shí)體模型或數(shù)據(jù)模型描述來實(shí)現(xiàn)的。每個(gè)世界模型均有其描述的地理空間對(duì)象,因此這些世界模型描述的內(nèi)容大不相同,必須定義出這些世界模型。
3.1.1現(xiàn)實(shí)世界模型
現(xiàn)實(shí)世界中,人們能看到一系列物質(zhì)和現(xiàn)象,對(duì)于這些物質(zhì)和現(xiàn)象,不管是否能叫上名字,它們都是客觀存在的,并且相互之間通過它們的關(guān)系組成了自然界的千差萬別。由此可見,能將現(xiàn)實(shí)世界中所有物質(zhì)和現(xiàn)象集合以及它們之間的相互關(guān)系用一定的形式進(jìn)行描述就是現(xiàn)實(shí)世界模型。
現(xiàn)實(shí)世界的物質(zhì)和現(xiàn)象集合中,隱含著許多不同的地理現(xiàn)象類,如地質(zhì)、礦產(chǎn)、石油、自然地理等地理現(xiàn)象類。地理現(xiàn)象類是現(xiàn)實(shí)世界的一個(gè)子集。由此可見,能將現(xiàn)實(shí)世界中所有地理現(xiàn)象類集合以及它們之間的相互關(guān)系用一定的形式進(jìn)行描述就是地理現(xiàn)實(shí)世界模型。
本文原文
3.1.3地理工程現(xiàn)實(shí)世界模型
地理現(xiàn)實(shí)世界的地理現(xiàn)象類集合中,特指一個(gè)或若干個(gè)地理現(xiàn)象就是地理工程現(xiàn)實(shí)世界,如自然地理等。地理工程現(xiàn)實(shí)世界是地理現(xiàn)實(shí)世界的一個(gè)子集。由此可見,能將地理現(xiàn)實(shí)世界指的地理現(xiàn)象以及它們之間的相互關(guān)系用一定的形式進(jìn)行描述就是地理工程現(xiàn)實(shí)世界模型。
3.1.4地理工程概念世界模型
要用計(jì)算機(jī)來描述地理工程現(xiàn)實(shí)世界中的地理現(xiàn)象,就必須對(duì)它們進(jìn)行抽象描述,形成地理現(xiàn)象在人們頭腦中的反映,生成概念模型。由此可見,能將地理工程現(xiàn)實(shí)世界指的地理現(xiàn)象以及它們的內(nèi)部關(guān)系用一定的形式進(jìn)行抽象的概念描述就是地理工程概念世界模型。
3.1.5地理工程尺度世界模型
將地理現(xiàn)象抽象成概念模型,僅有這些還遠(yuǎn)遠(yuǎn)不夠,因?yàn)楝F(xiàn)實(shí)世界中的所有地理現(xiàn)象均是有度量的,所以用計(jì)算機(jī)描述這些地理現(xiàn)象時(shí),也必須是可度量的。度量主要包括描述地理現(xiàn)象的歐幾里德幾何坐標(biāo)系和數(shù)學(xué)單位尺度。由此可見,對(duì)地理工程概念世界中的抽象地理現(xiàn)象進(jìn)行歐幾里德幾何坐標(biāo)系和數(shù)學(xué)單位尺度描述就是地理工程尺度世界模型。3.1.6地理要素分類世界模型
按照GIS理論,概念中的地理現(xiàn)象最終都是通過多種地理要素來表達(dá)的,因此如何對(duì)地理要素進(jìn)行合理的設(shè)計(jì)和劃分就顯得十分重要。根據(jù)ARC/INFO的分層理論,只有將這些地理要素進(jìn)行分類分級(jí),才能高效地處理它們。由此可見,對(duì)地理工程尺度世界中具有尺度度量的地理現(xiàn)象進(jìn)行地理要素的分類分級(jí)描述就是地理要素分類世界模型。
3.1.7地理要素編碼世界模型
要使計(jì)算機(jī)能識(shí)別和處理地理要素,就必須給這些地理要素進(jìn)行分類分級(jí)編碼,即用一串?dāng)?shù)字來表示它們,該分類分級(jí)編碼就成為該地理要素在計(jì)算機(jī)中的唯一標(biāo)志符,以便計(jì)算機(jī)能識(shí)別和處理。由此可見,對(duì)地理要素分類世界中具有明確分類分級(jí)定義的地理要素進(jìn)行分類分級(jí)編碼描述就是地理要素編碼世界模型。
3.1.8地理要素幾何世界模型
為了便于計(jì)算機(jī)的存儲(chǔ)和管理,必須將地理要素細(xì)分為幾何目標(biāo)。地理要素幾何目標(biāo)包括基本目標(biāo)和復(fù)合目標(biāo)?;灸繕?biāo)按地理要素的空間特征劃分為點(diǎn)狀目標(biāo)、線狀目標(biāo)、面狀目標(biāo)、體狀目標(biāo)和表面狀目標(biāo)等五種;復(fù)合目標(biāo)由基本目標(biāo)集合嵌套構(gòu)成。由此可見,對(duì)地理要素編碼世界中具有明確分類分級(jí)編碼的地理要素進(jìn)行幾何目標(biāo)的劃分和描述就是地理要素幾何世界模型。
3.1.9地理要素集合世界模型
因?yàn)榈乩硪卦谝欢ǖ臈l件下由相同或不同的點(diǎn)、線、面、表面和體等五類空間目標(biāo)組合而成,所以在實(shí)際使用中,必須通過計(jì)算機(jī)系統(tǒng)把數(shù)據(jù)庫中存儲(chǔ)的基本目標(biāo)、復(fù)合目標(biāo)還原成地理要素。由此可見,對(duì)地理要素幾何世界中具有基本目標(biāo)、復(fù)合目標(biāo)描述的地理要素進(jìn)行數(shù)據(jù)庫的幾何目標(biāo)集合操作就是地理要素集合世界模型。
定義9地理要素集合世界模型。設(shè)Con中地理要素點(diǎn)狀目標(biāo)、線狀目標(biāo)、面狀目標(biāo)、體狀目標(biāo)、表面目標(biāo)集合分別表示為Po、Lo、Ao、To、So,Atr為地理要素的某一地理特征集合,則地理要素集合世界模型為Ent={e|(Po,Lo,Ao,To,So)∈Atr}。
3.1.10地理空間抽取世界模型
地理空間抽取的主要功能就是從源數(shù)據(jù)庫中按地理區(qū)域范圍(矩形、橢圓、多邊形等)抽取出滿足一定條件的不同種類的地理空間數(shù)據(jù)。由此可見,對(duì)地理要素集合世界中的地理空間數(shù)據(jù)按一定地理區(qū)域范圍和地理特征進(jìn)行抽取的操作描述就是地理空間抽取世界模型。
3.1.11地理空間整合世界模型
數(shù)據(jù)庫中存儲(chǔ)的地理空間數(shù)據(jù)是以圖幅為單位組織的,但應(yīng)用系統(tǒng)使用數(shù)據(jù)是無圖幅概念的,是以地理區(qū)域范圍為組織的。由此可見,對(duì)地理空間抽取世界中抽取出的地理空間數(shù)據(jù)進(jìn)行圖形裁剪、圖形拼接、圖形接邊、圖形編輯和拓?fù)渲亟M等整合處理,形成以地理區(qū)域范圍為組織的無縫數(shù)據(jù)集合操作就是地理空間整合世界模型。定義11地理空間整合世界模型。設(shè)Con中圖形裁剪、圖形拼接、圖形編輯、圖形接邊、拓?fù)渲亟M功能分別表示為Cut、Stitch、Meet、Edit和Topology,整合功能集合表示為Fun={Cut,Stitch,Meet,Edit,Topology},則地理空間整合世界模型Pro={e|(e∈Ext,e∈Fun)}。
3.1.12地理空間統(tǒng)一世界模型
實(shí)現(xiàn)地理空間數(shù)據(jù)整合后,必須對(duì)來自不同源數(shù)據(jù)庫中的地理空間數(shù)據(jù)進(jìn)行統(tǒng)一,因?yàn)榈乩砜臻g數(shù)據(jù)存在著差異。這些差異表現(xiàn)在如下方面,即數(shù)學(xué)基礎(chǔ)差異、數(shù)據(jù)編碼差異和數(shù)據(jù)格式差異、數(shù)據(jù)精度差異。由此可見,對(duì)地理空間整合世界中的地理空間數(shù)據(jù)進(jìn)行數(shù)學(xué)基礎(chǔ)、數(shù)據(jù)編碼、數(shù)據(jù)格式、數(shù)據(jù)精度的統(tǒng)一操作和描述就是地理空間統(tǒng)一世界模型。
3.1.13地理空間產(chǎn)品世界模型
隨著應(yīng)用的深入,單純的地理空間數(shù)據(jù)已越來越不能滿足用戶的需求,用戶更加希望使用的是經(jīng)過測(cè)繪專業(yè)處理的、經(jīng)過二次加工處理的地理空間數(shù)據(jù)產(chǎn)品,后者在實(shí)際中具有更大的應(yīng)用價(jià)值。由此可見,對(duì)地理空間統(tǒng)一世界中的地理空間數(shù)據(jù)進(jìn)行測(cè)繪專業(yè)處理生成空間數(shù)據(jù)產(chǎn)品的操作就是地理空間產(chǎn)品世界模型。
定義13地理空間產(chǎn)品世界模型。設(shè)Con中單一、集成、融合、派生和關(guān)聯(lián)的功能分別表示為Single、Integrate、Fuse、Derive和Relate,測(cè)繪專業(yè)處理算法集合為Fru={Single,Integrate,Fuse,Derive,Relate},則地理空間產(chǎn)品世界模型Pdu={e|(e∈Uni,e∈Fru}。
3.1.14地理空間決策世界模型
建立空間數(shù)據(jù)倉庫的最終目的是為空間決策支持服務(wù),為用戶提供大量的具有空間決策支持的信息,這可通過空間數(shù)據(jù)倉庫中的空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析來實(shí)現(xiàn)。由此可見,對(duì)地理空間產(chǎn)品世界中的空間數(shù)據(jù)產(chǎn)品進(jìn)行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析,生成空間決策支持信息的操作和描述就是地理空間決策世界模型。
定義14地理空間決策世界模型。設(shè)Con中的空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析分別表示為Scube、Smine,空間決策分析算法集合為Sdss={Scube,Smine},則地理空間決策世界模型Dss={e|(e∈Pdu,e∈Sdss)}。
3.2轉(zhuǎn)換算子
在空間數(shù)據(jù)倉庫的認(rèn)知過程中,14個(gè)世界模型的變換離不開13個(gè)轉(zhuǎn)換算子,即命名、選擇、抽象、度量、分層、編碼、測(cè)量、聚集、提取、處理、變換、計(jì)算和分析,由它們實(shí)現(xiàn)每兩個(gè)世界模型的轉(zhuǎn)換。這些轉(zhuǎn)換算子主要是依靠元數(shù)據(jù)來實(shí)現(xiàn)的,因?yàn)槊總€(gè)世界模型均有描述它的元數(shù)據(jù),要實(shí)現(xiàn)兩個(gè)世界模型的轉(zhuǎn)換,通曉這兩個(gè)世界的元數(shù)據(jù)是轉(zhuǎn)換的前提。雖然這些轉(zhuǎn)換算子的具體定義不同,但它們都是實(shí)現(xiàn)每兩個(gè)世界模型的轉(zhuǎn)換,從數(shù)學(xué)的定義上說就是由某個(gè)世界模型通過函數(shù)轉(zhuǎn)換到另一個(gè)世界模型上,因此這些轉(zhuǎn)換算子的宏觀數(shù)學(xué)定義是一致的。
4結(jié)束語
目前,空間數(shù)據(jù)倉庫理論和技術(shù)研究才剛剛起步,其目標(biāo)是支持?jǐn)?shù)字地球發(fā)展、空間數(shù)據(jù)集成、空間決策支持發(fā)展的需求。因此應(yīng)該抓住這個(gè)千載難逢的好機(jī)會(huì),將我國的空間數(shù)據(jù)倉庫研究與建立邁上一個(gè)新臺(tái)階,以支持我國的空間數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)。本文對(duì)空間數(shù)據(jù)倉庫的概念框架和認(rèn)知過程體系進(jìn)行了一定程度的技術(shù)探討,希望能起到拋磚引玉的作用。
參考文獻(xiàn):
[1]ZOUYijiang.Theconceptualframeworkonthemulti-scaleandspatio-temporaldatawarehouse[C].Beijing:20thICCAcademicPress,2001:2823-2831.
[2]ZOUYijiang.Thedesignofspatlatldatawarehouse[C].Bangkok:GeoInformatics&DMGIS’2001AcademicPress,2001:421-426.
[3]ZOUYijiang.Theresearchofmetadataonspatialdatawarehouse[C].Durban:21thICCAcademicPress,2003:225-226.
[4]ESRI.ESRIopenstrategywhitepapersonSDE/CADclient&spatialdatawarehousing[EB/OL].(1998).Esri/com/base/compay/opengis.
[5]ESRI.AnESRIwhitepapers,mappingforthedatawarehouse[EB∕OL].(2002).Esri/com/base/compay/opengis.
[6]TOMB,GRAYJ,SLUTZD.Microsoftterraserver:aspatialdatawarehouse.microsoftresearchadvancedtechnologydivision[EB/OL].(2004)./.
[7]SHEKHARS,LUCT,TANX,etal.Avisualizationtoolforspatialdatawarehouses[EB/OL].(2003).cs.umn.edu/Research/Shashi-group.[8]DIMITRISP.EfficientOLAPoperationsinspatialdatawarehouses,HKUST-CS01-01[R].HongKong:[s.n.],2001:65-69.
[9]趙霈生,楊崇俊.空間數(shù)據(jù)倉庫的技術(shù)與實(shí)踐[J].遙感學(xué)報(bào),2000,4(2):157-160.
[10]李琦,楊超偉.空間數(shù)據(jù)倉庫及其構(gòu)建策略[J].中國圖像圖形學(xué)報(bào),1999,4(11):984-990.
[11]楊群,閭國年,陳鐘明.地理信息數(shù)據(jù)倉庫的技術(shù)研究[J].中國圖像圖形學(xué)報(bào),1999,4(8):621-626.
[12]周炎坤,李滿春.大型空間數(shù)據(jù)倉庫初探[J].測(cè)繪通報(bào),2000,22(8):22-23.
篇9
一、詞典編纂實(shí)踐
詞典編纂實(shí)踐依然是詞典學(xué)的基礎(chǔ)活動(dòng),主要議題有:(1)??圃~典編纂,如Ana Koren(斯洛文尼亞) 的英語斯洛文尼亞語網(wǎng)絡(luò)習(xí)語詞典、Cathy Wong(香港)的粵語英語借詞詞源詞典、Baldev Ram Khandoliyan等(印度)的梵語醫(yī)學(xué)古籍電子詞庫、意大利Macerata大學(xué)孔子學(xué)院團(tuán)隊(duì)編纂的漢語新詞詞典以及Patrick Leroyer(丹麥)的紅酒網(wǎng)絡(luò)詞庫――OENOLEX Burgundy;(2)通用詞典的媒介革新,如臺(tái)灣大學(xué)團(tuán)隊(duì)論述了漢語詞網(wǎng)的維基化(CWKIN),ames Breen等(澳大利亞)概述了《日語多語言詞典》在線數(shù)據(jù)庫(MDictDB)的設(shè)計(jì)和研發(fā);(3)瀕危語言詞典編纂,如Nor ashimah alaluddin 等(馬來西亞)介紹了編纂土著族Mendriq母語詞典的理論和實(shí)踐探索;(4)詞典語料庫創(chuàng)建,如菲律賓大學(xué)菲語研究中心的Bantay Wika項(xiàng)目就是為確保菲語的國家地位,利用現(xiàn)代信息技術(shù)創(chuàng)建的大型國語語料庫,它不僅可用于拼寫變體與詞頻描述,更是編纂菲律賓單語詞典的數(shù)據(jù)基礎(chǔ)。
二、詞典學(xué)研究
詞典學(xué)研究包含詞典編纂研究與用戶使用研究兩大話題,詳列如下:
1.元詞典學(xué)研究
(1)結(jié)構(gòu)層面的研究:對(duì)詞典結(jié)構(gòu)層面的研究仍是主流,集中于選詞、立目、釋義、翻譯、配例、用法、編排等方面:陶原珂(中國)追溯了漢語詞典詞條微觀結(jié)構(gòu)的變遷及詞目規(guī)范化的歷程;Danica Salazar(英國)梳理了《牛津英語詞典》第三版中東南亞詞匯的收錄情況;Ai Inoue(日本)分析了英語新現(xiàn)復(fù)合副詞短語“be in and out”的語義、組合和語法行為;Makoto Sumiyoshi (日本)基于“美國當(dāng)代英語語料庫”和“歷史美語語料庫”揭示了多詞表達(dá)的配價(jià)形式特征,二者的研究都致力于改善詞典對(duì)短語單位的覆蓋和處理。
Alenka Vrbinc(斯洛文尼亞)研究了紙質(zhì)單語詞典中未定義的副詞內(nèi)詞條在網(wǎng)絡(luò)詞典中的釋義類型、義項(xiàng)分類及其存在的問題;Kim Mi yun(法國)對(duì)比了《標(biāo)準(zhǔn)韓語詞典》(紙質(zhì))與《韓語詞匯網(wǎng)絡(luò)》中身體名詞的釋義方式; Francois Nemo等(法國)嘗試在電子詞典的多義詞釋義中引入韻律;Shan Wang等(香港、新加坡)探索了“漢語詞匯特性速描”(Chinese Word Sketch Engine)在詞典釋義尤其是近義詞意義辨析時(shí)的應(yīng)用;李知宇等(中國)比較了兩部紙本漢英專科詞典《體育科學(xué)詞典》(2000)與《體育大詞典》(1984)的宏、微觀結(jié)構(gòu),著重分析了立目、詞長、譯義的不足之處,為編纂網(wǎng)絡(luò)體育詞典提供了可行的參考方案;Rosario B. Dizon等(菲律賓)從接受反應(yīng)理論(Receptivereflection Theory)和翻譯學(xué)的視角分析了《多語軍事詞典》的等值翻譯技巧;Ni Ketut Mirahayuni(印度尼西亞)調(diào)查了英語復(fù)合動(dòng)詞的構(gòu)建方式和構(gòu)成因子,進(jìn)而輔助印尼語等值詞的確定。
Shin’ichiro ISIKAWA(日本)基于“亞洲英語學(xué)習(xí)者國際語料庫網(wǎng)絡(luò)”,考察了中、日、韓三國英語學(xué)習(xí)者典型的詞匯使用過度和使用不足現(xiàn)象,以此擴(kuò)充EFL詞典常規(guī)的用法說明;Yoshiho Satake(日本)基于“日本英語學(xué)習(xí)者語料庫”和“國際跨語言中介語語料庫”分析了日本學(xué)習(xí)者的高頻動(dòng)賓搭配失誤,為撰寫詞典搭配錯(cuò)誤說明提供了實(shí)證基礎(chǔ);Adam Kilgarriff(英國)介紹了Word Sketch在描述詞的組合形式與語法關(guān)系中的應(yīng)用,以期豐富詞條的搭配與語法信息;Yukio Tono(日本)探索了如何基于《歐洲語言共同參考框架》(Common European Framework of Reference for Languages:Learning,Teaching,Assessment,CEFR)評(píng)估和排列詞典中的語言項(xiàng)目(語法、詞匯、意義和功能)。
(2)知識(shí)層面的研究:Yuka Ishikawa(日本)討論了《基本日英詞典》第二版的例句和用法說明中蘊(yùn)含的性別偏見;Diah Ariani Arimbi(印度尼西亞)選取《劍橋高級(jí)英語詞典》第三版的CDROM數(shù)據(jù)庫,分析了含“man”“woman”且?guī)А癮pproving”“disapproving”標(biāo)簽的例句,揭示了英語語言的“語言轉(zhuǎn)向”(Linguistic Turn)及性別歧視;Irpan Apandi Batubara(印度尼西亞)基于Collins Cobuild資源包的Wordbank,對(duì)“Indonesia”一詞的索引行進(jìn)行了內(nèi)容分析和來源分析,得出了印度尼西亞的國家輪廓,探討了詞典編纂與網(wǎng)絡(luò)資源的關(guān)系。
(3)技術(shù)層面的研究:Wafa WALI等(突尼斯)探索了LMF(Lexical Markup Framework)標(biāo)準(zhǔn)化詞典中語義異常的自動(dòng)發(fā)現(xiàn)機(jī)制;Charles Kivunja(澳大利亞)介紹了數(shù)據(jù)挖掘軟件Leximancer的主要功能及其在詞典設(shè)計(jì)、編纂中的實(shí)際應(yīng)用;Toshihiko Uemura(日本)強(qiáng)調(diào)了網(wǎng)絡(luò)詞典載體升級(jí)(從個(gè)人電腦到平板電腦)的必要性及技術(shù)調(diào)整方案。
(4)規(guī)劃層面的研究:enning Bergenholtz(丹麥)討論了語言學(xué)家在詞典規(guī)劃和編纂實(shí)踐中的角色;Muhammad(印度尼西亞)分析了編纂英印雙語詞典時(shí)可能遇到的文化差異、語法結(jié)構(gòu)及科技新詞方面的難點(diǎn),并闡釋了編纂者須滿足的資質(zhì)要求;Antonia Cristinoi(法國)歸納了編纂瀕危語言詞典的挑戰(zhàn)及對(duì)策;Sri Andayani(印度尼西亞)論述了編纂東爪哇語詞典面臨的問題和困難; Saravanan Raja(印度)指出一部廟宇建筑術(shù)語詞典應(yīng)具有的結(jié)構(gòu)、組織特征;高永偉(中國)談到《英漢大詞典》第三版的網(wǎng)絡(luò)化計(jì)劃;Michal varn等(捷克)闡述了基于SUMO(Suggested Upper Merged Ontology)與過程顆粒度創(chuàng)建一部邏輯詞典的可能性。
2.用戶視角研究
(1)用戶需求研究:ilary Nesi等(英國)通過搜集、分析網(wǎng)絡(luò)社區(qū)Yahoo!Answers 和Knowledge iN的詞典相關(guān)問題,比較了英、韓兩國詞典使用者的查閱期望和知識(shí)需求;irapa Vitayapirak(泰國)調(diào)研了泰國大學(xué)生對(duì)智能手機(jī)電子詞典的查詢傾向、動(dòng)機(jī)及目的; Dora Amalia(印度尼西亞)考察了高級(jí)印尼語學(xué)習(xí)者在解碼與編碼情境下對(duì)四種釋義類型(同義詞對(duì)釋、“屬+種差”定義、配價(jià)形式以及jika―定義)的偏好與選擇;Paul ulian Santiago(菲律賓)調(diào)查了日本的菲律賓語學(xué)習(xí)者在語言產(chǎn)出時(shí)對(duì)日菲詞典詞條微觀結(jié)構(gòu)信息項(xiàng)(釋詞、例證、語法信息、句法信息)的查閱和利用。
(2)詞典使用研究:Robert Lew(波蘭)考察了由詞典媒介革新導(dǎo)引的詞典使用技能與策略的更新;Christopher Winestock等(韓國)闡釋了智能手機(jī)詞典應(yīng)用程序的商業(yè)模式、市場(chǎng)份額、定價(jià)策略、競爭對(duì)手及發(fā)展趨勢(shì);Chaker amdi(阿爾及利亞)調(diào)查了CDROM詞典和屏幕文本顯示對(duì)提高英語學(xué)習(xí)者閱讀理解水平的積極影響;Toshiko Koyama(日本)調(diào)查了電子詞典使用策略訓(xùn)練如何有助于日本英語學(xué)習(xí)者內(nèi)化查閱技能、強(qiáng)化閱讀理解和詞匯學(xué)習(xí);薛梅(中國)研究了詞典(或詞表)使用在中國英語學(xué)習(xí)者的閱讀理解及偶然性詞匯習(xí)得中的有效作用;Simon Potter(日本)介紹了他本人在2006―2012年間編纂的五部美國英語詞典的緣起、定位、結(jié)構(gòu)及其在日本名古屋大學(xué)英語課上作為文化教材的使用情況。
三、評(píng)述
基于大會(huì)論文的研究動(dòng)態(tài)和關(guān)注焦點(diǎn),當(dāng)今國際辭書界,尤其是亞洲辭書界的詞典編纂與研究可總結(jié)出三大新趨勢(shì):
第一,現(xiàn)代電子信息技術(shù)極大地拓延了詞典學(xué)的學(xué)科疆域,拓寬了詞典學(xué)的研究視野,拓展了詞典學(xué)的研究方法??梢哉f,以計(jì)算機(jī)、互聯(lián)網(wǎng)、數(shù)據(jù)庫、語料庫技術(shù)為支撐的詞典編纂與研究已演進(jìn)為當(dāng)代學(xué)者開展實(shí)踐與理論活動(dòng)的默認(rèn)范式,并正朝著語料深加工、語料數(shù)據(jù)化的方向穩(wěn)步邁進(jìn)。1999年,亞洲辭書學(xué)會(huì)第一屆年會(huì)上,章宜華教授(1999:49)曾提到“語料庫作為語言研究和詞典編纂的有效工具已被人們所認(rèn)識(shí),但由于經(jīng)濟(jì)和技術(shù)支持方面的原因,實(shí)施起來還有一定的困難”。如今,不到15年光景,詞典學(xué)的整體風(fēng)貌和具體環(huán)節(jié)已發(fā)生了革命性巨變??梢灶A(yù)見,在未來,詞典學(xué)還將繼續(xù)朝著數(shù)字化、智能化、網(wǎng)絡(luò)化、市場(chǎng)化的方向深入發(fā)展。
第二,在當(dāng)今信息時(shí)代,詞典學(xué)理論體系的構(gòu)建還遠(yuǎn)遠(yuǎn)滯后于自身的實(shí)踐發(fā)展。在信息科學(xué)的沖擊下,傳統(tǒng)詞典的核心特征日漸模糊,辭書業(yè)的研究版圖重新布局,構(gòu)成詞典學(xué)基石的理論觀點(diǎn)也在一一瓦解。縱觀參會(huì)的50篇論文,大多偏重實(shí)用的局部探索,很少開展宏觀的理論探索。一方面,這反映了國際詞典界務(wù)實(shí)的風(fēng)氣;再則,這也與西方辭書界重“術(shù)”輕“學(xué)”的傳統(tǒng)相契合(如Casares的《現(xiàn)代詞典學(xué)導(dǎo)論》、Zgusta的《詞典編纂手冊(cè)》、Béjoint的《英語詞典學(xué)》等均無意行理論之名)。另一方面,秉持“理論照亮實(shí)踐,實(shí)踐豐富理論”的思路,我們必須意識(shí)到,在詞典學(xué)活動(dòng)如井噴般活躍之時(shí),也是它最亟待規(guī)范之際。在新型傳載媒介的浪潮中,面對(duì)形形的新思路、新工具、新技術(shù),非常有必要建立一套與詞典學(xué)當(dāng)下發(fā)展相匹配的原則、方法與程序,尤其是有關(guān)網(wǎng)絡(luò)詞典編纂規(guī)范、質(zhì)量標(biāo)準(zhǔn)、評(píng)價(jià)指標(biāo)的制定,尤為緊迫。
第三,對(duì)一個(gè)多民族的統(tǒng)一國家而言,詞典對(duì)其文化發(fā)展有特殊重要的意義。本次學(xué)術(shù)會(huì)議雖然仍圍繞英語單語、雙語、多語詞典的編纂與研究,但小語種和民族語言尤其是瀕危語言詞典研究已頗具規(guī)模。關(guān)于詞典和語言的關(guān)系,過去一直強(qiáng)調(diào)“詞典工具論”“詞典再現(xiàn)論”,自俄語專著《理論與實(shí)踐詞典學(xué)》(1998)將詞典的社會(huì)性正式納入辭書研究范疇以來,詞典對(duì)語言的能動(dòng)作用就愈發(fā)凸顯。本次大會(huì)的多篇論文都顯示了詞典在拯救瀕危文化、增強(qiáng)民族凝聚力、維護(hù)民族團(tuán)結(jié)方面的作用。
新時(shí)期的詞典學(xué)還呈現(xiàn)出若干其他新特點(diǎn),如??圃~典編纂超越語文詞典編纂,用戶視角研究盛于編者視角研究,詞典史考察日趨冷淡,眾源編纂方式逐漸興起等等。論文議題還顯示,詞典學(xué)與跨文化交際、翻譯學(xué)、外語教學(xué)、二語習(xí)得、社會(huì)學(xué)、歷史學(xué)、術(shù)語學(xué)、統(tǒng)計(jì)學(xué)等學(xué)科領(lǐng)域已交匯融合,詞典學(xué)研究正以前所未有的廣闊度和多樣性鋪展開來。然而,再度思索,我們發(fā)現(xiàn)多數(shù)課題的研究深度還遠(yuǎn)遠(yuǎn)不夠。獲益于認(rèn)知語言學(xué)、語料庫語言學(xué)、詞匯語義學(xué)、短語學(xué)等關(guān)于詞匯意義理論的最新成果(如原型理論、框架語義學(xué)、配價(jià)語法、搭配理論、構(gòu)式語法、規(guī)范與變異理論等,不一而足)的研究尚不多見,具有深厚學(xué)理與前瞻遠(yuǎn)見的研究還屈指可數(shù)。廣闊度有余,專深度不足,這也是當(dāng)今詞典學(xué)界繁榮表面背后的隱憂。
詞典,作為人類步入文明社會(huì)后出現(xiàn)的一種認(rèn)知工具,它對(duì)人類社會(huì)的文化傳承起著舉足輕重的作用?!皫浊陙?,特別是近現(xiàn)代,語言研究在一刻不停地進(jìn)行,語言學(xué)理論在一刻不停地翻新?!保ㄓ汉兔?2004:49)辭書領(lǐng)域同樣如此。從1604年第一部英語單語詞典起,詞典編纂經(jīng)歷了17世紀(jì)的難詞傳統(tǒng),18世紀(jì)的文學(xué)傳統(tǒng),19世紀(jì)的歷史傳統(tǒng),20世紀(jì)的學(xué)術(shù)、實(shí)用、學(xué)習(xí)傳統(tǒng)三分天下,時(shí)至今日,拜迅猛的科技發(fā)展所賜,我們正在經(jīng)歷詞典史上千年未遇之變局,辭書的編纂理念、呈現(xiàn)形態(tài)、使用方式等方面都取得了一系列顛覆性的創(chuàng)新。一言以蔽之,在物質(zhì)基礎(chǔ)、研究客體、研究工具日益更新的前提下,詞典學(xué)的思想體系和方法系統(tǒng)唯有隨之不斷升級(jí),才能保持這門學(xué)科長久的生命力,走上“可持續(xù)發(fā)展”的道路。
參考文獻(xiàn)
1.雍和明. 語言?詞典與詞典學(xué).外語與外語教學(xué),2004(1).
2.章宜華. 亞洲辭書界的盛會(huì)――亞洲辭書學(xué)會(huì)第一屆年會(huì)側(cè)記.辭書研究,1999(3).
3.Béjoint . Modern Lexicography: An Introduction . Oxford: Oxford University Press, 2000.
4.Casares . Introduction a la Lexicografia Moderna . Consejo Superior de Investigaciones Cientifica, 1969.
5.Kwary A D, Wulan N, Musyahda L. (eds.) Lexicography and Dictionaries in the Information Age: Selected Papers from the 8th ASIALEX International Conference. Surabaya: Airlangga University Press, 2013.
篇10
[關(guān)鍵詞]大數(shù)據(jù);宏觀經(jīng)濟(jì)學(xué);教學(xué)改革
doi:10.3969/j.issn.1673 - 0194.2017.06.162
[中圖分類號(hào)]G642.0 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1673-0194(2017)06-0-02
0 引 言
隨著計(jì)算機(jī)互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算、社交網(wǎng)絡(luò)等現(xiàn)代網(wǎng)絡(luò)新技術(shù)突飛猛進(jìn)的發(fā)展,人們通過網(wǎng)絡(luò)瀏覽、搜索、購物等行為產(chǎn)生的數(shù)據(jù)日益增多,致使人們邁入了數(shù)據(jù)以大量性、多樣性、價(jià)值性和高速性為特征的大數(shù)據(jù)時(shí)代。在我國,大數(shù)據(jù)已提升到國家戰(zhàn)略的層面,國務(wù)院于2015年頒布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》指出,“深化大數(shù)據(jù)在各行業(yè)創(chuàng)新應(yīng)用”,在文化、教育等領(lǐng)域全面推廣大數(shù)據(jù)應(yīng)用和開展大數(shù)據(jù)應(yīng)用示范。十八屆五中全會(huì)通過的“十三五”規(guī)劃綱要進(jìn)一步提出了將“實(shí)施國家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開放共享”。
目前,大數(shù)據(jù)及大數(shù)據(jù)技術(shù)已經(jīng)滲透到經(jīng)濟(jì)、社會(huì)、生活的方方面面,并影響著人們的理念、行為和習(xí)慣,其中,本科高等教育也深受影響。隨著大稻蕕募鈾俜⒄?,F(xiàn)代教學(xué)技術(shù)不斷轉(zhuǎn)型升級(jí),出現(xiàn)了慕課、微課、翻轉(zhuǎn)課程等新的教學(xué)方法,對(duì)傳統(tǒng)的本科教學(xué)也提出了前所未有的新要求。如何追隨大數(shù)據(jù)時(shí)展帶來的深刻改革,對(duì)教師掌握日新月異的現(xiàn)代教學(xué)理念,提高教學(xué)效果具有重要的意義。國內(nèi)已有學(xué)者探討了大數(shù)據(jù)對(duì)應(yīng)用經(jīng)濟(jì)學(xué)、國際經(jīng)濟(jì)學(xué)、財(cái)政學(xué)、統(tǒng)計(jì)學(xué)和管理統(tǒng)計(jì)學(xué)等課程教學(xué)的影響及相應(yīng)的調(diào)整策略。盡管劉濤雄和徐曉飛(2015)、姜疆(2016)、申紅艷 等(2014)探討了大數(shù)據(jù)時(shí)代的宏觀經(jīng)濟(jì)分析,但鮮有文獻(xiàn)研究大數(shù)據(jù)對(duì)宏觀經(jīng)濟(jì)學(xué)教學(xué)的影響。因此,本文擬在大數(shù)據(jù)時(shí)代探討宏觀經(jīng)濟(jì)學(xué)本科的教學(xué)改革。
1 宏觀經(jīng)濟(jì)學(xué)傳統(tǒng)教學(xué)模式中的問題
宏觀經(jīng)濟(jì)學(xué)是經(jīng)濟(jì)管理類專業(yè)中一門承上啟下的基礎(chǔ)課程,是經(jīng)濟(jì)管理類碩士與博士研究生入學(xué)考試的必考課程。宏觀經(jīng)濟(jì)學(xué)研究整體經(jīng)濟(jì)現(xiàn)象,解釋同時(shí)影響許多家庭、企業(yè)和市場(chǎng)的經(jīng)濟(jì)變化,主要考察國民收入的決定與變動(dòng)、短期的經(jīng)濟(jì)波動(dòng)、長期的經(jīng)濟(jì)增長、就業(yè)、通貨膨脹和國際收支等問題。當(dāng)前大部分高校的宏觀經(jīng)濟(jì)學(xué)還是采用傳統(tǒng)的教學(xué)模式,存在諸如注重理論教學(xué)、輕實(shí)踐教學(xué);教學(xué)方式單一、學(xué)生自主學(xué)習(xí)意愿不強(qiáng);考核方式偏向固定化等問題。
1.1 注重理論教學(xué),輕實(shí)踐教學(xué)
宏觀經(jīng)濟(jì)學(xué)是理論性和實(shí)踐性均比較強(qiáng)的一門基礎(chǔ)課程,該課程的理論可以指導(dǎo)解決現(xiàn)實(shí)生活中的經(jīng)濟(jì)問題和現(xiàn)象。但在傳統(tǒng)的教學(xué)中,主要以講授抽象難懂的理論知識(shí)為主,如國民收入決定理論模型、IS-LM模型、AD-AS模型等,為了讓學(xué)生能夠理解清楚宏觀經(jīng)濟(jì)學(xué)理論的內(nèi)涵,任課教師往往會(huì)用大量的時(shí)間去講解這些理論知識(shí),盡管在一定程度上有利于學(xué)生掌握理論知識(shí),但占據(jù)了太多的課堂時(shí)間、消耗了教師太多的精力,教師在課堂上基本沒有多余的時(shí)間和精力區(qū)開展實(shí)踐性教學(xué)。
1.2 教學(xué)模式單一,學(xué)生自主學(xué)習(xí)意愿不強(qiáng)
大多數(shù)高校的宏觀經(jīng)濟(jì)學(xué)仍采用教師課前備課,課堂上講授教材附帶或自作的PPT,課后解答疑難問題單一的傳統(tǒng)教學(xué)模式。這種教學(xué)模式以教師為主體,教師在課堂上講授的內(nèi)容是學(xué)生獲取知識(shí)的主要途徑,而且教師課堂講授占據(jù)了大部分的課堂時(shí)間,留給學(xué)生在課堂上討論的機(jī)會(huì)和時(shí)間并不多,學(xué)生在課堂上以被動(dòng)聽講為主,導(dǎo)致學(xué)生自主學(xué)習(xí)意愿不強(qiáng),這不利于提高學(xué)生提問、探索、思考問題的能力。傳統(tǒng)的課堂教學(xué)深受時(shí)間和空間的限制,教師完全掌握了教學(xué)進(jìn)度,學(xué)生基本上按教學(xué)大綱進(jìn)行學(xué)習(xí),自主安排學(xué)習(xí)的空間不多,這不利于激發(fā)學(xué)生學(xué)習(xí)的積極性。
1.3 考核方式偏向固定化
傳統(tǒng)的宏觀經(jīng)濟(jì)學(xué)考核方式主要以期末考試為主,課程成績一般按照平時(shí)成績(包括出勤、作業(yè)、課堂表現(xiàn)、期中考試成績等)與期末考試成績3∶7或4∶6的比例加權(quán)平均組成。這種考核方式盡管在一定程度上能夠相對(duì)客觀地檢驗(yàn)學(xué)生掌握宏觀經(jīng)濟(jì)學(xué)基本概念、原理和規(guī)律等內(nèi)容的情況,但也可能存在教師在試題命題過程中因?yàn)闆]有為主觀題和客觀題設(shè)置合理的比例,而出現(xiàn)學(xué)生平時(shí)上課不認(rèn)真聽講,通過考前死記硬背獲得高分的問題,未能檢驗(yàn)學(xué)生運(yùn)用宏觀經(jīng)濟(jì)學(xué)理論分析并解決問題的能力。傳統(tǒng)的考核方式也未對(duì)學(xué)生的學(xué)習(xí)態(tài)度、實(shí)踐能力進(jìn)行考核。
2 大數(shù)據(jù)時(shí)代宏觀經(jīng)濟(jì)學(xué)教學(xué)改革的探討
大數(shù)據(jù)時(shí)代為宏觀經(jīng)濟(jì)學(xué)教學(xué)帶來了海量的數(shù)據(jù)和新穎的案例等資料,為宏觀經(jīng)濟(jì)學(xué)課堂教學(xué)提供了既豐富又生動(dòng)的素材,為推進(jìn)宏觀經(jīng)濟(jì)學(xué)教學(xué)改革提供了強(qiáng)有力的保障。在大數(shù)據(jù)時(shí)代,對(duì)宏觀經(jīng)濟(jì)學(xué)教學(xué)進(jìn)行改革,可以提高教學(xué)效率、激發(fā)學(xué)生學(xué)習(xí)興趣、培養(yǎng)學(xué)生獨(dú)立思考和解決問題的能力,更有利于經(jīng)濟(jì)管理類專業(yè)學(xué)生掌握宏觀經(jīng)濟(jì)學(xué)基礎(chǔ)知識(shí),為學(xué)習(xí)國際經(jīng)濟(jì)學(xué)、金融經(jīng)濟(jì)學(xué)、財(cái)政學(xué)等后續(xù)專業(yè)課程奠定扎實(shí)的基礎(chǔ),并為參加研究生入學(xué)、政府機(jī)關(guān)、金融機(jī)構(gòu)、高校等用人單位的招聘考試做好充分準(zhǔn)備。
2.1 形成基于大數(shù)據(jù)的教學(xué)理念
大數(shù)據(jù)時(shí)代要求人們要形成大數(shù)據(jù)思維,同樣,大數(shù)據(jù)背景下的宏觀經(jīng)濟(jì)學(xué)課程教學(xué)改革也需要具備大數(shù)據(jù)的思維。為了形成基于大數(shù)據(jù)的教學(xué)理念,任課教師要緊緊跟隨大數(shù)據(jù)時(shí)展的步伐,積極參加各種運(yùn)用大數(shù)據(jù)改進(jìn)教學(xué)的培訓(xùn)、進(jìn)修,認(rèn)真學(xué)數(shù)據(jù)時(shí)代先進(jìn)的教學(xué)技術(shù)和方法,并不斷將這些教學(xué)技術(shù)和方法引入宏觀經(jīng)濟(jì)學(xué)課堂教學(xué)中。
2.2 多渠道豐富教學(xué)內(nèi)容
第一,添加大數(shù)據(jù)時(shí)代的海量數(shù)據(jù)信息資料,豐富教學(xué)內(nèi)容。傳統(tǒng)的宏觀經(jīng)濟(jì)學(xué)教學(xué)存在理論性較強(qiáng)的問題,在大數(shù)據(jù)時(shí)代,任課教師可輔之以海量數(shù)據(jù)信息資料來豐富教學(xué)內(nèi)容。與純粹理論知識(shí)教學(xué)不同,基于現(xiàn)實(shí)經(jīng)濟(jì)現(xiàn)象的數(shù)據(jù)案例教學(xué)更加生動(dòng)有趣,更能激發(fā)學(xué)生學(xué)習(xí)的積極性,更有助于學(xué)生牢固掌握抽象的宏觀經(jīng)濟(jì)學(xué)理論知識(shí),并提高運(yùn)用宏觀經(jīng)濟(jì)學(xué)理論分析問題和解決問題的能力。比如,在講授居民消費(fèi)價(jià)格指數(shù)(CPI)時(shí),可分別引入基于掃描數(shù)據(jù)、網(wǎng)絡(luò)搜索數(shù)據(jù)、谷歌趨勢(shì)(Google Trends)預(yù)測(cè)CPI等案例分析。宏觀經(jīng)濟(jì)學(xué)課程中,所有章節(jié)的內(nèi)容基本都可以通過互聯(lián)網(wǎng)查找到大量相關(guān)的數(shù)據(jù)信息資料,利用這些資料可以更新、修訂教學(xué)大綱、教案和講義,有利于豐富教學(xué)內(nèi)容,也有助于提高教學(xué)效果。
第二,增加運(yùn)用大數(shù)據(jù)技術(shù)進(jìn)行宏觀經(jīng)濟(jì)分析的內(nèi)容。在經(jīng)濟(jì)新常態(tài)下,我國經(jīng)濟(jì)發(fā)展面臨著更加錯(cuò)綜復(fù)雜的國內(nèi)外形勢(shì)和更加繁重艱巨的任務(wù),因此,宏觀經(jīng)濟(jì)決策對(duì)宏觀經(jīng)濟(jì)分析提出了更高的要求?!笆濉币?guī)劃綱要中指出“完善政策制定和決策機(jī)制:注重運(yùn)用互聯(lián)網(wǎng)、統(tǒng)計(jì)云、大數(shù)據(jù)技術(shù),提高經(jīng)濟(jì)運(yùn)行信息及時(shí)性、全面性和準(zhǔn)確性”。因此,在大數(shù)據(jù)時(shí)代的宏觀經(jīng)濟(jì)學(xué)教學(xué)改革有必要加入宏觀經(jīng)濟(jì)分析。
傳統(tǒng)的宏觀經(jīng)濟(jì)分析主要通過對(duì)比宏觀經(jīng)濟(jì)指標(biāo)、構(gòu)建宏觀經(jīng)濟(jì)計(jì)量模型、仿真宏觀經(jīng)濟(jì)動(dòng)力系統(tǒng),對(duì)宏觀經(jīng)濟(jì)運(yùn)行形勢(shì)及其發(fā)展趨勢(shì)加以判斷和預(yù)測(cè)。大數(shù)據(jù)時(shí)代的數(shù)據(jù)規(guī)模大、類型多,拓寬了宏觀經(jīng)濟(jì)分析所用數(shù)據(jù)信息的來源,并提高了數(shù)據(jù)信息獲取的時(shí)效性。目前,國內(nèi)外運(yùn)用大數(shù)據(jù)的概念、方法和技術(shù)進(jìn)行宏觀經(jīng)濟(jì)分析的研究主要集中在宏觀經(jīng)濟(jì)預(yù)測(cè)(尤其是現(xiàn)時(shí)預(yù)測(cè))、宏觀經(jīng)濟(jì)分析技術(shù)、宏觀經(jīng)濟(jì)政策和宏觀經(jīng)濟(jì)數(shù)據(jù)挖掘等領(lǐng)域。
第三,借助大數(shù)據(jù)時(shí)代媒體報(bào)道拓寬知識(shí)面。在學(xué)習(xí)教材的基礎(chǔ)上,可推薦學(xué)生通過互聯(lián)網(wǎng);物聯(lián)網(wǎng);經(jīng)濟(jì)信息聯(lián)播、經(jīng)濟(jì)半小時(shí)、經(jīng)濟(jì)信息聯(lián)播等財(cái)經(jīng)類電視節(jié)目;《21世o經(jīng)濟(jì)報(bào)道》《經(jīng)濟(jì)觀察報(bào)》《金融時(shí)報(bào)》《經(jīng)濟(jì)學(xué)人》等報(bào)紙雜志的財(cái)經(jīng)報(bào)道,多渠道關(guān)注宏觀經(jīng)濟(jì)熱點(diǎn)問題,拓寬學(xué)生的知識(shí)面。
2.3 加強(qiáng)實(shí)踐性教學(xué)
培養(yǎng)學(xué)生熟練運(yùn)用宏觀經(jīng)濟(jì)學(xué)理論與方法分析國內(nèi)外現(xiàn)實(shí)生活中的經(jīng)濟(jì)問題和現(xiàn)象是宏觀經(jīng)濟(jì)學(xué)教學(xué)的目標(biāo)。因此,任課教師在講授理論知識(shí)和方法的基礎(chǔ)上,更應(yīng)注重實(shí)踐教學(xué)。
大數(shù)據(jù)時(shí)代的宏觀經(jīng)濟(jì)學(xué)本科實(shí)踐教學(xué),應(yīng)當(dāng)以培養(yǎng)學(xué)生的主動(dòng)性和創(chuàng)造性為根本出發(fā)點(diǎn),任課教師可以以宏觀經(jīng)濟(jì)學(xué)理論知識(shí)和豐富的大數(shù)據(jù)資源為基礎(chǔ),結(jié)合與大數(shù)據(jù)相關(guān)的課題、論文,將宏觀經(jīng)濟(jì)領(lǐng)域的研究思想、研究方法、研究前沿引入教學(xué)。具體而言,教師可通過引導(dǎo)學(xué)生如何觀察現(xiàn)實(shí)經(jīng)濟(jì)問題進(jìn)行選題,如何結(jié)合宏觀經(jīng)濟(jì)學(xué)理論構(gòu)建數(shù)學(xué)模型,如何查找和整理文獻(xiàn),如何搜集大樣本的宏觀經(jīng)濟(jì)數(shù)據(jù),如何撰寫學(xué)術(shù)論文并加以修改等方式增加研究性教學(xué)。鼓勵(lì)學(xué)生積極參與到研究中,使學(xué)生在研究過程中不斷學(xué)習(xí)和實(shí)踐,培養(yǎng)學(xué)生獨(dú)立思考的習(xí)慣,提高其研究學(xué)習(xí)能力。
此外,還可采取“走出去”與“請(qǐng)進(jìn)來”相結(jié)合的戰(zhàn)略開展實(shí)踐性教學(xué)?!白叱鋈ァ笔侵附M織學(xué)生到當(dāng)?shù)氐慕y(tǒng)計(jì)局、發(fā)改委、經(jīng)信委等與宏觀經(jīng)濟(jì)運(yùn)行緊密相關(guān)的政府部門和互聯(lián)網(wǎng)、金融、電信、零售等應(yīng)用大數(shù)據(jù)的企業(yè)進(jìn)行參觀學(xué)習(xí),加強(qiáng)與這些單位開展深入合作,建立校外實(shí)訓(xùn)實(shí)習(xí)基地,讓學(xué)生真正參與宏觀經(jīng)濟(jì)學(xué)實(shí)踐活動(dòng)?!罢?qǐng)進(jìn)來”是邀請(qǐng)這些單位既熟悉宏觀經(jīng)濟(jì)學(xué)分析,又精通大數(shù)據(jù)分析的工作人員到學(xué)校為學(xué)生開展報(bào)告、經(jīng)驗(yàn)交流座談會(huì)。
2.4 采用“以學(xué)生為中心”的教學(xué)模式
大數(shù)據(jù)時(shí)代的在線教學(xué)平臺(tái)、翻轉(zhuǎn)課堂、微課、慕課,為實(shí)現(xiàn)宏觀經(jīng)濟(jì)學(xué)教學(xué)模式,由“以教師為中心”轉(zhuǎn)換為“以學(xué)生為中心”提供了保障。具體來說,教師可先根據(jù)課程標(biāo)準(zhǔn)和教學(xué)實(shí)踐的要求,制作宏觀經(jīng)濟(jì)學(xué)課程教學(xué)大綱,接著按照微課、慕課、翻轉(zhuǎn)課堂等教學(xué)模式的要求,從學(xué)生學(xué)習(xí)需求的角度出發(fā),將每章節(jié)內(nèi)容制作成PPT、視頻、練習(xí)題、測(cè)試題、討論題、評(píng)分標(biāo)準(zhǔn)等資料,然后將這些資料上傳至教學(xué)平臺(tái),為學(xué)生提供豐富的學(xué)習(xí)資源,也為學(xué)生提供更多自主學(xué)習(xí)的空間,這樣學(xué)生可隨時(shí)隨地通過在線教學(xué)平臺(tái)進(jìn)行自主學(xué)習(xí)。
在線教學(xué)平臺(tái)采用交互式的短視頻學(xué)習(xí)模式,以10分鐘左右的片段式多媒體視頻為主,并在線完成配套的測(cè)試題,讓學(xué)生在輕松有趣的環(huán)境下掌握枯燥無味的宏觀經(jīng)濟(jì)學(xué)原理,有利于激發(fā)學(xué)生的學(xué)習(xí)興趣,提高學(xué)習(xí)效率。在線教學(xué)平臺(tái)為學(xué)生和教師、學(xué)生和學(xué)生、教師和教師之間搭建了交流平臺(tái),通過平臺(tái)可以相互發(fā)表觀點(diǎn)、交流意見、提問、解答等,有利于增加師生的互動(dòng),也有利于培養(yǎng)學(xué)生思考、分析和解決現(xiàn)實(shí)經(jīng)濟(jì)問題的能力。此外,在線教學(xué)平臺(tái)會(huì)將學(xué)生的學(xué)習(xí)行為進(jìn)行記錄,并根據(jù)記憶退化曲線提醒學(xué)生哪些內(nèi)容需要及時(shí)復(fù)習(xí),進(jìn)一步運(yùn)用大數(shù)據(jù)技術(shù)對(duì)平臺(tái)記錄的學(xué)生信息進(jìn)行分析,可提煉出學(xué)生的學(xué)習(xí)能力、性格特征、學(xué)習(xí)狀態(tài)等信息,依此開展有針對(duì)性的個(gè)性化教育。
2.5 實(shí)施多元化考核
在大數(shù)據(jù)背景下,宏觀經(jīng)濟(jì)學(xué)課程應(yīng)采用多元化考核方式,既考核學(xué)生對(duì)宏觀經(jīng)濟(jì)學(xué)理論知識(shí)的理解程度,也考核學(xué)生綜合運(yùn)用宏觀經(jīng)濟(jì)學(xué)知識(shí)的能力,同時(shí),也考核學(xué)生在線學(xué)習(xí)和參與宏觀經(jīng)濟(jì)學(xué)實(shí)踐教學(xué)等情況。如,其可根據(jù)教學(xué)平臺(tái)記錄學(xué)生完整的在線學(xué)習(xí)過程(包括每一個(gè)知識(shí)點(diǎn)內(nèi)容的學(xué)習(xí)進(jìn)度、完成配套練習(xí)和測(cè)試的情況,完成答題的時(shí)間、答題的熟練程度、答題的順序和答題的次數(shù)等),并結(jié)合參加實(shí)踐性教學(xué)的情況、對(duì)各部分內(nèi)容掌握的情況、課堂表現(xiàn)、出勤等綜合考核,給出合理的課程成績以及相應(yīng)的評(píng)價(jià)。
3 結(jié) 語
大數(shù)據(jù)時(shí)代的到來,為宏觀經(jīng)濟(jì)學(xué)課堂教學(xué)提供大量的數(shù)據(jù)和豐富生動(dòng)的案例等資料。在宏觀經(jīng)濟(jì)學(xué)教學(xué)改革中,應(yīng)緊扣大數(shù)據(jù)時(shí)展的脈搏,充分把握好大數(shù)據(jù)時(shí)代帶來的有利條件,整合一切可以整合的大數(shù)據(jù)資源,合理運(yùn)用翻轉(zhuǎn)課堂、微課、慕課等新教學(xué)方法,更好地發(fā)揮大數(shù)據(jù)服務(wù)宏觀經(jīng)濟(jì)學(xué)本科教學(xué)改革,不斷提高教學(xué)效果。
主要參考文獻(xiàn)
[1]白雪.大數(shù)據(jù)時(shí)代下高校應(yīng)用經(jīng)濟(jì)學(xué)教學(xué)改革模式探析[J].經(jīng)濟(jì)師,2016(3).
[2]方霞.教育大數(shù)據(jù)助力《國際經(jīng)濟(jì)學(xué)》課堂教學(xué)改革[J].金融理論與教學(xué),2016(3).
[3]盧盛峰.大數(shù)據(jù)背景下《財(cái)政學(xué)》本科教學(xué)改革探析[J].湖北經(jīng)濟(jì)學(xué)院學(xué)報(bào):人文社會(huì)科學(xué)版,2015(2).
[4]朱建平,李秋雅.大數(shù)據(jù)對(duì)大學(xué)教學(xué)的影響[J].中國大學(xué)教學(xué),2014(9).
[5]劉帆.大數(shù)據(jù)時(shí)代經(jīng)管類專業(yè)管理統(tǒng)計(jì)學(xué)教學(xué)改革研究[J].中國管理信息化,2016(15).
[6]劉濤雄,徐曉飛.大數(shù)據(jù)與宏觀經(jīng)濟(jì)分析研究綜述[J].國外理論動(dòng)態(tài),2015(1).
熱門標(biāo)簽
數(shù)據(jù)分析論文 數(shù)據(jù)挖掘論文 數(shù)據(jù)安全論文 數(shù)據(jù)管理論文 數(shù)據(jù)庫論文 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)誤差 數(shù)據(jù)采集 數(shù)據(jù) 數(shù)據(jù)通信論文 琵琶演奏 批判學(xué)派 批評(píng) 批評(píng)教育
相關(guān)文章
1政務(wù)數(shù)據(jù)協(xié)同治理的分析
3建筑業(yè)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量探討