教育數據挖掘和信息技術教學診斷探索
時間:2022-03-04 03:59:31
導語:教育數據挖掘和信息技術教學診斷探索一文來源于網友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

摘要:近年來,隨著信息化技術發(fā)展和信息化教學改革的深入,大量非結構化教育數據給常規(guī)教學診斷方法帶來挑戰(zhàn)。教育數據挖掘技術隨著“大數據”時代的到來日益成為學者研究熱點。本研究首先闡述數據挖掘應用于信息化教學的一般流程,隨后從數據預處理、教育數據挖掘和模型評估三個方面展開分析,探索教育數據挖掘技術應用于信息化教學數據中,實施教學診斷的途徑。研究表明,教育數據挖掘技術的引入,可以解決對于多樣性數據建模分析的痛點,進而反哺信息化教學,提升教學質量。
關鍵詞:教育數據挖掘;信息化教學;教學診斷
一、引言
“互聯網+”時代的到來給傳統的教育教學帶來了巨大的變革,在教育創(chuàng)新的大背景下,教育理念、教學技術、教學方法不斷發(fā)展。2018年4月,教育部出臺《教育信息化2.0行動計劃》,進一步明確了教育信息化在教育新時展中的重要地位。利用信息化手段開展教學改革,日益成為高校教育教學改革的研究熱點。信息化教學要求教師學習研究先進教學理念,輔助以適合的信息化技術手段,結合典型的工作情境開展教學活動。其中,信息化教學的一個典型特征就是現代教育技術手段的運用。教師在課堂上需要根據教學設計的安排,合理地調用盡可能豐富的教學媒體、信息化資源,構建良好的學習環(huán)境,有時候也可以利用微彈幕、問卷星等方式進行實時互動,以達到充分調動學生的學習主動性的目的,使得學生真正成為知識信息的主動建構者,達到良好的教學效果。由于信息化技術手段的介入,教師可以在有數據相佐證的情況下,全程跟蹤學生的學習情況。教師課前可以基于網絡平臺統計學生預習工作的完成情況,課中可以實時得到學生的問卷結果、測驗數據,課后也可以及時接收學生反饋。由于傳統的教學診斷方法往往只能給出教學環(huán)節(jié)中的單個節(jié)點信息,忽視了不同環(huán)節(jié)之間的相關性,教學質量分析結果的體現形式也只局限于比例分布、平均差、方差等信息。上述傳統方法的特性顯然不能滿足信息化教學改革對于全過程、多樣性教育數據的分析要求。因此,開展一種可以能夠與信息化教學相匹配甚至利用教育學、計算機科學、統計學等多學科融合理論進行教學質量評估、教學方法診斷的方法研究,具有較強的實際意義和現實價值。
二、基于信息化技術數據的教育挖掘方法
教育數據挖掘包含的研究內容可大致分為預測和描述兩類。其中,預測主要傾向于通過已有數據的分析,揭示其規(guī)律,預測未知的數據。而描述更強調在分析數據的過程中發(fā)現新的模式和結構。本研究關注在信息化教學中引入EDM的途徑和方法。因此,從這個角度出發(fā),將一個典型的信息化教學中EDM工作籠統分為數據預處理、數據挖掘和效果評估三個階段。其中的信息化課堂并非特指真實的課堂教學,而是包括課前、課中和課后的開放式教學環(huán)境。它不僅是信息化數據的來源,也是EDM介入后最終需要改進的目標對象。從教育的角度來看,這是一個從教育環(huán)境(信息化課堂)產生的數據中發(fā)現知識,再利用這些知識改善教育環(huán)境的循環(huán)過程(見下圖)。1.數據收集及預處理。數據是教育數據挖掘研究的基礎。具體到信息化教學的數據收集,是指在開放式課堂過程中充分利用網絡教學平臺、信息化手段和資源庫資源,收集的整個教育教學過程中靜態(tài)和動態(tài)的所有數據。理論上可以在不影響教師和學生活動的情況下,連續(xù)記錄整個教學活動的所有數據,如課前預習、教學資料、課堂實時互動甚至學生在每個知識點上停留的時間等。收集到數據之后,由于數據挖掘算法需要處理的數據通常是符合固定標準或者規(guī)范的數據。我們收集到原始數據包含諸如問卷調查、網絡統計、平臺在線測試等多個來源。其中有可能包含有噪聲(如學生隨意評分)、缺失(如沒有學生數據)和不一致(如數據分項和總項前后矛盾)等無效數據。如果直接基于原始數據進行數據挖掘,那么最終得到的結果質量將大打折扣。此時,就需要對于原始數據進行預處理,以達到消除數據中存在的噪聲,合并及歸類不同數據源數據,進行數據壓縮提升挖掘效率等目的。常用的數據預處理一般包括數據清理、數據集成和數據融合、數據變換和數據規(guī)約等步驟。由于新型教育數據的多樣化、大量化、非結構化等特征,大大加劇了預處理的復雜度。因此,通常來說,數據收集和預處理環(huán)節(jié)往往是EDM研究中工作量最多的。2.教育數據挖掘。數據經過預處理之后,已有的結果變量和真實值將會被完全標注。下一步就需要選擇合適的數據挖掘算法進行挖掘分析。信息化教學數據的教育挖掘一般用于在數據中建立預測模型。其常用的數據挖掘方法包括分類、聚類、回歸、關聯規(guī)則挖掘、文本挖掘、馬爾可夫模型、序列模式挖掘以及推薦算法等等。在上述方法中,根據訓練數據是否擁有標記信息,學習任務可大致劃分為“監(jiān)督學習”和無監(jiān)督學習。無監(jiān)督學習用于未知情況下,特定的組織或模式。監(jiān)督學習是使用一個已知的結果的記錄,研究該組數據的背后規(guī)律行為。其中,分類和回歸是監(jiān)督學習的代表,而聚類則是無監(jiān)督學習的代表。數據挖掘開始,通常假設樣本空間中全體樣本服從一個未知的分布,所有前期獲得的樣本數據都是獨立地從這個分布采樣獲得的,及“獨立同分布”。一旦一個模型表現良好,分析師可以將之遷移到新的數據集上去,用于預測新的數據集會產生的結果。3.模型評估及知識生成。在預測模型訓練的時候,不論是采樣諸如決策樹和回歸樹算法,還是各種關聯規(guī)則、貝葉斯模型等手段。為了考量模型的正確性和泛化能力,往往需要對于模型進行評估。具體的做法是將原有的實驗數據分為訓練集、驗證集和測試集三個部分。其中,訓練集用于模型訓練;驗證集用于模型的優(yōu)化選擇;測試集則用于對于模型的實際效果進行評估。劃分方法可以使用“留出法”(直接將數據集劃分為兩個互斥的集合)、“交叉驗證法”(數據集劃分為k個數據子集,子集多次交叉)、“自助法”(從原始數據集中隨機不刪除選取樣本)等。其中,自助法在數據集較小,難以有效劃分訓練/測試集時很有用。在得到不同部分的數據集之后,通常采用模型的準確率、召回率、精度、FScore以及AUC等指標對于模型進行性能衡量,選取最優(yōu)的模型以及模型參數作為學習到的知識,繼而反饋到信息化教學過程中。4.教學診斷應用實例。在信息化教學診斷研究中,最終目的是找到影響教學效果的關鍵因素,并預測學習效果。以常州信息職業(yè)技術學院《虛擬儀器應用技術》課程的“機器視覺物品分類檢測”項目為例,本次課的目標主要是讓學生理解視覺系統的硬件選型依據,掌握基于顏色和圖案紋理的視覺圖像檢測分類處理算法流程。教學設計環(huán)節(jié)運用課程團隊提出的“三角環(huán)式課堂模型”開展教學。對應模型中的“概念探索、應用分析、展示成果”三步驟分別設計課前、課中和課后拓展任務,分層、逐級實現技能提升和崗位對接。采用的信息化手段包括課程教學平臺(課程資源,課程測試),微視頻(真實案例展示)、硬件仿真軟件和交互式圖像處理軟件等。為了達到信息化教學診斷的目的,確定本次數據與處理的目標主要是清楚除噪聲,統計每個學生在開放教學環(huán)境中的課前平臺使用頻次及時間、測試成績以及錯誤部分統計,從中確定分類器的特征。分別統計得出學生網絡平臺使用時間、課程測試及格情況和主要錯誤失分點作為特征集,用于接下來的預測模型。數據挖掘階段,我們利用SPSS統計軟件工具包創(chuàng)建提純現有特征和特征空間縮減。選取樸素貝葉斯分類法開展模型訓練。最終的對比結果表明,該分類器在特異度指標以及敏感度指標上都好于其他常用分類器效果。因此,在得到該分類器模型時,我們將之反饋到信息化教學中用于預測某位學生課程中存在的問題以及最后不合格的可能性。如果預測的數值大于設定的警示閾值,那么教師就可以及時的為該學生提供幫助。
通過信息化教學改革嘗試,學生反映這種上課方式充滿新鮮感,同時試點班相較傳統班的應用技術水平有了較大的提升。課程結束后,組織學生參加由美國NI公司組織的CLAD(虛擬儀器助理開發(fā)工程師)認證考試,2018年試點班學生的通過率為60%,高于NI公布的2017年全國高校的CLAD平均通過率24%。以上成果進一步證實了EDM引入信息化教學改革的有效性。
參考文獻:
[1]王珠珠.教育信息化2.0:核心要義與實施建議[J].中國遠程教育,2018
[2]張一春.信息化教學設計精彩紛呈[M].北京:高等教育出版社,2018
[3]GarcíaE,RomeroC,VenturaS,etal.Acollaborativeeducationalassociationruleminingtool[J].Internet&HigherEducation,2011
[4]牛杰,李晴,戴艷.以翻轉課堂優(yōu)化高職工科教學設計[J].職業(yè)技術教育,2015
[5]陳雯雯,夏一超.教育數據挖掘:大數據時代的教育變革[J].中國教育信息化,2017
[6]周志華.機器學習[M].北京:清華大學出版社,2016
作者:戴艷 牛杰 單位:常州信息職業(yè)技術學院電子工程學院