高校教學(xué)評價(jià)證據(jù)調(diào)查研究
時(shí)間:2022-05-17 09:27:21
導(dǎo)語:高校教學(xué)評價(jià)證據(jù)調(diào)查研究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
一、國外高等學(xué)校教學(xué)評價(jià)的基本做法及經(jīng)驗(yàn)
1.學(xué)生評教的有效性和偏差
很多關(guān)于教學(xué)評價(jià)的早期研究都涉及了對學(xué)生評教有效性問題的關(guān)注。學(xué)生性格、教學(xué)條件、教師性格以及師生互動(dòng)關(guān)系等都是影響學(xué)生評教結(jié)果的可能因素[3];學(xué)生成績也是可能干擾學(xué)生評教因素中的一個(gè);課程類型、課程負(fù)擔(dān)、教師嚴(yán)厲程度和學(xué)生成績等都有可能使評價(jià)結(jié)果產(chǎn)生偏差[4]。雖然如此,還是有很多研究者相信,精心設(shè)計(jì)的學(xué)生評教的確是教學(xué)評價(jià)的有效手段?,F(xiàn)有研究表明,學(xué)生評教的不足之處還體現(xiàn)在學(xué)生沒能力對有效教學(xué)的所有環(huán)節(jié)進(jìn)行評價(jià)。他們可以對教師的課堂表現(xiàn)、組織能力、閱讀材料與作業(yè)的相關(guān)性、教師教學(xué)熱情、師生關(guān)系、教學(xué)內(nèi)容的覆蓋面、考試內(nèi)容、課程難度以及課程負(fù)擔(dān)等方面進(jìn)行評價(jià),但對課程內(nèi)容和學(xué)生學(xué)習(xí)是否充分等就不能評判了。學(xué)生有時(shí)并不能真正意識到他在一門課程中究竟學(xué)到了多少。學(xué)生并不能判斷某些課程中的教學(xué)內(nèi)容是否新穎,教師的專業(yè)知識是否淵博[5]。
2.多渠道收集教學(xué)評價(jià)證據(jù)
研究者普遍認(rèn)為,學(xué)生評教并不能起到對教師教學(xué)效果進(jìn)行全方位評估的作用。雖然學(xué)生評教的使用非常普遍,但仍不能確保學(xué)生有能力對教學(xué)效果做出準(zhǔn)確的判斷。學(xué)生反饋對反映教學(xué)活動(dòng)的某些方面是有用的,如師生關(guān)系、成績評定、課程內(nèi)容、教師的課堂呈現(xiàn)和組織技巧等,但教學(xué)內(nèi)容、相關(guān)性和教師投入等方面卻超出了他們的直接經(jīng)驗(yàn)。專注于有限的證據(jù)來源無法捕獲教學(xué)活動(dòng)的諸多方面,下列因素都需要依靠其它的證據(jù)來源:教師知識、教學(xué)過程的創(chuàng)新性、教學(xué)內(nèi)容的質(zhì)量和價(jià)值、課程效果、教學(xué)內(nèi)容與專業(yè)培養(yǎng)目標(biāo)的密切性、教師貢獻(xiàn)等。單純利用學(xué)生評教無法評估教師的學(xué)識、課程的中遠(yuǎn)期效果,以及教學(xué)內(nèi)容與學(xué)科專業(yè)目標(biāo)和任務(wù)的相關(guān)度。
二、研究問題和研究方法
最近的一項(xiàng)研究考察了美國某大學(xué)商學(xué)院在教學(xué)評估中多大程度上使用了多渠道的證據(jù)來源。我們在中國也進(jìn)行了類似的調(diào)查,利用開放式問卷了解教學(xué)評價(jià)證據(jù)的使用情況。美國、澳大利亞以及很多歐洲國家在利用多樣化評估證據(jù)方面取得了有意義的經(jīng)驗(yàn),中國在此方面似乎經(jīng)驗(yàn)不足。在美國大學(xué),學(xué)生評教已有近40年的歷史,中國大學(xué)使用學(xué)生評教的歷史平均只有8.5年,很多被調(diào)查學(xué)校只有5年甚至更少的時(shí)間。由于逐漸意識到需要利用多源證據(jù)對教學(xué)進(jìn)行評估,加之對不同評估證據(jù)的了解越來越多,我們預(yù)計(jì),中國大學(xué)的管理者們會(huì)越來越強(qiáng)調(diào)使用除學(xué)生評教之外的其它評估證據(jù)。我們研究的問題是:(1)教學(xué)管理者對學(xué)生評教有效性的看法如何?(2)教學(xué)管理者利用學(xué)生評教的機(jī)率如何?(3)用以教學(xué)評估的證據(jù)類型和使用機(jī)率是否因?qū)W校類型而異?(4)用以教學(xué)評估的證據(jù)類型和使用機(jī)率是否因管理者對指標(biāo)的信任度和經(jīng)驗(yàn)而異?我們從不同高校中選取了50個(gè)院系,通過電子郵件向系主任(院長)發(fā)出了問卷調(diào)查申請。之所以選取系主任作調(diào)查對象,是因?yàn)樗麄儗?a href="http://www.yuanjingfilm.com/lunwen/jxztlw/xxjxlw/201405/572528.html" target="_blank">教學(xué)評估負(fù)有最直接的責(zé)任,對用于教學(xué)評估的證據(jù)來源了解得最為透徹。在郵件中我們邀請被調(diào)查者登陸提供的網(wǎng)址來完成問卷(見附錄)。三周后,我們發(fā)出了第二次調(diào)查請求并很快收到了31位系主任的回應(yīng),其中27份答卷是可用的,回應(yīng)率為54%。被調(diào)查院系的具體信息如表1所示。在27份有效答卷所涉及的學(xué)校中,有6所“211工程”院校(占22.22%),21所普通院校(占77.78);有20所院校已接受過教育部本科教學(xué)工作水平評估,其中17所成績?yōu)閮?yōu)秀(占62.96%);有8個(gè)院系擁有博士學(xué)位授予權(quán)(占29.63%),15個(gè)院系有碩士學(xué)位授予權(quán)(占55.55%),16個(gè)院系授予學(xué)士學(xué)位(59.26%),9個(gè)院系為其它層次(占33.33%)。受調(diào)查者個(gè)人工作所限,被調(diào)查對象多為外語院系。但考慮到國內(nèi)高校的教學(xué)評估工作多數(shù)由學(xué)校教務(wù)處統(tǒng)一布置,調(diào)查結(jié)果應(yīng)該具有代表性。
三、調(diào)查結(jié)果及其分析
1.對學(xué)生評教有效性的看法
我們在問卷中設(shè)計(jì)了8個(gè)問題來了解被調(diào)查人對學(xué)生評教有效性的看法。使用的是五級量表,5表示非常同意,3表示不確定,1表示非常不同意。我們利用具有p值的t檢驗(yàn)統(tǒng)計(jì)量來檢驗(yàn)系主任對有效性的認(rèn)識與中立回答(3.0)是否具有顯著差異。統(tǒng)計(jì)結(jié)果表明,系主任基本上同意(3.74)學(xué)生能夠回答學(xué)生評教問卷中的大部分問題,如表2所示。他們的認(rèn)識顯著地高于中立(p=0.0004)。這與對美國大學(xué)的調(diào)查結(jié)果類似,其平均值為4.23。顯然,就調(diào)查樣本而言,美國大學(xué)的系主任更傾向于對學(xué)生回答評教問卷問題的能力感到滿意。這也許是源自美國大學(xué)開展學(xué)生評教歷史更久的緣故,但也可能是由于中美學(xué)生評教證據(jù)中的不同細(xì)節(jié)內(nèi)容所致。我們認(rèn)為后者的可能性更大,因?yàn)橹袊南抵魅卧谂袛鄬W(xué)生是否在超出自己經(jīng)驗(yàn)進(jìn)行評價(jià)問題上基本上保持中立(3.04),在判斷評價(jià)證據(jù)是否與專業(yè)領(lǐng)域相關(guān)時(shí)低于中立(2.85),在判斷評價(jià)證據(jù)與學(xué)校專業(yè)設(shè)置的相關(guān)性上更是低于中立(2.63,p值=0.0651)。被調(diào)查者基本上同意學(xué)生評教是一種很好的教學(xué)評估手段(3.44,p值=0.0394),但也同時(shí)承認(rèn)有些細(xì)節(jié)內(nèi)容可能會(huì)有負(fù)面效應(yīng)(3.33,p值=0.0951)。與對美國大學(xué)的調(diào)查結(jié)果類似,在“我相信學(xué)生評教結(jié)果”問題上系主任保持中立(3.15)。有鑒于此,我們認(rèn)為在對教師教學(xué)進(jìn)行評估時(shí)應(yīng)該利用一些其它評價(jià)證據(jù)。
2.用于教學(xué)評價(jià)的證據(jù)類型和使用頻率
有27位系主任認(rèn)為可以把學(xué)生評教當(dāng)作是教學(xué)評估的首要工具。這種對學(xué)生評教的高依賴與國外同類研究的結(jié)果是一致的,不同的是,在國外大約有81%的院系使用除學(xué)生評教之外的其它證據(jù)來源,而我們的調(diào)查表明,在中國這樣做的只有52%。在中國高校,用于教學(xué)評價(jià)的指標(biāo)來源平均為2.19種,而在美國平均為4.16種。中國高校只有22.21%的系主任使用了4種或以上的評價(jià)證據(jù),如表3所示。表4列舉了27位被調(diào)查對象提供的9種評價(jià)證據(jù),其中使用頻率最高的4種依次為:學(xué)生評教(100%)、同行觀察(37.04%)、非正式評論(29.63%)和教學(xué)獎(jiǎng)勵(lì)(14.81%)。同行觀察可以由系主任或其它教學(xué)管理人員完成,也可以由其它教師完成。非正式評論既可以來自學(xué)生,也可以來自其他同事。在美國最常用的4種評價(jià)證據(jù)依次是:學(xué)生評教(97%)、同行觀察(63.93%)、課程大綱(40.98%)和隨堂測驗(yàn)(37.70%)。相比而言,美國高校似乎更傾向于使用那些和課堂教學(xué)關(guān)系更直接的評估手段,而中國高校雖然也使用學(xué)生評教、課堂觀察這樣一些直接手段,但還使用非正式評論和教學(xué)獎(jiǎng)勵(lì)這些間接方式。我們認(rèn)為,來自學(xué)生或其他同行的非正式評論比較主觀,也許并不能反映課堂的真實(shí)情況。教學(xué)獎(jiǎng)勵(lì)并非是對課堂的直接評價(jià),盡管很可能參照了多方面的指標(biāo),但也只能是間接證據(jù),獲得教學(xué)獎(jiǎng)勵(lì)并不能說明該教師在課堂上講授了哪些內(nèi)容,也不清楚其組織能力如何。被調(diào)查者希望能夠增加教學(xué)評估的證據(jù)類型,以便有機(jī)會(huì)對教學(xué)活動(dòng)的各個(gè)側(cè)面進(jìn)行全方位的評估。
3.不同類型院校的證據(jù)使用情況
不同類型院校使用評估證據(jù)類型和頻率的情況,如表5所示。具體分為教育部評估成績不同院校、有無博士學(xué)位授予權(quán)院校、是否“211工程”院校等情況。最常使用的評估指標(biāo)依次是學(xué)生評教、課堂觀察、非正式評論和教學(xué)獎(jiǎng)勵(lì)。在教育部評估成績優(yōu)秀的高校中,隨堂考試和教學(xué)獎(jiǎng)勵(lì)的使用頻率相同。在無博士學(xué)位授權(quán)和非“211工程”院校當(dāng)中,隨堂考試比教學(xué)獎(jiǎng)勵(lì)的使用頻率稍微高一些。總的看來,不同院校所使用的評估證據(jù)在類型方面似乎沒有區(qū)別,但在使用頻率上稍有不同。無教育部評估優(yōu)秀成績院校,無博士點(diǎn)、非“211工程”院校,似乎更傾向于使用課堂觀察(50.00%:29.41%;42.11%:25.00%;38.10%:33.33%)和非正式評論(50.00%:17.65%;36.84%:12.50%;33.33%:16.67%)。無教育部評估優(yōu)秀成績院校,無博士點(diǎn)、非“211工程”院校分別要比對此類院校使用更多類型的評價(jià)證據(jù)(2.40:2.06;2.42:1.63;2.29:1.83)。對以上區(qū)別一種可能的解釋就是,無博士點(diǎn)、非“211工程”院校相對于有博士點(diǎn)、“211工程”院校更注重教學(xué),因而也更重視教學(xué)評估。根據(jù)被調(diào)查者信任學(xué)生評教的程度和使用年限對評價(jià)證據(jù)類型和使用頻度進(jìn)行分類,如表6所示。首先根據(jù)對學(xué)生評教的信任程度把被調(diào)查者分成A、B兩組,A組為5分或4分(非常同意、同意),B組為1到3分(很不同意、不同意、不確定)。雖然兩組使用的證據(jù)類型完全相同,但分布的頻率卻有變化。相信學(xué)生評教的A組對其它證據(jù)類型也都更信任:不太相信學(xué)生評教的B組平均使用1.71種評價(jià)證據(jù),而A組平均使用2.69種證據(jù)。按常理來講,不太相信學(xué)生評教的B組應(yīng)會(huì)使用更多其它證據(jù)來與學(xué)生評教搭配和補(bǔ)充使用,但事實(shí)卻恰恰相反。該區(qū)別還可以在使用學(xué)生評教年限不同的分組中得到體現(xiàn)。我們同樣把被調(diào)查對象分為A、B兩組,A組至少有7年的學(xué)生評教經(jīng)驗(yàn),B組不足7年。兩組在使用不同評價(jià)證據(jù)的類型和重要性排序方面是等同的,但不同的是,A組比B組使用了更多的評價(jià)證據(jù)(2.38:2.00)。這也許是由于使用學(xué)生評教更久的A組更好地認(rèn)識到了單純依賴學(xué)生評教的不足所致。如前所言,學(xué)生可以依靠自己的直接經(jīng)驗(yàn)來對教師的課堂呈現(xiàn)技巧、教學(xué)內(nèi)容的選擇或組織做出判斷,但對于教師的學(xué)識、教學(xué)內(nèi)容的新穎、教學(xué)內(nèi)容與教學(xué)目標(biāo)之間的關(guān)系等方面是不能判斷的,這些方面的評價(jià)需要利用其他一些評價(jià)證據(jù),如同行課堂觀察、教學(xué)大綱、隨堂測試、教師筆記等。前期研究表明,除學(xué)生評教外,所調(diào)查的美國大學(xué)經(jīng)貿(mào)系的系主任,會(huì)經(jīng)常利用同行觀察、教學(xué)大綱、測試、教師課堂筆記、教學(xué)材料和課程成績等作為常用的評估證據(jù)。
四、結(jié)論
研究發(fā)現(xiàn),對教師的教學(xué)行為進(jìn)行評估時(shí),多數(shù)大學(xué)都把學(xué)生評教看作是可以信賴的證據(jù)來源。調(diào)查發(fā)現(xiàn),系主任基本上認(rèn)為學(xué)生可以基于經(jīng)驗(yàn)回答問卷中的大部分問題,在判斷是否有些問題超出了學(xué)生的經(jīng)驗(yàn)范圍時(shí)態(tài)度不明確。他們認(rèn)為有些評價(jià)內(nèi)容會(huì)產(chǎn)生負(fù)面效應(yīng),因而在是否完全相信學(xué)生評教結(jié)果上態(tài)度不明確。幾乎一半的被調(diào)查院校在教學(xué)評估中只使用學(xué)生評教,總體平均只使用兩種評價(jià)證據(jù)。顯然這與教學(xué)活動(dòng)多方面、全方位的評估要求相差甚遠(yuǎn)。雖然有些被調(diào)查院校還使用課堂觀察、非正式評論和教學(xué)獎(jiǎng)勵(lì)等手段,但后兩種手段并不直接支持教學(xué)評價(jià)。為了對有效教學(xué)的各方面進(jìn)行全方位評估,我們建議除學(xué)生評教外,還要利用同行觀察、課程大綱、測試和教師課程記錄等其它評估手段。調(diào)查還發(fā)現(xiàn),非博士學(xué)位授權(quán)院系、非“211工程”院校和沒有教育部評估優(yōu)秀成績的院校更傾向于使用多種類的評估手段,而有博士學(xué)位授予權(quán)的院系使用的指標(biāo)種類最少。這也許是由于后者更重視科研的緣故。我們還發(fā)現(xiàn),那些更信任學(xué)生評教或使用學(xué)生評教歷史更久的院系會(huì)傾向于使用更多種類的評估證據(jù)。這也許是由于他們從總體上更重視教學(xué)評估,并且同時(shí)也認(rèn)識到單純學(xué)生評教并不能對教學(xué)效果的所有方面做出評判。本研究仍有一些局限性。首先,我們的調(diào)查取樣院校較少。其次,調(diào)查對象只涉及了系主任,沒有普通教師。雖然調(diào)查結(jié)果顯示了不同院校間的共同點(diǎn)和差異,但還無法了解各評價(jià)手段在實(shí)際中是如何使用的。最后,調(diào)查結(jié)果也許并不適用于樣本外的院校。來自無教育部評估優(yōu)秀成績院校的回應(yīng)偏少。未來研究也許可以調(diào)查教師對個(gè)別評價(jià)證據(jù)的看法,考察不同評價(jià)證據(jù)所包含的具體內(nèi)容等。(本文來自于《高教發(fā)展與評估》雜志?!陡呓贪l(fā)展與評估》雜志簡介詳見.)
作者:王廣成1BrianPatricGreen2工作單位:1.曲阜師范大學(xué)公共外語教學(xué)部2.DepartmentofAccounting