高等教育績效評估問題分析
時間:2022-04-28 09:22:11
導語:高等教育績效評估問題分析一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
(一)高等教育機構(gòu)是生產(chǎn)多種“產(chǎn)品”的組織
高校生產(chǎn)“產(chǎn)品”的多樣性是評估高等教育產(chǎn)出的主要障礙之一。高等教育產(chǎn)出的范圍和性質(zhì)決定了較其他大多數(shù)產(chǎn)業(yè)在績效評估上具有更大的復(fù)雜性。有學者指出“測量教育產(chǎn)出確實非常困難……教育中最根本的一些困難如考試成績、班級規(guī)模以及類似的屬性至今沒有得到深入的討論,雖然這些相關(guān)問題的測量是值得關(guān)注的。更重要的是,因為他們是多元產(chǎn)出的組織,他們不只是產(chǎn)生唯一的教育,他們也生產(chǎn)其他產(chǎn)品”[2]。大型研究型大學培養(yǎng)本科生,提供專業(yè)性及研究生學位,參與公共服務(wù)活動和研究,創(chuàng)造文化等等。高職學院和一些地方院校,為直接就業(yè)的畢業(yè)生提供職業(yè)證書,為考入研究型大學的學生設(shè)計學位課程,為滿足當?shù)貏趧恿κ袌龊吞囟ü椭餍枨笤O(shè)置專業(yè)課程。面對這些任務(wù),開發(fā)能囊括各種不同類型大學的所有產(chǎn)出增值的財會體系是非常困難的。許多專家對如何改善大學投入和產(chǎn)出的測量提出了很多建設(shè)性建議,但仍有一個難題無法解決。研究及其他學術(shù)創(chuàng)新性活動作為大學聯(lián)合生產(chǎn)的一部分應(yīng)該被納入績效綜合核算。然而聯(lián)合生產(chǎn)帶來的分析問題的困難在于如何從學位生產(chǎn)成本中將研究開發(fā)生產(chǎn)成本分離出來;如何比較研究與學位產(chǎn)出的相對價值;如何分配教職員工在每項任務(wù)上的時間投入。在區(qū)分高等教育產(chǎn)品功能的教育與非教育成分的過程中必須做出判斷是件困難的事情。同時,大學具有提升大學畢業(yè)生的社會責任感和未來職業(yè)責任感等精神境界的任務(wù)。然而如何測量確實仍未找到合適的工具。
(二)高等教育的非市場性和外在效應(yīng)
非市場性進一步使計算高等教育的投入與產(chǎn)出比復(fù)雜化。學生的時間和學校非金錢收益等因素,不能買賣,不能輕易用貨幣衡量。此外,并不是受教育的公民的全部利益都能轉(zhuǎn)化為為教育付出的人的利益。這樣的特點就使得這些因素很難測量。因此,在生產(chǎn)率測量中這些因素會經(jīng)常被省略掉。那些關(guān)心國家在教育上投資回報的政策制定者應(yīng)該對院校為個人和社會創(chuàng)造的全部價值感興趣。這些社會價值大多是無形易變的,例如,就同輩影響而言,寄宿院校要比走讀院校創(chuàng)造更多的社會資本。盡管上述社會價值不能被準確地測量,但是這種非市場性維度無疑是高等教育功能的重要組成部分。這通常也是高等教育作為一項優(yōu)先的公共支出項目的原因之一。高等教育創(chuàng)造的積極外在效應(yīng)被認為是刻意地將學費都制定得低于市場均衡價格。國家給予院校多種形式的定量配給和補貼以滿足特殊行業(yè)的需求,如國防生、免費師范生。經(jīng)濟補助和其他形式的交叉補貼可以使院校增加錄取弱勢學生群體的人數(shù)。這種非市場指導的價格導致最終的邊際成本與價格不一致,總收入不能與院校產(chǎn)出相等;不同活動收入的分配也不能被用來建構(gòu)反映相關(guān)消費者價值產(chǎn)出的總指數(shù)。有學者為了避免測量產(chǎn)出存在的問題,假設(shè)教育價值與學生將來收入貼現(xiàn)價值相等。他們基于畢業(yè)生終身收入評價教育對人力資本的貢獻[3]。然而除去其他假設(shè),這種測量不能簡單回歸到一個具體的教育片斷,對成果的關(guān)注可能包含教育作為區(qū)分不同能力個體的篩選機制的角色。這就潛在地夸大了教育的貢獻。
(三)高等教育中投入異質(zhì)性
異質(zhì)性是指具有不同產(chǎn)出的院校組織功能具有不同的特點。影響質(zhì)量的因素幾乎寓于高等教育投入的各個方面。這種復(fù)雜數(shù)據(jù)和分析需要精確和靈敏的質(zhì)量測量,需要長期研究調(diào)查。高等教育生產(chǎn)率的全面具體的測量將會解釋質(zhì)量隨時間的變化以及個體、院校在投入和產(chǎn)出的質(zhì)量變量。鑒于學生和教師的天賦不同,他們學與教的準備和有效性也就不同。很顯然,高職院校、普通大學和重點大學的學生存在明顯差異,師資條件也不同。1.學生因素對績效評估的影響。學生群體以下因素明顯地對教育投入與產(chǎn)出之間的關(guān)系產(chǎn)生影響:(1)家庭經(jīng)濟地位的不同。(2)學生高中知識基礎(chǔ)的不同。(3)學生學習性投入。學生動機和能力變量強烈地影響學習過程及效率。(4)同輩影響。學生互動影響高等教育的投入和產(chǎn)出。如果準備較差的學生能受到周圍準備較好的學生熏陶,提高學習成績,那么這種提高也是高等教育體驗價值的一部分。一般來說,院校學生群體的構(gòu)成將影響院??冃y量的得分。如果測量的標準是畢業(yè)成果的話,學生的低水平學術(shù)程度將轉(zhuǎn)化成低生產(chǎn)率。如果考量的是附加值或者邊際效益,知識基礎(chǔ)較低的學生可能導致高生產(chǎn)效率,因為可彌合的學習差距大。近年來,國內(nèi)學者引入了學生學習性投入測量,其優(yōu)勢在于可以洞察指定院校學生的體驗。這種方式日漸重要,因為學生為教育活動投入努力的程度是學習過程的一個至關(guān)重要的因素。學生投入性的測量在了解院校對學生學習和自身發(fā)展方面的影響是有益的。即使如此,學生學習性投入測量調(diào)查仍有其局限性。首先,有關(guān)學生投入度的調(diào)查更多地關(guān)注學生學習性投入,但是當涉及學生持有率和滿意度的相關(guān)問題時,社會投入性的數(shù)據(jù)同樣很重要[4]。其次,任何有關(guān)學生特點的測量都必須記住就質(zhì)量測量方面院校之間的方差總是小于院校內(nèi)部的方差。這是因為院校內(nèi)部學生個體的表現(xiàn)總是比院校之間平均表現(xiàn)具有更多的變化。這適用于每一個層次的教育。NSSE對大學一年級和四年級學生做的14個測量指標中,除了一個指標之外,院校之間的學生學習性投入的方差都不足總方差的10%,而在學院或者大學內(nèi)的學生中剩余的方差超過95%[5]。因此,只在一個學院機構(gòu)層面測量質(zhì)量在估計生產(chǎn)率時可能會產(chǎn)生誤導。2.教師因素對績效評估的影響。大學教師可以簡單地分為兩類:教授和助教、講師。教授承擔教學、科研和公共服務(wù)。一般來說,在研究型大學,教授的主要時間顯然要用于研究;而高職學院,主要精力要用于教學。在動力和能力方面,助教、講師與教授相比孰優(yōu)孰劣是一個經(jīng)驗問題。正是這些問題突出了更合理的績效測量的必要性。不同情況下,得到的答案也會不同:在某些情況下,研究和行政責任可能改進教學質(zhì)量;在其他情況下,學術(shù)成果發(fā)表的壓力會促使教授不關(guān)注教學質(zhì)量,忽略教學。在所有類型的院校中,助教、講師幾乎都會被安排教授具體課程,研究型大學中助教、講師還會承擔科研任務(wù)。如上所述,科研創(chuàng)新性很難被測量。因此,有必要分析教授和助教、講師的授課質(zhì)量。就具體授課的質(zhì)量來講,助教、講師和教授可能具有相同的質(zhì)量。教師質(zhì)量通常依據(jù)成績和學生評價來測量。然而,這些結(jié)果可能會嚴重地受到外部因素的影響,因此院校很難弄清楚教師質(zhì)量對學生成功的貢獻。在一項控制研究中,將大學生隨意分配給終身教師或者兼職教師,分析學生課程分數(shù)評估教師質(zhì)量。研究發(fā)現(xiàn),兼職教師(更具體地說,沒有獲得最終學位,缺乏經(jīng)驗的教師)教授的學生在較低級別的課程(微積分1)所取得的成績更好。然而,高級課程評估結(jié)果就截然相反了(微積分2)。兼職教師更可能通過教授入門級課程從而提高學生考試成績,但終身教師更可能提升學生對知識的理解[6]。即使研究提供了測量教師質(zhì)量的有用方向,但不可能使所有的大學和學院進行這樣的可控制的研究,如此豐富的數(shù)據(jù)用于分析還不是很容易獲得。
(四)高等教育產(chǎn)出的異質(zhì)性
高等教育產(chǎn)出方面,高校頒發(fā)不同級別和學科的學位。這些不同,影響了教育過程和畢業(yè)生勞動力市場的價值。院校服務(wù)多樣的學生群體追求不同的使命。雖然大學都致力于培養(yǎng)受過良好教育的合格公民,事實上,一些院校僅僅提供四年制本科的學位證書,一些院校努力培養(yǎng)學生有能力考入研究型大學,高職院校培養(yǎng)學生的職業(yè)技能,其他一些研究型大學提供不同學科領(lǐng)域?qū)W士和研究生學位。一些產(chǎn)出注定比其他產(chǎn)出昂貴,然而由于異質(zhì)性,人們無法判斷哪種更優(yōu)。理想化來說,衡量高等教育的產(chǎn)出價值,需要識別質(zhì)量維度,整合相關(guān)的學習、課程預(yù)備、就業(yè)準備和收入效益等相關(guān)指標。即使信息全面,衡量這些特點還是需要主觀評價。我們強調(diào)用清晰無誤的定量質(zhì)量指標定義高等教育產(chǎn)出在現(xiàn)階段是不可行的。盡管大學通常使用學分作為每個課程重要性和挑戰(zhàn)度的測量標準,但是他們不能完全代表課程對學生和社會的全部價值。1.畢業(yè)學生的經(jīng)濟報酬問題。已往的經(jīng)濟學文獻研究了教育產(chǎn)出的市場導向型評估,注意到薪水效益隨學習領(lǐng)域和院校質(zhì)量的不同而不同。一些研究試圖評估學院成本與學生和院??冃еg的關(guān)系。除了工資成果外,畢業(yè)后一定時間內(nèi)找到工作的畢業(yè)生的數(shù)量;校友對他們受到教育的滿意度;當?shù)毓ど虡I(yè)界對大學提供技能職員角色的滿意度;繼續(xù)取得高級學位的學生的數(shù)量。這些都作為對院??冃гu價的指標。教育經(jīng)濟學領(lǐng)域在這方面做了很多工作,但即使目標是估算教育的經(jīng)濟報酬,但是還有許多難題沒處理。如何更好地運用工資數(shù)據(jù)進行計算,哪項工資數(shù)據(jù)最重要:第一份工作,五年以上的薪水或者終身收入貼現(xiàn)?此外,代際、商業(yè)周期效應(yīng)以及變化的勞動力市場條件都會造成相關(guān)工資的持續(xù)變動。最重要的是,影響收入的因素如學生特點、人口異質(zhì)性、可達性和機會以及其他因素在這些經(jīng)濟研究中必須是可控的。產(chǎn)出測量的全面質(zhì)量調(diào)整還只是預(yù)想,因為還有諸多問題有待解決。2.學生學習性投入對產(chǎn)出的影響。除了測量學分、學位、相關(guān)的工資收益是測量學生學習的附加價值的指標。測量學位和學分數(shù)本身不能成為高等教育產(chǎn)出的全部指標。如果學生取得學士學位,但是沒有獲得勞動力市場及社會中真正需要的知識、技術(shù)和能力,那么所得學位也不過是一個空洞的符號。測量指標應(yīng)該注重的是學位質(zhì)量,例如,學習的數(shù)量以及校園后的價值(如收入、職業(yè)地位以及其他測量標準),超越學位和證書本身。忽略學習質(zhì)量或者學生投入性的測量,單純強調(diào)學生的數(shù)量,可能誤導院??冃гu估制定出狹隘的政策。人們是能接受一個學校學生畢業(yè)數(shù)量很多但學習性投入和成果較低,還是學生接受較高的學術(shù)挑戰(zhàn),顯示出高水平的技能和實力,院校能夠更好地滿足個人和公共的利益,即使畢業(yè)生數(shù)量較少呢?學生學習性投入和成果與規(guī)模數(shù)量的績效并不是彼此排斥的,但是每一項都代表了院校績效和學生發(fā)展不同的方面。帕斯卡雷拉和特瑞茲尼(PascarellaandTerenzini)指出,大學對學生學習和自身發(fā)展的影響主要取決于學生個人的努力程度和在學術(shù)、人際及校內(nèi)課外活動中的投入程度。學生對中等后教育體驗的收獲承擔主要責任。一旦院校變量(例如選拔性)是可控的,學生自身的動力就成為影響大學后收入差距的重要因素[7]。為了估算教育生產(chǎn)率,對院校質(zhì)量作出分級,大學排行榜應(yīng)運而生。大多數(shù)排行榜的主要缺陷是,他們幾乎不提學生在大學的體驗和收獲。涉及學生質(zhì)量指標的排名系統(tǒng)局限性具體體現(xiàn)在只是參照一個數(shù)字進行排名,那就是錄取學生的高考分數(shù)。這并不是說選拔性與學院質(zhì)量無關(guān)。高選拔性的學校環(huán)境至少對某些學生的本科教育是有益的。院校的選拔性與學業(yè)成就、生源人口特征和質(zhì)量差異等因素的控制緊密相關(guān)。但相反的觀點認為,高校“生產(chǎn)率”也會受到“欠匹配”的嚴重損害,準備良好的學生加入富有挑戰(zhàn)性的學校也頻繁失敗,尤其是那些來自貧窮家庭的孩子。換句話說,選拔性與有效教育實踐不是顯著相關(guān)的。院校的選拔性對學生在校期間的學習和認知發(fā)展有最低程度的貢獻。如有學者對大學排行榜批評道:鑒于他們對最佳本科教育的測量主要基于資源和聲望,而不是基于我們認為最重要的學生校內(nèi)體驗。大學排名的更精確的名字應(yīng)該是“最具優(yōu)勢大學”[8]。相比之下,同輩因素更加重要,因其廣泛地影響了學生的態(tài)度、價值觀和個人及社會發(fā)展的其他維度。
二、高等教育績效評估的展望
(一)高等教育績效評估應(yīng)當謹慎實施
盡管一些指標的測量是可以達到的,但美國統(tǒng)計局目前不提供教育部門生產(chǎn)率的測量。在美國,此類研究大多數(shù)都集中在中小學教育。此外,歐盟成員和其他國家也在研究如何測量教育的產(chǎn)出和投入,但在如何測量高等教育投入和真正產(chǎn)出的問題上還沒有達成一致。高等教育生產(chǎn)率的現(xiàn)實測量要比教科書模型更具挑戰(zhàn)性。多樣的產(chǎn)出、異質(zhì)性的投入和產(chǎn)出、質(zhì)量隨時間的變化、院校間和體系間的質(zhì)量變量都增添了任務(wù)的復(fù)雜性。為了改進生產(chǎn)率測量,有必要認識到不是上面列舉的所有的復(fù)雜性都能獲得充分解釋,至少現(xiàn)階段是這樣。單一的測量不能全面組織和總結(jié)一個部門的績效,我們應(yīng)時刻牢記其復(fù)雜性。沒意識到這點,測量將必定被誤用并且誘發(fā)不恰當?shù)膭訖C。例如,受到物質(zhì)刺激鼓勵的“文憑工廠”的危險確實存在??冃y量是開發(fā)利潤構(gòu)成的前提,但也會造成激勵某些“受歡迎”的特定行為。任何單一績效考量,不足以實現(xiàn)大多數(shù)目標,尤其是那些與利益相關(guān)者需求有關(guān)的目標。高??冃У牟糠譁y量對改善院??冃]有多大作用。只有總體測量高等教育績效,才能形成更佳的政策環(huán)境,進而間接地改善院校的績效。
(二)高等教育績效評價可借鑒方法
經(jīng)合組織和高等教育院校管理機構(gòu)在世界范圍內(nèi)聯(lián)合開展高等教育領(lǐng)域優(yōu)質(zhì)教育實踐研究。研究指出,全面了解教學與學習質(zhì)量之間的因果關(guān)系,需要具有開創(chuàng)性并且深入的評估方法和工具[9]。美國國家研究委員會有關(guān)研究博士課程質(zhì)量測量的報告概述了博士課程教師質(zhì)量的評估方法。評估基于大量數(shù)據(jù),較過去的評估包括更多具體題目,例如,出版數(shù)量、引用的數(shù)量、獲得校外研究撥款情況、跨學科的參與度、人口統(tǒng)計的信息、獲得獎勵和榮譽的數(shù)量。該報告解決了一個復(fù)雜問題,強調(diào)教師質(zhì)量測量的重要性,適合四年制研究型大學研究博士課程的績效評估[10]。理解高等教育產(chǎn)出的另一個方法將是采取間接測量。經(jīng)合組織制訂了《成人能力國際評估計劃》(PIAAC)。PIAAC將評估成人的讀寫和計算能力以及在技術(shù)支持的環(huán)境解決問題的能力。該項目將從參與調(diào)查的成人那里搜集大量信息,包括他們?nèi)绾螌⒓寄苓\用到工作和其他環(huán)境,例如家里和社區(qū)。最理想的情況是,基于PIAAC收集的信息,除了教育收獲,學院專業(yè),已往工作經(jīng)歷、加入高等教育院校的時間和類型有關(guān)的信息,可被用來估算高等教育產(chǎn)出。因此,PIAAC和其他基于技能的調(diào)查可能會為高等教育產(chǎn)出或生產(chǎn)率評價提供有益借鑒[11]。
作者:苑健工作單位:北京航空航天大學