測驗考試總結(jié)范文

時間:2023-03-20 06:34:30

導語:如何才能寫好一篇測驗考試總結(jié),這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

測驗考試總結(jié)

篇1

國家公務員考試《行政職業(yè)能力測驗》是對未來從事行政工作的國家機關工作人員是否具備行政工作能力的一種可能性的測查與驗證。與單純以基礎知識和智力為主要考查對象的一般測驗不同,行政職業(yè)能力測驗考查的是人的基本資質(zhì)與潛在能力,具體表現(xiàn)在考查考生是否具備快速、敏捷、準確地分析、解決問題的能力。

在國家公務員招錄考試發(fā)展的十余年里,《行政職業(yè)能力測驗》考試命題規(guī)律可概括為以下三點。

1、多樣性、廣泛性

國家公務員考試《行政職業(yè)能力測驗》包括言語理解與表達、數(shù)量關系、判斷推理、資料分析、常識判斷五種類型的題目。通俗地講,這種測驗在形式上涵蓋了對漢語基礎、邏輯、文史、社科、數(shù)學、時政、法律等各方面的綜合測試。這種廣范圍的題型及考點設計,正體現(xiàn)了公務員考試公正、公平的精神——不偏向于任何一門專業(yè),保證“人人可參與,人人可發(fā)揮”,也保證日后從事公職的人員不是“偏才怪才”,而是各種能力均具備、各種崗位均可適應的全才。

2、基礎性、思維性

歷年國家公務員考試大綱的“測試內(nèi)容”部分規(guī)定:行政職業(yè)能力測驗主要測查與公務員職業(yè)密切相關的、適合通過客觀化紙筆測驗方式進行考查的基本素質(zhì)和能力。從歷年國家公務員考試與地方真題也可以看出,《行政職業(yè)能力測驗》90%以上的題目均為基礎性題目。這種基礎性既是針對某一專門學科而言,也是針對從事公務員工作所應知應會的基本素養(yǎng)而言。然而,基礎并非意味著簡單,這種基礎性是與思維性緊密結(jié)合的,考核的是“活生生”的知識,需要考生有“活”的思維來與之對應。

篇2

第一個方面是題型。

從備考的角度來看題型,那題型的量是更大的。考試前考生所要準備的,就是想方設法的擴大自己的題型庫,最簡單的方法就是做真題。現(xiàn)在從中央到地方,公布的真題大概有90套,考生能做40多套真題就已經(jīng)足夠了,每一套真題和真題之間的題型差距也是比較大的,做了40多套對應付這次考試問題肯定是不大的。

第二個方面是題型后面的快速解法。

行政職業(yè)能力測驗的考試是一個時間的賽跑。每個題型所采用的方法的解答速度是不一樣的,所以考生在掌握題型的同時還要想方設法的找到這個題型最快捷的解答方法。

第三個方面是心態(tài)的調(diào)整。

第一階段是用十天左右的時間做題,這個時候做題,強調(diào)一個原則就是慢慢的做,不要太快,這時候做題很明確,目的在于分析和總結(jié)題型。這是一個新題型,它的特點是什么,又出現(xiàn)一個新題型,它的特點又是什么,一定要這樣的總結(jié),十天的時間通過做真題的形式把你的題型庫擴大。

篇3

很多人認為,國家公務員考試,特別是《行政職業(yè)能力測驗》和《申論》兩門科目不需要做復習和準備工作,完全靠的是自身的能力和素質(zhì),其實提前準備一下還是大有益處的。相當一部分考生在走出公務員考試的考場后,都發(fā)出同樣的感慨:只要認真準備,國家公務員考試其實并不難。

公務員考試命題研究專家張奉均認為,考生應著重從以下幾個方面進行復習:

第一,考生要與時俱進,按照年度考試大綱的要求進行準備。他說,每年的考試大綱都對考生有不同的要求,這需要考生仔細地閱讀。如,從2005年的考試大綱看,《行政職業(yè)能力測驗》比以往主要有以下變化:一是原A、B類的職位劃分改為甲、乙類職位劃分,這也預示著2005年公共科目考試會有一定的變化;二是考題順序的調(diào)整,將言語理解與表達調(diào)整到第一部分,這給考生的答題時間的安排設置了一個考驗;三是恢復對數(shù)字推理題型的考查,這體現(xiàn)了對考生數(shù)理能力考查的重要性;四是恢復對事件排序題型的考查;五是常識判斷部分側(cè)重考察法律知識的運用,因此對基本法律常識的了解應成為考生備考的重點;六是取消了聽力理解。

第二,考前練習很重要。對大多數(shù)考生來說,公務員考試都是第一次,都還不是很熟悉,只有多做練習才能對考試的題型、考查點有一個全面的了解,在考試時才能作到心中有數(shù)。

第三,注重平時積累和方法總結(jié)?!缎姓殬I(yè)能力測驗》的考題覆蓋面頗廣,包括法律、政治、經(jīng)濟、人文、社會、科技和管理等方面的內(nèi)容,臨時突擊做練習雖有幫助但更重要的是平時的積累。在數(shù)字推理和判斷推理部分主要考查考生的解題技巧,而不是考查考生的知識深度。

不管是報考哪一類職位的考生,關鍵是要熟悉《行政職業(yè)能力測驗》和《申論》的考試方法。

他提醒考生,不同的題型要用不同的方法和思路去解答,比如《行政職業(yè)能力測驗》中的判斷、推理等題目,主要靠平時的積累,不管是知識的積累,還是實踐的積累,都很重要。例如,推理題經(jīng)常給出一系列日常行為事件,要求考生按行為發(fā)生的先后順序排序,這就需要考生有實踐的積累。

而數(shù)量關系和資料分析類的題目更需要技巧,這些技巧是和一個人的思維方式、價值觀相連的,所以,要通過考試,更需要方法和積累?!案叻值湍艿目忌隙ㄊ菬o法通過這樣的考試的”,張奉均強調(diào)。

篇4

一、論證推理

論證推理題是指在論證分析的過程中需要補充某些部分,以加強或者削弱給定的結(jié)論。對于此種題型,根據(jù)論證角度的不同,其題型可以分為前提假設型、支持加強型、削弱質(zhì)疑型和原因解釋型。

其中需要重點掌握的是削弱質(zhì)疑型和支持加強型。對于這兩類題,首先要找到它的論點,明確需要削弱或者支持的論點是什么,然后找到論證過程,結(jié)合選項進行作答。

例1、市長任職的三年里經(jīng)常被控對女性有性別歧視的態(tài)度。然而,他已經(jīng)在他的管理層的19個高層職位中任用了5名婦女,她們中的所有人都仍在服務,這表明市長并不是一名性別歧視者。

以下哪項為真,最能反駁上面得出的結(jié)論?[2014年山西公務員考試行政職業(yè)能力測驗真題-83]

A.市長任命的一名高層職位的女性正準備辭職

B.市長所在的政黨的政綱要求他在高層職位里至少任命5名女性

C.三年前在市長選舉中,47%的女性投票支持這位市長

D.相鄰市的市長最近在高層職位任命了7名女性

解析:本題屬于削弱質(zhì)疑型,削弱方式為他因削弱。要削弱的論點是“市長不是一名性別歧視者”,如果B項為真,則表明市長任用了5名婦女可能是其他原因,即任用5名婦女不能作為市長不歧視女性的證據(jù),因而反駁了題干的結(jié)論。其他三項均不能反駁“市長不是一名性別歧視者”。所以選擇B選項。

例2、某鎮(zhèn)組織部姚科長在接受當?shù)赜浾叩牟稍L時說:“近年來剛進入機關的干部對下基層鍛煉的興趣普遍比以前強多了。我鎮(zhèn)的機關干部對于下基層的報名十分踴躍。這在幾年前幾乎是不可思議的。”

姚科長的結(jié)論基于以下哪項假設?[2014年山西公務員考試行政職業(yè)能力測驗真題-85]

A.機關干部下基層鍛煉,對當?shù)氐陌l(fā)展也起到推動的作用

B.對待下基層的態(tài)度是衡量是否有下基層興趣的重要標準

C.近年來進入該鎮(zhèn)的干部較前幾年的比起來有較高的綜合素質(zhì)

D.該鎮(zhèn)機關干部對下基層鍛煉產(chǎn)生興趣,是由于基層待遇提高

解析:本題屬于前提假設型。B選項是必須假設的,否則下基層的態(tài)度和興趣沒有關系,那就不能通過報名踴躍得出興趣強的結(jié)論。所以B選項是必須假設的,所以選擇B選項。

提示:在這種題型中,要迅速找到題干的論據(jù)和結(jié)論,然后在選項中找到能把論據(jù)和結(jié)論聯(lián)系起來的選項,就是正確選項。

二、日常推理

日常推理題是在題干中列舉大量事實論據(jù)或理論論據(jù),然后考查考生從中可以得出或無法得出某個結(jié)論。對于此類題型,首先要抓住題干的主體,因為偷換概念是我們?nèi)粘I钪谐7傅腻e誤,也是題目設置的主要考點,在解題時要注意收斂思維,選擇與主體一致的答案。

例3、近期的食物監(jiān)測表明:炸薯片中含有大量的鋁,長期食用會引起神經(jīng)系統(tǒng)病變,表現(xiàn)為記憶力減退,視覺與運動系統(tǒng)協(xié)調(diào)失靈。

由此可以推出:[2014年山西公務員考試行政職業(yè)能力測驗真題-76]

A.少吃薯片可以防止神經(jīng)系統(tǒng)病變

B.鋁在人體中的積累可導致神經(jīng)系統(tǒng)病變

C.記憶力減退說明神經(jīng)系統(tǒng)發(fā)生病變

D.視覺與運動系統(tǒng)協(xié)調(diào)失靈說明神經(jīng)系統(tǒng)發(fā)生病變

解析:本題屬于隱性結(jié)論型。題干指出長期食用炸薯片會引起神經(jīng)系統(tǒng)病變,前者是后者的充分條件。充分條件的假言推理否定前件(不食用薯片)不能否定后件(不病變),所以A項不能推出;炸薯片中含有大量的鋁,如果長期食用炸薯片,那么鋁就會在人體中積累起來,就會引起神經(jīng)系統(tǒng)病變,所以B項可以推出;神經(jīng)系統(tǒng)病變的表現(xiàn)有記憶力減退,視覺與運動系統(tǒng)協(xié)調(diào)失靈,前者是后者的充分條件,充分條件的假言推理肯定后件(記憶力減退,視覺與運動系統(tǒng)協(xié)調(diào)失靈)不能肯定前件(神經(jīng)系統(tǒng)病變),故C項和D項均不能推出。所以選擇B選項。

提示:在這種題型中,要抓住題干的主體,如此題中的“鋁”,題干的主體和正確選項的主體通常是一致的,選項中常見的錯誤有偷換主體、夸大事實、以偏概全等,可以通過觀察選項的特征來排除錯誤選項,選擇正確答案。

三、形式邏輯

形式邏輯是運用邏輯規(guī)則進行的必然性推理,因此要求考生掌握必要的邏輯學基礎知識。山西省公務員考試行政職業(yè)能力測驗中??嫉男问竭壿嬵愵}型為分析推理,此類題通常給出若干人或事物,要求利用互相間的關系,對其進行組合,實現(xiàn)一一對應。

有的考生對于此種題型的大量信息往往感到無從下手,為此總結(jié)了解決此類題型的有效方法。

第一步:對描述共同信息最多的條件進行分析,得到推理起點(最大信息優(yōu)先);

第二步:尋找與已知結(jié)論相關的條件,繼續(xù)推理;

第三步:難以得到肯定結(jié)論時,運用假設法,找到邏輯矛盾,進而得到肯定結(jié)論。

第四步:重復第二步。

下面結(jié)合真題來說明此種方法的運用。

例4、在一次考試中,試卷上畫了五大洲的圖形,每個圖形都編了號,要求填出其中任意兩個洲名,分別有五名學生填了如下編號。

甲:3是歐洲,2是美洲

乙:4是亞洲,2是大洋洲

丙:1是亞洲,5是非洲

?。?是非洲,3是大洋洲

戊:2是歐洲,5是美洲

結(jié)果他們每人只填對一半,請根據(jù)以上條件判斷下列正確的選項是()[2014年山西公務員考試行政職業(yè)能力測驗真題-76]

A.1是亞洲,2是歐洲

B.2是大洋洲,3是非洲

C.3是歐洲,4是非洲

D.4是美洲,5是非洲

篇5

    1 研究情況

   

    1.1研究對象重慶醫(yī)科大學已進入臨床專業(yè)課程學習階段的臨 床醫(yī)學本科學生。以自然班為對象隨機設立實驗組與 對照組,實驗組179人,對照組169人。

1.2研究方法在兩組學生的兒科學教學中實施不同的評價方 式,在授課教師、教學內(nèi)容、教學方法、學時數(shù)、使用教 材等方面完全一致。實驗組采用“形成性評價為導向 的綜合評價”方法,對照組采用以期末考試為主的總結(jié) 性評價方法。將兩組學生的學習效果進行比較,并對 兩種評價方式的相關性、差異性進行統(tǒng)計分析。在課159程結(jié)束后,采用自制問卷對實驗組學生的學習狀態(tài)進 行調(diào)查并運用SPSS 20. 0軟件進行統(tǒng)計分析。

1.3評價方案本研究在充分征求授課教研室教師意見的基礎上 制定評價方案(見表1)。實驗組的評價內(nèi)容由課堂紀 律、床旁示教討論、學習記錄檔案袋(網(wǎng)絡輔助)、期中 測驗、期末考試5部分組成。其中,課堂紀律、床旁示 教討論環(huán)節(jié)由評價者借助日常教學日志的客觀記錄完 成評價;學習記錄檔案袋(網(wǎng)絡輔助)、期中測驗、期末 考試環(huán)節(jié)設置了一致的評價標準,評價者依據(jù)標準即 可給予學生評價。學習記錄檔案袋的評價在重慶醫(yī)科 大學網(wǎng)絡教學平臺的輔助下進行,學習記錄檔案袋中 以案例分析、網(wǎng)絡學習、師生互動討論為基礎,包含課 后作業(yè)、學習與教學互動情況,為評價結(jié)果提供客觀可 信的依據(jù)。對照組采用傳統(tǒng)的期末考試總結(jié)性評價方 式,結(jié)果由考試成績數(shù)值構(gòu)成。為了比較兩組學生的 客觀學習效果,對照組也參與了期中理論測驗,但測驗 結(jié)果不計入綜合性評價。為避免因評價者主觀因素導致評價客觀性、公平 性降低,評價內(nèi)容盡可能采取能夠量化的方式,并輔以 過程記錄為客觀依據(jù)。同時,為了保證大樣本評價的 可操作性,兒科專業(yè)研究生擔任課程教學助教,由兒科 學課程組組織和培訓參與教學工作。評價者由課程教 師和助教共同構(gòu)成,共計32名。評價者承諾嚴格按照 指標客觀、公正給予評價。同時,在課程教學過程中, 專業(yè)助教負責記錄教學日志及學生課堂紀律、課堂表 現(xiàn),日志內(nèi)容作為教學組教師評價的客觀依據(jù)之一,補 充和完善教師評價。

2學習效果分析

    課程考試是檢驗學習效果、評價教學質(zhì)量、衡量教 學目標是否實現(xiàn)的重要手段。因此,以兩組學生的兒 科學期中、期末課程考試成績比較作為兩組學生學習 效果差異的評價指標。兩組兒科學課程期中、期末考 試采取同一時間、同一試卷考試,內(nèi)容、題量、難度一 致。兩次的試卷命題均包括單選題、填空題、判斷題、 問答題、病例分析題五大題型,主要從基本知識點、初 步臨床思維、綜合分析問題等方面對學生的學習效果 進行考核。根據(jù)表2數(shù)據(jù)顯示,實驗組學生期中測驗、期末考 試以及總評成績的數(shù)據(jù)分布離散程度小,較對照組更 為集中和穩(wěn)定。兩組學生期中測驗的客觀成績差異無 統(tǒng)計學意義(P = 0. 898>0. 05);兩組學生的期末考試 成績、總評成績均存在顯著差異,且差異均有統(tǒng)計學意 義(P<0. 01)。同時,實驗組學生對基本理論知識的 掌握較期中測驗時顯得更為牢固(期中65. 0±9. 6,期 末7 6. 8±8. 8 ),整體水平有提升;對照組的提升效果 明顯低于實驗組(期中64. 7 士 10. 5,期末72. 8 士11.2)。

在考試成績分布上(見表3)70 — 90分段中,實驗 組149人(占實驗組總數(shù)的83. 24%),對照組110人 (占對照組總數(shù)的65. 09%)不及格人數(shù)中,實驗組2 人(占實驗組總數(shù)的1. 12%),對照組為22人(對照組 總數(shù)的13. 01%)。根據(jù)學習記錄檔案袋以及課程教 學日志顯示,實驗組不及格的兩名學生除了期末理論 考試成績外,其余項目的評價結(jié)果均為“差”,評價的客 觀結(jié)果均在60分以下。

對兩組學生共同使用的期中、期末理論試卷進行 信度分析,克朗巴赫系數(shù)(Cronbach' Alpha)分別為 0.6654和0.8476,試卷信度可靠。從表2的數(shù)據(jù)結(jié)果 來看,實驗組學生體現(xiàn)出的知識水平和綜合能力水平 優(yōu)于對照組,總體學習效果優(yōu)于對照組。

2.2 實驗組綜合評價方式與學習效果的相關性分析教學評價的方式多種多樣。

   為了檢驗評價方式的 合理性和有效性,學生整體學習質(zhì)量、學習效果的優(yōu)良 成為了重要的衡量指標。因此,本研究將實驗組綜合 評價結(jié)果同學生學習效果進行相關性分析,檢驗“形成 性評價為導向的綜合評價模式”在兒科學課程教學中 是否合理、有效。分析數(shù)據(jù)見表4。根據(jù)統(tǒng)計學對相關系數(shù)的界定,1為正相關,一1 為負相關,0為不相關,當相關系數(shù)大于0. 8時,可以 認為兩個變量之間有很強的相關性。從表4的數(shù)據(jù)分 析來看,實驗組綜合性評價的總評成績均與期中、期末 成績呈顯著正相關,與期末成績的相關程度明顯高于 期中成績??梢姡孕纬尚栽u價為主的綜合評價方式 長期、穩(wěn)定實施,有助于學生學習效果的提高。

3實驗組學習狀態(tài)與感受調(diào)查

    兒科學課程教學結(jié)束后,就實驗組學習狀態(tài)與感 受進行調(diào)查,主要包括“學習壓力、學習負擔的學習狀 態(tài)與提高學習興趣、臨床思維能力、邏輯思維能力、溝 通交流能力、團隊協(xié)作能力的個人感受”個方面。發(fā) 放調(diào)查問卷179份,回收問卷174份,有效問卷174 份,有效回收率為97.21%?;厥盏膯柧碛肊xcel建立 數(shù)據(jù)庫,并運用SPSS 20. 0軟件進行信度系數(shù)檢驗,得 出問卷信度為0.816,大于0. 8,可以推斷此問卷的內(nèi) 部一致性較高,可信度較好。詳細數(shù)據(jù)見表5。

根據(jù)數(shù)據(jù)顯示,實驗組大部分學生學習興趣很高, 通過兒科學課程的學習,建立了初步的臨床思維,提高 了自身的邏輯思維、溝通交流、團隊協(xié)作、主動學習等 四方面能力,在學習過程中并未感受到太大的學習壓 力和學習負擔。

4結(jié)論及思考

    4.1長期、穩(wěn)定的以形成性評價為導向的綜合評 價模式能有效提高學習的學習積極性與主動性實驗組的評價方案涵蓋了整個兒科學的教學過 程。根據(jù)表4、的數(shù)據(jù)分析結(jié)果可以看出,在課程教 學結(jié)束時,綜合性評價對實驗組學生學習效果的影響 明顯高于期中時的影響。并且,與對照組相比,實驗組 的學習效果更好,兩者有明顯的效果差異。從表2、3、 5的數(shù)據(jù)對比分析結(jié)果來看,實驗組學生在以形成性 評價為導向的綜合評價模式引導下,以往學習中存在 的功利主義思想得到扭轉(zhuǎn)。大部分學生在學習過程中 更多地著眼于對基本知識的吸收、掌握,對自身思維方 式、綜合能力的訓練和提高。調(diào)查結(jié)果顯示,在綜合評 價模式的引導下,實驗組學生能夠更積極、愉快地投入 到兒科學學習中,表現(xiàn)出很強的學習興趣。

4.2 以網(wǎng)絡平臺為基礎的學習記錄檔案袋,有助 于師生互動反饋,顯著提升教學效果網(wǎng)絡平臺的運用,彌補了課堂教學時間有限、空間 不足的問題,為學生進一步鞏固及深入了解兒科學知 識、訓練兒科臨床思維,為師生間的有效溝通提供了更 廣闊的平臺。網(wǎng)絡平臺能將學生每次的訪問內(nèi)容、案例 分析、學習互動以及教師評價的情況如實記錄,形成觀、動態(tài)的學習記錄檔案袋。教與學雙方都能從網(wǎng)絡平 臺中導出學生個人學習狀態(tài)及對應的評價信息,并能夠 借助這些信息,在教學過程中不斷總結(jié)與反思,指導或 修正后續(xù)階段的教學行為,使教學效果得到提升。

4.3 完善綜合性評價方案,提高評價效力 在實驗組的綜合性評價方案中,總結(jié)性評價以期 末考試的方式展開,而形成性評價則包括了多項內(nèi)容: 學習紀律、學習態(tài)度、學習效果、綜合能力,等等。多種 因素的評價結(jié)果是否客觀、公正,直接影響最終的評價 效力。雖然本次研究盡可能擴大了評價者的數(shù)量,評 價者達到32名,即一個評價者關注5 — 6名學生即可。 但根據(jù)評價者反饋,在對學生學習表現(xiàn)進行評價時,床 旁示教討論等以鼓勵、引導為主要方式的環(huán)節(jié),評價的 操作性和公平性仍難達到最佳狀態(tài)。究其原因是在具 體操作中,評價者往往會被個別表現(xiàn)突出的學生所吸 引,而忽略了對其余學生的關注和引導。因此在這些 環(huán)節(jié)中,評價者會由于主觀原因而使得評價結(jié)果的公 平性和客觀性降低,這也直接導致在進行綜合評價時, 評價的效力減弱。所以,評價方案應進一步細化,提高 可操作性,盡可能降低人為因素對評價結(jié)果的影響,提 高評價結(jié)果的說服力。

篇6

高等學校博士學科點專項科研基金聯(lián)合資助課題(20103604110002),國家自然科學基金(31100756),江西省高校人文社會科學研究青年基金(XL1003)。

通訊作者:戴海琦,E-mail:。

摘 要:群體不變性是等值的一個重要假設,即對不同的考生子群體等值函數(shù)一致。本研究對不同平行測驗定義下線性等值的群體不變性進行了理論分析和模擬研究,模擬研究REMSD指標通過六種不同加權(quán)方式計算。結(jié)果顯示,嚴格平行測驗在信度較低時REMSD指標更大;子群體均值差異和信度差異對REMSD的影響存在明顯的交互作用;REMSD指標在期望權(quán)重等權(quán)下的最大,在分數(shù)權(quán)重采用子群體比例加權(quán)最小。最后對結(jié)果進行了討論,對REMSD權(quán)重使用及進一步研究給出了建議。

關鍵詞:等值;群體不變性;平行測驗;同質(zhì)測驗

中圖分類號:B841.2

文獻標識碼:A 文章編號:1003-5184(2012)01-0067-05

1 引言

等值(Equating)是實現(xiàn)平行測驗分數(shù)相互比較的重要技術(shù)。有些情況下,研究者也需要建立并非嚴格平行測驗的分數(shù)對應關系,如一些大型考試的內(nèi)容進行了更新,此時新舊考試并非平行測驗,但不論從實踐還是從研究角度都有必要報告新舊考試的分數(shù)對應關系,此時稱之為鏈接(Linking)(Kolen,2004)。鏈接是實現(xiàn)不同測驗分數(shù)比較的一般形式,當鏈接的兩個測驗滿足了相同構(gòu)念、等信度、對稱性、公平性、群體不變性等五個條件,即為等值(Dorans & Holland,2000)。即,等值是要求更為嚴格的鏈接。

近年來,研究者對錨測驗代表性、不同等值方法的穩(wěn)健性進行了大量研究,花費了大量時間和精力收集測驗數(shù)據(jù)以進行等值,但很少有實踐者關注等值過程是否真正實現(xiàn)了測驗分數(shù)可比。Flanagan指出測驗的本質(zhì)是抽樣,不同測驗在內(nèi)容上的差異(包括平行測驗)使等值或鏈接對不同群體的敏感性存在差異(Kolen,2004)。所以必須考慮等值函數(shù)是否對所有被試唯一確定,若測驗間的分數(shù)對應關系不因被試所在群體而變化,則稱等值的群體不變性(Population Invariance,PI)成立。群體不變性是等值最重要的假設之一,在評估考試分數(shù)的公平性時起著重要的作用,在其不成立時使用統(tǒng)一的等值函數(shù)對被試而言是不公平的。

第32卷第1期

劉鐵川等 不同定義平行測驗等值的群體不變性

心理學探新2012年

近年來,在Dorans和Holland(2000)提出了群體不變性的量化評價指標之后,關于等值或鏈接群體不變性問題的研究才開始大量出現(xiàn),對一些大型規(guī)模考試項目如美國大學預修課程考試(AP;Dorans,2004;Yang,2004;Von Davier & Wilson,2008)、學術(shù)性向測驗(SAT;Yi,Harris,& Gao,2008)、法學院入學考試(LSAT;Liu & Holland,2008)、大學代數(shù)考試(CLEP;Yang & Gao,2008)的等值或鏈接的群體不變性進行了研究。他們所提出的指標稱為均方根差異(Root Mean Square Difference,RMSD),比較在不同子群體和整個被試群體上計算出的等值函數(shù)的差異,公式如下:

RMSD(x)=∑jwj[ePj(x)-eP(x)]2σYP(1)

公式1適用于單組或等組設計下的觀察分數(shù)等值,也就是說被試群體P中的所有被試來自同一總體;其中,x表示測驗形式X的某個分數(shù);eP(x)表示由全部被試數(shù)據(jù)估計出由X到Y(jié)的等值轉(zhuǎn)換關系;ePj(x)表示由子群體j的數(shù)據(jù)所估計出的等值轉(zhuǎn)換關系;分母σYP是全部被試數(shù)據(jù)估計出的Y測驗的標準差;wj表示對子群體Pj與全部被試P等值關系差異的權(quán)重。wj有兩種計算方法,其一是以子群體被試比例作為權(quán)重,公式為Nj/N,其中Nj為第j組被試數(shù)量,N為所有被試數(shù)量,此時應保證樣本數(shù)據(jù)中的被試比例結(jié)構(gòu)能夠代表測驗的真實使用情境;其二是進行等量加權(quán)。

RMSD(x)是對個別測驗分數(shù)水平上評價等值的群體不變性,可以對等值差異求期望、再加權(quán)、開平方以得到總結(jié)性的指標,用來對整個測驗等值關系的群體不變性進行整體評價,稱為期望均方根差異(Root Expected Mean Square Difference,REMSD)。具體公式如下:

REMSD=∑jwj∑max (x)x=min (x)vxj[ePj(x)-eP(x)]2σYP(2)

上式中,wj可稱為期望權(quán)重,獲取方法同前;vxj為題目分數(shù)權(quán)重。vxj有三種計算方法,其一為子群體比例加權(quán),公式為Nxj/Nj,其中Nxj為第j組中測驗分數(shù)水平x被試數(shù)量;其二為總體比例加權(quán),公式為Nx/N,其中Nx為全部被試中測驗分數(shù)水平x被試數(shù)量;其三為等量加權(quán),公式為1/max (x)-min (x)+1,Kolen和Brennan(2004)稱之為等權(quán)REMSD(ewREMSD)。分數(shù)權(quán)重的選擇取決于研究者的經(jīng)驗,若研究對各個分數(shù)水平的等值準確性同樣重要,則宜用等權(quán);若樣本數(shù)據(jù)能夠代表實際應用情境,則根據(jù)樣本數(shù)據(jù)的分數(shù)比例進行加權(quán),Dorans和Holland(2000)傾向于使用總體比例加權(quán),而Kolen和Brennan(2004)傾向于使用子群體比例加權(quán)。

錨測驗不等組設計(Non-Equivalent Anchor Test,NEAT)是很常見的等值數(shù)據(jù)搜集方法,但公式1、公式2只適用于單組或等設計下的觀察分數(shù)等值。為探索更復雜設計下的等值群體不變性,Von Davier,Holland和Thayer(2004)將RMSD(x)和REMSD推廣至NEAT設計下的等值群體不變性評價,但關注的仍是觀察分數(shù)等值。Von Davier和Wilson(2008)又將此指標應用于NEAT設計下項目反應理論下的真分數(shù)等值的群體不變性研究。

NEAT設計中,參加兩個測驗X、Y的被試分別來自總體P和Q,根據(jù)人口統(tǒng)計變量將P和Q分成多個子群體,對其中第j子群體加權(quán)合成后可以得到合成組子群體Tj(公式3)。對于RMSD(x)和REMSD公式中合成組子群體的權(quán)重,一種方法是設子群體權(quán)重相等;另一種方法是,根據(jù)P和Q子群體j的權(quán)重來加權(quán)計算,公式如下:

Tj=w(Pj)+(1-w)Qj,wj=w(wPj)+(1-w)wQj(3)

上式中,wPj和wQj為子群體j在P和Q中的權(quán)重;w為P的權(quán)重,可以根據(jù)P的比例來計算。NEAT設計下計算群體不變性指標還需要合成組在Y測驗上的標準差,由于只有Q群體的被試參加了測驗Y,所以無法直接得到合成組標準差,需要使用Tucker方法、或鏈線性等值方法計算(Von Davier et al.,2004)。

雖然群體不變性假設對等值質(zhì)量至關重要,但關于REMSD指標加權(quán)方式及其影響因素的研究不多。本文將對不同平行測驗定義下線性等值函數(shù)差異進行理論分析,并在模擬條件下計算不同加權(quán)方式的REMSD指標,對影響線性等值群體不變性的因素以及加權(quán)方式對REMSD指標的影響進行探索。

2 不同定義平行測驗等值的群體不變性

測量學中對平行測驗有多種定義,如嚴格平行(Strictly Parallel)、Tau等價(Tau Equivalent)、基本Tau等價(Essentially Tau Equivalent)、同質(zhì)(Congeneric)等。Brennan(2008)對平行線性等值下的REMSD公式進行了研究,他認為若兩測驗嚴格平行或滿足Tau等價的條件,并且各組被試在兩測驗上的分數(shù)分布都相同,此時無論信度水平如何,REMSD均為0,等值的群體不變性都成立,事實上此時沒有必要進行等值;若兩測驗滿足基本Tau等價,被試的測驗真分數(shù)相差一個常數(shù),誤差方差不一致導致兩測驗信度不同,但一般情況下比較接近,此時群體不變性基本成立;若兩測驗同質(zhì),被試在兩測驗上的真分數(shù)存在線性關系,真分數(shù)方差與誤差方差都不一致,兩測驗所測構(gòu)念相同,但信度水平相差越大,REMSD也越大,群體不變性通常不成立。

下面通過真分數(shù)等值函數(shù)對同質(zhì)測驗的群體不變性進行分析。在同質(zhì)條件下,測驗X與測驗Y所測構(gòu)念相同,被試在兩測驗上的真分數(shù)存在如下線性關系(Holland & Dorans,2006):

TY=α?TX+β (4)

α=σY/σX?ρYT/ρXT,β=μY-α?μX(5)

公式(4)中,TX和TY為兩測驗上的真分數(shù);公式(5)中,σX和σY為兩測驗觀察分數(shù)標準差,ρXT和ρYT為信度系數(shù)的平方根,μX和μY為兩測驗觀察分數(shù)平均值。上式與觀察分數(shù)的線性等值函數(shù)相似,但斜率系數(shù)增加了信度比值的平方根作為乘數(shù)。用a和b來表示測驗X和測驗Y觀察分數(shù)等值函數(shù)的斜率和截矩,可以得到下式:

a=α?ρXT/ρYT=

(α2?σ2XT+E2Y)/(σ2XT+E2X),b=μY-a?μX(6)

公式(6)中,σ2XT和σ2YT為兩測驗真分數(shù)方差,E2XT和E2YT為兩測驗的誤差方差。REMSD指標會受到子群體間等值系數(shù)差異的影響,若兩測驗滿足同質(zhì)條件,不論被試屬于哪個子群體,公式(4)對所有被試成立(Brennan,2008)。此時,公式(6)中的斜率系數(shù)a對子群體相同,對于截矩系數(shù),由公式(4)和(6)可得b=β+α?1-ρXT/ρYT?μX,可以看出滿足同質(zhì)條件的測驗,若子群體分布均值不同,則觀察分數(shù)等值的截矩系數(shù)b也不同。

通過上式可以對其他三種平行測驗定義下的子群體等值系數(shù)差異進行分析。滿足嚴格平行條件的測驗,兩測驗信度相同,所以觀察分數(shù)等值的斜率系數(shù)a為1,截矩系數(shù)b為0,各子群體相同。滿足Tau等價的測驗,兩測驗信度不同,斜率系數(shù)a不為1,但各子群體相同;截矩系數(shù)b=1-ρXT/ρYT?μX,由于兩測驗信度不同,所以系數(shù)b不為0。滿足基本Tau等價的測驗,兩測驗的真分數(shù)方差與誤差方差均不相同,兩測驗信度不同,斜率系數(shù)a不為1,但各子群體相同;截矩系數(shù)b=β+1-ρXT/ρYT?μX??梢钥闯觯瑢τ赥au等價和基本Tau等價測驗,子群體觀察分數(shù)等值截矩系數(shù)的差異大小取決于他們在測驗X上的分數(shù)均值。

兩測驗信度水平差異也影響截矩系數(shù)的差異,Dorans和Holland(2000)認為實踐中兩個測驗信度不會完全相同,如鏈等百分位等值方法中,錨測驗中由于題目數(shù)量少,其信度要低于全長測驗,仍然可以獲得理想的等值結(jié)果。所以,他們認為信度是等值過程中需要考慮的次要因素。Liu和Holland(2008)對LSAT考試的研究發(fā)現(xiàn),若兩平行測驗的信度相似,則等值過程通常具備群體不變性,他們認為只要測驗的穩(wěn)定性達到一定水準,信度對平行測驗等值的群體不變性影響不大。Dorans和Holland(2000)給出了單組設計下平行線性等值下的群體不變性指標的上限公式,在這個公式中兩測驗的信度越高,則REMSD的上限值越小。需要注意的是,信度高只是使可能的上限更小,并不一定使REMSD的實際取值更小。

3 不同平行測驗定義下的模擬實驗

如前所述,在REMSD指標的計算中有兩次加權(quán),期望權(quán)重wj可采用等權(quán)(ew)和比例加權(quán)(pw),分數(shù)權(quán)重vxj可采用等權(quán)(ev)、總體比例加權(quán)(pv)和子群體比例加權(quán)(gv)。所以REMSD可有六種組合加權(quán)方式,分別表示為ew.ev、ew.pv、ew.gv、pw.ev、pw.pv、pw.gv。本研究自編程序模擬不同平行測驗定義下的數(shù)據(jù),通過計算上述六種不同加權(quán)方式的REMSD指標來評價各種條件下線性等值的群體不變性。

3.1 嚴格平行測驗

對嚴格平行測驗,兩測驗的信度包括08、06、04、02四種條件,其中一個子群體均值為70,真分數(shù)標準差為7,又更接近真實情境,另一個子群體的均值與之相同或相差一個標準差。在不同群體被試所占比例相同的條件下,REMSD指標中的期望權(quán)重采用等權(quán)和采用比例加權(quán)結(jié)果是一致的,而實際研究中不同群體的樣本量通常不一致,所以兩子群體樣本量分別設為1000、2000。每種條件重復100次。

表1呈現(xiàn)了不同條件下嚴格平行測驗的六種群體不變性指標的模擬結(jié)果??梢钥闯?,在各種條件下,期望權(quán)重和分數(shù)權(quán)重采用等權(quán)時的REMSD指標取值要比其他加權(quán)組合方式更大。當子群體分布相同時,REMSD指標的分數(shù)權(quán)重采用總體比例加權(quán)和子群體比例加權(quán)的結(jié)果一致,當子群體分布不同時,采用總體比例加權(quán)的REMSD指標值總是大于使用子群體比例加權(quán)。隨兩測驗信度水平下降,六種權(quán)重組合的REMSD指標均增加。

3.2 同質(zhì)測驗

對同質(zhì)測驗,兩測驗信度水平分別為(0.8,08)、(0.8,0.9)、(0.9,0.8)三種條件,真分數(shù)等值斜率有0.9、1.1兩個水平,代表較易和較難的兩個測驗,真分數(shù)截矩設為1.75,其它設定與嚴格平行測驗相同。

由表2可以看出,在子群體分布均值相同條件下,由高信度測驗等值到低信度測驗的REMSD較小,兩測驗信度差異并不會使REMSD增加,而是略有下降;在子群體分布均值不同條件下,兩測驗信度差異會使REMSD增加較大,斜率為0.9時,由低信度測驗等值到高信度測驗的REMSD比由高信度到低信度等值的更小,斜率為1.1時趨勢相反,但不明顯。

Tau等價與基本Tau等價是同質(zhì)條件的特例,結(jié)果與同質(zhì)條件相似,限于篇幅不再呈現(xiàn)結(jié)果。對于這三種非嚴格平行測驗,與嚴格平行測驗條件下相同,兩個權(quán)重都采用等權(quán)下的REMSD最大,而期望權(quán)重采用比例加權(quán)、分數(shù)權(quán)重采用子群體比例加權(quán)時的REMSD最小。

4 討論和總結(jié)

本研究通過理論分析和模擬數(shù)據(jù)對不同平行測驗定義下的線性等值的群體不變性進行了探索,結(jié)果與前人研究有所不同。

對于嚴格平行測驗,本文第二部分的理論分析可以得出子群體等值系數(shù)無差異的結(jié)論。Brennan(2008)認為等信度條件下信度水平高低并不是等值群體不變性的必要條件,信度越小,REMSD取值越小。但模擬數(shù)據(jù)結(jié)果與此不同,隨著測驗信度水平下降,各種加權(quán)方式下的REMSD都會增加。需要指出的是,隨著測驗信度下降,誤差成分在觀察分數(shù)中所占比例變大,此時估計出的等值關系很少能反映真分數(shù)之間的對應關系,而更多是由隨機誤差所決定,而REMSD指標并沒有反映等值系數(shù)的估計誤差,這可能是理論分析與模擬結(jié)果不一致的原因。

對滿足同質(zhì)條件的測驗,子群體等值系數(shù)差異主要在截矩系數(shù),差異的大小可能會受到兩測驗信度差異和分數(shù)分布的影響。模擬數(shù)據(jù)進一步顯示兩個因素存在明顯的交互作用,子群體均值相同時,信度差異增加不會使REMSD增加,而子群體均值存在差異時,信度差異會使REMSD增加較大。由低信度測驗等值到高信度測驗與相反情形下的REMSD之間存在差異,但很小。

對于REMSD的加權(quán)方式,期望權(quán)重和分數(shù)權(quán)重采用等權(quán)時比其它加權(quán)方式要更大,當子群體分布不同時,分數(shù)權(quán)重采用總體比例加權(quán)的REMSD指標值總是大于使用子群體比例加權(quán)。以往研究認為指標權(quán)重的選取是主觀的,實際數(shù)據(jù)中分數(shù)分布通常存在差異,本研究以為REMSD指標中的分數(shù)權(quán)重采用子群體比例加權(quán)更為恰當。

本文對等值的群體不變性的分析基于各種定義下的平行測驗,對等值群體不變性的分析有一個重要的假定,即各子群體的真分數(shù)對應關系相同。但這個假設在實踐中可能不滿足,如測驗X對子群體是公平的,測驗均值相同,但測驗Y由于內(nèi)容不當題目數(shù)量較多則存在功能差異,一個子群體的考生更擅長這些考試內(nèi)容。那么在測驗X上得分相同的不同子群體的考生在測驗Y上得分會存在差異,所以兩測驗在內(nèi)容上的差異可能導致子群體真分數(shù)對應關系不同,此時子群體等值函數(shù)的截矩與斜率均不相同,REMSD指標可能較大??赡苡捎谶@個原因,所以鏈接通常不滿足群體不變性(Kolen,2004)。

具備群體不變性的等值才是公平有效的,而實測數(shù)據(jù)中人口統(tǒng)計信息的缺乏限制了對等值假設的檢驗。無法使用不同的等值函數(shù)轉(zhuǎn)換分數(shù)時,如何解決群體不變性不成立時的等值對于實踐者來說也是一個難題。理論上,項目功能差異題目可對等值群體不變性產(chǎn)生影響,但影響方式、影響大小尚未有研究涉及。這些都是關于群體不變性的進一步研究所亟待解決的問題。

參考文獻

Brennan,R.L.(2008).A discussion of population invariance.Applied Psychological Measurement,32(1),102-114.

Dorans,N.J.(2004).Using subpopulation invariance to assess test score equity.Journal of Educational Measurement,41(1),43-68.

Dorans,N.J.,& Holland,P.W.(2000).Population invariance and the equatability of tests:Basic theory and the linear case.Journal of Educational Measurement,37(4),281-306.

Dorans,N.J.,Liu,J.,& Hammond,S.(2008).Anchor test type and population invariance:An exploration across subpopulations and test administrations.Applied Psychological Measurement,32,81-97.

Holland,P.W.,& Dorans,N.J.(2006).Linking and equating.In R.L.Brennan(Ed.),Educational measurement(4th ed.).(pp.187-220).American Council on Education /Praeger,Westport,CT.

Kolen,M.J.(2004).Population invariance in equating and linking:Concept and history.Journal of Educational Measurement,41(1),3-14.

Kolen,M.J.,& Brennan,R.J.(2004).Test equating:Methods and practices.New York:Springer.

Liu,M.,& Holland,P.W.(2008).Exploring population sensitivity of linking functions across three law school admission test administrations.Applied Psychological Measurement,32,27-44.

Von Davier,A.A.,& Wilson,C.(2008).Investigating the population sensitivity assumption of item response theory true-score equating across two subgroups of examinees and two test formats.Applied Psychological Measurement,32(1),11-26.

Von Davier,A.A.,Holland,P.W.,& Thayer,D.T.(2004).The chain and post-stratification methods for observed-score equating and their relationship to population invariance.Journal of Educational Measurement,41,15-32.

Yang,W.-L.(2004).Sensitivity of linkings between AP multiple-choice scores and composite scores to geographical region:An illustration of checking for population invariance.Journal of Educational Measurement,41(1),33-41.

Yang,W.-L.,& Gao,R.(2008).Invariance of score linkings across gender groups for forms of a testlet-based college-level examination program examination.Applied Psychological Measurement,32,45-61.

Yi,Q.,Harris,D.J.,& Gao,X.(2008).Invariance of equating functions across different subgroups of examinees taking a science achievement test.Applied Psychological Measurement,32,62-80.

Population Invariance of Linear Equating under

Different Definition of Parallel Test

Liu Tiechuan1,Dai Haiqi1,Zhao Yu2

(1.School of Psychology,Jiangxi Normal University,Nanchang 330022;

(2.Department of Psychology,Gannan Medical College,Ganzhou 341000)

Abstract:

篇7

一、教學課程計劃的改革

1.教學課程計劃要突出主要學科,保證學科之間的聯(lián)系

學校制定教學課程計劃時,要在分析各學科的性質(zhì)、任務、特點及相互關系的基礎上,確定所要開設的學科、學科順序、開設時間、教學時數(shù),規(guī)定教學的內(nèi)容、范圍和時間等,學科設置要有主有次。語文是中學的主要學科,要從時間安排上高度重視起來。各學科之間要互相聯(lián)系、互相配合,不能互相隔絕、各自為政。教師在語文教學中可以適當?shù)貫閷W生介紹與教學內(nèi)容相關的地理、政治、美術(shù)知識,學科之間的融合能促進學生開闊思路,提高學習的積極性,對語文教學有促進作用。

2.打好學習基礎,關注學生的發(fā)展

學生是學習的主體,按照課程計劃所執(zhí)行的教學方式要符合學生的身心發(fā)展水平和接受能力,注重教學內(nèi)容的趣味性和學生掌握知識的可能性,強調(diào)基礎知識的傳授和基本技能的養(yǎng)成。尤其是基礎知識,這是學生深入學習的根本,如果基礎的東西都掌握不了,更不用談學生學習能力的培養(yǎng)、道德的升華。在知識經(jīng)濟的時代,要讓學生在牢固的知識基礎之上進行能力和整體素質(zhì)的提高。

3.課程計劃要有統(tǒng)一性、穩(wěn)定性和靈活性

語文教學要按照全國統(tǒng)一的教學大綱、新課標來指導教學,這樣才能保證教學的正確方向。素質(zhì)教育改革的深入實施,使素質(zhì)教育這個核心目標成為教學課程計劃的導向。具體到教學時間中,教師的計劃要根據(jù)教材內(nèi)容,根據(jù)學生的情況進行編排,一旦形成,不能朝令夕改。教師在教學中的時間安排要嚴格執(zhí)行,不能因為一些阻礙就把課程時間拖延,影響整體的計劃。當然,教師在具體的計劃細節(jié)上還要做到靈活多變,因為課堂教學面對的是學生,有很多不確定的因素,教師要根據(jù)學生的學習情況進行調(diào)整。

4.教師要開闊視野,學習先進的教學經(jīng)驗

教師對課程計劃的制定要立足國內(nèi),放眼世界,縱向上總結(jié)國內(nèi)以往課程計劃的成敗得失,橫向上比較國外相關的課程計劃,從中吸取可以借鑒的經(jīng)驗。

二、考試評價內(nèi)容的改革

傳統(tǒng)的考試以紙筆測驗為主要形式,突出了三個中心,即“教師中心”“教材中心”“課堂中心”,考試內(nèi)容嚴重脫離實際,導致學生通過了考試,雖然成績優(yōu)秀,但對知識地靈活運用等方面的能力不足。素質(zhì)教育強調(diào)的是學生的全面發(fā)展,即知識和技能、過程與方法、情感態(tài)度和價值觀的發(fā)展。改革考試評價的方式方法就要更新理念,探索運用更多的考試形式和方法。

實施靈活多樣的考試評價方法,改變以往單一紙筆測驗的方式,可以考慮根據(jù)語文學科的性質(zhì)和教學目標引入口試,如背誦、朗讀、理解表達等。注重引入表現(xiàn)性考試,教師可根據(jù)對學生基本素質(zhì)的要求,設立反映學生情感和價值觀的表現(xiàn)性考試形式,給學生展示特長和興趣愛好的機會。例如,組織學生進行演講比賽、社會實踐等??荚囆问蕉喾N多樣,紙筆測驗也應考慮改革。例如,倡導開卷的考試形式,開卷考試形式考察的重點在于學生分析和解決問題的能力,而不是強化記憶,教師在教學中要將日常測驗演變成學習過程。一般而言,考試評價總是居高臨下,評價對象處于被動地位,這種狀況不利于學生的發(fā)展,他們不能很好地理解考試評價的意圖,甚至為應付考試而不惜忽視被認為非重點的學習內(nèi)容。改變考試評價觀,教師應認識到調(diào)動學生積極參與考試評價是促進其發(fā)展的重要舉措。對于學生而言,學習是終身的事情,要學會不斷地利用考試評價的方式來了解自己的進步,分析自己的成績,定向自己的發(fā)展。做到這一點需要學生對考試本身有一個深刻的認識,也需要積極地參與考試的整個過程,要清楚地認識到日常的考試不是為了選拔,而是通過測驗促動學生學習,獲得更好的學習效果。教師為了讓學生主動進行自我考試評價,可以讓學生自己出考題,為了讓學生不斷總結(jié)歸納自己的不足,可以給學生多次考試機會,進行差異性考試。

三、教學手段的改革

信息科技的發(fā)展,勢必帶來教學現(xiàn)代化的改革。現(xiàn)代化的教學手段最常用的是多媒體課件,它利用了計算機網(wǎng)絡、投影儀、幻燈機、錄像等方式,形成了視頻、圖畫、文字、音樂等多種功能的知識傳輸系統(tǒng),具有傳統(tǒng)教學手段不具備的優(yōu)越性,使用多媒體可以激發(fā)學生的學習興趣。傳統(tǒng)教學一般使用文字教科書、掛圖、教師的口頭語言和黑板書面語言等方式傳授知識,比較單一、抽象,語文課文的豐富內(nèi)涵和場景不能體現(xiàn)出來,學生往往學得枯燥乏味。而使用多媒體進行教學刺激了學生的感官系統(tǒng),教師利用多媒體教學課件使課文場景形象逼真地呈現(xiàn)出來,使知識變得生動、形象,學生的學習氣氛活躍,調(diào)動了其主動學習的積極性。多媒體的人機互動功能給教師和學生提供了良好地互動,教師可以通過Email和MSN和學生保持聯(lián)系,可以幫助學生解答在課堂上沒有理解的問題,與學生討論問題,形成交互式學習。教師甚至可以和學生聊天,作為他們的良師益友,可以聽聽學生的心聲,虛心聽取學生對教師的評價。新課改下的教學不再是傳統(tǒng)教育中的以教師為中心、以課堂為中心,而是以學生為中心。同時,學生可以自主上網(wǎng)學習,查找自己感興趣的資料,進行網(wǎng)上練習等,鍛煉了自主學習的能力。在運用多媒體的過程中,教師不能一味的“拿來主義”,要規(guī)避其不足之處,這樣才能發(fā)揮其實效性,促進課堂教學。例如,過分地強調(diào)課件的重要性,認為只有使用課件才能把課上好,甚至認為板書都是多余的,教師成了一個點擊鼠標的工具,電子板書占據(jù)了整堂課,學生不再認真做筆記,而更依賴于拷貝教師的教案。聽覺和視覺成了一節(jié)課最重要的環(huán)節(jié),忽視了親手演練才是學生學習及鞏固知識最重要的環(huán)節(jié)。教師在制作課件時,為了提高學生的學習興趣,過多地加入了音樂視頻及其他一些動畫,雖然課堂氣氛變得很活躍,但課堂的重難點并不突出,教師只顧埋頭操作電腦,在課堂上缺乏與學生的溝通,無法對學生的行為進行有效監(jiān)督,不能了解學生對知識的理解程度。所以,教師在利用多媒體教學時,要認真設計課堂教學計劃,做到用現(xiàn)代化工具輔助教學,提高課堂效率的目的。

篇8

【關鍵詞】財務管理;課程;考核

《財務管理》是大多數(shù)高校經(jīng)濟、管理類各專業(yè)的必修課程,也是其他多個專業(yè)的選修課程。本課程主要介紹財務管理的基本理論和基本方法,使學生對財務管理有一個基本的認識,領會財務管理在現(xiàn)代企業(yè)管理中的作用,并能為本專業(yè)的學習提供幫助。要求學生明確企業(yè)財務管理的目標以及貨幣時間價值、風險與收益等基本概念,掌握財務分析、投資決策、籌資決策、收益分配以及企業(yè)價值評估等理論和方法。

《財務管理》課程考核是教學評價的重要組成部分,對實現(xiàn)教學目標具有重要的督導作用。設置得當?shù)恼n程考核有利于調(diào)動學生的學習積極性、培養(yǎng)學生的創(chuàng)新精神和創(chuàng)造能力,并對教學起到反饋、調(diào)節(jié)、評價和促進作用。那么應該如何安排課程考核,才能起到以上作用?在從事多年財務管理教學的基礎上,筆者就以下幾個方面談一談自己的體會。

一、實行分專業(yè)考核還是統(tǒng)一考核

以往本門課程考核時,考慮到各專業(yè)班級之間評分的公平與可比性,以及教師命題、評價的可操作性和效率性,一般都要求統(tǒng)一命題,統(tǒng)一考核。但基于以下原因考慮,筆者認為分專業(yè)考核更為合理:

首先,雖然各專業(yè)開設的本課程教學總體目標基本相同,但課程定位不同。對會計學、財務管理專業(yè),該課程(也稱中級財務管理)是核心課程;對經(jīng)濟管理類其他專業(yè),該課程是專業(yè)教育必修課;而對于經(jīng)管類以外的各專業(yè),如語言類,社科、理工類各專業(yè),則是為擴展知識面而開設的選修課。

其次,學時安排不同。會計和財務管理專業(yè)的本課程學時安排比較多,以本校為例,一般有中級財務管理48或54學時,高級財務管理48或54學時;其他經(jīng)管類各專業(yè),本課程一般安排48學時或54學時,不分中級和高級課程;經(jīng)管以外各專業(yè),一般設置為選修課,只安排32學時的課程。

再次,教學重點不同。對于會計和財務管理專業(yè),重點在于財務決策、財務分析等方法的具體應用上。比如講到項目投資決策部分,基本方法對這些專業(yè)的同學來說非常簡單,只要介紹清楚就可以,而后面的不同壽命期投資項目的決策,設備更新決策、考慮折舊和所得稅問題的復雜決策等才是研究的重點;但對于經(jīng)管類其他專業(yè)的同學來說,由于會計方面知識學的比較少,復雜問題的決策不宜過多展開;而對于經(jīng)濟和管理類以外得各專業(yè),重點應該放在基本方法比如貼現(xiàn)分析的幾種不同決策方法上。

二、采用形成性評價還是總結(jié)性評價

形成性評價是指對學生日常學習過程中的表現(xiàn)、所取得的成績以及所反映出的情感、態(tài)度、策略等方面的發(fā)展做出的評價,是在對學生學習過程的持續(xù)觀察、記錄的基礎上做出的評價。形成性評價重視的是過程,具體可以采用觀察、提問、作業(yè)、測驗、問卷、案例分析、分組討論等手段。形成性評價應設置得較為頻繁,比如可安排一個章節(jié)或一個單元后的作業(yè)、小測驗等。

在《財務管理》課程中采用形成性評價的好處在于:

首先,可以及時獲得反饋信息,有利于教師改進教學。比如在課堂講解的同時,通過觀察學生對所講內(nèi)容的反應,了解學生對所學知識的理解情況,可以隨時調(diào)整教學。

其次,促使學生及時掌握已學部分知識。如“貨幣時間價值”部分學習結(jié)束后,可以安排作業(yè)或者小測驗,促使學生及時回顧課堂所學內(nèi)容,并加深理解,為以后投資、籌資等單元的學習掃清概念理解和方法基礎上的障礙。

再次,可以及時發(fā)現(xiàn)學生學習過程中存在的問題,比如通過提問、作業(yè)等發(fā)現(xiàn)部分同學在與折舊相關的現(xiàn)金流量分析上發(fā)生錯誤,教師可以對這部分內(nèi)容重新講解,學生也可以及時發(fā)現(xiàn)自己有哪些理解上的偏差,存在哪些錯誤,并根據(jù)教師講評和自己的重新認識進行更正。

第四,增強學生學習積極性。通過教師的正面肯定,使學生通過情感反應加強了進一步學習的積極性,也通過學生的認知反應加固了其對正確概念、原理等的認識,校正了含糊的理解和不清晰的記憶。

第五,促使學生參與評價。比如在以往的教學中,安排問卷調(diào)查,請學生自己分析什么樣的評價方式更為合理,同學們也提出了很多建設性的意見。

當然,形成性評價在應用時也存在一些弊端,比如:如果不把形成性評價的結(jié)果量化并計入到學生最終成績中,學生的積極性和參與度不夠,如果量化并計入最終成績,其評價結(jié)果本身可能并不公允,比如提問時每位同學回答的問題不同;作業(yè)很難保證獨立完成;分組討論時部分同學不開口不參與;作業(yè)、測驗的評價難以標準化;頻繁評價的時間精力難以保證等等。

總結(jié)性評價則是在教學活動告一段落后,為了解教學活動的最終效果而進行的評價,也稱為“事后評價”。總結(jié)性評價最常用的手段就是學期末的考試,其目的是檢驗學生的學業(yè)是否最終達到了課程教學目標的要求。

在《財務管理》課程中采用總結(jié)性評價的好處在于:

首先,可以考察教學目標的實現(xiàn)程度,考察學生掌握知識、技能的程度和能力水平。通過期末的考試可以考察學生是否明確企業(yè)財務管理的基本概念,是否掌握了財務分析、投資決策、籌資決策、收益分配、企業(yè)價值評估等的理論和方法,是否具備財務決策分析等能力。

其次,便于評定學生的學習成績??偨Y(jié)性評價最常見的作用是評定學生的學習成績,通過對學生達到教學目標的程度予以確定并打出分數(shù),評出等級。

再次,對教師的教學提供反饋。教師可以從評價結(jié)果中獲得有用的信息,了解學生對這門課程的掌握程度、存在的問題和難點,這些信息將會對教師下一次組織教學提供參考。

應用總結(jié)性評價也存在一些弊端:比如,學生不重視過程只重視結(jié)果,平時學習積極性不高,考試前臨時抱佛腳;總結(jié)性評價有一次考試定終身之嫌,忽略了過程的考核;基于考核時間的限制,難以覆蓋絕大多數(shù)知識點,也難于滿足對學生創(chuàng)新和創(chuàng)造能力的考核。

在實際應用中,對《財務管理》課程考核應將總結(jié)性評價和形成性評價相結(jié)合。在形成性測試時,不要簡單地只打分數(shù),而應通過適當形式地讓學生知道他是否已掌握了該單元的學習材料。如果學生掌握,應明確指出;如果沒有掌握,也要盡可能予以鼓勵并提出改進建議。在進行總結(jié)性評價時,要采用合適的考核形式,設定適當?shù)目己穗y度,選用多種類型的考核題目,保證評價結(jié)果的客觀、公正,能夠反映出學生對知識和技能的掌握程度以及學生的能力。

三、采取開卷、閉卷還是論文形式

在總結(jié)性評價時,應該選用哪種考核形式呢?目前普遍采用的有閉卷考試、開卷考試和論文幾種形式。

在《財務管理》以往的教學中,筆者和同事都傾向于采用閉卷考試的形式。從評分角度來看,閉卷考試確實有不少優(yōu)點,更適合標準化評分。閉卷考試的特點是:第一,有利于直接考查學生的識記、理解和應用能力,也是對學生多方面基本能力素質(zhì)的考查。第二,試題形式封閉,有利于培養(yǎng)學生思維的敏捷性和流暢性。第三,閉卷考試不允許學生攜帶任何與考試無關的資料和工具,不允許學生交頭接耳,可能會給學生造成緊張的氛圍,影響其發(fā)揮。

采用開卷考試,考生可以自由查看資料,但是仍應獨立完成。與閉卷考試相比,開卷考試的試題更具開放性,更加靈活,為考生回答問題提供了充分的思考空間,有利于學生充分發(fā)表自己的見解,展現(xiàn)自己的能力,發(fā)揮自己的水平。開卷考試的特點是:第一,有利于考查綜合能力素質(zhì)。開卷考試時,試題的提問角度不是直接的,大多不是能從書面上直接找到答案的問題。第二,試題形式比較開放,只有對系列知識的融會貫通,才能靈活地駕馭問題的回答,進而發(fā)表個人的獨特見解。第三,開卷考試允許考生翻閱隨身所帶的各種資料,考試環(huán)境相對寬松,能夠減輕學生的考試壓力。

以寫論文作為考核形式,對教師來說,命題的工作量大大減輕;同時學生也沒有考試壓力;論文也比試卷更能反映學生的綜合運用能力和創(chuàng)新能力。但是論文無法像閉卷或開卷考試那樣,有比較大的考核知識點覆蓋面,學生可以只選擇自己比較熟悉或感興趣的部分內(nèi)容展開論述;論文寫作時學生可以參考大量資料,有的同學會在網(wǎng)上下載大量資料照搬或者抄襲,對此難于完全杜絕;論文的評分不像試卷那樣易于標準化,采用百分制評分并不太合適,也難以體現(xiàn)客觀和公正。

對會計和財務管理專業(yè),建議采用閉卷筆試的形式,考核內(nèi)容覆蓋面廣,既考核財務分析,財務決策等的方法掌握程度,又考核基本知識點和背景知識了解情況,考慮到這些專業(yè)的同學多有參加注冊會計師考試的需要,因此在題型安排和難度設置上可以部分參考CPA考試的情況,但對于CPA考試中未考察的實務以外的知識點等仍應考察。

對于金融、國貿(mào)、經(jīng)管、市場等其他經(jīng)管類專業(yè),難度應該降低,考核基本概念、理論知識和復雜程度一般的分析決策等技能的掌握情況,另外考慮到和本專業(yè)結(jié)合的要求,可以采用開卷或閉卷筆試加論文的方式考核,開卷或閉卷筆試可以考察學時基本知識點和基本方法的掌握情況,論文又能促使學生結(jié)合本專業(yè)具體情況,選擇部分問題展開研究。

經(jīng)管類以外的各專業(yè),由于是作為擴展知識面開設的課程,只要學生能了解基本理論,應用基本方法解決經(jīng)濟生活中的簡單問題即可。因此只考核基本知識點,最基本的決策和財務分析能力,可以采用有條件的開卷考核方式。

參考文獻:

[1]李宇,易松芝.財經(jīng)類院校課程考試改革研究[J].當代教育論壇,2011(3).

[2]笪強生,翟晶.大學課程考核改革探索性研究[J].出國與就業(yè)(就業(yè)版),2010(19).

篇9

關鍵詞:課程考核方式;改革;過程考核;全面評價

目前,我國高職院?!洞髮W語文》課程的考核主要分階段性測試與期中期末考核的方式,而一般情況下,大部分教師都采取作文考核或卷面測試的方式。作為傳統(tǒng)考核方式,作文或卷面考核固然可以全面考核學生對所學知識的掌握程度,而且各種題型教師和學生都很熟悉,操作簡單,因此沿用至今。但是這兩種傳統(tǒng)考核方式也存在許多弊端,如(1)“一刀切”的考核形式,無法滿足職業(yè)教育“以能力為本位”的本質(zhì)需求,只能考查學生對所學知識的掌握程度,而不能全面反映學生語文素質(zhì)和能力水平。(2)沒有針對不同階段不同教學內(nèi)容采取相應的測試形式,考試形式單一。(3)傳統(tǒng)考核方式的評卷尤其是作文批改工作量大,必然導致效率不高,并且在分數(shù)的驅(qū)使下,必然會對語文課堂帶來“功利教育”的負面影響,學生不重視平時學習,到期末考試時臨時抱佛腳,不能真正體現(xiàn)學生的真實學習狀況。這些都在一定程度上制約了教學水平和教學質(zhì)量的提高,降低了學生對語文課程的學習興趣,也影響了大學語文教學改革的深入推進。

為此,我院在不斷推進大學語文教學改革的過程中,嘗試進行課程考核方式改革,探索提升教學質(zhì)量的有效方法,把考核貫穿到日常教學過程中,改變對學生“一次性評定”的方式,力求對學生的學習語文的過程中各節(jié)點進行質(zhì)量控制,激發(fā)學生學習主動性,以更全面的評核學生的學習情況?,F(xiàn)從改革理念、改革目標、改革內(nèi)容以及結(jié)果和成效等方面來談談。

1改革理念

高職教育是素質(zhì)教育和職業(yè)能力教育,教學過程尤其是評價過程對于學生學習態(tài)度和學習信心的促進都起到很重要的作用。要讓層次不同的每一個學生都能主動發(fā)展,都能獲得成功的體驗,就必須改革目前這種終極式的、以知識再現(xiàn)為主的、一刀切式的考試模式,建立新的語文考核方式,突出過程評價、注重興趣培養(yǎng)及能力訓練,讓每一個學生都在學習的過程中獲得成功的情感體驗,從而激發(fā)他們的主體精神。

2改革目標

我院大學語文已不再是空談素養(yǎng),簡單學習幾篇文章的所謂“高四語文”,而是根據(jù)高職學生需求,加強應用文寫作和口語表達,把能力與素養(yǎng)相結(jié)合,已取得了較好的教學效果。本次考核方式改革項目試圖從高職語文課程考核方式的變革入手,尋求解決傳統(tǒng)語文教學模式、考核模式不足的方法,以期將語文課堂育人、能力培養(yǎng)的本質(zhì)目標最大化。主要目標如下:

1)以我院高職語文“能力為核心”的教學理念為依據(jù),現(xiàn)代教育測量理論為指導,合理編制高等職業(yè)院校語文考試評價模式,力求考核模式的科學性和適用性。2)培養(yǎng)學生平時學習的自覺性和創(chuàng)造性,建設踏實的學風,促使學生注重學習過程,充分利用平時時間努力學習,使學生在較短時間內(nèi)掌握基礎的實用寫作及口語表達的技能。3)全面正確客觀的評價學生的學習情況。能使我們真正的掌握學生的學習狀態(tài)、看到學生的學習成果,檢驗自己的教學效果。

3考核內(nèi)容

為配合大學語文的教學改革,切實提高教學質(zhì)量,根據(jù)高職教育的培養(yǎng)目標和教學要求,我院基礎課部語文教研室經(jīng)過集體討論,對現(xiàn)有的課程考試模式進行了改革,建立以“能力測試”為中心的考核模式,以充分發(fā)揮考試在教學和人才培養(yǎng)中的教育作用、引導作用和導向作用。具體方案如下:總評成績=平時成績(30%)+應用文寫作環(huán)節(jié)成績(40%)+口語表達環(huán)節(jié)成績(30%)+獎勵附加分。

考核方式的改革主旨是為了評價學生學習全過程,測試學生是否達到既定能力目標。

通過三個學期的實踐,語文課程的考核方式已大致定型。前兩個學期,我們?nèi)∠恕捌谀┛荚嚒?,設計了專用練習本,按照既定方案實施課程考核,分階段、全過程地考查學生在“寫作”和“口語”方面的學習情況。以“出勤率”、“平時作業(yè)”、“課堂表現(xiàn)”記錄學生的平時成績,“寫作”成績由一次隨堂階段測驗和一次合作完成的任務書綜合評定,“口語”成績由演講(拍攝視頻上交)和一次課堂情景模擬綜合評定,然后按照比例計入總分。最后為鼓勵學生進行課外延伸學習,給學有余力,表現(xiàn)優(yōu)異的學生進行適當加分,一并計入總分。

從這兩學期學生的學習成績看來,學生開始重視過程學習,作業(yè)水平有所提高,不及格率有所下降。但某些合作完成項目,仍存在部分學生渾水摸魚的現(xiàn)象,為此,教師修訂了練習本,要求學生在作業(yè)中注明本人在合作項目中為團隊具體做出何種貢獻,情況有所好轉(zhuǎn),公平性得到提升。

在考核方式改革實施過程中,我們通過及時反饋和總結(jié),進一步對高職語文考核方式的可行性進行論證,不斷改進考核方式。

第三學期,在大學語文教學改革不斷深入探索的過程中,我們把“寫作”+“口語”的模塊化教學進一步深化為打破模塊的“活動單導學”的教學方式,把“口語”和“寫作”的教學內(nèi)容融合在一起,以“活動單”為學生的學習指引,在一個活動項目中,結(jié)合與該活動有關的相關知識能力點,涵蓋“說”“寫”“素養(yǎng)”三方面內(nèi)容。因此,原有的方案把“說”和“寫”進行相對獨立考核,顯然已不夠適合現(xiàn)有教學方式。因此,在第三學期,我們把考核內(nèi)容稍作修改,在不改變“說”和“寫”的能力指標評價的基礎上,以“活動單”為單位進考核項目包含了任務完成、演講視頻、現(xiàn)場模擬、階段性測驗,采用“筆試”+“口試”的形式,對學生知識掌握(階段測驗)、能力應用(任務完成、演講視頻、現(xiàn)場模擬)和素養(yǎng)提高(團隊協(xié)作、探索分析)進行了全方面的考評。

修訂過的考核內(nèi)容更多,計分更細致,也能更詳細地對學生的學習狀況作如實反映,評價更為全面。

4考核方式改革的創(chuàng)新點

(1)注重平時成績、全面評價考生。前兩年教學改革中實行的考核方式,雖然已經(jīng)注意到了寫作和口語的分項考核,相當程度改善了評價模式,但是由于期末考試成績?nèi)匀凰急戎剌^大,仍有部分學生存在平時糊弄,考前突擊的現(xiàn)象,而有些同學認為做試卷才是考試,把學習的功夫過多用于考場上,記背理論知識,對平時老師布置的項目、任務卻敷衍了事,甚至不重視口語測試,這些都不利于學生創(chuàng)造性和主動性的發(fā)揮,阻礙了創(chuàng)新思維的培養(yǎng)與發(fā)展。為培養(yǎng)學生學習的自覺性和創(chuàng)造性,促使學生充分利用平時時間努力學習,本學期我們經(jīng)過集體討論,結(jié)合我們的課程改革實際,決定期末不再舉行大規(guī)模卷面考試,考核成績分別由平時成績、寫作成績、口語成績組成,具體由平時作業(yè)、課堂表現(xiàn)、單元測驗、項目操作、課堂實訓等環(huán)節(jié)構(gòu)成、設立相應指標體系和能力點,構(gòu)建了一套相對全面、客觀、合理的考核體系。這樣的考核方式強化了學習過程的重要性,加強了對學生的學習過程評價,促使學生在平時多下功夫,逐漸積累,真正投入學習中,利于學校學風建設。

(2)考試方式多樣化、考試內(nèi)容側(cè)重能力培養(yǎng),改重寫輕說為說寫并重。傳統(tǒng)的考試一般采用終結(jié)式考核方式,對于學生學習成果的檢驗僅來自于那一場考試,對學生的考核方式比較單一,經(jīng)過了兩年的教學改革,大學語文的考核方式已經(jīng)作了較大改進:增加了口語考試,寫作部分雖仍以試卷為主,但是以材料寫作題為主,并采取了開卷的方式。在本次考核方式改革中,我們決定舍棄呆板的卷面考試方式,全力挖掘?qū)W生的學習潛能,弱化記憶性成分,強化學生對知識的實際應用能力,分析和解決問題的能力,允許學生以合作者身份介入命題,采用完成任務書,操作項目、角色扮演等多種新型考核方式 。

(3)建立良好的反饋機制。在原來的教學過程中,由于考試是期末一次性終結(jié)考試,學生考試結(jié)束,就意味著本門課程學習的終結(jié)??荚囍写嬖诘膯栴},教師不能與學生進行反饋與交流。學生不知道自己差在哪里,不明白的問題一直是問題,而任課教師也難以在教學中及時了解學生對知識的掌握程度,不能了解學生為何會出現(xiàn)那些問題,也就無法對教學做出必要的調(diào)整。本次改革后,由于設立了分階段的測驗和完成任務書,每次測驗后或者完成某項任務后教師都能及時把測驗情況和任務完成情況反饋給學生,存在的問題老師能很好的跟學生進行交流,學生能有所收益,而反饋過程也為任課教師改進教學提供了參考。學習成為了一個良性互動的過程。

5考核方式改革的結(jié)果與成效

(1)考核方式改革后真正體現(xiàn)了對學生知識、能力、素養(yǎng)的全面考核。例如:單元測驗從學生知識體系入手,采用開卷形式、考題設計以知識為基礎,能力考核為主旨。活動單的完成全面考查了學生分析問題、解決問題的能力,在考核過程中,學生團隊協(xié)作、自主鉆研等素養(yǎng)得到全面提升,獎勵積分的方式促進學生不算自我完善、自我加壓,在課外繼續(xù)進行延伸學習。

(2)改革后的考核方式突出過程評價、注重興趣培養(yǎng)及能力訓練,讓學生們都學習的過程中獲得成功的情感體驗,從而激發(fā)他們的主體精神。例如:學生文字表達作業(yè)在校報上集結(jié)發(fā)表(校報某期副刊專版、近期校報又會發(fā)表),激發(fā)了學生的學習興趣,獲得成功體驗,有利于學生學習積極性的提高。學生通過團隊協(xié)作完成活動方案,在全班展示,有的甚至在生活中付諸實施并獲得成功,學生主體精神得到全面發(fā)揮。

(3)新的考核方式獲得學生好評。在考核方式改革的兩年中兩次對語文學習開展問卷調(diào)查,問及“你覺得改革后的考核方式如何?” 絕大部分的學生都認為新的考核方式“較好的考核了學生的總體學習情況”。每學期的師生座談會上學生對于考核方式改革均給予大力肯定,他們認為,這種考核方式較為公平全面地體現(xiàn)了他們的學習狀況,并且通過這樣的考核方式,培養(yǎng)了他們多方面能力,比如團隊協(xié)作能力、口語表達能力、探索研究自主學習的能力,使他們更喜愛語文課程的學習。學生在考核中完成了活動方案的制作、演講視頻的拍攝、個人營銷等能力展現(xiàn)。

(4)學生成績有所提高,不及格率降低。從三學期的成績統(tǒng)計看來,學生在適應了新的考核方式后,學習興趣增強,學習主動性得到提高,總體成績逐步上升,不及格率較以前有較大幅度的降低。

課程考核是為了了解學生對知識的掌握和運用的教學效果。合理的考核方式能引導學生進行自主的研究性學習,發(fā)揮考試的診斷、評價、反饋、導向和激勵的功能,促進教學改革的深入發(fā)展。因此,我們只要潛心研究,大膽探索,不斷總結(jié)提高,就能摸索出一條適合高職人才培養(yǎng)需求的考核方法,進一步促進我院大學語文教學改革,從而達到我院“給予能力,以人為本”的人才培養(yǎng)目標。

篇10

(一)文件筐測驗的概念

所謂文件筐測驗,也稱公文處理測驗,屬于情景模擬面試方法的一種,是評價候選人能否勝任特定管理崗位的常用情境模擬技術(shù)之一。公務員面試文件筐測驗手段最初來自于企業(yè)選拔領導干部時常用的方法,目前廣泛應用于領導行為、培訓、工作滿意度、績效評估、組織公民行為、組織信息加工、決策、壓力管理、組織氣氛等諸多領域的研究。

公務員面試的主要目的是要考核考生的基本素質(zhì)是否與公務員崗位要求相匹配,尤其要考核考生處理公文的能力。由于申論目前采用提出問題、分析問題與解決問題的模式,在一定程度上不能充分地考核考生處理公文的能力。而文件筐測驗方法則恰恰是針對這一缺陷而設計的面試方法。

在公務員面試中,文件筐測驗往往用于在限定角色、限定時間、限定背景、限定條件的前提下,通過要求考生處理諸如記錄、報告、請示、聲明、通知、總結(jié)、函電函件、備忘錄、待審批簽發(fā)的文件、統(tǒng)計資料和報表等日常公務來考察被試者的計劃、組織、預測、決策和溝通等能力。一般只給日歷、背景介紹、測驗提示和紙筆,考生在沒有旁人協(xié)助的情況下回復函電,擬寫指示,做出決定,以及安排會議。評分除了看書面結(jié)果外,還要求考生對其問題處理方式做出解釋,根據(jù)其思維過程予以評分。

(二)文件筐測驗的特點

文件筐測驗把被試者置于模擬的工作情境中去完成一系列的工作,與通常的紙筆測驗相比,較能反映被試者的真實能力水平。與結(jié)構(gòu)化面試、無領導小組討論等其他測評技術(shù)相比,它提供給被試者的背景信息和測驗材料以及被試的作答都是以書面形式完成的,一方面考慮到被試者在日常工作中接觸和處理大量文件的需要,另一方面也為每一位被試者提供了工作的前提條件和機會相等的情境。文件筐測驗可以同時對大批量的被試者進行測試,這也是其他情境測驗方式所無法比擬的。

文件筐測驗是評價擔任特定職務的管理人員在典型職業(yè)環(huán)境中獲取、研究有關資料、得體處理各類信息、準確做出管理決策、有效開展指揮、協(xié)調(diào)和控制工作能力及其現(xiàn)場行為表現(xiàn)的綜合性測驗。文件筐測驗作為評價技術(shù)手段體系的一個重要組成部分,一直被認為是選拔領域有效的甄選工具之一。與其他面試方法相比,文件筐測驗具有全面性、針對性、準確性、公平性、復雜性、難以把握等特點。

1.全面性

文件筐測驗要求考生在限定條件下,迅速準確地處理一系列公文,這就要求考生必須全面調(diào)動自己的知識儲備與經(jīng)驗積累,不僅僅是要保證公文格式的完整準確,而且還必須能夠?qū)μ囟ㄎ募婕暗谋尘爸R(如業(yè)務知識)、操作經(jīng)驗以及其他能力要素有全面的把握。也就是說,考生在考場強刺激環(huán)境下,必須能夠迅速調(diào)用自己與待處理文件有關的一切要素,才能夠取得優(yōu)秀的成績。而且公文筐測驗是一套公文的組合,可以同時從多個維度上評定一個人的管理能力,這些能力是知識、經(jīng)驗和智力相互作用和整合的結(jié)果,具有綜合性。

2.針對性

結(jié)構(gòu)化面試和無領導小組討論往往存在一個共同的缺陷,即考試題目常常陷入過于抽象、過于籠統(tǒng)、過于概括的境地,這種籠統(tǒng)性使公務員面試的針對性在一定程度上有所弱化。從而導致考試本身的信度與效度也隨之下降,不利于選拔符合職位崗位要求的最佳人選。而文件筐測驗則不同,題目一般都會具有很強的實踐性與操作性,針對某一個或某幾個特定的公務,這些公務都是考生在進入工作崗位之后常常要處理、要面對的公務。考生在考場上的表現(xiàn),在一定程度上能夠反映出考生在進入工作崗位之后的表現(xiàn)。

3.準確性

文件筐測驗最大的優(yōu)點在于其具有較高的表面效度,它模擬的是真實工作情境,測驗材料是實際工作的樣本。作為一種情境模擬技術(shù),文件筐中有的公文材料采用手寫體,有的函件采用報考單位的信箋書寫,這使其具有較好的模擬效果,比傳統(tǒng)的認知測驗和人格測驗更能吸引被試者投入測試,也有利于考官根據(jù)考生的處理態(tài)度、處理方式、處理結(jié)果來直觀而準確地判斷考生潛在的素質(zhì)是否能夠與職位崗位要求形成最佳匹配。文件筐測驗高度仿真和接近管理實戰(zhàn),非常有利于激發(fā)被測評者的積極性和創(chuàng)造性,對于在很短的時間內(nèi)全面、準確掌握管理者的能力、潛能以及個性心理特征的某些關鍵要素具有不可替代的重要作用,是不折不扣的“管理者實戰(zhàn)演習”。兩小時左右的文件筐測驗對被測評者自身綜合素質(zhì)狀況、工作經(jīng)驗積累、專業(yè)知識和相關知識的系統(tǒng)整合與嫻熟應用的考察效果為其他許多人事測驗所望塵莫及。據(jù)統(tǒng)計,歐美發(fā)達國家和日本在選拔、評價管理人員時最常用的技術(shù)就是評價中心,而評價中心中文件筐測驗的使用頻率高達95%。文件筐測驗效度和信度極高(信度相關系數(shù)為0.92)。研究表明文件筐測驗具有良好的內(nèi)容效度。雖然文件筐在測驗過程中采用的是靜態(tài)的考察方式,但是其材料包羅萬象,范圍廣泛,任何靜態(tài)的測評要素,比如背景知識、專業(yè)知識、操作經(jīng)驗以及能力傾向等都可以隱含于文件之中,通過文件處理這種形式對被試者的潛在能力和綜合素質(zhì)進行考察。

文件筐測驗中的成績與實際工作中的表現(xiàn)有很大的相關,對被試者未來工作績效有很好的預測能力,即該測驗具有良好的預測效度。因此,只要被試者能夠妥善處理文件筐中的各類文件,評價者就有理由認為被試者在一定程度上具備了勝任新職位所需要的素質(zhì)。西方有研究者觀察了51人的工作實際績效后發(fā)現(xiàn),工作績效與文件筐測驗之間的相關度高達0.42;還有人發(fā)現(xiàn)文件筐測驗的績效與日后三年內(nèi)的晉升之間的相關度為0.32。

4.公平性

文件筐測評的技術(shù)手段,與其他面試手段不同,它常常采用團體測評的方式。所有考生同時對一個文件筐進行處理。由于這種處理一般都是以書面形式完成的,因此基本上可以排除相互之間的影響和干擾,也排除了結(jié)構(gòu)化面試入場次序不同所導致的不公平現(xiàn)象(比較典型的是:結(jié)構(gòu)化面試中,最后一個入場接受測評的考生,在表現(xiàn)相同的情況下,成績往往會比先入場的考生要低,這與考官的心理變化有關)。與結(jié)構(gòu)化面試考官獨立打分不同,文件筐常常由考官組進行討論之后,才對考生的表現(xiàn)做出綜合評價,這有助于提高公文處理的信度。

5.復雜性

文件筐測驗的復雜性體現(xiàn)在專家命題、培訓考官、考生答題、考官評分整個面試過程。專家在命題的過程中,必須考慮到考生所報考職位的特點與要求,考慮到題目所涉及的公務在日常工作中的代表性與全面性,還要盡可能降低外在因素對準確判斷考生潛質(zhì)的消極影響,很大的題量、很長的考試時間,對考官自身的素質(zhì)提出了較高的要求,采用文件筐測驗,會使得面試時間成倍地增加,也使得面試的成本大大增加,這無疑也加大了面試的難度。

6.評分的困難性

由于文件筐測評具有很強的針對性,因此就不僅僅對考生的素質(zhì)提出了更高的要求,對考官評分的要求也大大提高。在我國公務員面試中,考官組成的規(guī)則決定了同一個考官要對大量報考不同部門不同職位的考生進行面試與測評。而不同部門、不同職位所面臨的日常公文又具有一定的區(qū)別,考官很難對所有部門與職位的日常工作都相當了解,加之個人素質(zhì)、機構(gòu)性質(zhì)、工作理念的差異,使得文件筐測評從工作分析、能力分析到選擇材料、題目成型,都存在著較大的困難。

一份文件的處理,除了個人素質(zhì)的原因外,機構(gòu)、氛圍、管理觀念等不同的組織,具有不同的評價標準。顯然政府機關與公司企業(yè)、私營企業(yè)與國有企業(yè)對有關文件的處理是大相徑庭的。在我國從事實際工作的人們往往缺乏對招聘單位管理或經(jīng)營狀況的深入了解,因而文件如何處理才能充分表明考生具備招聘職位所需素質(zhì),專業(yè)人員與實際工作者往往存在理解上的差異。因此,評分不容易把握。

二、文件筐測驗的題目編制

文件筐測驗的題目編制與結(jié)構(gòu)化面試大同小異,除了共性之外,其題目編制還有以下幾個特點:

(一)工作分析

工作分析是文件筐測驗題目編制的第一步,也是文件筐測驗題目編制的根本指針。命題人需要根據(jù)招考職位說明書,對各個與文件筐測驗相關職位工作的特點、必備的知識、經(jīng)驗、能力進行充分的調(diào)研了解,以便題目的編制能夠充分體現(xiàn)出招考職位的素質(zhì)要求。工作分析的方法可以是面談、現(xiàn)場觀察或問卷。通過工作分析,命題人基本上可以確定文件筐測驗需要測評哪些要素,各個要素能夠得到測評的程度以及所占權(quán)重。

文件筐測驗一般可以考查以下要素:

1.書面表達及其理解;

2.統(tǒng)籌計劃能力;

3.組織協(xié)調(diào)能力;

4.洞察問題和判斷、決策能力;

5.任用授權(quán)能力;

6.指導控制能力;

7.崗位特殊素質(zhì),如法規(guī)條例知識。

(二)文件設計

在進行了充分的職位調(diào)研,確定需要測評的要素及所占權(quán)重之后,命題人就需要進行文件設計的工作。文件設計工作的第一步,是選擇文件種類,例如報表、備忘錄、批示、請示、信函、通知、報告等。一般情況下,命題人可以選擇其中的一個文件種類,如統(tǒng)計報告,也可以選擇幾個文件種類進行組合式命題。文件設計工作的第二步,是確定每個文件的具體內(nèi)容,如文件假定的背景(包括考生的身份設定、考生所處場景),文件的具體要求、具體格式,工作的具體內(nèi)容。如果文件數(shù)量較多,則時間以2~3小時為宜。文件的簽發(fā)方式及其行文規(guī)定可以忽略,但文件的行文方向(對上與對下,對內(nèi)與對外等)應有所區(qū)別,特別要注意各個文件測評要素的設計。一個文件不同的處理常??梢泽w現(xiàn)不同的要求,對文件的處理方式要有所控制,確定好計分規(guī)則或計分標準,要求測評要素與評分標準做到一一對應,須盡量避免一個測評要素對應兩個及兩個以上評分標準,或者測評要素與評分標準無法對應的現(xiàn)象。

整個文件筐測驗的設計要特別注意兩點:

一是測驗材料難度的把握。目前國內(nèi)對各個職位應具備何種程度的知識、經(jīng)驗和能力缺乏客觀可靠的依據(jù),難度的把握比較困難。把握不準,材料過易或者過難,都容易導致考試成績?nèi)狈茖W的區(qū)分度,不利于選拔最優(yōu)秀的人才。

二是要注意材料真實性程度的把握。完全杜撰的材料,考生可以根據(jù)一般知識推理,處理的結(jié)果沒有針對性,看不出考生的水平差異,考生被錄取后需要經(jīng)過較長時間的培訓和適應才能勝任工作。完全真實的材料,過于偏重經(jīng)驗的考查,忽視潛能的考查,最后選拔到的人無疑是完全與招聘單位文化氣氛相同的人,違背了引入外來人才、給單位輸入新鮮血液的本來目的。同時完全真實的材料,使招聘考試本身對單位內(nèi)部考生和單位外部考生不公平,同樣的能力水平,內(nèi)部考生被錄取的可能性更大,結(jié)果給人留下“一切都是內(nèi)定,考試不過是走形式”的印象,這對真正想引進外部人才的單位尤其不利。

三、文件筐測驗的實施

文件筐測驗可以單獨測試,但為了節(jié)約時間和成本,也可以集體施測,實施過程分準備、測試和評分三個步驟。

1.準備

主要指測驗材料和測試場所的準備。給每個考生的測驗材料,事前要編上序號,答卷紙也要有相應序號,實施前要注意清點核對。答卷紙主要由三部分內(nèi)容構(gòu)成:一是考生姓名(或編號)、應聘單位和職位、文件序號等;二是處理意見(或處理措施)、簽名及處理時間;三是處理的理由。文件序號只是文件的標識順序,不代表處理的順序,應允許考生根據(jù)輕重緩急調(diào)整順序,但給所有考生的文件順序必須相同,以示公正。測試的場所要求比較寬敞、安靜,每個人一桌一椅,相互之間無干擾。為了保密,最好所有考生在同一時間完成。如果文件內(nèi)容涉及到招聘單位內(nèi)部的一些情況,測試前應對所有考生提供培訓,介紹相關情況,縮小內(nèi)部考生和外部考生對職位熟悉程度的差別。

2.實施