圖片來源:攝圖網(wǎng)
職業(yè)教育要滿足企業(yè)需求和促進學生發(fā)展的雙重目的,其學業(yè)評價更為復雜。當前職業(yè)教育學業(yè)評價存在課程評價脫離實踐、技能考核缺乏規(guī)范、職教高考科學性不足等問題,社會發(fā)展拓寬了技能的內(nèi)涵,具有職教特色的學業(yè)評價呈現(xiàn)出技能考試正向職業(yè)能力測評方向發(fā)展,評價方法多元化成為趨勢等特征,未來更多會采用事實性標準與個性化標準相結(jié)合,量化評價方法占主導地位,質(zhì)的方法成為重要補充。
一、學業(yè)評價方法:一個被忽視的重要領(lǐng)域
科學的評價對職業(yè)教育的健康發(fā)展具有重要意義。中共中央、國務院2020年印發(fā)的《深化新時代教育評價改革總體方案》(以下簡稱《改革方案》),提出建立富有時代特征、彰顯中國特色、體現(xiàn)世界水平的教育評價體系的奮斗目標。針對學業(yè)評價,《改革方案》提出完善“學生學業(yè)要求”“過程性考核與結(jié)果性考核有機結(jié)合的學業(yè)考評制度”以及“高等職業(yè)教育‘文化素質(zhì)+職業(yè)技能’考試招生辦法”等多方面的任務,這對職業(yè)院校學業(yè)評價工作提出了更高的要求。
學業(yè)評價是指以教育教學目標為依據(jù),運用恰當、有效的工具,系統(tǒng)收集學生在學習過程中認知、行為變化的信息和證據(jù),根據(jù)一定標準對學生的知識、技能和能力水平做出客觀衡量和科學判定的過程。合理的學業(yè)評價要體現(xiàn)黨和國家的教育方針,尊重和體現(xiàn)學生的個體差異,激發(fā)學生努力實現(xiàn)自身的價值。
普通教育學業(yè)評價相對簡單,通常根據(jù)課程標準規(guī)定的學習目標,采用相應測量工具進行,如標準參照性測驗和成就測驗等。職業(yè)教育既要符合勞動力市場的功利性要求,又要實現(xiàn)促進學生生涯發(fā)展的教育性目的,其學業(yè)評價更為復雜和多樣,除了課程考試外,還有技能競(大)賽、對口升學考試和職業(yè)能力測評等多種形式。
與普通教育相比,職業(yè)教育學業(yè)評價結(jié)果的影響也更大,它直接影響著學生的升學和就業(yè)、影響著企業(yè)員工招聘以及職業(yè)院校的發(fā)展。目前職業(yè)教育的學業(yè)評價在方法層面尚存不少問題,主要表現(xiàn)在:
(一)傳統(tǒng)學歷教育的課程評價因脫離實踐而受詬病
院校內(nèi)的科目考試缺乏可比性,一些地區(qū)通過專業(yè)測評建立教學質(zhì)量監(jiān)控系統(tǒng),也遇到方法的科學性和經(jīng)費可及性等困難,即便是發(fā)達地區(qū)也是如此。如,廣州教育局曾在所屬職業(yè)學校針對開設最多的10門專業(yè)基礎(chǔ)課和2門專業(yè)核心技能課進行監(jiān)測,監(jiān)測科目也僅覆蓋全部課程的18%,但仍難以全面反映學生的綜合學業(yè)成績,后未能堅持下來。
(二)X技能等級證書缺乏規(guī)范的技能考核方法
對已發(fā)布的X職業(yè)技能等級標準進行文本分析發(fā)現(xiàn),目前社會評價組織對技能評價方法的科學性尚不敏感,采用的評價方法有些強調(diào)操作技能考試(如特殊焊接技術(shù)),有些只提知識考核(如失智老年人照護),有些盡管關(guān)注理論和實踐相結(jié)合但依然采用筆試形式,實操考試也有筆試、網(wǎng)絡考試等多種方式,一些證書甚至沒有提出明確的考核評價方法。
(三)職教高考科學性不足,“指揮棒”作用有待優(yōu)化
在各地開展的職教高考中,技能考試多針對特定的操作活動,關(guān)注技能的熟練度和可測量性,對該項技能對整體職業(yè)能力的甄別和促進作用以及未來工作中的普適性則少有系統(tǒng)考量,且標準含糊,打分隨意;專業(yè)課考試命題缺乏行業(yè)和考試專家參與,難以保證考試效度和區(qū)分度。由于缺乏有效的技能測試,很多職教高考的內(nèi)容主體仍然是文化課和專業(yè)理論,這既無法反映行業(yè)企業(yè)的用人需求,也背離了職業(yè)教育宗旨,造成職業(yè)院校對專業(yè)技能教學的不重視。
(四)技能大賽也存在評價效度問題
調(diào)查發(fā)現(xiàn),有的技能大賽獲獎畢業(yè)生職業(yè)發(fā)展后勁不足,其綜合素質(zhì)與沒有參加競賽的其他同學相比甚至處于劣勢。這說明,如果評價方式有缺陷,技能大賽也無法實現(xiàn)促進人才培養(yǎng)質(zhì)量提高的初衷。個別省份開展的技能抽查的科學性問題就更多了。
圖片來源:圖蟲創(chuàng)意
鑒于職業(yè)教育學業(yè)評價的難度,很多地區(qū)把文化課統(tǒng)考作為職業(yè)院校(特別是中職)學業(yè)評價的主要方式,這勢必造成職業(yè)教育“去職業(yè)化”趨向,在此美國提供了前車之鑒。2002年,布什政府推出《不讓一個孩子掉隊法案》,試圖解決美國中小學教育質(zhì)量低下的問題。該法案的實施,提高了學生尤其是處境不利學生的閱讀和數(shù)學成績,但是大大削弱了職業(yè)課程,很多學校放棄了非考試科目課程,其中就包括職教課程,導致美國中等職業(yè)教育事實上的“消失”。目前,強調(diào)文化課統(tǒng)考的《不讓一個孩子掉隊法案》已經(jīng)被《每一個學生成功法案》取代,提出在基礎(chǔ)教育階段重新發(fā)展多樣化的課程(包括生涯與技術(shù)教育),這為美國重振中等職業(yè)教育提供了可能。
綜上所述可以發(fā)現(xiàn),在職業(yè)教育質(zhì)量保障體系建設過程中,開展科學、規(guī)范且實施便捷的學業(yè)評價的難度長期被低估,這也凸顯了《改革方案》的及時性和重要性。職業(yè)教育學業(yè)評價必須反映技術(shù)技能人才的發(fā)展性目標和職業(yè)規(guī)范的雙重要求,這對評價方法提出了巨大挑戰(zhàn)。本文探討具有職業(yè)教育特色的學業(yè)評價的方法性特征,以期引發(fā)進一步討論并為具體評價方案設計提供理論基礎(chǔ)。
二、職業(yè)教育的經(jīng)典學業(yè)評價模型:柯氏評價
職業(yè)教育是賦予學習者從事某種職業(yè)性工作所需能力的教育,其學業(yè)評價必須考慮教學內(nèi)容與職業(yè)活動之間的緊密聯(lián)系。學習成功與否,最終只能在真實的職業(yè)工作實踐中衡量,需要結(jié)合實際工作績效表現(xiàn)。按照判據(jù)、表達方式等評價要素的要求,職業(yè)教育學業(yè)評價的對象不僅包括學習收獲,也涉及學習者在企業(yè)工作中的績效水平,在此,經(jīng)典的“柯氏評價理論”具有重要的意義。
1959年,柯克帕特里克(D.L. Kirkpatrick)圍繞培訓過程中的反應、學習、行為和結(jié)果發(fā)表了4篇文章,確定了職業(yè)教育學業(yè)評價的四個基本層次。
一級評價為學員反應,即課程結(jié)束時進行學生滿意度調(diào)查,對所學知識技能在將來工作中的有用性進行展望,但這尚未涉及真正的學習結(jié)果。
二級評價針對學習效果,通過學習過程記錄、學習結(jié)果測試等方式確定學習者學習結(jié)束后在知識、技能和工作經(jīng)驗等方面提高的程度,對課程目標的達成情況進行確認。
三級評價在學習結(jié)束一段時間后進行,確定學習者行為轉(zhuǎn)變的程度。這些數(shù)據(jù)的獲得比較困難,需要一定外部條件,如真實的工作情境和工作條件等;評價方法也更為復雜,常常需要正式測評和非正式方式(如現(xiàn)場觀察)相結(jié)合。
四級評價針對績效實現(xiàn)情況,即學習者因參加教育培訓后實現(xiàn)的最終結(jié)果,強調(diào)因?qū)W習而產(chǎn)生的績效提高,如生產(chǎn)服務質(zhì)量改善和效率的提高,包括精神方面的影響,常見的如對口就業(yè)率調(diào)查和畢業(yè)生發(fā)展跟蹤調(diào)查。四級評價之間的關(guān)系如圖1所示。
三、四級評價需要在企業(yè)和勞動市場中了解職業(yè)教育對學習者發(fā)展的促進作用,經(jīng)費和時間花費較大,操作起來也很困難,有時甚至具有科研性質(zhì),但是由于體現(xiàn)了職業(yè)教育的最高宗旨,因此具備更強的說服力。孫鈺林曾以養(yǎng)老服務專業(yè)為例,對傳統(tǒng)實操考試對學習者工作績效的預測效度進行研究。
結(jié)果發(fā)現(xiàn),職業(yè)院校普遍采用的實操考試的成績(二級評價)并不能預測未來的工作績效水平(四級評價),其相關(guān)系數(shù)僅為0.01。這說明,四級評價中的每一級評價都有必要。從方法上講,評價結(jié)果只有在下一級評價中得到驗證才有實際意義,評價方法必須進行科學設計,以確保評價的質(zhì)量,即所謂信度、效度、區(qū)分度和客觀性等要求。但是柯氏評價缺乏對教育規(guī)律的考慮,不涉及學習者的能力發(fā)展和素質(zhì)提高過程,因此無法獨立承擔起職業(yè)院校學生學業(yè)評價的重任。
三、學業(yè)評價方式:職業(yè)技能考試和職業(yè)能力測評
職業(yè)院校學生學業(yè)評價離不開對學生職業(yè)能力或技能水平的評價,其基本方式是技能考試和職業(yè)能力測評。
(一)技能考試
不同國家技能考試制度不同,但大多都會采用“知識+實踐技能”考核方式。我國的職業(yè)技能等級(資格)鑒定考試一般也分為理論和實踐考核兩部分,采用紙筆測試、現(xiàn)場考核、典型作業(yè)、模擬操作等形式。技能主要采用專家觀察評分法確定;對職業(yè)規(guī)范和工作道德等隱性范疇的內(nèi)容,則通過對工作過程和工作結(jié)果的觀察進行考評。國外研究發(fā)現(xiàn),目前技能評價中普遍采用的標準化考試的職業(yè)效度并不高,因為企業(yè)真實的生產(chǎn)服務活動不是簡單的操作或線性過程,不能簡單按照“對—錯”標準或“投入—產(chǎn)出”關(guān)系來衡量。
技能大賽是一種社會關(guān)注度高和高利害性的、特殊的技能考試,不同大賽在賽項設置、評分標準等方面有所不同。職業(yè)院校技能大賽常圍繞教學標準及生產(chǎn)技術(shù)設置賽項,強調(diào)工藝難度,這與世界技能大賽有較大區(qū)別;世界技能大賽被認為對專業(yè)技術(shù)水準和職業(yè)素質(zhì)能夠進行更為全面檢驗,實施成本高昂,但是如果其試題轉(zhuǎn)化應用得好,可以為職業(yè)教育的高質(zhì)量發(fā)展提供有效的借鑒。
當今社會,技術(shù)發(fā)展對傳統(tǒng)的技能考試產(chǎn)生了重要影響。人們發(fā)現(xiàn),除了特別簡單動手操作行為外,采用主觀性較強的觀察法對復雜技能評價的結(jié)果的信度很低,因此發(fā)達國家技能考試出現(xiàn)的一個共同趨勢是采用“表現(xiàn)性評價”,即考生“在特定情境中運用獲得的知識完成某項任務,以考查其知識技能掌握程度,或問題解決、交流合作和批判性思考等多種復雜能力的發(fā)展狀況”。
此外,技能的含義也得到了很大拓展,人們更加強調(diào)應用知識完成任務和解決問題的能力?!秶衣殬I(yè)教育改革實施方案》(以下簡稱“職教20條”)明確指出職業(yè)技能等級證書要“反映職業(yè)活動和個人職業(yè)生涯發(fā)展所需要的綜合能力”,這說明在“1+X”技能證書制度設計中,“技能”和“能力”已經(jīng)幾乎成為同義詞,意味著職業(yè)技能正在發(fā)展成為更強調(diào)認知和綜合性的職業(yè)能力。此外,傳統(tǒng)的技能考試費時費力,特別是在開展大規(guī)模的技能測試時,要想達到較高的信度和效度要求,測試費用和人員投入會高到令人無法接受的地步。因此,很多(大規(guī)模)職業(yè)技能考試需要向成本較低的職業(yè)能力測評方向發(fā)展。
(二)職業(yè)能力測評
職業(yè)能力測評旨在評價應用知識技能解決實際工作中的問題的能力,它與職業(yè)技能考試的區(qū)別在于:考試針對教學(或職業(yè))標準,考察對學習內(nèi)容的掌握程度,一般有對錯之分,反映教學標準的效度;能力測評評價與特定工作相關(guān)的認知特征和認知水平,考察實際工作能力,只有能力水平高低之分而沒有標準答案,反映職業(yè)要求的效度。
職業(yè)能力測評的基本功能是將能力發(fā)展的實際水平及時反饋給教師和學生,幫助其處理學習過程中發(fā)生的問題并進行過程優(yōu)化,是鼓勵先進、鞭策后進和調(diào)動學習積極性的手段。當今社會對技術(shù)技能人才的全面發(fā)展和綜合性要求越來越高,技能工作者必須有能力(參與)設計工作計劃,按照經(jīng)濟性、創(chuàng)新性和環(huán)境可持續(xù)發(fā)展等綜合性要求對工作的過程和成果進行評價??茖W的能力測評要用整體化觀念看待職業(yè)能力,不但針對工作任務的完成情況,而且還關(guān)心學生是否能夠?qū)ぷ鬟^程和工作成果進行反思和改進,應加強對諸如技術(shù)敏感性和創(chuàng)新性等高層次實踐能力的評價,促進學生的“價值理性”和“事實性評價能力”的發(fā)展。
從宏觀管理角度看,如果對職業(yè)院校學生進行的能力測評能夠達到大規(guī)模質(zhì)量監(jiān)測的信度和效度要求,就可以藉此進行校際甚至區(qū)域間的比較,并對不同學校人才培養(yǎng)過程的優(yōu)劣進行分析和解釋,從而為政府的科學決策提供實證基礎(chǔ)。在此,需要研究和開發(fā)基于先進學習理論(如建構(gòu)主義和情境學習理論等)的、技能考試與職業(yè)能力測評相互補充的、反映綜合能力評價要求的、具有高預測效度的評價模型和評價實施方案,并為職業(yè)院校和技能評價組織設計和實施高質(zhì)量的評價提供實操性的工具和實踐經(jīng)驗。
圖片來源:圖蟲創(chuàng)意
四、學業(yè)評價標準
個體的學業(yè)成就是學習過程的產(chǎn)出或結(jié)果,學業(yè)評價旨在對學習者的學業(yè)成就水平的高低(學習績效)進行判定和分級,處于某一級別的人必須滿足相關(guān)標準的質(zhì)量要求。標準是判斷質(zhì)量優(yōu)劣和滿意程度的門檻性要求,可以是一種標桿、價值取向或一項最佳成就記錄,如精確性、準確性或與某一樣板(人或事)的相符程度。
在教學實踐中我們看到,很多教師往往寄希望于制定絕對“科學合理”的標準,這個目標可能永遠也無法實現(xiàn)。萊茵伯格(F. Rheinberg)將學業(yè)成就評價標準分為三類,即事實性標準、社會性標準和個性化標準,在此基礎(chǔ)上可以界定具體評價指標,其中只有事實性標準屬于客觀標準。
(一)事實性標準
事實性標準是教學標準(或職業(yè)標準)中規(guī)定和描述的能力要求,藉此可以對學習結(jié)果進行客觀評價。事實性標準的優(yōu)點是:評價結(jié)果與教學標準要求的關(guān)系清晰可見,可以明確判斷是否達到了最低要求,從而權(quán)威性地證明達到了某一特定要求(如技能等級)。事實性標準可幫助學生進行目標導向和自我管理式學習,但是無法讓老師了解學習難度,對學生的進步也不敏感。另外,工作世界經(jīng)常很難嚴格和客觀定義什么是優(yōu)秀、良好或者及格(如很多服務和技術(shù)過程無法精確評分)。如果學校對學生的成績分布有要求(正態(tài)分布)時,教師還必須根據(jù)社會性標準對考試分數(shù)進行修訂,這不但造成結(jié)構(gòu)性困難,而且容易引發(fā)矛盾,并為教學設計帶來困難。
(二)社會性標準
社會性標準是與他人對比時學生表現(xiàn)出來的績效差異,即學生在一個團體中的相對水平。社會性標準的最大優(yōu)點是能夠識別表現(xiàn)相對較好和較弱的學生,確定能力差異,為開展個性化教學提供基礎(chǔ)。其局限性是:可比性只是在特定的團體內(nèi)有效(班級內(nèi)部標準)。由于看不到全體成員的共同變化,所確定的成績有可能掩蓋全體成員的共同努力或相同的退步,掩蓋事實性標準的實現(xiàn)程度,以至失去標準本來的理性和可信度。社會性標準無法精確確定考生的分數(shù),這有可能對學習動機造成消極的影響。
(三)個性化標準
個性化標準是與自己的過去進行比較,由此追蹤學生的學習和成長過程。個性化標準的優(yōu)點是:無論是好的還是差的學生都能確定自己的學習狀態(tài),自身努力與學習成就間的關(guān)系清晰可見,不同階段的績效波動可以可視化,這有利于提高學習者的學習動機。采用個性化標準,后進生不會受到優(yōu)秀同學的打擊,而優(yōu)秀學生也可以與“過去的自己”相比較。但是個性化標準弱化了學生之間確實存在的差異,使學生失去客觀評價自己的信息源,不適合評價外部有特定要求的領(lǐng)域(如入學考試和職業(yè)資格考試)。
綜上所述,每種評價標準都有自己的優(yōu)勢和“盲點”,不可能滿足學業(yè)評價的所有要求,教師在實踐中需要利用多種標準并相互補充,學生也應學會利用各種標準進行自我評價。理想的狀態(tài)是,個性化標準發(fā)揮主導作用,但又不忽略其他標準提供的信息;事實性標準與個性化標準相結(jié)合,是未來職業(yè)教育學業(yè)評價發(fā)展的趨勢。
圖片來源:圖蟲創(chuàng)意
五、學業(yè)評價的方法
根據(jù)不同的背景、需求和目標,學業(yè)評價會采用不同的方案,這涉及不同設計理念、數(shù)據(jù)收集、分析和結(jié)果解釋的方法。學業(yè)評價有多種分類方法,本文不進行分類學研究,只討論若干重要問題。
(一)量化測評
19世紀中葉人們開始進行大規(guī)模的學業(yè)成就測驗,其標志性事件是賴斯(J. Rice)對33000名學生進行的拼寫能力調(diào)查。20世紀30年代,“評價之父”泰勒(R.W. Tyler)采用實驗設計模式對教學改革成果進行比較分析,量化評價方法成為學校教育最重要的學業(yè)評價方法。
職業(yè)教育中采用的量化評價有能力傾向測試、學習成就測試、人格測試和能力測評等多種方法。其中,能力傾向測試對個人的潛在能力進行評價,預測個體能力未來發(fā)展傾向;學習成就測試對個體的學業(yè)成就進行測試,典型的如考夫曼教育成就測驗-II(KTEA-II);人格測試通過特定測試量表(如明尼蘇達多相人格調(diào)查表、艾森克人格問卷等)對個體的心理特征進行測試,如興趣、動機、態(tài)度、氣質(zhì)和性格等;能力測評方法很多,既有單項能力測評方法,也有綜合能力測評方法,如BCI方法通過性格問卷對個人能力、自我組織和自我控制能力進行診斷評價,基于等級描述分類的混合式能力評價方法SOLO(Structure of the Observed Learning Outcome)通過解答問題的表現(xiàn)特征對人的思維發(fā)展進行可視化分析。
量化方法可以避免考官個人主觀因素對評價結(jié)果的影響,對促成目標達成有較好效果,因此在學業(yè)評價中發(fā)揮著重要作用。但是科學的量化評價模型很難建立,這極大地影響了評價結(jié)果的說服力,而且這些方法在過程性評價中的使用效果往往也不理想,采用互動性更強的質(zhì)性方法更容易深入理解和解釋被觀察的現(xiàn)象。
(二)質(zhì)性評價
人力資源管理最先開始采用基于勝任特征模型的質(zhì)性評價方法,如“工作勝任力測評法”(Job Assessment Method,JACM)和“行為錨定修正法”(Modified Bars Method)等。這些方法建有能力模型,但是沒有量化工具和流程,致使操作靈活性很大甚至過大。德國開發(fā)實施了數(shù)十種職業(yè)能力測評方法,其中有很多是質(zhì)性方法,如行動導向測評方法、單項技能評價方法和能力總結(jié)與匯總方法(Competence balance)等。
我國一些職業(yè)院校采用類似方法進行形成性評價,如北京市商業(yè)學校以職業(yè)素養(yǎng)學分和證明、證章評價方式,記錄學生在思想品德、技術(shù)技能、文化藝術(shù)、體育科技等方面取得的成績,在此基礎(chǔ)上給學生頒發(fā)“職業(yè)素養(yǎng)護照”。蘋果公司A+雛鷹計劃在其試點院校校企合作學徒培養(yǎng)中建立“學習檔案”(Portfolios),有意識地搜集證據(jù),記錄和反省自己在某一領(lǐng)域的進步,用可靠的證據(jù)記錄學生取得的進步并獲得成績。
質(zhì)性方法的主要缺陷是結(jié)果的可比性較差。由于對學生的行為描述、分類、選定能力指標和確定界別的難度大,此類方法對評價人員的專業(yè)要求也很高。此外,如果被評價者過于謙虛、夸張或不誠實,評價結(jié)果的可信度也會有問題。
(三)混合式評價
職業(yè)能力是個體從事一個職業(yè)時的心理認知特性,波蘭尼“隱性知識”理論被廣泛接受,間接否定了按照行為主義理念采用純量化方法進行能力測量的合理性,量化與質(zhì)性相結(jié)合的混合式方法成為發(fā)展方向,國際有影響的職業(yè)能力評價方法均據(jù)此建立技能模型和測評模型。
21世紀初開始的PISA等大規(guī)模教育測評項目引發(fā)了全球?qū)β殬I(yè)教育質(zhì)量評價方式的討論。討論取得的一個共識是職業(yè)教育質(zhì)量控制應實現(xiàn)從“投入導向”向“結(jié)果導向”的范式轉(zhuǎn)變,而作為學業(yè)成就標志的職業(yè)能力是職業(yè)教育最重要的“結(jié)果”。
圖片來源:Unsplash
COMET(Competence Measurement)職業(yè)能力測評是世界上第一個真正實施的大規(guī)模職業(yè)能力診斷工具,它基于“從初學者到專家”的能力發(fā)展邏輯,建立包含“級別”“內(nèi)容”“行動”三個維度的跨職業(yè)能力模型,采用開放性測試題目,確認被測學生的職業(yè)能力發(fā)展級別,即名義能力、功能性能力、過程性能力和設計能力。教育部督導局在開發(fā)《高等職業(yè)教育專業(yè)評價試點方案》時采用了COMET方案,對三個代表性省份物流管理等四個專業(yè)的高職學生試驗性的能力測評。結(jié)果顯示,COMET能力測評可以較好確認不同院校學生的職業(yè)能力發(fā)展水平,其開放性測試題目不但被企業(yè)認可,也廣受學生歡迎。
COMET能力測評不僅適合宏觀層面和中觀層面的學生學業(yè)評價,對不同院校的教學質(zhì)量進行比較,也適合微觀層面的教學評價,對教師的教學設計提供指導。COMET還被工業(yè)與信息化部以及世界技能大賽和“一帶一路”技能大賽等不同的技能評價工作采納。在設計能力測評實施方案需要特別考慮的是,哪些評價手段既能獲得大量深入和有效的數(shù)據(jù),而不會產(chǎn)生過多的經(jīng)費和時間投入。在此需要解決的關(guān)鍵問題,一是關(guān)于產(chǎn)出和投入的因果關(guān)系分析,二是具體評價工具的開發(fā),包括測試題目類型的研究等。
(四)診斷性評價
“診斷”的概念起源于醫(yī)學,本義是通過特定的工具檢查病人的病癥,并有針對性地開具處方。布魯姆(B. Bloom)最先在教育領(lǐng)域提出“診斷性評價”概念,指在學習開始之前對學習者現(xiàn)有水平進行評價,強調(diào)預防性的“事前行為”。診斷性評價是內(nèi)部評價方法,其最大特點是采用“協(xié)商模式”,即相關(guān)人員共同協(xié)商裁定和解決相關(guān)問題,從而提高評價結(jié)果使用的可能性。診斷不是簡單的現(xiàn)狀描述,而是通過獲得足夠深入的信息,揭示學習中存在的問題及其成因,并通過制度化的措施形成持續(xù)改進的機制。
進入21世紀,診斷成為引領(lǐng)學校建構(gòu)反思意識、發(fā)現(xiàn)問題、提高效能、促進自主發(fā)展的新型教育技術(shù),特別是教育部通過促進建立職業(yè)院校“教學診改”機制的行政措施,使這一思想得到了普及。值得注意的是,診斷不僅僅是收集數(shù)據(jù),更重要的是使利益相關(guān)者都參與到診斷過程中,共同發(fā)現(xiàn)問題、尋找解決策略并實施改進。
學業(yè)成就的診斷性評價是采用量化或質(zhì)性工具,根據(jù)職業(yè)教育利益相關(guān)者的共同訴求(“會診”)對學生在學習中取得的成果和存在的問題(“病情”)進行多維度分析,確認和總結(jié)原因(確診“病因”),并提出解決策略(“開處方”),從而提高學習者的學習能力,以取得更大成功(“健康”)。
六、總結(jié)與展望
鑒于職業(yè)教育學業(yè)評價的復雜性,簡單一種或幾種評價方法都不可能完全滿足所有評價目的的要求,評價方法的多元化成為必然的發(fā)展趨勢??v觀人類歷史,教育評價理念和方法論發(fā)展經(jīng)歷了“科學主義”“人文主義”和“后現(xiàn)代主義”三個階段,這對職業(yè)教育學業(yè)評價方法發(fā)展也有重要的啟發(fā)。
19世紀科學技術(shù)發(fā)展取得了輝煌的成就,其強調(diào)證據(jù)、關(guān)注邏輯和量化設計的認知范式影響著評價方法的發(fā)展?;跊Q定論思想的“科學主義”教育評價通過“科學”手段和量化方法收集信息,形成對評價對象的認識并由此了解事物的“本來面貌”,此類評價強調(diào)量化指標和統(tǒng)一標準,注重外部評價,但是對情感態(tài)度和創(chuàng)造力等主觀因素的評價有很大局限。
20世紀中葉,秉承多元化觀點的人文主義者發(fā)展了質(zhì)性評價方法。據(jù)此,評價不局限于針對純粹的客觀事實,也關(guān)注意義、價值和情感等主觀因素,管理者的授權(quán)、團體凝聚力和合作思想同樣重要。斯塔弗而比姆(D. Stufflebeam)建立的CIPP評價模式就是這種思想的集中反映,即關(guān)注評價的背景(Context)、投入(Input)、過程(Process)和產(chǎn)出(Product),考慮主觀經(jīng)驗在評價中的作用,強調(diào)描述性的定性分析。
進入21世紀,后現(xiàn)代主義思想注意到科學主義和人文主義評價觀的優(yōu)勢和不足,開始弱化量化分析而重視知識建構(gòu)、應用條件以及由此帶來的差異,由此提高了質(zhì)性方法的價值,典型代表是第四代評價、參與式評價和授權(quán)評價理論。第四代評價關(guān)注社會的多元化現(xiàn)實和多元利益主體的需求;參與式評價立足行動研究,強調(diào)促進公民參與評價;授權(quán)評價則進一步發(fā)展了參與式評價,為利益相關(guān)者提供操作性工具,通過討論過程的量化和可視化實現(xiàn)質(zhì)性與量化評價的融合,即混合式評價。按照庫克(T.D. Cook)的后實證主義多元化評價理論,高質(zhì)量的評價應提倡利益相關(guān)者的多元參與、對相互矛盾的數(shù)據(jù)進行分析和解釋,強調(diào)動態(tài)建模,并關(guān)注不同情境和時間段的評價結(jié)論的可推廣性。
在現(xiàn)代職業(yè)教育中,學生學業(yè)成就的獲得是個性化過程,學業(yè)評價要為學生提供差異化和多樣化的啟發(fā),這需要改變傳統(tǒng)的認知導向、僅強調(diào)產(chǎn)出的評價方式。按照后現(xiàn)代主義評價理念和現(xiàn)代學習理論,學業(yè)成就在很大程度上是“人為的設計”的,并沒有一定要遵循的固定標準和特定答案,而更多要通過與參與者的協(xié)商和對話來確定。職業(yè)教育學生的學業(yè)成就有多種表現(xiàn)形式,可通過工作過程和產(chǎn)品展示,通過再現(xiàn)、重組、遷移和解決問題展現(xiàn),也可表現(xiàn)為創(chuàng)造性、社會性、認知性、生產(chǎn)性和行動導向的工作績效。學業(yè)評價過程應當嵌入在工作和學習過程中,這既有對個體的評價,也有對集體的評價,需要參與者相互信任和團結(jié)合作。學業(yè)成就具有價值取向,學業(yè)評價需要參與者的理解和反思;學業(yè)評價還要確定學生的發(fā)展?jié)摿托枰鉀Q的問題,這需要通過機構(gòu)化和系統(tǒng)化的支持,幫助學生解決自己所特有的問題。
目前我國職業(yè)教育學業(yè)評價的基礎(chǔ)仍然是共享價值觀,價值多元化還沒有受到足夠的重視。隨著現(xiàn)代職業(yè)教育和終身學習體系的建立,以及受教育者的多樣化(如高職擴招)發(fā)展,未來應當承認和尊重不同的取向和要求,職業(yè)教育學業(yè)評價也會出現(xiàn)從外部評價轉(zhuǎn)向內(nèi)部診斷,從一元控制走向多元治理。盡管量化評價方法仍然會占據(jù)主導地位,但質(zhì)的方法會成為重要的補充。
總之,應關(guān)注傳統(tǒng)考試存在的理念和技術(shù)問題,如果缺乏現(xiàn)代教育理念和教育測量理論的指導,不關(guān)心測量的技術(shù)指標,學業(yè)評價就無法支撐高質(zhì)量職業(yè)教育體系的發(fā)展。我們需要加強相關(guān)研究和實踐探索,如關(guān)注綜合職業(yè)能力發(fā)展,這意味著不僅要評價動手操作技能,而且還需關(guān)注認知和精神運動領(lǐng)域的內(nèi)容。
按照情境學習理論,專業(yè)實踐能力只能在特定的工作情境中被調(diào)查和獲知,需要采用案例分析或民族志方法;指導實踐的知識只能在特定情境下才能被辨識,對專業(yè)能力的評價需要在真實的工作情境中、以完成典型工作任務的考核方式進行,高技能人才評價需要更為復雜的考核方法。這里最大的困難是開發(fā)情境性考試題目,即有助于確立工作能力的標準化案例性任務,它既要反映重要的企業(yè)實踐價值,又要能藉此評判被試者職業(yè)能力的高低。例如,廣州市將世界技能大賽標準轉(zhuǎn)化為技能人才標準,通過產(chǎn)教融合方式開發(fā)高新技術(shù)領(lǐng)域的新賽項,不但滿足了高技能人才培養(yǎng)和評價要求的“實用性目標”,而且有效促進了學生創(chuàng)新能力的發(fā)展,踐行了職業(yè)教育立德樹人,培養(yǎng)具有職業(yè)素養(yǎng)和領(lǐng)域特長的、德智體美勞全面發(fā)展的社會主義接班人和勞動者的要求。
本文轉(zhuǎn)載自微信公眾號“中國職業(yè)技術(shù)教育“(ID:JournalCVATE),作者趙志群。本文摘自《中國職業(yè)技術(shù)教育》2021年第10期。文章為作者獨立觀點,不代表芥末堆立場,轉(zhuǎn)載請聯(lián)系原作者。
來源:中國職業(yè)技術(shù)教育