大學教育的評價有內部評價、外部評價以及第三方評價三種模式,每種模式都存在或多或少的問題。美國馬薩諸塞大學波士頓分校終身教授、教育領導系主任嚴文蕃從科學研究的方法與評價相結合的角度剖析破解之道。他認為評價的關鍵是提供證據,而搜集和分析證據的過程就需要借助基礎研究,考慮應用需求。要讓評價數據真正在現代化教育治理體系當中起作用,就需要開發(fā)新項目,并不斷在不同條件下測試。
以下是整理后的演講實錄:
今天的話題是現代教育治理,我自己想說說科學研究和評價在學校治理當中的重要作用,特別是大家知道現在提出了管辦評分離,還有第三方評價。我想從評價角度來看,科研的重要性跟評價怎么做才是合理的。
從評價到底是評什么,評價的目的是什么,然后誰來評,最后怎么評,這幾個方面來看,理清一些誤解,搞清我們面對什么。
歷來我們評價目的有兩個爭論,到底是外部還是內部,問責還是提高。(這些)就是平衡問題。外部問責講究規(guī)律性、控制,內部講究自我評價與改善。外部評價重點就是問責,認證是最明顯,然后是績效,也是涉及到進步問題。內部更注重以學生為主題,更加注重到底以什么來促進學生學習。
近三十年來,評價最明顯的一個變化,由外部逐漸轉向內部,由問責逐漸轉向以發(fā)展為中心。誰來評價呢?一種是內部自我評價,是內部專業(yè)人員評價,一種是完全由外部評價。實際上不是簡單的內外,內部也是分兩種,一種是人員自己評價,一種是外部評價。
三種評價模式的偽評價問題
內部評價最大的問題是什么?很容易缺少客觀性,同時評價人員本身的評價能力往往有問題。專業(yè)人員指的是內部專業(yè)人員,比如各個學區(qū)、各個教育局有自己的研究院,或者自己的評價中心,他基本上研究方法、評價方法是合格的,但是問題是同一個人。
外部評價在美國的話最常見是由大學、專業(yè)評估公司組成。這些人比較合格,作為局外人的第三方評價。但是服務費很貴。
在美國外部評價還有一個很大問題,就是假評委、偽評價,偽評價很多都是由外部評價公司出的報告。這些報告有很多都是存在問題的,主要是利益關系。一個是政治利益關系,一個是形象利益關系??梢苑治鲆幌?,在評價過程當中的利益群體,一個是制定者,一個是執(zhí)行者,一個是客戶,一個是評價者。
制定者有他自己的利益關系,執(zhí)行者也有它的利害關系,客戶也有他利益關系、感興趣的東西。第三方評價也有自己的利益關系,關心自己的職業(yè)生涯,關心下次是不是還要他評價。這造成了他不一定按照實際來做的?;旧习凑赵u價的價值模型。
這三種模型實際上如果按照評價幾個群體來看,各個群體有自己趨向的一種評價,喜歡的模式。通過第三方評價的話,在夾縫當中,很容易出問題。我們還要注意關于第三方評價不是完全公正,也會出現很多偽評價問題。
評價的關鍵是提供證據
怎么評?最簡單的按照思維模式,任何做的行為就是輸入、過程、結果。細化一下,無論作為項目的干預,輸入做什么,找誰做,結果怎么樣。特別是結果短期、中期、長期都有一個價值觀暴露在里面,什么數據要,什么數據不要,在這個評價過程當中都有一個篩選過程。
詳細一些的話,每個指標體系和變量都可以運用,把前面幾個只不過再擴大一下,再放清楚一些??梢钥闯鰜硭慕Y果是,一個好評價不僅包含初期,還有中期、長期。
大學評價當中的一些傳統評價完全按照這個模型來做的。評估一個學校辦學,第一個看它的Inputs,就是辦學條件的這些變量,評價關心過程變量Processes,就是大學這些過程的一些變量。
最感興趣的還是出處問題,特別是學生的結果變量。所以能看到,這樣一個線性思維方式。對于評價的影響,不管哪個,最核心的就是提供證據,不是拍腦袋,證據為主。什么才是證據?美國21世紀開始特別推崇實驗法、科學方法,提出什么算證據,什么算可能是證據,什么算根本沒有證據。按照這幾個科學研究方法比較。對比是否有真正的控制組和實驗組,是否是隨機,是否是處理一致,是不是能復制。統計過程當中是不是一個地方做,另外一個地方也是一樣的。
教育評價仍然是瞎子摸象
美國21世紀當中特別出了一系列關于研究報告、評價報告提出的改變教育質量的報告,特別提出了質量、教育科研三個基本問題。主要的問題就是因果關系,出現任何學生的結果,原因是什么,怎么發(fā)生的,機制是什么。所有科研研究就是這三個問題。如果拿這個模型來看前面講的幾個模型,也是這樣,一個過程問題,一個因果問題。
美國專門建立一個數據庫,那就是WWC,國家政府組織的,提出四個標準,作為干預和評價的標準。實際上可以看到跟實驗結果、實驗想法、科研辦法也是一致性。關鍵問題出在什么地方?這個數據庫根據上面的標準,對七千多個美國教育干預進行分析,按照這個標準分析,完全符合標準的只有2%,有保留的2%,參加評審不符合標準13%。實際上70%多統統都是不符合標準。換句話說,大多數教育干預都是失敗的。
我們花了很多錢,做了很多干預,結果花了一百萬買回來的結果是“可能”,也有可能“不可能”。根本問題是交易復雜性使在每個地方看到,這個地方work,換一個地方不work,換另外一個人不work,換另外一個人調整又work。永遠解決不了三個問題,為什么work,什么條件下work,怎么work。解決不了。我們想當黑匣子,我們想研究這個黑匣子,想打開黑匣子,做瞎子摸象的事,你摸一把,出一個報告,我摸一把也出一個報告,結果報告對起來全對不起來。這個過程就是瞎子摸象。
美國學者講,我們整個做的事情像在黑暗當中跳舞,我們舞者不管是政策制定者也好,政策執(zhí)行者也好,政策受益者也好,評價者也好,大家都看不見對方,都在黑暗當中舞蹈,動作都是非常復雜,但是都受環(huán)境影響,這是我們的現狀。
最好的研究方法是借助基礎研究,考慮應用需要
怎么改變現狀?我們做過什么干預,干預放到數據庫,WWC對所有干預進行評分。所有的干預,不管是“可能”也好,但是出一個干預操作指南,對學校老師非常感興趣,大家都去下載,差不多一年的下載量16000,大家都想對教育數據庫進行改革。
最主要改變狀況的辦法是研究方法上進行改變。如果按照我們的框架,研究分兩個維度,研究不考慮應用,是不是考慮基本原理,是不是考慮運用。如果說是單純基礎研究, 只考慮原理,不考慮應用。如果單純應用,只考慮應用,不考慮原理。就是對角線的這兩個。最好的就是右上角的那個。最差的是沒有應用價值,沒有應用原理,就是偽科學、偽報告。我們最希望的研究方法,特別是做評價當中,借助基礎研究,考慮應用需要。
專家隊伍分兩類,一類在自己圈子里面,自己研究學問,最感興趣他的學問對未來有什么影響,這批專家對政策影響不大。希望大學老師投入跟政策、干預、評價有關這方面研究。任何研究最好要形成一種互相爭議,最有典型意義是大學為主兩個中心,大家最感興趣問題是美國特許學校到底好還是不好。
CRPE和NEPC中心,CRPE說特許學校好,另外一個中心NEPC說這個研究方法不對。美國出一個報告,跟著另外一個報告講它不好,這樣一個氛圍出現,進一步推動往前走。
只要行動起來,我們肯定不斷地打開黑匣子,只要有行動就要有收獲。最好的行動理論:計劃、執(zhí)行、行動、學習,最好形成一個對干預效果研究的循環(huán)。最好的循環(huán)還是要不斷地做,開發(fā)一個新項目,按照這個循環(huán)做,把新項目在不同條件下測試,多變條件下再測試,然后長期做。這樣才能真正做到在評價數據當中引起我們的真正現代化教育治理體系的有效作用。
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現有價值的內容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。