芥末堆芥末堆

又到一年畢業(yè)查重季:機器與人的戰(zhàn)爭

作者:徐超軼 發(fā)布時間:

又到一年畢業(yè)查重季:機器與人的戰(zhàn)爭

作者:徐超軼 發(fā)布時間:

摘要:以純機器的手段作為“過濾器”,將會帶來“誤殺”“錯放”同時存在的尷尬局面。

1555669043280894.jpeg

圖片來源:攝圖網

*來源:徐超軼,南都觀察特約作者。本文經南都觀察(ID:naradainsights)授權轉載

臨近畢業(yè)季,完成畢業(yè)論文成為高校學生的“頭等大事”。在此過程中,最關鍵的往往不是論文完成質量的高低,或者所謂“創(chuàng)新性”的多少——事實上,至少對于大多數本科生而言,以其掌握的知識量,實難在本學科領域取得能稱為“創(chuàng)新”的成果——而是如何通過最基本但至關重要的論文“查重”。

查重真的有用嗎?

對于論文重復率的要求,基本上是所有高校對學生畢業(yè)論文的通用檢測手段。通過文獻庫的比對,論文中與已有文獻“重復”的比例不能超過一定數值,否則論文需要被退回修改。這一措施的用意主要是防止論文抄襲,保證論文的原創(chuàng)性。畢竟大段復制已有文獻的做法,很容易被這套查重系統(tǒng)檢出。但是,正如任何測量指標都不能做到完美衡量,查重結果在很大程度上也無法完全反映論文重復程度的高低。

一方面,不乏學生利用數據庫收錄文獻范圍的有限性,抄襲數據庫以外的港澳臺地區(qū)中文論文或翻譯外文論文以通過查重。這種抄襲的隱蔽性較高,特別是翻譯外文論文的情形,除非參與論文評審工作的教師熟悉文獻,否則僅通過機器比對難以發(fā)現問題。

另一方面,確實靠自身獨立完成論文的學生,也可能由于直接引用較多,或是文章中作為研究對象的文本、劇本、法律條文等出現較多而被系統(tǒng)標記為重復,在某些情況下會導致重復率超標的狀況。

對于這種重復率超標,學生往往只能通過一些“技術手段”降低重復率,具體的做法包括改變語言表達方式、將正文改為引注、避免直接引用原文等,更有學生“借鑒”抄襲外文文獻的方法,將論文內容翻譯為外文后,再翻譯回中文加以修改——即利用翻譯過程中的信息扭曲降低所謂“重復”的比例。實際上,如此修改之后的論文在內容上沒有任何改變,甚至還因此損失了直接引用的準確性。原有論文在明確標明引用來源的情況下,其實并不存在學術不端問題。如此以機器查重的重復率作為指揮棒的論文檢查與修改,實際上只是浪費時間的無用功。

7a9c3b443d866ca5005bfb89bfd61376.jpg

▲ 靠自身獨立完成論文的學生,也可能由于直接引用較多,或是文章中作為研究對象的文本、劇本、法律條文等出現較多而被系統(tǒng)標記為重復,在某些情況下會導致重復率超標的狀況。 ? Scribbr

最關鍵的是,使用機器查重實際上只能檢查論文的“形式重復性”,即語詞、句子表達的重合,而不能檢查出“實質重復性“,即內容的雷同。形式表達上不同的文章完全可能在內容上涉嫌抄襲,實質上不同的文章也有可能在特定部分的表達上存在一致性——特別是對于研究同類對象的不同論文而言更是如此。

但是,幾乎所有高校都將論文的機器查重作為論文答辯前的必經程序,這使得被這套查重系統(tǒng)判定為“高重復率”的論文甚至沒有機會進入到實質的人工審查程序,從而在實質上給了學生一種錯誤的學術引導:既然參考或引用他人的學術成果可能造成重復率高、不能通過系統(tǒng)的問題,那么純粹自己“創(chuàng)作”的內容就比較容易通過這套系統(tǒng)的審核。但問題在于,沒有建立在足夠知識和文獻儲備上的“原創(chuàng)研究”,其學術性和學術價值是頗值得懷疑的。

查重催生的產業(yè)

由于這套不甚合理的查重機制,圍繞著“查重”與“降重”,儼然形成了一套產業(yè)鏈。為了避免在學校的正式查重中不能通過而影響畢業(yè)進度,學生往往在論文提交前會自行尋找平臺進行查重。這些平臺因其數據庫覆蓋面的差異收取不同的價格,收費高者可達數百元一篇。而如果選擇一些低價或者免費的論文查重平臺,一方面可能由于數據庫覆蓋不全而導致查重結果與學校系統(tǒng)有偏差,另一方面一些不正規(guī)的平臺甚至存在剽竊學生論文的現象。

若是自行查重的重復率偏高,則又有形形色色的“降重”產品。這種“降重”服務無非是利用機器查重僅針對形式上重復的特點,通過文字編輯的方式降低機器檢出的重復率,客觀效果上是幫助本身存在抄襲或不規(guī)范引用的論文進行“規(guī)避”,可以說是變相地助長學術不端。

既然機器查重本身存在各種問題,為何各大高校仍然愿意每年向查重平臺繳納費用,對學生論文進行查重?其中的原因恐怕是多方面的。

查重與官僚制

一方面,機器查重確實在某種程度上實現了論文把關的功能,將一部分低質量或存在明顯抄襲問題的論文在進入實質答辯前過濾出去,在減輕論文評審壓力的同時,也能避免由于評審教師自身水平問題而未能識別出抄襲論文的尷尬,尤其是在每年生產的論文數量巨大,人力閱讀難以窮盡的情況下。

另一方面,在高度行政化的學校管理體系中,采取機器給出的“重復率”這一看似客觀的、可復現的數值,非常容易向負責此事的上級“交代”,日后若論文出現了相關的問題,也可拿出數值化的結果撇清自身的責任。

而除此之外,以機器替代人工查重的初衷,恐怕還是對人,特別是具體人的不信任,意圖通過自動化、平臺化的機器查重,避免人工論文評審中的學術腐敗與尋租問題。但在引入機器查重機制后仍頻頻曝光的學術不端事件顯然表明,僅靠機器查重作為預防學術不端的防線,恐怕難以達到預期的效果。

盡管機器查重的初衷也許是盡可能排除人為因素的影響,但實際上在引入機器查重之后,人為因素仍然能在整個過程中上下其手。于是論文查重的存在,僅僅成為了科層制管理體系中的一種慣習,或是具體人員卸下自身責任的一種工具。

c6a3dd59175fc8e5f6ba4259b130762d.jpg

▲ 靠論文查重的存在,僅僅成為了科層制管理體系中的一種慣習,或是具體人員卸下自身責任的一種工具。 ? Pinterset

這種自動化的查重工作因其自身的缺陷,無法真正與論文存在抄襲與否的事實建立相關性,而高校又基于操作效率的考量,將其作為論文進入實質評審的前置條件,在某種程度上使之成為浪費學生金錢與時間的“贅生物”,以數據化的“重復率”為指揮棒,發(fā)展出了一套令人啼笑皆非的“降重”技巧。而通過這種方法產生的論文,盡管能通過查重系統(tǒng)的檢驗,絕大多數仍然是毫無學術價值的“學術垃圾”。

相信數據而不相信人

從觀念層面而言,以機器查重作為論文進入實質評審前必經程序的做法,是當下行政管理中相信數據而不相信人的具體表現之一。這種觀念的立足點可以說是“對未來負責”,如前所述,當多年以后出現倒查責任的需要時,當事人可以通過客觀的、可復現的數據“經得起歷史的檢驗”,以擺脫自己的責任。至于是否產生毫無價值的學術垃圾,并不在優(yōu)先考量的范圍內。

但論文評審面對的顯然是學生畢業(yè)的當下,在現時的情形下評估一項研究是否有學術上的價值、能夠表明學生掌握了相應的學術能力,而不是學生是否抄襲。這才是論文審查各個階段中最重要的考量因素。而這是機器查重本身所難以做到的。

那么,既然機器查重的做法已然出現種種問題,是否可以重新引入人的因素?通過改變機器查重作為論文審查前置程序的定位,允許被機器判定得出初步“不通過”結論的論文,再接受作為專業(yè)人的論文評審者的檢驗,或許可以避免機器查重過程中“誤殺”遵守學術規(guī)范的論文。

退一步而言,對于被機器判定為重復率超標的論文,也至少需要給予學生申訴“自證清白”的機會,而不是根據機器給出的一個百分比數據,直接將待審論文拒絕在人工評審的大門外。畢竟論文評審的結果,對于學生的畢業(yè)與否存在重大影響。如果僅以機器評判的結果直接作為論文評審不通過的依據,似乎過于草率。

雖然提前引入人工評審論文的環(huán)節(jié)將在某種程度上增加整個論文審查環(huán)節(jié)的工作量,也給參與評審的教師提出了更高的學術水平要求。但至少這樣的做法在高校目前的架構下是完全能夠實施的,而這可能也是完善論文評審,甚至是績效考核機制、在高度機械化的學校管理中重新反思“人的作用”的第一步。

754be80a6f16713a0191f6a661b02e74.jpg

▲ 這可能也是完善論文評審,甚至是績效考核機制、在高度機械化的學校管理中重新反思“人的作用”的第一步。 ? itrevolution.com

當然,機器查重作為論文評審的一種方式,也有著人力所不能及的作用與優(yōu)勢,筆者也無意主張應將機器查重完全排除在論文審查的方法之外。但正如前文反復提及的,單純以機器審查結果作為拒絕論文進入實質審查的理由,與在論文審查過程中借助機器查重的方法,更全面地評價論文的獨創(chuàng)性和規(guī)范性,彼此之間是存在本質上的區(qū)別的。

以純機器的手段作為“過濾器”,看似客觀簡便,但機器查重的本質也決定了這種依賴將會帶來“誤殺”“錯放”同時存在的尷尬局面。更深層次而言,這是一種高度僵化、只求得到數據對上級有所交代的行事邏輯,而與學術論文本身最注重的獨創(chuàng)性大異其趣。

從這一角度而言,論文的機器查重只是一個窗口,反映出的問題,是存有諸多缺陷的高校管理體制和高度機械化的具體操作模式。此等問題的解決雖非朝夕之功,但從具體的小問題出發(fā),亦可找到相應的改善路徑,從而撬動這一不存在“人”、更不存在作為學術主體的學生和教師的高校管理模式。

本文轉載自微信公眾號“南都觀察家“(ID:naradainsights),作者徐超軼。文章為作者獨立觀點,不代表芥末堆立場,轉載請聯系原作者。

1、本文是 芥末堆網轉載文章,原文:南都觀察家;
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現有價值的內容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源:南都觀察家
芥末堆商務合作:王老師 18710003484
  • 又到一年畢業(yè)查重季:機器與人的戰(zhàn)爭分享二維碼