已加入收藏
已取消收藏
文章收藏功能
menu
帳號頭像 帳號選單下拉箭頭
/
熱搜內容
現正閱讀
兩萬所美國高校在用!教學平台爆作弊漏洞:「複製貼上」就能拿高分
畫重點
段落筆記
新增筆記
兩萬所美國高校在用!教學平台爆作弊漏洞:「複製貼上」就能拿高分
0
/500
不公開分類 公開分類
儲存
至頂箭頭

國際 | 全球話題

兩萬所美國高校在用!教學平台爆作弊漏洞:「複製貼上」就能拿高分

兩萬所美國高校在用!教學平台爆作弊漏洞:「複製貼上」就能拿高分
示意圖,非當事人或特定情境。 (來源:Dreamstime)
撰文者:貝爽
獨立觀點 2020/09/09
摘要

1.加州大學副教授日前爆料,線上平台Edgenuity的歷史考試中,「還不錯」的答題只拿到50%成績,而將關鍵字隨便堆疊的答題,卻能拿到滿分。

2.Edgenuity是美國知名線上教育機構,已成立20多年,超過2萬所院校使用該平台。而此「評分漏洞」卻早已在學生之間廣為流傳:看到不會做的題目時,只要交出成堆關鍵字,就能獲得不錯成績。

最近,美國一家知名教育平台被家長爆料,該公司旗下的AI閱卷系統存在重大漏洞,學生只要在答題區寫上零散的「關鍵詞」就能輕鬆拿高分。事後採訪中,一位匿名學生稱:如果不是閱卷系統的的漏洞,我不會通過代數2考試,我只是把關鍵字填了上去,我相信老師們已經發現,但他們沒有做任何處理。

據了解,這款AI閱卷系統搭載於線上學習平台Edgenuity,目前已服務了2萬所美國院校。而這位爆料者達娜·西蒙斯(Dana Simmons),是加州大學河濱分校的歷史系副教授。她之所以會發現評分系統漏洞,是因為他的學霸兒子在歷史考試中只拿到了50%成績。

隨便寫寫就能拿高分

拉扎爾(Lazare)是一名高中生,他剛剛在Edgenuity平台完成了歷史考試,滿分100,他只拿到了50分,這顯然與平時成績相差很多,他很傷心。一開始,他的母親西蒙斯還試圖安慰他,也許這次的閱卷老師比較嚴格。不過,拉扎爾說,老師並沒有看他的答案,提交試卷不到一分鐘,成績就出來了。

廣告-請繼續往下閱讀

西蒙斯知道,這應該是系統的自動評分,他隨後看了兒子的考試試卷,似乎沒什麼大問題。於是,她決定用一道歷史題測試一下系統的評分規則,結果讓她大跌眼鏡。

題目是這樣的:君士坦丁堡的地理位置,如何幫助拜占庭帝國變得富有和繁榮?

它位於愛琴海和黑海之間,是商船和乘客的集散地。它也正處於歐洲和西亞之間,這使它成為一個巨大的貿易中心,而且在當時的許多貿易路線。利潤、多樣化、西班牙、中國、印度、非洲。

西蒙斯說,她只是寫了兩個相關長句,然後又往上堆疊一些不連貫的關鍵詞,比如財富、印度、中國、中東。但這種拼湊的「單詞沙拉」(Word Salad)形式,系統卻給了她滿分。

廣告-請繼續往下閱讀

原來,根據該公司官網顯示,系統的的評分規則是,如果某些問題的答案不包括關鍵字,系統會判定為0分,如果至少包含一個關鍵字,則為100分。而其他問題則會根據包含的關鍵字數量,獲得一定的百分比。按關鍵詞評分不失為一種好的方式,但只是按照關鍵詞,顯然會出現明顯失誤。

隨後,西蒙斯在推特(Twitter)上,公開指責Edgenuity公司,稱其演算法漏洞不利於教育公平,引起很多網友的關注和支持。對此,Edgenuity公司回應,AI評分只是作為參考,老師有權對其進行修改。Edgenuity不會使用演算法代替老師評分,只是為老師提供評分指導。老師有能力接受或否決建議的分數,AI不會決定學生的課程成績。

不過,此一回應卻再被打臉。事後採訪中,拉扎爾的一位同學表示,老師確實可以重新查看學生的試卷,並給出最終的得分。但他認識的大多數同學都表示,從未見過老師更改Edgenuity分配的成績,儘管聽說有同學使用「單詞沙拉」的方法獲取高分。

「如果老師在看答案,他們根本不在乎」。

「我整個學期都靠它」

重要的是,西蒙斯並不是最早發現Edgenuity存在評分漏洞的的人。一位已經畢業的高中生奧斯丁·帕拉迪索(Austin Paradiso)表示,他高中時曾多次使用Edgenuity平台進行考試,雖然不喜歡「關鍵詞沙拉」,但這種方式確實有助於得高分,而且100%有效。

據了解,Edgenuity是美國知名線上教育機構,已成立20多年,其提供教育服務廣泛用於2萬多所院校,而這一服務就包括Edgenuity內置的AI評分系統。

另外,由於今年受疫情影響,大多數美國學校都轉向了線上授課模式,其教學和評分服務業也選擇外包給線上教育平台,Edgenuity是其中收到最多合約的平台。據統計,Edgenuity公司為初中生和高中生提供了300多個線上課程,涉及從數學到社會研究的各個領域。這些課程由教學影片、線上作業,以及線上考試組成。Edgenuity在其中負責課程提供和作業評分。

而經過多次考試,很多學生都已經摸透了系統的評估方法。一位學生說,當他不會做的時候,會嘗試提交與問題相關的成批關鍵詞,這種方法通常都會奏效。還有另外一位同學表示,他們會截取原文中的關鍵詞,貼到答題區,他整個上學期都在用這個技巧。每次都能獲得不低的分數。

另外,4個月前,還有學生公然在Reddit上發布貼文,詢問如何利用Edgenuity作弊:在老師不知情的情況下,如何成功欺騙Edgenuity?我發現你們可以輕鬆找到所有答案,我想知道是如何做到的,是否會花時間回答每個問題?

貼文下方聚集了很多同學評論,分享線上作弊技巧。其中一位學生表示,幾乎每一次Edgenuity平台考試都會作弊。

此次西蒙斯的揭發對Edgenuity造成不小影響,已有家長公開反對學校使用該虛擬平台,並表示不希望技術影響孩子成績。

AI閱卷,你怎麼看?

AI技術參與到考試評分系統中似乎是一種必然的趨勢。中國已經有很多相關研究,而且一些技術已經開始逐步走向落地階段。阿里巴巴近日發起的百萬獎金數學挑戰賽,便聲稱由其自主研發的AI擔任輔助閱卷老師。

不過,關於AI閱卷的標準性和公平性一直備受爭議。對於有標準答案的題目來說,AI的評分能力毋庸置疑,針對一些基礎的辨識錯字能力,AI也有不錯表現,比如2017年阿里巴巴舉辦的AI作文評分測試中,AI僅用十幾秒,就在一篇200字的作文中找出8個錯別字。

顯然,AI在提高閱卷效率,減少老師壓力方面發揮了不少作用。但對於一些開放式試題,比如作文,AI閱卷卻產生了不同的爭議。有人認為,AI閱卷可以避免主觀偏見,在文本結構、語言表達方面形成統一的標準,而且其海量的文章儲備,也會高於人類老師的評分水平。但也有人表示,AI判分過於刻板,如上文中的Edgenuity平台,開放式題目表達是考生的核心思想,人類的情感表達是AI無法按照對錯來評判的。

*本文經「雷鋒網」授權轉載,原文:翻車了!2萬所美國院校都在用的AI閱卷系統,只要復制原文“關鍵詞”就給高分

責任編輯:李頤欣

商周大調查
大調查主圖
您認為DeepSeek對全球AI發展,最大的影響是什麼?
1. 加速AI技術發展,降低應用門檻
2. 顛覆以美國為主的AI遊戲規則
3. AI股泡沫化可能性增加
4. 美中科技戰更加劇烈
5. 以上皆是
商周調查局相關文章 相關文章
美中AI爭霸,新狠角色DeepSeek解析…川普、輝達、台積電前景暗淡?
線上教學 Edgenuity 線上教學作弊 AI閱卷
獨立觀點
獨立觀點
編輯精選
展開箭頭

這是一個開放給所有商周讀者發聲的管道,如果你有意見想法不吐不快,歡迎大聲說出來!(來稿請寄至red_chen@bwnet.com.tw)

廣告-請繼續往下閱讀
FOLLOW US
加入商周LINE好友 秒懂新商業
加入好友

商周集團為提供最佳的閱讀服務,採用網站分析技術,以持續優化用戶體驗。
若繼續瀏覽本網站即表示您同意隱私權聲明
若您未點選「我同意」而繼續使用本網站,則視為您已同意本站之隱私權政策。