推特照片剪裁演算法被指存在種族偏差,推特承諾進一步研究並開源成果

推特會對推文照片進行剪裁,以突出呈現照片重點,不過,有用戶卻發現,當照片同時存在黑人與白人臉孔時,推特照片的演算法會優先選擇有白人臉孔的部分,而且甚至在卡通人物上,也有同樣的現象發生。

在這個BLM(Black Lives Matter,黑人的命也是命)之火還在延燒的時刻,官方也迅速回應社群,表示雖然他們有檢查機器學習模型的偏差,但是顯然還有一些課題需要研究,之後會把相關成果開源出來。

這件事的起源,是由加密貨幣基礎設施廠商Iqlusion共同創辦人Tony Arcieri開始,他在推特上發了多張共和黨參議院領袖Mitch McConnell以及美國前總統Barack Obama的拼貼照,實驗推特照片演算法,結果發現,膚色較白的Mitch McConnell總是被演算法選中,在縮圖中突出顯示。

接著許多網友開始進行各種實驗,包括更換人物身上的領帶顏色、幫歐巴馬戴上眼鏡,還有在拼貼圖中增加歐巴馬的照片的數量,甚至拿歌手Michael Jackson的照片進行比對,似乎在特定的情況下,演算法會傾向選擇突出顯示白皮膚人物,但有一些實驗卻呈現相反的結果,推特設計長Dantley Davis以穿著同一套西裝的黑人與白人上半身相片為例,推特演算法選擇將黑人重點呈現,而把白人剪裁掉。

為了研究推特照片剪裁演算法是否存在偏差,身份認證平臺UnifyID首席科學家Vinay Prabhu進行了更為嚴謹的實驗,以探索演算法的特性,他使用了93張經本人同意的自拍照,這些照片控制了飽和度、大小、解析度、光照條件、臉部表情和衣著等條件。他製作了多張拼貼圖,每張拼貼圖都有兩張人臉,這些拼貼圖被實際發布到推特上,以觀察照片剪裁演算法的行為。

實驗結果出乎意料,93張照片有92張成功發送出去,其中有1張因為自動隨機發送推文失誤而失敗,而成功發送的92張拼貼圖中,演算法重點呈現白人與黑人的比例為40:52。對於這項實驗結果,Vinay Prabhu提到,這樣的結果,雖然表面上看起來,演算法並沒有種族偏見,但是因為種族主義是經驗性的,並非統計可以說明。另外,這項實驗使用的資料集也有缺陷,自然的人像背景通常不會是白色,而這可能會影響演算法的判斷。

對於推特演算法的行為眾說紛紜,Dantley Davis表示,他們仍在研究神經網路技術,而看起來的確有一些變數需要進一步查看,而推特的公關團隊也即時地跳出來回應,說明推特對部署的模型,都有經過偏差測試,但是在測試結果,他們並沒有發現任何性別或是種族偏差存在的證據,但從結果看起來,他們需要進行更多的分析,而之後將會公布他們的發現以及新的行動,也會開源相關研究結果。

由於最近臉部辨識開始被大量應用在各種情境,從社交平臺的好友標記,到政府單位執法甚至是邊境控管,因此臉部辨識演算法,是否存在種族偏差的議題被大量的討論。

美國國家標準暨技術研究院(NIST)在去年的時候,研究了市面上200多種臉部辨識演算法,發現其中大部分演算法存在種族偏差,尤其是美國開發的演算法,亞裔和非裔美國人臉孔偽陽性誤判率,比白人高出10到100倍,且在部分應用下,非裔美國女性錯誤率明顯偏高。NIST提到,偽陽性誤判會把錯誤的人擺進需要審查的名單中,對這些人造成權利上的侵害,使用者不應該完全相信系統,而且應質疑用途的合理性。

原文來自 iThome Online