免费久久国产&夜夜毛片&亚洲最大无码中文字幕&国产成人无码免费视频之奶水&吴家丽查理三级做爰&国产日本亚欧在线观看

訂閱
糾錯
加入自媒體

為什么不能是「她」?AI也要反性別偏見

2020-07-15 09:48
將門創投
關注

尋找翻譯法:測試語音識別系統的翻譯準確度

在后續實驗中,研究人員創建了三個語音識別系統:

End2End語音識別系統,它借助c語言和開放源碼來接受Librispeech數據集的培訓,并通過自動將原始英語文本翻譯成目標語言,來對語料庫進行“反哺式”擴充。* Cascade,其與End2End的核心技術相同,其區別在于,它從OPUS庫中提取并訓練了7000萬對英語-意大利語數據和1.2億對英語-法語語言數據,最后對訓練數據進行微調,提供大量語料信息。* Cascade+Tag系統,又在Cascade的基礎上,在訓練數據中添加了許多能夠表明說話者性別的語料標簽。

有趣的是,研究人員發現,在“MuST-SHE”上進行實驗時,將性別信息輸入Cascade語音識別系統,并沒有收到顯著效果。數據集中原始引用和“錯誤”引用之間的差異值表明,這三個系統都偏向于男性語言思維模式,似乎女性被放在了弱勢地位。

三類語音識別系統的產出成果衡量示意圖

在語料分類方面,Cascade在區分第一類翻譯語料時表現最差,因為它無法獲取說話者的性別信息,從而無法翻譯出正確的語句。相比之下,End2End能夠利用音頻特性來準確地標注出說話者的性別,但它在區分第二類翻譯語料上表現最差,原因可能在于它提取的訓練數據集比較小,不足以讓它推斷出比較清晰的翻譯思路。

研究人員寫下了他們的實驗感想:“如果在系統中輸入'機器吃什么’這樣的話語,那么AI可能會根據人類的食譜來列舉出具體的菜單,這就是站在人類的角度,對'吃'這個用詞闡發思考。它也可能站在機器的角度,寫出機器吃汽油之類的答案。但是通過對'吃'這個字的翻譯解釋,我們就能得到這樣的結論:AI的巨大優勢在于,它能夠從輸入的音頻信號中推斷說話者的性別/屬性。這說明它的可塑性其實非常強。”

谷歌也在谷歌翻譯軟件中引入了性別區分翻譯意識,主要目的也是為了解決性別偏見。谷歌研究團隊將AI翻譯的性別差異性通過一種被稱為StereoSet的指標體現出來,以顯示哪種系統翻譯方式比較可行,那種語料庫比較切合這種翻譯識別方法。希望在不久的將來,性別偏見可以真正從AI市場上被根除殆盡。

關于我“門”

將門是一家以專注于發掘、加速及投資技術驅動型創業公司的新型創投機構,旗下涵蓋將門創新服務、將門技術社群以及將門創投基金。將門成立于2015年底,創始團隊由微軟創投在中國的創始團隊原班人馬構建而成,曾為微軟優選和深度孵化了126家創新的技術型創業公司。

將門創新服務專注于使創新的技術落地于真正的應用場景,激活和實現全新的商業價值,服務于行業領先企業和技術創新型創業公司。

將門技術社群專注于幫助技術創新型的創業公司提供來自產、學、研、創領域的核心技術專家的技術分享和學習內容,使創新成為持續的核心競爭力。

將門創投基金專注于投資通過技術創新激活商業場景,實現商業價值的初創企業,關注技術領域包括機器智能、物聯網、自然人機交互、企業計算。在近四年的時間里,將門創投基金已經投資了包括量化派、碼隆科技、禾賽科技、寬拓科技、杉數科技、迪英加科技等數十家具有高成長潛力的技術型創業公司。

<上一頁  1  2  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號