人妻bbbxxx,日韩在线欧美,日韩人妻无码一级毛片

涉嫌侵犯隱私，IBM未經許可將用戶照片用于AI訓練

2019-03-14 15:14

當面部識別成為越來越廣泛應用的技術，隨之而來的是關于個人數(shù)據(jù)隱私泄露的擔憂。IBM這次就撞在了槍口上。近日，外媒報道曝光IBM未經許可，利用網(wǎng)絡相冊Flickr上近100萬張個人照片，訓練它們面部識別系統(tǒng)，同時與外部研究人員共享這些照片。

眾所周知，機器學習的關鍵就是大量的數(shù)據(jù)訓練，人臉識別算法亦然。為了提高算法的精確度，需要標注上百萬的照片來訓練AI。

據(jù)了解，在Flickr上傳照片的用戶并不同意IBM將其照片用于開發(fā)面部識別系統(tǒng)，因為這些可能最終會被用來監(jiān)視和識別他們。一位攝影師透露：“我拍攝的人中沒有一個人知道他們的照片是以這種方式使用的�！�

這些照片被IBM統(tǒng)稱之為訓練數(shù)據(jù)集，他們已經對照片上人物的膚色、性別、面部輪廓等做了詳細的標注。

盡管IBM保證Flickr用戶可以選擇退出數(shù)據(jù)庫，但報道該事件的媒體NBC新聞發(fā)現(xiàn)，刪除照片幾乎是不可能的。IBM要求攝影師通過電子郵件發(fā)送他們想要刪除的照片的鏈接，但該公司尚未公開分享數(shù)據(jù)集中包含的Flickr用戶和照片列表，因此沒有簡單的方法可以找到包含哪些照片。

這幾年隨著面部識別的大規(guī)模應用，不少科技公司都和IBM一樣，抓取網(wǎng)絡上公開、非商業(yè)性質的圖片、視頻來訓練AI程序。

此次被曝光的IBM數(shù)據(jù)訓練集就是YFCC100M照片庫的一部分，YFCC100M是Flickr前東家雅虎為進行研究而收集的照片數(shù)據(jù)庫。所有照片都是在CreativeCommonsLicense版權協(xié)議下共享的，這種版權協(xié)議表明照片可以自由使用，但存在一些限制。

面對質疑，IBM表示數(shù)據(jù)集不會將人臉的照片與其姓名相關聯(lián)，而且他們的目標是為了解決算法的偏差，以防可能出現(xiàn)的種族歧視。但是，公民自由倡導者和技術倫理研究人員仍然質疑IBM的動機，因為IBM也在銷售人臉識別系統(tǒng)，這些工具因侵犯公民自由一直受到批評。

有業(yè)內人士指出，IBM和Facebook等公司的研究機構和商業(yè)運營之間的區(qū)別是模糊的。即使算法由學術研究人員使用非商業(yè)數(shù)據(jù)集開發(fā)，它們通常也會被企業(yè)使用。