国产迷奸一区,国产小仙女视频一区二区,国产精品无码久久久久成人app,久久精品成人一区二区三区,97精品 ,天天干天天骚天天色,亚洲精品中文字幕不卡一区二区,www.szjiaye.cn,亚洲欧美v国产一区二区三区

  1. 首頁
  2. 大牛說
  3. 欺騙AI手冊

欺騙AI手冊


文章&圖片來源:Fastcompany,作者:MARK WILSON

那是井蓋還是桌子上的蜻蜓?那是一只綠色的鬣蜥還是一只帶著堅果奔跑的松鼠?馬路中間的那個是滑板還是鱷魚?

如果是人類,那么遇到上述情況一般都能很容易地給出正確答案,但要是換成世界上最好的圖像識別人工智能(AI),它卻找不到任何線索。

美國芝加哥大學、華盛頓大學、加州大學伯克利分校正在做的就是要建立一份終極照片檔案,約7000張照片中的每一幅圖像都經(jīng)過精心挑選,為的就是能欺騙最先進的圖像識別技術。

“目前的(機器學習)模型很脆弱。”加州大學伯克利分校計算機科學專業(yè)博士生丹·亨德瑞克(Dan Hendrycks)說,“雖然其他研究使用人工數(shù)據(jù)來研究魯棒性,但我們發(fā)現(xiàn),各種模型在真實數(shù)據(jù)(與真實照片)上犯著驚人且高度一致的錯誤。”

為了理解為什么這很重要,讓我們倒回去看下歷史。

在過去的幾年里,圖像識別技術發(fā)展的非常快,效果也變得越來越好。這在很大程度上要歸功于斯坦福大學創(chuàng)建的一個不斷增長的開放數(shù)據(jù)集ImageNet。

現(xiàn)在,這個集合已有1400多萬張照片,每張照片都用“tree”和“sky”這樣的標識符標記。

這個龐大的數(shù)據(jù)庫就像是一個訓練集,或者說是為新AI系統(tǒng)學習如何識別圖像提供參考,就像一個蹣跚學步的孩子可以參照一本圖畫書來慢慢地學習新單詞一樣。

使用ImageNet訓練的AI——比如微軟的Bing——獲得了極高的精準度,能夠以高達95%的準確率識別物體。這實際上比人類做同樣的工作還要好。

但是,縮小最后5%的準確率差距是一個非常大的問題。自2017年以來,計算機在識別圖像方面沒有變得更準確。這就是為什么研究人員正在探索如何理解計算機似乎無法解析的那部分少數(shù)圖像。

相關工作人員所做的,是手動在Flickr上尋找他們認為可能混淆軟件的照片。他們將這些照片與在ImageNet上訓練的AI模型進行測試,如果這些圖像讓系統(tǒng)困惑,這些照片就會被添加到其新數(shù)據(jù)集中,并被命名為ImageNet-A。

可以說,這7000張照片就是ImageNet的對立面,AI的準確率也從高于90%下降到僅僅2%。是的,你沒有看錯。世界上最好的視覺AI模型看一張照片100次就會有98次被搞糊涂。

為什么AI系統(tǒng)不能理解這些圖像,這個問題很復雜。

如今,AI的提高傾向于堆積大量數(shù)據(jù)并根據(jù)最終結論判斷其準確性,而不是依據(jù)達到這個目標的過程。

換句話來說,如果AI看到了足夠多的樹的形態(tài),它就可以在新的照片中把樹識別出來,然后我們也就認為系統(tǒng)是成功的。(這種重復的任務被稱為機器學習)

問題是,我們不知道AI到底是為什么決定一棵樹就是一棵樹的。是形狀嗎?顏色嗎?還是背景?質地?難道是因為樹木有一些人類從未認識到的核心幾何結構?

我們不知道。我們判斷AI的標準是它的答案,而不是中途的推理。

這意味著人們可以從AI中獲得各種意想不到的偏差,而當AI系統(tǒng)被用于自動駕駛汽車等技術或刑事司法等領域時,這就構成了一個重大問題。

這也意味著圖像識別系統(tǒng)并不是真正的智能,他們更像是玩匹配游戲的專家。

構建ImageNet-A是為了欺騙AI,以發(fā)現(xiàn)為什么某些圖像會混淆這些系統(tǒng)。

例如,當AI將松鼠的圖像錯誤地理解為海獅時,我們就能發(fā)現(xiàn)它缺乏更深層次的智能和推理能力。該系統(tǒng)僅依賴于這些動物的紋理,而沒有考慮它們的相對大小或形狀來進行識別。

“需要了解物體形狀的照片似乎最具有欺騙性。”亨德瑞克解釋說。

通過ImageNet-A,研究人員成功地發(fā)現(xiàn)了視覺人工智能中的7000個盲點。這個數(shù)字算多算少?是否意味著把這些圖像放進一個新的訓練集就能彌補系統(tǒng)的缺點?很可能不會。

基于現(xiàn)實世界中的多樣性和復雜性,對AI使用這些圖像進行的訓練可能不會教會數(shù)據(jù)模型如何有效地管理所有的視覺輸入。

對此,亨德瑞克給出的回答是:“收集和標記1萬億張圖像可能會解決一些模型盲點,但當新的場景發(fā)生和世界發(fā)生變化時,與之前的每個盲點匹配很可能都會失敗。”

換句話說,僅僅將越來越多的照片添加到當前的機器學習數(shù)據(jù)集中并不能解決其邏輯的核心缺陷。

總會有一些計算機以前沒有看到過的圖像,進而無法準確識別。那么研究人員能做些什么來縮小這5%的差距呢?

亨德瑞克表示,他們需要開發(fā)出現(xiàn)代機器學習之外的新方法,來創(chuàng)建更復雜的AI系統(tǒng)。或者,不這么做——讓人類繼續(xù)保持相對于機器的自以為是的優(yōu)越感,哪怕再多一點點時間也好。

來源:第一電動網(wǎng)

作者:汽車商業(yè)評論

本文地址:http://www.155ck.com/kol/95572

返回第一電動網(wǎng)首頁 >

收藏
59
  • 分享到:
發(fā)表評論
新聞推薦
第一電動網(wǎng)官方微信

反饋和建議 在線回復

您的詢價信息
已經(jīng)成功提交我們稍后會聯(lián)系您進行報價!

第一電動網(wǎng)
Hello world!
--> 主站蜘蛛池模板: 永年县| 临城县| 北海市| 株洲市| 安泽县| 广丰县| 凌云县| 阿城市| 邹平县| 玉林市| 休宁县| 石狮市| 临泉县| 汾西县| 奈曼旗| 湾仔区| 海口市| 浦城县| 新闻| 呼和浩特市| 晋江市| 南皮县| 石台县| 韩城市| 马鞍山市| 伊川县| 常山县| 巫山县| 昭觉县| 荥阳市| 广汉市| 武穴市| 忻城县| 富阳市| 二手房| 长春市| 荔浦县| 正定县| 友谊县| 江油市| 柞水县|