近幾年,人工智能發(fā)展迅猛,應(yīng)用領(lǐng)域不斷拓展。但在各領(lǐng)域大展身手的同時(shí),AI“翻車”案例也頻上熱搜,基于此,本版今開設(shè)“AI·成長的煩惱”欄目,聚焦AI“翻車”的那些事兒,剖析現(xiàn)象、分析原因、探討解決之道,同時(shí)期待它的成長。
球賽結(jié)束后,球迷要求裁判戴帽子或假發(fā),大概是史無前例了。
10月底,蘇格蘭球迷經(jīng)歷了一場“難忘”的足球賽。在因弗內(nèi)斯對陣艾爾聯(lián)的蘇格蘭足球冠軍聯(lián)賽上,無論球員傳球還是帶球進(jìn)攻,場邊的AI攝像機(jī)都視而不見,反而不離不棄跟著一名邊裁,時(shí)不時(shí)來張“C位”特寫。原來,AI攝像機(jī)誤將這名裁判的光頭識別成足球,所以瘋狂追了一整場。
在家觀看這場90分鐘比賽的球迷,大部分時(shí)間不是看球,而是在圍觀光頭。不少網(wǎng)友打趣:這場球賽實(shí)打?qū)嵉?ldquo;看了一個(gè)寂寞”。
為什么AI攝像機(jī)會(huì)把光頭看成了足球?為避免AI犯類似失誤,我們需要做些什么?出現(xiàn)“翻車”事件,能就此認(rèn)為AI“弱爆”了嗎?
來自光頭裁判的無意識“挑釁”
從直接參與體育賽事到記錄運(yùn)動(dòng)員表現(xiàn),再到直播比賽現(xiàn)場、分析運(yùn)動(dòng)員健康狀況,AI正成為體育界的寵兒。幾個(gè)月前,巴塞羅那足球俱樂部(巴薩)還攜手視頻技術(shù)公司Pixellot,打造了人工智能教練解決方案。
沒想到,在體育界一路高歌猛進(jìn)的AI,這次出人意料地遭遇了一名光頭邊裁無意識的“挑釁”。由于這名邊裁光頭太亮,加之陽光照射,AI攝像機(jī)根本分不清哪個(gè)是球,哪個(gè)是頭。此前,因弗內(nèi)斯隊(duì)表示,他們使用的AI跟蹤技術(shù),可以將直播畫面清晰地傳輸?shù)矫恳晃患酒辟徺I者家中,讓因新冠肺炎疫情而無法前往主場的球迷不錯(cuò)過任何一場比賽。
據(jù)悉,此次比賽直播使用的攝像機(jī)正是與巴薩合作的Pixellot所提供的多攝像機(jī)系統(tǒng)。該系統(tǒng)由英偉達(dá)的圖形處理器(NVIDIA GPU)提供動(dòng)力支持,捕獲的視頻分辨率可達(dá)8K。這些攝像機(jī)可以安裝在固定位置,無需攝像機(jī)操作員進(jìn)行操控。為捕獲關(guān)鍵時(shí)刻畫面,Pixellot收集了數(shù)十萬個(gè)小時(shí)的體育視頻,用于在本地工作站的NVIDIA GPU上訓(xùn)練其算法。
擁有海量的可用數(shù)據(jù),使用了深度學(xué)習(xí)算法,加上高性能GPU計(jì)算加持,具備推動(dòng)AI前行的三大動(dòng)力,Pixellot的這款A(yù)I攝像機(jī)為何“翻車”呢?
活動(dòng)結(jié)束后,相關(guān)俱樂部和制造攝像頭的技術(shù)公司進(jìn)行了反思,問題似乎非常清楚:足球的大小、形狀與人的腦袋差不多,加上陽光直射,讓AI攝像頭陷入了“迷茫”。因弗內(nèi)斯隊(duì)回應(yīng)稱已知曉了問題,并且將為下一場比賽進(jìn)行改進(jìn),給觀眾帶來更好的體驗(yàn),希望這種情況不會(huì)再發(fā)生。
Pixellot公司也表示解決這個(gè)問題并不難?,F(xiàn)有的目標(biāo)檢測與追蹤技術(shù)已比較成熟,Pixellot在設(shè)計(jì)階段沒考慮到光頭的影響,需要收集一些足球和光頭的數(shù)據(jù)對算法進(jìn)行微調(diào),以排除來自光頭的干擾。
有技術(shù)人員表示,在訓(xùn)練直播球賽的AI攝像機(jī)時(shí),需要的不僅“這是球”數(shù)據(jù)集,還需要一個(gè)“這不是球”數(shù)據(jù)集。光頭、足夠亮的白鞋、燈光、比賽場地旁訓(xùn)練場上的球、球員用來熱身的球,都是訓(xùn)練AI時(shí)需要考慮的干擾因素。
AI“視力差”才是常態(tài)
盡管可以通過加大數(shù)據(jù)“投喂量”,加強(qiáng)訓(xùn)練和改進(jìn)算法改善AI攝像機(jī)性能,但有專業(yè)人士認(rèn)為,隨著AI應(yīng)用場景逐步拓展,此類“翻車”事件還將長期存在。
“AI‘翻車’是常態(tài),不‘翻車’才奇怪。”北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授、北京智源人工智能研究院院長黃鐵軍接受科技日報(bào)記者采訪時(shí)直言。
黃鐵軍認(rèn)為,表面上看,這次AI攝像機(jī)出現(xiàn)失誤可能是因?yàn)榍捌谟?xùn)練不夠,但最主要的原因是現(xiàn)在的計(jì)算機(jī)識別系統(tǒng)還只是用特定的數(shù)據(jù)訓(xùn)練出來的,例如在上述例子中,使用大量足球視頻訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在識別足球方面已超越人類,但卻忽視了這個(gè)網(wǎng)絡(luò)對光頭更敏感,對
沒見過的對象胡亂識別或“視而不見”,這種問題普遍存在。
機(jī)器視覺就是將視覺感知賦予機(jī)器,使機(jī)器具有和生物視覺系統(tǒng)類似的場景感知能力,涉及到光學(xué)成像、圖像處理、分析與識別、執(zhí)行等多個(gè)組成部分。
“把攝像機(jī)作為AI的‘眼睛’,在現(xiàn)實(shí)場景中,讓AI像人眼一樣去識別足球和光頭,還有很長的路要走。”黃鐵軍表示。
什么時(shí)候能走完這條路,甚至實(shí)現(xiàn)AI之眼超越人眼?
這取決于機(jī)器視覺何時(shí)彌合與生物視覺的差距。“顱骨之中的大腦通過三百多萬根神經(jīng)纖維實(shí)時(shí)感知外部世界,其中每只眼睛后面就有一百多萬根。”黃鐵軍表示,“發(fā)展至今天的機(jī)器視覺,與花費(fèi)億萬年進(jìn)化而來的生物視覺系統(tǒng)相比,還是小巫見大巫。”
人眼適應(yīng)性很強(qiáng),能在復(fù)雜及變化的環(huán)境中識別目標(biāo),具有高級智能,能運(yùn)用邏輯分析、推理能力去識別變化中的目標(biāo),并總結(jié)規(guī)律。而反觀機(jī)器視覺,雖然可以利用人工智能神經(jīng)網(wǎng)絡(luò)技術(shù),但不能很好識別變化的目標(biāo),受硬件條件制約,目前一般的圖像采集系統(tǒng)色彩分辨能力較差。
“與生物視覺神經(jīng)網(wǎng)絡(luò)相比,人工智能的視覺神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)、規(guī)模上相距甚遠(yuǎn),所以功能也要差很多。”黃鐵軍表示,“在現(xiàn)實(shí)應(yīng)用中,機(jī)器視覺‘翻車’不是偶然事件,把光頭識別成足球,只是個(gè)案,類似問題其實(shí)大量存在。”
黃鐵軍說:“這一次,技術(shù)提供方可以把光頭誤認(rèn)為足球的漏洞補(bǔ)上,但還有更多的漏洞,用對抗性圖片訓(xùn)練騙過人臉識別系統(tǒng)只是揭開機(jī)器視覺不足的冰山一角。”
不同技術(shù)路線在賽跑
“基于深度學(xué)習(xí)的機(jī)器視覺在圖像識別等方面取得重大進(jìn)展,但并未真正解決感知問題。”黃鐵軍認(rèn)為,深度學(xué)習(xí)遠(yuǎn)未抓住人類視覺系統(tǒng)的復(fù)雜性。
深度學(xué)習(xí)建立在圖像和視頻大數(shù)據(jù)的訓(xùn)練基礎(chǔ)上,和主動(dòng)感知?jiǎng)討B(tài)世界的生物視覺相距甚遠(yuǎn),而且仍未脫離算力需求。例如,如果把視頻幀率從30提高到3萬,深度學(xué)習(xí)的算力就需要提高1000倍。
而生物神經(jīng)網(wǎng)絡(luò)是脈沖神經(jīng)網(wǎng)絡(luò),更適合完成視覺信息處理。黃鐵軍認(rèn)為,借鑒生物視覺系統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和信息加工機(jī)理,建立一套新的類腦視覺信息處理理論和技術(shù),是重啟機(jī)器視覺的希望所在。
專家表示,發(fā)展人工機(jī)器視覺,目前有兩條主要技術(shù)路線,一是通過收集更多數(shù)據(jù)、增加數(shù)據(jù)量,加大訓(xùn)練力度,構(gòu)造出強(qiáng)大的智能系統(tǒng);二是模仿生物神經(jīng)系統(tǒng),照葫蘆畫瓢,將生物神經(jīng)系統(tǒng)的結(jié)構(gòu)甚至機(jī)理搞清楚,以此為基礎(chǔ)發(fā)展未來智能。
黃鐵軍認(rèn)為,第二條路徑要比第一條路徑更有效。“短時(shí)間來看,第一條更易取得成果。但長遠(yuǎn)來看,從生物神經(jīng)網(wǎng)絡(luò)入手更為直接,實(shí)現(xiàn)目標(biāo)也更有把握。”
目前,AI學(xué)界多數(shù)支持第一條路徑,即通過“大數(shù)據(jù)+大算力”的方式,發(fā)展機(jī)器視覺在內(nèi)的人工智能。黃鐵軍踏上少數(shù)人走的那條路,是因?yàn)樗麍?jiān)信生物視覺神經(jīng)網(wǎng)絡(luò)有巨大潛能可以挖掘。“生物大腦是億萬年進(jìn)化的產(chǎn)物,是最好的先驗(yàn)結(jié)構(gòu)。強(qiáng)大智能必須依托復(fù)雜結(jié)構(gòu),站在進(jìn)化肩膀上,看似艱難,實(shí)則最快。”
“計(jì)算機(jī)科學(xué)之父”圖靈早就表達(dá)過對生物大腦的推崇。1943年初,香農(nóng)提議,可以把“文化的東西”灌輸給電子大腦,圖靈有一次在大庭廣眾之下反駁:“不,我對建造一顆強(qiáng)大的大腦不感興趣,我想要的不過是一顆尋常的大腦,跟美國電報(bào)電話公司董事長的腦袋瓜差不多即可。”
發(fā)展機(jī)器視覺,抑或是人工智能,是重起爐灶,是模仿生物神經(jīng)網(wǎng)絡(luò),還是另有他法?暫無定論。在不同的賽道上,人工智能都在加速前進(jìn)。
盡管AI“翻車”案例不在少數(shù),比如谷歌AI眼部疾病診斷系統(tǒng)的實(shí)用性在泰國大打折扣,騰訊AI翻譯在2018年博鰲論壇上鬧出笑話。但AI時(shí)代正加速到來,勢不可擋。
“必須承認(rèn),AI確實(shí)解決了不少現(xiàn)實(shí)問題,它將逐步替代人的部分功能。但不能過分夸大,它距離我們想象中的智能還有很多不足,還需要更多突破。”黃鐵軍說,要保持開放的思維,跨越“實(shí)驗(yàn)?zāi)M”與“真實(shí)世界”之間的鴻溝,AI技術(shù)發(fā)展任重而道遠(yuǎn)。 (實(shí)習(xí)記者 代小佩)