當(dāng)你工作累了一天回家休息,你說“放一首歌吧”,然后智能音箱就自動(dòng)放出你最喜歡的歌曲。當(dāng)你在超市里堆滿購物車后,只需對著攝像頭進(jìn)行人臉識(shí)別從而完成支付,甚至可以不用掏出手機(jī)。
這就是人工智能在生活中的應(yīng)用。隨著人工智能在語音識(shí)別與合成、圖像識(shí)別、自然語義理解等方向取得突破,越來越多的生活場景開始出現(xiàn)人工智能的應(yīng)用。
當(dāng)復(fù)雜的垃圾需要分類處理時(shí),人們也想到了人工智能,并期望它能夠幫助他們做出判斷。2019年7月,上海率先開始實(shí)行區(qū)域性的生活垃圾管理?xiàng)l例,隨后北京傳出也將出臺(tái)相關(guān)制度。
互聯(lián)網(wǎng)巨頭如阿里巴巴、騰訊開始推出垃圾識(shí)別的應(yīng)用程序,其背后通過物品的視覺識(shí)別做出垃圾分類的判斷。一些此前并不涉及垃圾行業(yè)的企業(yè)如平安、中國電信也開始利用人工智能的技術(shù)推出不同的解決方案。打開應(yīng)用商店,更是出現(xiàn)了近百個(gè)垃圾分類的應(yīng)用,記者通過下載測試發(fā)現(xiàn),其大多數(shù)為個(gè)人開發(fā)者制作,由于技術(shù)能力的限制,他們更多選擇語音對話的形式完成,也有部分具備了圖片識(shí)別的能力。
然而,當(dāng)人們使用這些應(yīng)用后會(huì)有這樣的疑問,這些應(yīng)用真的提高效率了嗎?有人工智能公司的技術(shù)專家告訴記者,這些匆忙發(fā)布的產(chǎn)品,很多數(shù)據(jù)訓(xùn)練的樣本并不足以支持其滿足日常使用的準(zhǔn)確率,“他們的識(shí)別率只有20%~30%”。
讓機(jī)器理解干垃圾和濕垃圾是個(gè)難題
微軟亞洲研究院主管研究員傅建龍告訴記者,目前來看,視覺識(shí)別技術(shù)落地在垃圾分類領(lǐng)域主要有三個(gè)難題,分別是核心技術(shù)算法,產(chǎn)品的設(shè)計(jì)以及使用習(xí)慣難以被改變。在這背后,當(dāng)商品成為垃圾后,其發(fā)生的變化使其定義復(fù)雜化,也就是“非標(biāo)準(zhǔn)化”。
然而,計(jì)算機(jī)的優(yōu)勢就是處理定義好的問題,并且問題中有大量數(shù)據(jù)可以學(xué)習(xí)。通常情況,無論是語音,還是圖像,機(jī)器想要認(rèn)識(shí)它,就必須經(jīng)過兩個(gè)過程,也就是人工智能技術(shù)成為產(chǎn)品的兩個(gè)階段,分別被稱之為“訓(xùn)練”算法和利用算法“推理”結(jié)論。
無論是在訓(xùn)練階段,還是在推理階段,投入大量的樣本數(shù)據(jù)是提高識(shí)別率的必要條件。傅建龍表示,在此前的嘗試中,他們也曾投入過小樣本數(shù)據(jù)進(jìn)行模擬訓(xùn)練,也就是讓計(jì)算機(jī)對一個(gè)類別通過對幾百個(gè)樣本學(xué)習(xí),達(dá)到可以做出判斷的程度。但在這個(gè)過程中,他們發(fā)現(xiàn)了一個(gè)問題,就是垃圾本身不僅類別廣,而且總有新的類別產(chǎn)生,影響判斷。
在推理階段,如何讓機(jī)器理解干垃圾和濕垃圾本身也是一個(gè)難題。這就像計(jì)算機(jī)很容易識(shí)別出一把雨傘,但很難理解人將使用雨傘去遮陽,還是去擋雨。在學(xué)會(huì)這個(gè)問題的階段,計(jì)算機(jī)需要專業(yè)知識(shí)的輸入來學(xué)習(xí)和理解真正的意圖,或者說是為垃圾引入“上下文”。
因此,對于前端用戶用手機(jī)拍攝識(shí)別的過程,多數(shù)受訪人工智能專家并不認(rèn)為技術(shù)目前可以取代人眼的效率。
金融壹賬通智能風(fēng)控總經(jīng)理、人工智能研究院首席科學(xué)家施奕明表示,針對部分用戶來說,拍照識(shí)別是一個(gè)比較高效的輔助方式。因?yàn)槠淇吹皆谝呀?jīng)實(shí)施垃圾分類的上海,需要大批志愿者幫助用戶進(jìn)行垃圾分類和檢查是否正確,這需要大量的人工,而且工作也非常艱巨。作為平安旗下的業(yè)務(wù)部門,其在2-3周的時(shí)間內(nèi)發(fā)布了一款垃圾分類的小程序。
混合垃圾識(shí)別困難,機(jī)器需要更多樣本學(xué)習(xí)
從垃圾箱到處理廠后,垃圾的數(shù)量急劇上升,這為人工智能提供了大量的樣本可以學(xué)習(xí)。曠視研究院研發(fā)總監(jiān)、檢測組組長俞剛告訴記者,在垃圾回收站做批量分揀,這時(shí)AI視覺應(yīng)用將極大利于效率的提升。
在這個(gè)環(huán)節(jié),目前視覺識(shí)別技術(shù)也只是萌芽。拍攝圖像分類的問題解決后,更重要的是還需要解決識(shí)別物體是什么,以及從混合在一起的垃圾中識(shí)別更加的困難,因?yàn)橐苊庹趽跻约拔矬w變形對識(shí)別的影響。一位人工智能獨(dú)角獸公司的專家告訴記者,“人可以推理,但機(jī)器需要更多的樣本學(xué)習(xí),目前算法和人的肉眼識(shí)別還有一定的差距?!?/p>
不過,傅建龍告訴記者,目前計(jì)算機(jī)視覺識(shí)別新的研究方法就是計(jì)算機(jī)對物體抽取一個(gè)部分進(jìn)行識(shí)別,從而確定物體本身。如果被遮擋的物體露出了相應(yīng)的識(shí)別點(diǎn),就可以被機(jī)器捕捉。此外,新的研究方向?qū)⒖梢詮?D到3D進(jìn)行轉(zhuǎn)化,并進(jìn)行多視角建模,未來也將一定程度上解決遮擋問題。
在實(shí)際應(yīng)用中,上述人工智能專家表示,海外企業(yè)使用了多個(gè)傳感器和機(jī)械臂結(jié)合,垃圾在傳送過程中就被自動(dòng)分類抓取。這種商業(yè)模式的產(chǎn)生,是人力成本的增長。但隨著人工智能技術(shù)成熟,會(huì)給工廠帶來更大的成本節(jié)省。
在這種模式下,視覺識(shí)別的算法需要與機(jī)械臂聯(lián)動(dòng),而這其中需要一整套的系統(tǒng)解決方案。目前比較大的問題是,需要針對需求進(jìn)行定制,不同區(qū)域不同的分類標(biāo)準(zhǔn)都需要做精準(zhǔn)的調(diào)整,因?yàn)楸仨氁_(dá)到人工的水平,甚至要超過人工,這樣的投入才有意義。