為提高計(jì)算機(jī)視覺能力,F(xiàn)acebook正為開發(fā)者社區(qū)越來(lái)越多地開源內(nèi)部工具。
計(jì)算機(jī)視覺隸屬于人工智能(AI),可協(xié)助機(jī)器理解圖像。計(jì)算機(jī)視覺不需要手工輸入關(guān)鍵詞或描述語(yǔ)等元數(shù)據(jù),而是將圖像分解并在逐個(gè)像素的基礎(chǔ)上處理圖像。
照片,視頻以及一般圖像都是Facebook的重要素材,而計(jì)算機(jī)識(shí)別圖像中的對(duì)象的能力非常利于縮放圖像的內(nèi)容分類。對(duì)于一段視頻或一張圖片,人眼可以輕易確定其中有3個(gè)人、1個(gè)冰箱和6罐啤酒,但對(duì)機(jī)器來(lái)說,建立自己的意志并不簡(jiǎn)單。面對(duì)圖像上光線和顏色的無(wú)數(shù)種混合方式,人類顯然更具優(yōu)勢(shì)。
然而計(jì)算機(jī)視覺技術(shù)已經(jīng)取得跨越式發(fā)展,計(jì)算機(jī)越來(lái)越擅長(zhǎng)識(shí)別圖像的內(nèi)容以及圖像中對(duì)象的位置。檢測(cè)對(duì)象只是一方面,機(jī)器還需要認(rèn)清對(duì)象的重疊部分,這種影像分割問題更加復(fù)雜。比如,機(jī)器不能將動(dòng)物的部分軀體和前方站立的人體混為一談。Facebook的研究人員想要推進(jìn)的就是這個(gè)方面。
Facebook將一些計(jì)算機(jī)視覺算法代碼上傳到了GitHub以供大眾下載,包括DeepMask分割框架還有SharpMask分割精細(xì)化模塊,以此促進(jìn)、同時(shí)在某種意義上幫助Facebook促進(jìn)這項(xiàng)技術(shù)。另外還有給圖像上對(duì)象逐一打標(biāo)簽的“專用卷積網(wǎng)絡(luò)”MultiPathNet。
Facebook將一些計(jì)算機(jī)視覺算法代碼上傳到了GitHub以供大眾下載,包括DeepMask分割框架還有SharpMask分割精細(xì)化模塊,以此促進(jìn)、同時(shí)在某種意義上幫助Facebook促進(jìn)這項(xiàng)技術(shù)。另外還有給圖像上對(duì)象逐一打標(biāo)簽的“專用卷積網(wǎng)絡(luò)”MultiPathNet。
“我們開放代碼給所有人,希望他們能夠一起助力機(jī)器視覺領(lǐng)域的迅速提升?!盕acebook人工智能研究組(FAIR)的研究科學(xué)家PiotrDollar在博文中說,“隨著核心技術(shù)的發(fā)展,我們?nèi)詫⒗^續(xù)發(fā)布最新成果,更新開放給大眾的開源工具?!?/p>
越來(lái)越多的企業(yè)轉(zhuǎn)向關(guān)注機(jī)器學(xué)習(xí)領(lǐng)域,為客戶尋求更優(yōu)質(zhì)的自動(dòng)化技術(shù)。最近被微軟收購(gòu)的聯(lián)想輸入鍵盤企業(yè)SwiftKey就在研究一個(gè)與AI有關(guān)的復(fù)雜后端。其中的人工神經(jīng)網(wǎng)絡(luò)(ANN)直接基于人類大腦的架構(gòu)和工作方式。圖片庫(kù)巨頭Shutterstock也打造了自己的卷積神經(jīng)網(wǎng)絡(luò)以提高逆向圖像搜索技術(shù)。
將自己的軟件遞交給開發(fā)者社區(qū),F(xiàn)acebook能夠事半功倍。其實(shí),F(xiàn)acebook已多次開源內(nèi)部技術(shù)。過去幾個(gè)月中,這個(gè)社交網(wǎng)絡(luò)巨頭就為加速AI的研究開源了Torchnet,以及將360photo和360video中的圖片和視頻嵌入到應(yīng)用中的SDK。GitHub上,F(xiàn)acebook的項(xiàng)目有200多個(gè)。開源總監(jiān)JamesPearce最近解答了Facebook擁抱開源社區(qū)的原因,總的來(lái)說可以歸結(jié)為意識(shí)形態(tài),創(chuàng)新,以及開源通常利于商業(yè)的這一事實(shí)經(jīng)驗(yàn)?!拔覀?cè)贔acebook的目標(biāo)是,盡可能多地開源我們的技術(shù),特別是我們認(rèn)為對(duì)更廣大的整個(gè)工程界來(lái)說有價(jià)值的技術(shù)。”