視頻也能提取“指紋”,人工智能破解行業(yè)盜版難題

時間:2017-12-05

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:近年來,視頻行業(yè)得到了迅猛的發(fā)展。與之對應(yīng)的是視頻數(shù)量的爆發(fā)。但是,隨著行業(yè)的迅猛發(fā)展,“搬運工”、“剪刀手”等侵權(quán)現(xiàn)象也變得日益突出,如何更高效地進行版權(quán)保護,成為視頻行業(yè)發(fā)展的當務(wù)之急。

版權(quán)問題一直是困擾視頻行業(yè)發(fā)展的一大瓶頸,隨著人工智能技術(shù)的逐漸成熟,這一問題也有望得到解決。

日前,阿里大文娛集團聯(lián)合阿里巴巴達摩院共同發(fā)布了名為“鯨觀”的全鏈路數(shù)字版權(quán)服務(wù)平臺。據(jù)悉,該平臺通過搭載達摩院iDST(數(shù)據(jù)科學(xué)技術(shù)研究院)的人工智能技術(shù),可實現(xiàn)對視頻的智能編輯,同時在音視頻素材上抽取“指紋”,讓其在全網(wǎng)范圍可追溯。

這也是阿里達摩院自成立以后,研究成果的首次落地。阿里巴巴達摩院iDST首席科學(xué)家兼副院長任小楓告訴21世紀經(jīng)濟報道記者:“馬老師(指馬云)給我們定的目標非常高,我們要做的就是解決未來的問題?!逼渲芯桶ㄒ曨l行業(yè)的版權(quán)保護問題。

解決盜版難題

近年來,視頻行業(yè)得到了迅猛的發(fā)展。據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心第40次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,截至2017年6月,中國網(wǎng)絡(luò)視頻用戶規(guī)模已達到5.65億。

與之對應(yīng)的是視頻數(shù)量的爆發(fā)。據(jù)今日頭條創(chuàng)始人張一鳴近日表示,僅今日頭條旗下的平臺,每天就有超過2150萬條短視頻上傳。但是,隨著行業(yè)的迅猛發(fā)展,“搬運工”、“剪刀手”等侵權(quán)現(xiàn)象也變得日益突出,如何更高效地進行版權(quán)保護,成為視頻行業(yè)發(fā)展的當務(wù)之急。

任小楓告訴21世紀經(jīng)濟報道記者,指紋對于視頻的版權(quán)保護來說非常重要。如果能夠像指紋一樣去計算視頻的精確特征,那就可以對每一個視頻實現(xiàn)唯一的匹配。

以往,侵權(quán)者會通過加logo、壓縮分辨率或者調(diào)整亮度等一系列操作來改變某一視頻的特征?!暗ㄟ^指紋技術(shù),就能夠在各種各樣的變化中找出他們,現(xiàn)在我們已經(jīng)可以去分辨多場景的視頻,且準確率在99%以上。”任小楓說。

實現(xiàn)這一成果的背后,人工智能功不可沒。據(jù)悉,鯨觀平臺在處理視頻時,會利用達摩院iDST的人工智能技術(shù)對視頻內(nèi)容進行各個維度的分析,并為之打上兩萬余種標簽,同時利用知識圖譜對標簽進行多維度編目。這樣一來,視頻內(nèi)容就變得可識別和搜索了。

另據(jù)21世紀經(jīng)濟報道記者了解,除了精準的識別技術(shù)外,鯨觀平臺在視頻處理效率上也實現(xiàn)了突破。目前,其通過一臺機器就可以處理近30萬小時的視頻。

任小楓告訴記者,這是因為該平臺采用了一個“二值”的索引引擎。簡單來說,就是把視頻所有的變化都轉(zhuǎn)化成“二值”,即零或一,這樣便能簡化視頻的指紋特征,使得存儲和計算速度得到大幅提升。

目前,鯨觀平臺上視頻的下載、解碼、編碼都能夠達到毫秒級的處理速度,5分鐘時長的視頻經(jīng)過上述全鏈路處理可在10秒內(nèi)完成。更為重要的是,在這個過程中,視頻的精度不會損失,和原始特征一模一樣。

視頻技術(shù)接近美國

今年6月,任小楓加入阿里擔任阿里巴巴iDST首席科學(xué)家和副院長。資料顯示,iDST是阿里巴巴負責人工智能技術(shù)研發(fā)的核心團隊,成立于2014年,由一批杰出的科學(xué)家及工程師組成,分布在杭州、北京、西雅圖、硅谷等地。

而在此之前,任小楓是亞馬遜級別最高的華人科學(xué)家。他從2013年開始任職于亞馬遜無人零售店AmazonGo部門,并領(lǐng)導(dǎo)計算機視覺算法團隊。因此,其對計算機視覺領(lǐng)域中的圖像分類、物體識別、跟蹤、檢測、事件檢測等均有全面且深入的理解。

任小楓告訴21世紀經(jīng)濟報道記者,對于視頻技術(shù),他有很多期望,這次與阿里大文娛一起發(fā)布鯨觀平臺,也是希望視頻技術(shù)在這個平臺上能夠得到鍛煉和提高。

加入阿里以后,任小楓仍專注于計算機視覺領(lǐng)域的研究,并主攻圖像視頻內(nèi)容的識別和理解。在他看來,目前的工作內(nèi)容其實與在亞馬遜并無太大差異,都是對動態(tài)的人體或者物體進行檢測,同時對其姿態(tài)、動作進行分析等。

從技術(shù)角度來說,動態(tài)的視頻要比靜態(tài)的圖片更加難以識別和分析。以人臉識別為例,在視頻中就可能會受到分辨率、角度、距離等因素的影響?!盀榻鉀Q這些問題,我們選擇使用超深卷積網(wǎng)絡(luò),并對模型簡化加速,從而實現(xiàn)精準的人臉檢測、跟蹤、識別。”任小楓說。

但對于這位技術(shù)大牛而言,他腦海中對視頻的理解,并不是簡單的給視頻加上一些標簽,而是要能對視頻內(nèi)容更加細致的理解和分析。比如有些視頻的人物、場景都無法識別,但可以分析他們的關(guān)系;或者可以對一些動作、行為進行識別和分析。這也將是阿里巴巴iDST未來要研究的方向。

任小楓坦言,視頻技術(shù)正處于快速發(fā)展的階段,他自己也在思考,除了提升現(xiàn)有的一些技術(shù)應(yīng)用外,還有沒有新的領(lǐng)域可以進行探索。

而在談及中美的技術(shù)差異時,他告訴記者,中國在人工智能技術(shù)上與美國其實還是有一些差距,不過,在人臉和圖像的識別技術(shù)上,這個距離已經(jīng)非常接近。

中傳動網(wǎng)版權(quán)與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(m.y3602.cn)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0