繼搜狗CEO王小川攜搜狗語音亮相央視后,近日搜狗正式對外發(fā)布搜狗語音交互引擎——知音,該技術主打“能聽會說”以及“能理解會思考”能力,讓人機交互更加自然。
憑借互聯(lián)網(wǎng)公司的天然優(yōu)勢以及多年來的數(shù)據(jù)和技術積累,搜狗的“知音”引擎可以做到識別速度更快、糾錯能力更強、支持更加復雜多輪的交互以及更加完善的服務能力。
首先,“知音”解決了用戶在說話過程中因語速過快而導致的吞音問題,語音識別錯誤率相對下降30%以上,語音識別速度提升3倍。其次,“知音”能夠在語音交互的過程中支持用戶修正錯誤的識別結果,用戶可以使用自然語言進行改錯,例如,用戶可以說:“把‘張’修改為立早‘章’,或者把‘張’修改為文章的‘章’?!?/p>
不僅如此,“知音”還支持多輪對話,處理更復雜的用戶交互邏輯,用更自然并且用戶更容易接受和理解的方式進行交互,更好地感知用戶語音請求背后的真正需求,從而提供更為便捷的人性化服務。比如用戶說我要去首都機場,它會問T1還是T2,當用戶確定航站樓后,它會問是出發(fā)還是接人。
據(jù)搜狗CTO楊洪濤介紹,搜狗從2012年開始研發(fā)智能語音技術,并在2013年開始進行深度學習,目前搜狗的智能語音技術已經(jīng)成功應用到搜狗的全線產(chǎn)品中。
數(shù)據(jù)顯示,搜狗日均語音搜索次數(shù)增長超過4倍,搜狗手機輸入法日均語音輸入超過1.4億次,成為中國語音輸入功能使用量最大的移動手機產(chǎn)品,搜狗語音技術也在用戶產(chǎn)品的迭代中快速取得了行業(yè)領先效果。相關數(shù)據(jù)顯示,在語音輸入的準確性上,搜狗與科大訊飛大致持平,領先于百度。
楊洪濤表示,自然交互和知識計算是搜狗在人工智能領域的兩大戰(zhàn)略方向,目前搜狗在AI領域的研發(fā)已經(jīng)全面展開,并在智能語音領域取得了重大突破,“知音”引擎作為搜狗在自然交互方面的重要成果,充分說明了搜狗強大的技術實力,未來隨著搜狗在自然交互與知識計算方面的不斷完善,“知音”將會在更多場景為用戶提供服務。
隨著人工智能浪潮的來臨,以及物聯(lián)網(wǎng)場景下應用需求的不斷擴大,智能語音產(chǎn)業(yè)規(guī)模將持續(xù)快速增長。搜狗適時推出“知音”引擎,不僅有利于其在即將迎來的行業(yè)爆發(fā)期中占得良機,對整個智能語音行業(yè)的技術革新也具有深刻意義。隨著搜狗語音技術的日趨智能化和服務化,“知音”將會在物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、人工智能等各個方面得到應用,并布局到更多的終端入口。
更多資訊請關注自動化軟件頻道。