深圳商報2019年3月19日訊 (記者陳姝)被譽為AI皇冠上的明珠,自然語言處理(NLP)已成為互聯(lián)網(wǎng)公司研發(fā)的重中之重。近日,在國際頂尖NLP競賽——第七屆對話系統(tǒng)技術挑戰(zhàn)賽(DSTC7)中,首次亮相的微信智言團隊拿下一個賽道的冠軍。被稱為微信AI“二孩”的智言“誕生”一年多,靠著“能說”的本事,和“會聽”的姐姐“智聆”支撐起了微信智能對話系統(tǒng)“小微”。
雖然智言背后是一個只有十余人的小團隊,但在研發(fā)上卻相當“專一”,未來要把智言打造成國內(nèi)NLP領域第一梯隊的品牌。
讀得懂還要答得妙
DSTC7挑戰(zhàn)賽分為三個賽道,分別考驗AI如何對回復進行排序、機器生成回復,以及音視頻場景下的對話能力,智言參加的是第二個賽道的競爭。智言團隊相關負責人說,如果說第一個賽道是做選擇題,第二個賽道就是問答題,相較而言,后者難度更高。
在這次比賽中,微信智言提出了一種基于多方位注意力機制,能夠“閱讀” Fact與對話上下文信息,并利用原創(chuàng)動態(tài)聚類解碼器,產(chǎn)生與Fact和上下文相關并且有趣的回答。這位負責人解釋說,在較早神經(jīng)網(wǎng)絡為基礎的對話模型中,AI對特殊信息的關注度不夠,因此回復的針對性和趣味性欠缺。比如,你問一家餐飲平臺的智能客服,“哪家火鍋店環(huán)境好?”在很多情況下,它會給你很生硬的回答,例如“我不清楚”“這個太好了”“太棒了”等。而智言會把注意力集中在“環(huán)境”這個關鍵詞,利用它所閱讀過的“評價”,把相似的答案聚類去重,從中挑選有趣的回答,然后告訴你:“××餐廳的環(huán)境不錯,可以推薦?!?/p>
這位負責人稱,在找餐館、搜歌這類較垂直、給出了明確信息的生活服務類場景中,智言的閱讀和回復水平已有很大程度的提升。但在一些意圖模糊的場景中,AI與人的水平仍有差距,比如你問機器人“失戀了怎么辦”,它最多只能回答“出去旅游吧”,這類千篇一律的回復并不能讓人滿意。
已支持四大領域智能對話
在騰訊內(nèi)部,智言被稱為微信AI“二孩”,它與“姐姐”智聆同屬于微信AI團隊打造的品牌。與“姐姐”專注于互聯(lián)網(wǎng)語音技術不同,智言聚焦智能對話和自然語言處理,“姐弟倆”一個能“聽”,一個會“說”,幫助微信智能對話系統(tǒng)——“小微”用聲音連接世界。除了我們平時使用的微信語音對話,小微已經(jīng)用于支持家居硬件等四大領域,滿足個人、企業(yè)乃至行業(yè)的智能對話需求。
2017年12月開始籌備,2019年1月正式亮相,“話癆弟弟”智言“出生”時間比智聆“姐姐”晚了6年,但團隊研發(fā)力量不容小覷。在這次核心參賽組員中,僅一名來自CMU(美國卡耐基梅隆大學)的T4專家為指導,主力卻是一名實習生。
讓“小微”能聽會說
記者在采訪中了解到,相較騰訊其他AI團隊,智言在NLP領域非?!皩R弧?,無論是文本分類、問答、對話,還是語義解析,都有大量投入。智言的目標,是打造“對話即服務”平臺。具體來說,“小微”通過智言,將每個用戶終端與微信體系內(nèi)的智能硬件、行業(yè)云、公眾號和小程序等生態(tài)內(nèi)容和服務,騰訊生態(tài)下的家居、出行、購物和娛樂等各行業(yè)服務,緊密連接在一起。智言將發(fā)力三個方向:服務外部第三方的音箱等智能設備市場,為騰訊內(nèi)部業(yè)務提供支持,同時繼續(xù)深耕學術領域,將智言打造成國內(nèi)NLP領域第一梯隊的品牌。
這位負責人表示,近兩三年,國內(nèi)NLP研究和應用進步非???,論文水平已躋身國際一流,技術在搜索、信息推薦等領域有大規(guī)模落地和提升。對話機器人已經(jīng)展開嘗試,但還不夠成熟。
“對話系統(tǒng)最難的是,如何在開放領域與用戶進行交流,技術仍需打磨”。他說,目前AI還只能與人進行單輪對話,未來要推進多輪場景下的對話?!拔覀儠葟穆犚魳?、講故事、打車等場景切入,先在微信內(nèi)部產(chǎn)品上線,內(nèi)部迭代,看用戶反饋進行擴展?!?/p>