5月23日雲棲大會武漢峰會上,阿里巴巴達摩院機器智慧技術實驗室語音交互首席科學家鄢志傑最快以每秒5個字的語速在一台機器前狂點了30多杯咖啡。
【推薦學習】
你想賺人民幣?
那就不得不瞭解中國最大社交工具
騰訊官方合作夥伴開課了!
【微信實戰課程 | 微信、公眾號全面解析】
→限時52折,立即瞭解課程←
“五個巧克力、兩個香草拿鐵,巧克力加奶油。”
“兩個中杯焦糖拿鐵,一個熱的一個冷的。”
”算了巧克力不要了。”
“再要六個小杯少冰摩卡,三杯加焦糖三杯加香草。”
“再加一個大的冷的拿鐵,去冰半糖加脫脂奶,打包。”
5月23日雲棲大會武漢峰會上,阿裡巴巴達摩院機器智慧技術實驗室語音交互首席科學家鄢志傑最快以每秒5個字的語速在一台機器前狂點了30多杯咖啡。
與這台機器一同接受挑戰的,是一位資深咖啡師。當咖啡師因“語速太快、記不下來”在中途選擇放棄時,這台機器卻在每一輪對話中都做出了精准回應,並且在49秒時下單成功。
咖啡師在聽了鄢志傑第二次複述後,用了2分37秒完成訂單。
“今天,我們將機器對人類口語的理解能力帶到了新的高度”,鄢志傑說,這種對話模式完全打破了“語音喚醒+語音指令”的傳統命令式對話模式。
上述點單環節包含了修改、刪除、加單等多輪對話,在整個交流過程中,鄢志傑沒有說“hi,點單機“之類呆板的喚醒詞,而是直接下單。
鄢志傑介紹,這是由於這台機器中嵌入了多模態語音交互方案,包括公共場所強雜訊環境下的信號處理和語音辨識、視頻識別與面部識別、場景感知等多模態融合的感知智慧,同時,融合了流式對話、多輪多意圖口語理解、業務知識圖譜自我調整等認知智慧。
“我們首創的流式多意圖口語理解引擎,極大地提升了對人類隨意、自然的口語表達的理解力,能夠做到免喚醒的、自然的人機交流式的語音交互。”鄢志傑說。
據瞭解,阿裡雲這項解決方案除了可以做收銀員之外,還能在地鐵站賣票。目前,上海地鐵某些網站已經部署了這一技術,乘客可以直接用語音購票。
比如,當乘客走到語音購票機前時,購票機的螢幕會自動切換至購票頁面,並顯示:請說出您想要前往的地鐵站。當乘客說出目的地,售票機會推薦合適的網站和路線。
比如,當乘客說“我要去東方明珠”,購票機螢幕下方會顯示:建議坐到陸家嘴站,距離東方明珠285米。
同時,語音購票機會回答:“一張去陸家嘴站的票,一共4元,您可以掃碼支付。”乘客還可以語音設定購票數量,比如說“換成兩張”,購票機會自動回復“已換成兩張”,乘客拿出手機對準螢幕二維碼掃描完成支付後,機器就會出票。
測試資料顯示,普通買票耗時往往超過30秒,而語音購票全程只需要10秒左右。
對初到上海的乘客來說,語音購票無疑會給他們帶來很多便利,因為面對十幾條線路、三百多個網站,誰都會懵。
鄢志傑介紹,目前,該套解決方案已經落地的場景還包括車內語音助手、電話智慧客服、可免遙控器操作的遠場語音電視、可精准區分多人對話的智慧麥克風等。
“未來,我們希望實現公眾空間裡的萬物皆能對話。”鄢志傑說。
來源:天下商網
【特別提醒】 點擊下圖,立刻 開啟你的商業智慧
FB
微信x公眾號x微商城x騰訊廣告
一個以企業品牌出發的微信課程現正募資中
👉http://pse.ee/5U7WT
留言列表