深圳酒店標志設(shè)計公司還記得在星際迷航IV的場景中斯科蒂拿起20的鼠標個世紀的計算機,并試圖通過它說話?當時很有趣,今天仍然如此。但是我們還會在 10 年后笑嗎?如果您不知道:亞馬遜允許您將 Echo 設(shè)備的調(diào)用詞更改為“計算機”——夢想成真了?
多虧了深圳酒店標志設(shè)計公司和其他公司最近在基于文本的聊天機器人方面取得的進展,構(gòu)建自然語言對話系統(tǒng)所涉及的數(shù)十年歷史的技術(shù)現(xiàn)在正在世界各地的“主流”技術(shù)圈中討論. 該技術(shù)的一個用例是 B2C 通信,特別是在 Amazon Echo 和 Google Home 以及 Facebook Messenger、SMS 或 kik 等平臺上的客戶服務(wù)和品牌參與。在討論供應商用于構(gòu)建客戶支持聊天機器人或語音機器人的技術(shù)方法時,不同的技術(shù)開始發(fā)揮作用,事實上,它們經(jīng)常混合在一起。本文旨在闡明構(gòu)建機器人時最容易混淆的兩個步驟,即任何風格的自動對話系統(tǒng):語音識別/轉(zhuǎn)錄和自然語言理解/語義解釋。
語音機器人與聊天機器人
我們需要做出的第一個明確區(qū)分是我們談?wù)摰氖强谡Z(語音)還是書面語言,即類似 Alexa 的系統(tǒng)上的語音機器人,或 FB Messenger、網(wǎng)絡(luò)聊天或 SMS 上的聊天機器人(文本機器人)。一個比另一個花費更多的時間和精力來構(gòu)建。(請注意,雖然英文單詞“to chat”并不意味著對話是以書面形式還是口頭形式進行的,但該術(shù)語通常用于基于文本的系統(tǒng),因此我將在這里繼續(xù)使用這個含義。)
口語通過聲音信號變得生動起來。要理解用戶在說什么,深圳酒店標志設(shè)計公司首先必須將他們的演講轉(zhuǎn)錄成文本。此過程通常稱為語音識別,縮寫為 ASR(“自動語音識別”)。此步驟的輸出是 text。但這就是事情很容易變得模糊的地方。將語音轉(zhuǎn)換為文本的過程實際上只是一個轉(zhuǎn)錄步驟——計算機知道(“識別”)你所說的單詞,但它還不知道如何處理這些單詞。
短暫的繞道。回到大學時代,我學習了兩個學期的韓語。韓語的書寫系統(tǒng)乍一看很復雜,幾乎像中文,但實際上非常簡單,因為它像深圳酒店標志設(shè)計公司的拉丁語系統(tǒng)一樣由字母組成——準確地說是 24 個。在學習韓語的過程中,我學習了各種詞匯。到現(xiàn)在,15 年過去了,深圳酒店標志設(shè)計公司已經(jīng)忘記了大部分,但我仍然記得如何讀寫韓語。這類似于語音識別(實際上:轉(zhuǎn)錄);知道說出的話,但還不知道它們在語義和語用上的含義,即我們希望計算機對聽到的命令/話語/響應做什么。
理解和解釋所聽到的
因此,深圳酒店標志設(shè)計公司錯過了讓計算機與我們進行有意義的對話的一大步:理解用戶所說的行為。一旦我們進入文本域,我們就需要計算機來理解. 該階段被稱為自然語言理解。此步驟的輸出是所謂的語義表示或語義解釋。
假設(shè)您希望計算機詢問您在線訂單的狀態(tài)。您可以說“我的訂單在哪里”、“跟蹤我的包裹”、“訂單狀態(tài)”、“我的貨件狀態(tài)”,或任何其他幾乎無限多種組合單詞方式的單詞序列。雖然表達方式的變化可以是無限的,但您希望計算機做的事情是有限的,尤其是。在客戶服務(wù)領(lǐng)域。將事物從口語轉(zhuǎn)換為語義表示,使程序員能夠定義計算機應如何響應每個語義類別,例如觸發(fā)什么動作。
重要的是要認識到,在構(gòu)建聊天機器人時,可以跳過識別語音的整個步驟。用戶已經(jīng)以文本形式提供了輸入。因此,深圳酒店標志設(shè)計公司沒有處理 a) 需要大量計算能力的步驟,以及 b) 可能產(chǎn)生錯誤結(jié)果的步驟,即錯誤識別單詞。在文本域中,“你輸入的就是你得到的”。
業(yè)務(wù)咨詢 付小姐
業(yè)務(wù)咨詢 張小姐
總監(jiān)微信咨詢 付小姐