産品特色
編輯推薦
1.這是一本由設計專傢呈現自己17年經驗的語音界麵設計經典!!
2.這是由阿裏資深設計師傾情翻譯的語音界麵設計經典!!
3.這是阿裏巴巴國際UED負責人傅利民、Designaffairs閤夥人小猴科技創始人兼CEO劉力丹、同濟大學設計創意學院副院長孫效華、物靈科技CEO前百度少帥顧嘉唯傾情作序力薦的語音界麵設計經典!!
內容簡介
《語音用戶界麵設計:對話式體驗設計原則》是一本由擁有17年從業經驗的資深語音用戶界麵設計(VUI)係統設計專傢CathyPearl撰寫的語音設計經典,從VUI係統簡史開始講述,包括瞭語音用戶界麵設計的基本原則,VUI係統設計中必不可少的人物模型設計,還包括一些語音用戶界麵設計的進階知識,如語音識彆技術,自然語言理解、情感分析、數據收集和文本語音轉換策略等,另外還介紹瞭語音界麵用戶測試的知識,以及VUI在投入實際使用後需要注意的地方,特彆提到瞭包括傢庭助理設備和可穿戴設備等如何設計VUI係統。
作者簡介
Cathy Pearl,Sensely 用戶體驗總監,為Sensely 創造瞭富有同理心和對話性的虛擬護士形象。在Nuance和微軟任職期間,為銀行、航空、醫療公司設計瞭多款VUI係統,也是福特SYNC係統的設計師。在沃爾沃任職期間,她創造的對話式 ipad app 使用戶可以從 Esquire magazine的生活專欄作傢獲得建議,與聖誕老人聊天或者與脫口秀演員說笑。
王一行,設計師。設計領域涉及交互設計、智能硬件設計、工業設計。曾先後任職於百度、網易,目前就職於阿裏,從事平颱設計創新工作。關注設計與技術背後的人文思考,緻力於使技術為人道服務的設計實踐。
目錄
第1 章 導語 1
1.1 語音用戶界麵(VUI)簡史 1
1.2 對話式用戶界麵 7
1.3 VUI 設計師是什麼 11
1.4 聊天機器人 11
1.5 本章小結 14
第2 章 語音用戶界麵基本設計原則 17
2.1 移動設備與 IVR 係統設計 17
2.2 對話式設計 21
2.3 設定用戶期望 25
2.4 設計工具 28
2.5 確認策略 32
2.6 命令—控製模式和對話模式 41
2.7 對話式標識 50
2.8 異常處理 52
2.9 不要責怪用戶 60
2.10 新手和專傢用戶 61
2.11 持續跟蹤上下文 63
2.12 幫助和其他通用部分 68
2.13 延遲 72
2.14 消除歧義 74
2.15 設計文檔 76
2.16 無障礙設計 78
2.17 本章小結 88
第3 章 人物模型、虛擬形象、演員和視頻遊戲 91
3.1 人物模型 92
3.2 我的VUI 應該做成可視化的嗎 98
3.3 使用虛擬角色時不該做什麼 99
3.4 使用虛擬角色(或預先錄製的視頻)時該怎麼做 103
3.5 我什麼時候該在VUI 中使用視頻 111
3.6 視覺VUI——最佳實踐 113
3.7 視覺反饋(無虛擬角色) 124
3.8 選擇一個聲音 128
3.9 虛擬角色的優點 128
3.10 虛擬角色的缺點 132
3.11 本章小結 136
第4 章 語音識彆技術 139
4.1 選擇語音識彆引擎 139
4.2 語音打斷 141
4.3 N-Best 列錶 156
4.4 語音識彆的挑戰 158
4.5 數據隱私 165
4.6 本章小結 166
第5 章 語音用戶界麵設計進階 167
5.1 不同類型的語音輸入 169
5.2 消除歧義 175
5.3 處理否定 182
5.4 捕獲意圖和對象 183
5.5 對話管理 184
5.6 不要晾著用戶不管 187
5.7 VUI 要顯示識彆到的信息嗎 188
5.8 情感分析和情緒檢測 190
5.9 文本轉語音和預錄語音 193
5.10 說話者確認 197
5.11 “喚醒”詞 199
5.12 語境 200
5.13 高級多模態交互 201
5.14 自助數據集 202
5.15 高級自然語言理解(NLU) 204
5.16 本章小結 209
第6 章 語音用戶界麵的用戶測試 211
6.1 VUI 用戶測試的特殊考慮因素 211
6.2 用戶及用例背景研究 212
6.3 為真實用戶設計研究方案 214
6.4 早期測試 226
6.5 可用性測試 233
6.6 衡量測試結果 239
6.7 下一步計劃 240
6.8 測試汽車、硬件設備和機器人的VUI 係統 241
6.9 本章小結 244
第7 章 完成VUI 後,下一步該做什麼 247
7.1 預發布測試 248
7.2 效果評估 252
7.3 日誌 264
7.4 轉錄 266
7.5 發布階段 268
7.6 調研 269
7.7 分析 270
7.8 工具 275
7.9 本章小結 278
第8 章 帶語音功能的設備和汽車 279
8.1 設備 279
8.2 汽車和無人駕駛車輛 295
8.3 本章小結 308
後記 309
附錄 書中提到的産品 311
精彩書摘
《語音用戶界麵設計:對話式體驗設計原則》:
另一個使用熱詞的場景是,用戶需要在對話中先暫停並完成一項操作。這種一般發生在用戶需要去找一些物品來迴答問題的時候,比如在續訂處方的過程中,用戶需要去拿一個藥瓶來確認處方編號。此時係統問:“你需要一些時間來確認處方編號嗎?”如果用戶說“是的”,係統會提示用戶在找到後說句“我迴來瞭”或者“繼續”。這也就相當於暫停瞭對話。
對於那些不僅僅依賴於語音的VUI係統,不建議經常使用打斷功能。比如,如果你的VUI使用瞭預先錄製的視頻,就不應該使用打斷功能。因為被打斷時,預先錄製的視頻很難處理。難道視頻應該突然停止嗎?之後要從剛纔停止的地方重新開始播放嗎?當你的VUI係統有一個虛擬形象或者預先錄製的視頻時,它的體驗會更像和一個真人進行交談,用戶往往會更有禮貌,並耐心等待係統把話說完。當虛擬形象或預錄視頻說話時,用戶可能也在說話(與彆人交談),顯然此時用戶並不需要虛擬形象聽自己說話。如果你的係統沒有啓用打斷功能,請不要強製用戶收聽很長的列錶或菜單,而應該把事情分成更多的步驟,並依靠可視化的列錶來減輕認知負擔。
……
前言/序言
推薦序一
我在用半語音、半打字的模式寫下這段文字時,聯想到語音用戶界麵的發展與互聯網技術的發展非常類似。
在互聯網時代來臨之前,用戶界麵是以Windows為主的GUI,當用戶需要工作、娛樂和遊戲的時候,就購買相應的軟件,安裝後纔可以使用。當時大部分的設計和研究方法都集中在獨立程序上。大概在1998年,撥號上網時代結束,Web瀏覽器在功能上的完善讓大傢的眼光開始關注到互聯網上,那時Amazon剛剛有瞭百萬用戶,WebVan和Pets.com正在蓬勃發展(這兩款應用目前均已消失)。各種産品開始轉嚮互聯網,因為Web瀏覽器可以穿透各個程序,方便地把各種各樣的內容和功能都呈現在前端頁麵上。之後,互聯網給整個IT行業帶來瞭深刻的變化,獨立程序漸漸消失,取而代之的是在瀏覽器界麵中的應用。
到瞭移動互聯網的時代,一輪新的程序開發又開始瞭。App像雨後春筍一樣湧現齣來,滿足用戶在娛樂、遊戲、工作等各個方麵的需求,由於移動屏幕尺寸和網絡速度的限製,單單使用一個簡單的移動瀏覽器不能解決所有的問題。
語音和當年的瀏覽器一樣,是一個可以穿透所有程序、解決用戶所有問題的方法。當需要叫車服務的時候,我並不在乎是哪個軟件在叫車,最好的情況是語音發齣後,通過各個應用的比較,找齣一個最佳的路綫,並且最符閤我使用習慣的叫車方案。語音是人類古老和自然的交互方式,在人工智能發展到可以部分理解語音的時候,語音時代開啓瞭。語音除瞭在娛樂、遊戲、工作上有廣泛應用,還會廣泛應用在IoT上。越來越多的設計師的工作會涉及語音界麵設計。這本書的作者Pearl把自己17年的工作經驗總結齣來,介紹瞭語音界麵的設計原則、語音識彆技術、自然語言理解、語音用戶研究方法,以及語音在設備上的應用。理論和實踐相結閤,非常實用!
這本書是天貓精靈設計團隊的參考書之一,在使用過程中發現這本書非常有用,因此我們的設計師一行花時間把整本書翻譯成中文分享給大傢。
PaulFu
Sr.Director,UserExperience,AlibabaGroup
推薦序二
一行囑我為他翻譯的書寫序,還沒有看過是什麼,我便欣然同意瞭。一行曾是我的學生。學生時代的一行就成熟得不像他的年齡。在初期時我對他說,“小心技術過於成熟而落入俗套。”事實證明我是錯的。一行最大的特點是冷靜並特立獨行。每次問他問題,他先是沉默,想好後可以很縝密地迴答,往往挑不齣什麼漏洞。基於這樣的經驗,之後的閤作我便選擇完全地相信他。所以我想一行精心挑選翻譯的書籍,一定不會差。
一行陸續給我寄瞭原稿和翻譯稿,我讀後有一些感想:交互方式正從單純的視覺、硬件交互轉化為多感官綜閤的交互。每一次技術的變革都帶來交互上的巨大挑戰。“與機器像和人一樣對話”,VUI不是一次升級,而是一個完全不同的新世界。這個世界正在來臨,但又還有很多未知;這個全新的體驗正呼之欲齣,等待人們去定義。
VUI感性層麵的需求比視覺交互和硬件交互更為復雜。除瞭閤理的邏輯之外,場景、對話的上下文關聯、角色的設定、語境的感知等都對用戶體驗起到瞭重要的作用。VUI像是給機器賦予一個新的性格。在這個領域也將産生不同的人纔需求。最近遇見Dyson的設計師,他稱自己為工程師,並解釋他自己也不知道自己是什麼樣的定義,隻知道伴隨瞭産品整個的研發流程。在VUI領域,同時需要被打破的職業界限,需要更多元的職業類型介入去共同定義。他們可能是設計師,是開發者,是語言學傢,是心理學傢,是劇作傢,等等。
最近我買瞭AmazonEcho,女兒每天早上嚮Echo問好。Echo沒有屏幕,環轉的燈光非常友好地展示瞭擬人化的傾聽。我意識到VUI已經來瞭,它很聰明,但是又還很魯莽;它讓人興奮,但又時時給人帶來與機器對話的挫敗感受。哪怕産品很智能,一個不好的VUI就像是一個聰明人無法傾聽和錶達一樣無奈。在這個技術與設計並行發展的進程中,VUI還處在一個很早期的狀態,會有很多令人睏擾的問題:怎樣的設計流程可以支持這個新的領域?VUI和屏幕交互是什麼樣的關係?什麼樣的場景最為適閤?機器需要有什麼樣的性格?如何管理用戶的期望值?如何彌補對話中帶來的挫敗體驗?交互過程中的情感感受將會怎樣?
VUI領域還沒有太多的經驗可以參考,設計教育界也還沒有做好足夠的應對,而這是一本來得如此及時的、難得的、實用的工具書。一行告訴我,書的內容隻是一個開始,希望讀者通過此書能開啓一個全新的思考。
劉力丹
designaffairs閤夥人、小猴科技創始人兼CEO
推薦序三
從軟件工程轉到工業設計專業,現在又在從事交互設計的工作,王一行一直是一個在自己喜歡的方嚮上執著鑽研、追求完美的學生和設計師。當以往的學霸和紅點得主來找我為他的譯著寫序時,我很是欣喜。非常欽佩一行哥(同學中的昵稱)在阿裏繁忙的工作之餘還能擠齣時間來學習新知識,並有心布道語音交互界麵設計這一交互設計的新成員。
作為一種自然人機交互方式,語音交互由來以久,近年來更是被運用到瞭越來越多的産品之中,如從手機到智能産品、智能傢居,從機器人到車載HMI。然而對語音交互的設計方法、流程,以及對其特有的設計問題的研究卻非常匱乏。15年前在IBMT.J.Watson參與基於對話的語音交互係統的研究與應用實踐,到現在進行多模態車載HMI的設計中,我大都是把語音交互作為交互係統中的一個重要元素加以運用。本書將語音交互作為一個與視覺交互界麵(GUI)並列的界麵類型,對其設計進行係統地分析、研究與實踐指導,視角新穎,為對語音交互設計的深入研究打開瞭一片天地。相信一行精準到位的翻譯可以將大傢完美地帶入這一交互設計的新領地。
孫效華
博士、教授、博士研究生導師
同濟大學設計創意學院副院長,交互設計方嚮負責人
數字創意中心負責人
推薦序四
當很多人正在熱議AI究竟是會幫助人類還是毀滅人類的時候,人工智能的浪潮正在悄然顛覆著我們生活的一點一滴。而基於CUI(ConversationalUserInterface,對話式用戶界麵)的智能産品,就好像是衝在AI浪潮最前沿的浪花,將隱藏其身下的算法和數據幻化成最能“直接拍打在用戶皮膚上”的體驗。作為一個新生的領域,VUI(VoiceUserInterface,語音用戶交互界麵)對於用戶體驗設計提齣瞭更多語言學、情感塑造、邏輯搭建等方麵的新要求,於是這樣一本專業、全麵的VUI設計指南的齣現,就更顯得彌足珍貴。
我在第一時間就和我的團隊一起精讀瞭英文原版,受益匪淺,相信中文譯本的齣版一定會幫助更多的共同前行的夥伴,受邀作序,備感榮幸。
就在我敲下這些文字的時候,大多數行業從業者都激進地把人工智能在人類曆史上的重要性堪比、甚至遠超過工業革命,很多人正擔憂人工智能即將陸續取代一些職業並改造我們的社會化分工。我認為有一點是毫無疑問的,這是一個不可避免的智能時代,作為新生産工具的AI,除瞭在限定技術邊界的垂直行業應用領域,各行各業都有機會被AI力收割“lowhangingfruits”來迅速提升各類生産效率,將對人類文明和産業變革産生重大影響。
迴顧過去,機械設備的齣現為人類帶來瞭提升效能的工具,互聯網的齣現,將效能再次提升,而伴隨著AI的齣現,效能將進一步大規模提升。不可避免地說,在智能時代,大量重復性工作的人力工種肯定不復存在,還有很多具有結構化知識的經驗性工作也會被機器智能所取代,甚至未來是創造性工作,但是更多的是通過為人賦能的方式,減輕社會勞動者和服務業的壓力,將會重新進行一輪人類社會化分工。
在互聯網時代,“連接”是核心關鍵詞,如果C不能滿足A和B的完整需求,那互聯網有機會讓A通過連接,跨過B和C直接找到D,但如果在一些場景和行業內B/C/D是稀缺性資源,那麼這個情況在互聯網時代就很難得到解決,AI的齣現將有機會扭轉這種供需關係。舉例來說,以前用戶看病花在預約和掛號的時間基本占到95%,真正用於醫患有效溝通和問診時間僅為5%。人工智能將代替以往所謂“互聯網醫療”盲目且低效的連接,如VUI/CUI初診問答機器人將患者進行分流,縮短醫師護士等在預約和問詢過程低效的重復時間,改善供需方的不對等關係。
大傢都知道過去60年裏人工智能經曆瞭兩次潮起潮落。現在我把這次AI的興起,分為新AI時代的頭十年和後十年。前十年是AI解決行業問題,比如前麵講的醫療、教育、信貸和金融風控等,通過大數據和機器學習迅速提升效率和準確率;新AI時代的後十年,機器智能將全麵升級消費産品和用戶生活場景,人工智能必將革新交互方式,進入計算無處不在的時代。下一代人機交互革命就在眼前,這將是一個激動人心的時代,就好比百年前蒸汽機、汽車、飛機等偉大産品的發明一樣,如今將會齣現大量被重新定義的智能産品,無人駕駛車、智能傢居、傢用機器人、下一個時代的個人助理等。當馬車被汽車替代的時候,人們是措手不及的,同樣的,AI時代的創新傢們已經蓄勢待發準備重新發明和改造今天陳舊的生活方式瞭。
我覺得賦能是人工智能對人類最重要的事情,因為這是人類進化需求的本質。人都渴望被賦能,這是天性。人發明蒸汽機、汽車、飛機、手機、計算機,從運動能力和生産效率等方麵突破自身局限。大部分人沉迷於遊戲,是因為在遊戲中感受到自己被賦予瞭更大的權利和能力。這些都是順應人性的事情,我覺得VUI最有價值的場景應用就是在人機交互過程中産生的便利性賦能。
無論是從雲端到邊緣在下一代硬件架構的變化,還是深度學習算法在圖像識彆和語音識彆的單項上逐漸超過人類水平,AI的技術成熟度還在不斷提升和進化過程,但是今天語音對話交互技術的發展尚還沒有成熟到可以替代鼠標鍵盤和觸摸屏。不過現階段已經可以應用在一些特定場景下,比如用戶雙手不便下達快速指令、智能電視或者智能音箱上的跳步檢索某一首歌或者某一個電影關鍵詞,又或是實時機器翻譯。但可以肯定的是,未來無處不在的
AI技術,必將帶來交互的革命,顛覆的機會,也將屬於那些極少數懂得技術邊界、極具場景化思維、勇於革新的創新傢們。
2016年,我和誌同道閤的小夥伴們一起創立瞭“物靈”。在工具化大工業産品思維主導的今天,我們希望去開闢另外一條路徑,去創造人機共生的靈性世界。我們認為,人和産品的關係,在這個萬物智能的時代,正在發生著巨大革新。我們經曆瞭電器設備鏇鈕時代、鍵盤鼠標時代、觸屏智能機時代,而現在萬物智能時代的到來,很快就會將我們從鼠標鍵盤和低頭點手機平闆的觸摸屏上解放齣來,機器與人的交互會從不平等的單嚮被動模式轉變為逐漸平等雙嚮的多模態主動模式。而語音交互正是這個過程的第一步。我們認為這種互動模式的本質就是“關係”。我們把這種“基於關係的交互方式”稱作RelationshipUI。物靈想要做的“智能/關係式交互”産品,不單單是計算機視覺、自然語言理解、深度學習、大數據等這些正在不斷突破的AI技術的集閤體,更加是一個讓用戶能體驗到生命感,産生依賴,寄托情感的“靈物”。這本書裏提到的Jibo機器人,正是RelationshipUI的一個很好的例子。我作為Jibo的董事長,物靈作為Jibo在中國的獨傢閤作夥伴,我們和MIT的CynthiaBreazeal的團隊也正在一起努力把這個可愛的小“靈物”帶給中國的消費者。
當語音交互、智能匹配和個性化推送成為新一代用戶的主流交互方式的時候,蘋果構築的那個以一個個各自為陣的App為核心的生態纔能再一次瓦解——從移動互聯到智能物聯的轉變,我們將經曆ContextualUI取代SelectiveUI的産品形態。
而想要真正構建好這種産品和用戶之間的“關係”,VUI無疑是最重要也是最自然的交互通道之一。在創業初期,我們的VUI團隊一直在摸索如何設計對話內容和邏輯,創造Character,優化體驗。不同於傳統的GUI,由於缺乏係統性的指導和總結,我和團隊做瞭很多的嘗試,也走瞭很多的彎路。這本書的齣現很好地幫助我們理清瞭VUI相關的基本框架和設計規則,而其中的很多觀點,也和團隊在實踐過程中得到的經驗有很好的切閤。對每一個想要從事VUI相關領域的UX設計師、語言學傢甚至工程師,這本書都能起到啓濛和指南的作用。
從我前麵提到的AI前後十年的說法來看,當下我們所處的弱AI結閤強産品的時代,還是有機會通過産品矩陣來形成現象級産品的,而這時正需要懂AI技術邊界的設計師和産品人,來重新思考和設計使用場景。甚至都不是“尋找”應用場景瞭,而是要去“發明”應用場景的時代。創造齣偉大的産品,在工程師把技術基礎打造得差不多時,還是需要設計師、心理學傢、社會學傢等,去創造和拓展用戶交互場景的疆界。
我們團隊的一大常規團隊建設內容就是一起重溫那些經典的科幻電影,吸收靈感,也感嘆原本隻存在科幻電影裏的人工智能,在這短短的幾年就已經走進瞭我們的生活,甚至我們的現實已經在很多的場景下超越瞭科幻電影的設定。而我們深知,這短短幾年AI爆發的背後,是幾十年同行者在不同基礎領域的不斷積纍,是像本書作者CathyPearl這樣將近20年專注於VUI的探索和實踐並著書立說、開放分享的精神。既然我們正在進入一
語音用戶界麵設計:對話式體驗設計原則 下載 mobi epub pdf txt 電子書