文章目录[隐藏]
Image credit: Kuromon Ichiba Market, Ōsaka-shi, Japan
大家好,这个星期将通过一个Alexa案例分析来介绍用户如何使用语音交互来解决功能性问题。(10分钟左右阅读时间)
笔者作为用户体验设计师就职于一家人工智能公司,17年12月和18年1月进行了2轮为期两周的用户研究来了解:语音理财助手的用户特点,用户为什么会使用语音理财助手,用户如何与语音理财助手交互,常见的语音交互错误类型,以及用户期望的交互方式。这篇文章作为一个总结,旨在分享部分研究结果和研究方法以帮助更多用户体验设计师和研究员进行更好的研究,以及帮助非用户研究领域但是对语音交互有兴趣的朋友了解更多工业界语音人工智能。
语音交互的研究方法 — 日记研究
第一轮日记研究在17 年12月份面对公司内部的30个人,其中大部分人是开发人员,少部分是市场,销售,和运营人员。每个人把Amazon Alexa带回家并且登录自己的个人银行账号,在为期2周的时间里每天会收到一封邮件教育用户可以问的问题和日记提示(Diary Prompt)写下自己的感想,每三天会收到有一份问卷。2周结束后有10分钟-1小时不等的访谈(Interview)。
在成功的完成公司内部的日记研究之后,第二轮日记研究面向当地的50个用户进行相似流程。50个用户来自不同的年龄,职业,和社会地位,但50个用户都对科技感兴趣并且愿意尝试新的科技。
与此同时,笔者也在人机交互领域阅读相关的研究文章和书籍,将人机交互(Human Computer Interaction, HCI)行业领域的文献和此次用户研究相结合进行简单的从宏观到微观的分析。
KJ法分析方法(affinity diagram)
智能语音理财助手的用户特点
此次研究的地区主要在美国密西根州,用户均有使用过智能语音系统的经验,例如苹果的Siri, 亚马逊的Alexa, 谷歌助手,三星的Bixby, 或者是微软的Cortana等。
一个通常的误解是千禧年一代(Millennials)或者类似的中国80后90后会是语音理财助手的主要消费者,但是在我们的研究过程中发现只要消费者符合以下两点便可以是主要消费者,并不限定于职业,年龄,性别,或者社会阶级:
-
关心自己的财务信息。设定理财目标并且积极的进行个人理财。
-
愿意尝试新科技。根据在创新扩散理论,用户群体并不一定限定在第一个使用新科技的人,但不是最后使用新科技的人。
用户为什么会使用智能语音助手理财
用户使用语音理财助手的主要原因有:
更快捷及时的搜索个人账户相关的信息。相对于登录银行网站或是使用手机App查询账户信息,能够在家里快捷的询问个人账户信息是用户最为满意的一点。
对话比打字更为自然。用户每天都有上百个想法,能够提供非常简单方便使用的产品使得用户在想起来的那一瞬间便能轻易的时使用产品就能很好的提高用户粘度。用户喜欢Alexa个人理财助手的一点便是能够进行从简单到复杂的对话并且人工智能也能理解。
多任务同时处理(multitasking)。很多用户会希望在一边开车,一边走路,或者一边做饭时候进行对话。
更好的进行个人理财。因为能很便捷的了解个人财务信息,用户觉得可以做出更好的预算,消费决策,并且达到长期的健康理财。
使用语音交互系统(Alexa,Google Home)会让用户在同温层之间显得很酷😎。有25%的用户表示使用Alexa个人理财助手能让他们在人际关系的同温层中看起来很酷。
为大型购物做预算。20%的用户想要通过Alexa个人理财助手来进行更好的财务规划以便在不久的将来计划一些大的开销,例如买车,买房,买机票等。
便捷快速的理由也和另一份文献研究相符合:
Capgemini, Conversational Commerce, Page 15
同时,用户使用Alexa个人理财助手的主要顾虑有:
隐私和安全问题。使用Alexa个人理财助手的时候,如果不进行用户登录验证,那么任何人都可以获得财务信息。但是进行用户登录验证的话,又会使得使用语音的快捷性降低。同时很多用户不希望Alexa大声读出自己的财务信息以免邻居们可能会听到。
在Capgemini文献中也给出了更多原因,例如觉得不需要语音助手,没有使用语音助手的激励,担心透露过多个人信息等:
Capgemini, Conversational Commerce, Page 17
用户与智能理财助手的主要交互挑战
通过两次的日记研究和对用户对话历史记录的分析,更微观层面用户使用Alexa个人理财助手的主要挑战有:
理财业务流程多样化,个性化。转账付款是一个比较根据用户性格来确定的功能,有些用户会不介意使用语音转账,有些用户会比较谨慎需要进行两部认证,例如发送确认信息到手机上等。交互的调账不经在于用户进行转账的流程多样化,不同的银行也会有不同的商业模式,所以对话比较难设计
用户很难记住语音助手读出的一长串表单。用户会使用语音搜索账单上的一条开销,是否已经支付了账单,以及是否收到工资等。在询问开销的时候,有时候会需要通过语音呈现一个表单。表单上通常会包括几个开销明细,每个开销明细包括金额,日期,商铺。很多时候用户听完一个开销明细后会记住大概的金额,但是听到多余一个开销的明细之后很容易忘记所以的信息。所以在进行语音设计的时候,对表单的呈现需要考虑普通用户对语音的接受程度。
用户不知道可以问什么样的问题。刚开始使用的时候,非常常见的一个情况便是用户在思考要问什么,但Alexa以为用户结束问问题了就停止了对话。另一个经常使用的便是对新用户而言,因为缺少可以理解的提示(Affordance)用户分不清楚什么时候是Alexa状态什么时候是理财助手,导致用户会把理财助手当做Alexa来问问题。
对话模式和自己的对话习惯不一致。用户很多时候会按照他们习惯的语言方式来对话,有逻辑或者没逻辑,简洁或者复杂,思维跳跃或者思维定向,这些复杂的个性化对话都指向语音交互需要个性化到每一个人。当用户听到不需要的信息,或者很长的表单信息的时候,用户会自然的想要打断对话或者中止对话但却不知道如何进行语音交互。
Human to Human Conversation, by Daniel S Gaxiola
常见的语音交互错误类型
笔者会在未来的文章里面更细节的探讨常见的交互问题和相应的交互设计解决方法。这里不完全的将错误归为4类:
语音识别错误(Automatic Speech Recognition Mistake, ASR)。Amazon从2014年第一次发布Alexa到现在,在语音识别领域涉及到专有名词的时候还是会有比较多的错误,比如把产品名字理解错(Finie — Funny, Beanie),把一些常用词理解错(Clothes — Close)等。有些时候用户并不知道可以使用Alexa App查看语音聊天记录,所以并不了解是在语音识别过程除了问题从而认为产品没有理解他们。
话题领域。很多时候用户提问的话题可能不是工程师和设计师呕心沥血设计出来的话题,比如用户会问一下还不支持的话题,或者会因为第一种ASR错误导致AI无法理解原本可以支持的话题。在未来的文章中我会探讨更多如何设计话题内容(Dialog Prompt)和如何教育用户问什么问题。
答复质量。有时候AI可能正确的理解了用户想问的问题但是由于种种限制没有提供用户想听的信息或者以用户无法理解信息,比如说用户想知道这个月账户有多少钱,但是语音理财助手读出了用户17个账号的明细导致用户记不住任何信息等。
使用习惯。人们会把人与人对话适用到与智能语音助手对话中,例如打断对话,中止对话,要求重复答复,开玩笑,表示不满,表示感谢,想要听到赞美等各种复杂的心理活动。
对话中的错误会极大的影响用户体验,导致用户不愿意再和语音助手交流。
用户对语音理财助手期望的交互方式
通过此次日记研究,从用户角度考虑,美国地区的用户对智能语音助手期望的交互方式主要有一下三点:
能真正理解自然语音的语音助手。在美国科技创新的文化下,用户期待语音助手能够提供高精确度的自然语言处理和机器学习,不仅能理解用户或复杂或随性的对话,同时能够保存情境从而进行更为复杂的对话。用户并不满足于聊天机器人(Chatbots)式的生硬对话,期待语音助手能够理解更为自然的对话。
更便捷的多任务同时处理。在信息过载,较长的工作时间,开车为主导的文化下,用户希望能够便捷快速的使用语音助手在碎片时间进行多任务同时处理。用户希望语音助手不仅存在于Alexa上面,而且能在App, 电脑,汽车上保持同步。
更个性化的设置。用户期待语音交互能够更加个性化,期待语音助手能够学习用户不同的使用习惯并且进行个性化的设置,比如设置女性或者是男性的嗓音,说话的速度,说话的音量,展示的信息,记录对话历史等。
同时,根据Capgemini对2558用户的研究表明,最重要的便是能让语音助手真正的理解人们说的话,而不是将chatbot的科技生搬硬套到语音系统上。
Capgemini, Conversational Commerce, Page 16
题外话:如何展示研究结果
笔者和队友们在结束两个月的两次日记研究之后,摸索了很多呈现研究结果的方法,虽然他们可能看不到这篇文章,但是仍然要感谢队友Dr. Alex Shye和Emma Furlong的付出。
在展示用户研究的结果时,个人经验觉得将听众分为三类比较适用:
公司领导者和产品经理。注重宏观角度的分析,从上而下,提供清晰的问题描述(Problem Statement)和可执行方案(roadmap, etc)。谨慎使用专有名词,比如说用户画像(Persona)等,并且把握好信息结构。
工程师和设计师。注重微观角度的分析,从下而上,注重逻辑的严谨性和用户体验。可以提供用户画像(Persona),产品痛点,用户体验流程(user journey maps)等,越具体越好。
市场和销售人员。提供宏观层面的分析,类似于SWOT分析,用户画像(Persona),用户的偏好等,以帮助市场和销售人员更好的给客户说明公司产品。
两次的日记研究对象主要是公司内部人员和密西根州的居民,所以一定程度上不能代表所有美国地区的用户。这篇文章意在分享通过日记研究发现的更多问题来为之后语音助手的设计提供更多基石。
Conversation, by Phil Coffman
在下一篇文章,我将会分析从用户体验设计师的角度而言,如何设计语音交互内容,错误类型,以及如何从错误中恢复。
感谢樊星(Product Designer, Rokid)对文章的修改意见😄。