AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

文 | 何忞来自雷锋网(leiphone-sz)的报道雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路。雷锋网将其编译如下正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角...

 
雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路,来自雷锋网(leiphone-sz)的报道 雷锋网将其编译如下
文 | 何忞

正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角下,我们在思考机器学习(ML)如何在解决人类的需求时发挥自身的独特性。我们的团队集合了 Google 整个公司的各种人才,为 UX 用户带来机器学习的核心概念,让用户了解如何将机器学习和人工智能完美地融合到交互设计中。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

由谷歌AI相机Google Clips camera捕捉的父母、孩子和宠物的真实时刻

Google Clips 是谷歌的一款 AI 相机,专门用于捕捉身边人的精彩时刻。设备自带的人工智能可以通过机器学习了解到谁是你最亲密的身边人,并且知道如何才能拍出一张漂亮又令人难忘的照片。今天,我们将以这款 A I相机为例,详细阐释在这三年中,我们是如何构建出产品模型、进行工业设计和用户界面的。通过这篇文章,我们希望大家能够了解如何用以人为本的方法来设计 AI 产品。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

AI 相机可以放置在固定的框架上,并保持静止。上图中,我把相机夹在了篮筐上,抓拍到了我儿子打篮的精彩时刻。

只是将更多的 UX 用户分配到机器学习的项目中是远远不够的。更加关键的是让更多人了解到机器学习的核心概念,充分理解 AI 的能力,并能够围绕最佳实践产品来构建和维护信任。其实,从确定在产品构建中哪些模型是有用的,到数据的收集和注解,以及新颖的原型机的建造和测试,机器学习生命周期中的每一个阶段都是创新的时机。

首先第一个问题是,为什么采用以人为本的方法来构建机器学习产品和系统是非常重要的呢?我们认为有以下几个原因:

  • 机器学习本身并不会找出现实中需要解决的问题。如果你在设计中没有考虑到人的需求,那么你只是建立一个非常强大的系统来解决一个非常小或者根本不存在的问题。

  • 如果 AI 系统的目标不明确,并且用户对自身在调教系统中的角色认识不清,那么用户就会根据自己对 AI 的理解或想象来看待系统,这会让他们的信心受到影响。

  • 为了迅速发展,机器学习必须适应多学科的任务,即使不需要太多学科,但如何适应人类社会系统应该是一个需要面临的技术问题。机器学习是根据它在数据中自动发现的模式和关系进行预测的技术。一个 ML 模型的工作是要弄清楚这些自动发现的这些模式有多大可能出错,从而尽可能地保证通常的预测尽可能地正确。但这是远远不够的。从一开始建立模型的思路,到选择训练用的数据源到样本数据本身、以及用于描述和标记数据的方法,一直到模式关系对错的判断标准,机器学习系统的方方面面都是依靠人的判断来调整和修正的。总之,那句 UX 的公理“你永远不如用户了解他自己”,在这里显得异常重要。

三种以人为本提升AI设计的方法

解决人类的真正需求

今年,人们将会使用我们的相机拍摄大约一万亿张照片。在面对如此庞大的数字照片库时,我们中的很多人实际上并不会仔细浏览。新手父母尤其如此,感受宝宝的每一个第一次就是他们的日常生活。在那些珍贵而短暂的时刻,人们已经习惯使用他们的手机相机,希望能够为未来捕捉和保留一些回忆。但最终的结果是,人们用一个小小的屏幕来取代所有的感官,与世界的互动反而更低了。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

作为一个新手父母,你的照片库可能看起来很像我的上面手机照片——连续地拍摄,以捕捉孩子最完美最可爱的表情。

因此,我们在想,能不能创建一个产品,帮助我们更加关注我们关心的人呢?能不能让我们出现在照片中,而不是总躲在照相机后面呢?我们能不能“即时”拍摄照片,而不必停下来,拿出电话,打开相机,在镜头中对焦,保持这一刻的真实呢?我们能不能让一个摄影师在我们身边随时捕捉更多真实的生活时刻,比如孩子们的真正微笑呢?那些真实而转瞬即逝的时刻,往往让我们觉得甚至永远背着相机都不可能全部捕捉得到,而这就是我们这款 AI 相机打算满足的人类需求。

引导机器智能

产品设计之初,最迫切的问题是:如果人们拍摄了大量的照片,但其实并不想回头去整理它们,那么我们要如何标注数据呢?这就是基础的“以人为本的机器学习”项目诞生的起点:描述理论上的人类“专家”执行任务的方式。这个理论有两层含义:第一,如果连人类也无法完成这个任务,那么 AI 也不可能完成; 第二,通过深入研究专家完成任务的方法,我们可以找到一些信号来指导数据的收集、标记和组件模型的架构。

当时我们能想到的最接近“专家”就是一位婚礼摄影师,所以我开始了采访工作。我们通过代理进行招聘,并且使用了一个非常模糊的招聘信息“秘密项目!摄影!”。经过一番筛选加上一些运气,我们最终发现了一个宝库——一个纪录片制作人、一个摄影记者和一个美术摄影师的专业素材。我们一起开始收集团队成员的镜头材料,试图回答“什么是令人难忘的时刻?”

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

在评估我们的照片和视频的质量时,我们必须意识到很多细微之处、人们的审美本能和个人的生活历史,这些在过去都被我们所忽视了。例如,每当我看到我的小儿子在探索一根弯曲的吸管(左边),或者我去偷亲他(中间)时,我的心情就会泛起涟漪。当我看到我的大儿子在公园里骑自行车的时候(右边),我便非常自豪,因为我记得那一天是他第一次独自骑车。

建立信任

这个项目的初始假设是:我们可以向机器学习模型展示我们认为美丽而有趣的东西,然后它会学习如何找到更多这样的东西。我们对于图像的景深、构图原则、光线强弱、视频剪辑、情节设计等方面的处理显得较为随意,但遗憾的是,我们发现,永远不能低估人类运用常识和本能的能力。

这些早期的实验暴露出一些关键的技术差距,也帮助我们重新评估了我们对产品的假设,让我们真正明白了这项工作的本质。我们转变了工作方式,机器学习并不是我们所认为的那样“神圣”,它只有在相当简化的框架下才能有效地学习。打个比方,当时的我们就像在用莎士比亚而不是“Go,dog,go!”来教一个两岁的孩子英语。对我来说,这就是 AI 这个“庞然大物”走下“神坛”的时刻——AI 并不意味着一种可以理解所有事物、并且可以将学到的知识自行推广的单一“智能”。不,它差远了。

回归基础

“一致性”是教授任何东西时秘诀。比如我们在教孩子们英语时,为了正确发音,我们会不断地重复同一类词汇(如 tough, through, thorough 中的 O-U-G-H,或 cat, bat, sat 中的 A-T),通过一致性,我们可以预测更多同类的词汇发音和拼写。

而信心便来自一致性。试想一下,当一位老师提供两个似乎并不一致的例子时,大多数学生会立刻指出其中的不协调。但是算法并不会提供这样的反馈。就算法而言,除非另有指示,否则为算法提供的所有内容对算法而言都具有相同的价值。对于 Clips Camera 来说,这意味着我们不仅需要示例间的一致性,而且还需要每个示例中的一致性。AI 需要对每一个单独的框架进行具体预测。同时我们还需要教会它哪些内容可以被忽略。

捕获图像

我们需要训练模型学习什么是不好的图像:比如手挡在镜头前、快速晃动、镜头模糊。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我们使用上面的例子来训练机器学习模型来识别相机是在口袋或钱包里面(左图),或者相机被手指挡住时(右图)。虽然训练模型去忽视某些东西的好处并不能立即体现,但随着时间的推移,它会成为我们设计中的关键战略部分。这种训练能够让相机减少无效照片的拍摄浪费,捕获图像的总体质量将会显著上升。

构图问题

我们需要训练模型以保持图像的稳定性、清晰度,还要正确的取景。如果不稍加注意,面部探测模型就会将画框中心和边缘检测到的面部同等对待。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

为了训练模型保持对某个对象的连续性,需要特别强调一些特殊的例子。比如上图中,左边是我的小儿子全程都处在焦点范围内,而右图中我的大儿子只有 5% 左右的时间处在焦点中。

确定人物

熟悉你是为你拍摄的前提:你将相机对准某人时,他们通过微笑或摆姿势来暗示同意,你才能按下快门。并且,摄影师才是那个决定取景和构图的人。所以对自动相机而言,我们必须根据社交线索来确定你想要和谁一起拍照,我们可以根据你和他人相处的时间长短来确定是否拍摄有关他的照片。

编辑

多样性和冗余问题在我们拍照时并不是什么大问题,因为 我们脑海里总会有一个小小的声音说:“我们还没见过这个,需要拍下来!” 或者 “你已经拍了太多孩子的照片,可以停下来了。”,但是我们的 AI模型在这方面则需要很多的帮助。

我们从三个方面来处理多样性:

  • 时间:时间是最简单的图像捕捉信号。相机不能停工太久。

  • 视觉: 颜色微妙或戏剧性的变化可以说明环境和活动的变化。可以据此捕捉独特的精彩时刻。

  • 人物: 你正在一大群人当中,还是独自一人?让相机理解你正在和多少不同的熟悉面孔在一起,是不错过你人生重大时刻的关键。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我把 AI 相机放在书架的边缘,镜头朝下,这个角度正好可以看到我的孩子们搭积木的场景。同时,这也意味着我在相当长的一段时间里,向相机展示了一堆非常相似的内容。既要避免不必要的冗余又不能错过太多的精彩时刻,这在很长一段时间里都将会是一个非常复杂的 UX 挑战。

用户信任和自我效能

我们投资在 AI 相机上的一个原因是想要向大家展示出,设备自带的用户私人机器学习系统有多么重要,当然还有它其他非常强大的功能特点(例如,它只需要很少的电量,设备不会发烫,而且设备处理器不需要网络连接就可以快速而可靠地工作)。相机是一个非常私人化的物品,而我们一直在努力保证这一特性——相机硬件内容和机器智能都只属于你一个人。所有的一切都会永远保留在你的相机里,除非你自己将它公之于众。

概念设计

我们着眼于用户的信任和自我效能,在用户界面设计中也非常强调这一点。这意味着,在项目开始的时候,我们就在不断假设一个 AI 产品应该如何“存在”。

当我们开始考虑与未来相关的科技时,许多设计师都会一下子跳跃到“少数派报告”或“刀锋战士”这类电影中的沉浸式体验中。但是请你想象一下,“少数派报告”中的 UI 是多么疯狂:  只需伸出手臂,等待两秒后,抓一把空气,然后大手一挥反方向一转就搞定了,多么简单!几乎每个科幻片中的用户界面都有类似的东西,仿佛产品的交互模式必须要体现出科幻系统的无敌复杂性。虽然在我们早期的设计中曾经有过这样的一段时间,但是我们最终尽量避免了这样的幻想,其中的原因是这样的:

  • 我们在一个明显的模拟环境中向人们展示了虚假内容,人们并没有与图像进行真正的交互。请注意,这个问题不是AI独有的;可用性实验室中常有发生。

  • 我们每天都和同行们在一起,对AI的未来想法一致。我们的错误在于,忘记了普罗大众才是我们产品设计的参照点。

  • 我们总认为我们的新设计非常酷,所以总觉得即使产品无法尽快实现也说得过去。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

大多数产品都有一些学习曲线,但是随着 AI 的火热,我们需要着重考虑到用户的认知负担。对用户来讲,当产品的内容相对新颖时(图A),可靠性非常重要。当UI界面非常新颖需要用户学习时(图B),需要特别考虑到初级用户的使用体验。而当产品的功能特别新奇时(图C),你的用户界面应该向人们熟悉的模式靠近。

随着时间的推移,我们放弃了那些不实用的幻想。我们开始大幅降低用户界面的复杂性,并为我们的体验框架提供了用户控制,增加用户的熟悉感。我们在相机上增加了一个软件取景器和一个硬件捕捉按钮。从相机中的最佳取景框到理想的持续时间,我们都确保用户有最终决定权。同时,我们让相机拍摄了更多的照片,因为实际上,让用户看到更多照片,自己删除一些不那么精彩的照片,才让他们更好地理解相机所能拍摄的画面,才能提升他们对相机的信任。

经过这个过程,我们发现了另一个关于测试 AI 产品的重要原则:使用用户的真实内容来创建用户体验模式比使用 ML 模型进行测试更加有用。后者需要花费很长时间来构建和部署(与传统的软件开发相比,ML 模型的灵活性和适应性也差得多,所以错误的的代价也更高),而前者则能提供真正的人类视角,人们才能真正从你的产品中获得价值。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

用户通过从相机流式传输来预览他们的照片。左图中,用户可以选择他们想要保存在收集中的图片。中间图中,用户可以切换到建议的视图。右图中,用户可以精确定位出他们想要保存的静态图片。

在主观性和个性化的背景下,完美是不可能的,我们甚至不应该以此为目标。与传统的软件开发不同,机器学习系统永远不会“没有 bug”,因为预测是本身就是一种模糊科学。但正是这种模糊的特性才让机器学习变得非常有用!这正是帮助我们制造更为强大和动态的“IF”语句的真谛所在,我们可以用它来设计一些东西——“如果看起来像 X,则执行 Y 任务”。我们不仅要背离僵硬的逻辑规则,还需要抛弃传统的用户参与方式。谷歌 AI 相机的成功不仅仅在于“保留,删除,点击和编辑”(尽管这些都很重要),但更关键的是,用户的作者身份、机器和用户的共同学习和不断的改进。我们很希望通过这个产品,让用户可以忘掉拍照,尽情玩耍。

带着目的去设计

通过对传统 AI 范例的重新定位,找到让机器变得更加智能的方法,探索提升人类能力的方法,我们可以释放出机器学习的更多潜力。它会成为一个前所未有的探索创新工具; 一个帮助我们找出自己和周围世界内在模式的工具。在“以人为本的机器学习”项目中,我们有无数的机会用 AI 来塑造一个更加人性化、更加包容的世界。而这一切要从我们的本源出发:寻找和解决人类真正的需求,维护人类的价值。要始终记住:我们是为了增强人类的能力而设计,不是为了机器的自动化。

人工智能的作用不是帮我们在杂草里寻找丢失的针,而是帮助我们清除杂草,好让我们自己找到那根针。

via design.google 雷锋网编译

  ◆  ◆
推荐阅读

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

    NLP工程师入门实践班

     

 

三大模块,五大应用,手把手快速入门NLP、海外博士讲师,丰富项目经验、算法+实践,搭配典型行业应用、随到随学,专业社群,讲师在线答疑,详情点戳阅读原文链接或长按识别下方二维码~

 

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

原创文章,作者:交互精选,如若转载,请注明出处:https://www.iamue.com/35073/

(0)
交互精选交互精选
上一篇 2018-02-03
下一篇 2018-02-03

相关推荐

  • UI交互设计只需掌握这3点

    说到交互设计,就不能不提需求,因为所有的交互设计的工作都是基于需求,这也是交互设计的第一个着力点。因此,只有深刻理解需求以后,才有可能做出好的交互设计。举一个饱含血泪的例子:在做一个项目的过程中,有一个需求是要将一个应用的数据展示做一下调整,使之能够查看在三个月之内的该数据。当时,自以为已经很了解需求,只是将时间限制放开到三个月,同时,数据的展示限制在一个月内。也就是说,可以查看三个月内任意小于三十天的时间段。优点是:1)满足了需求;2...

    2018-02-27
  • 微信公众号哪些细节会影响用户体验?

    公众开发运营官网公众运营平台微信公众号哪些细节会影响用户体验?在微信公众号里面,哪些细节会影响大家对公众号的体验呢?下面小编就来为大家讲解一下这些细节,快来看看吧。1.无意义的自定义菜单内容第一个就是毫无意义的自定义菜单内容,很多企业公众号费心费力通过了企业认证,好像不用这个自定义菜单挺可惜的,然后就非得放些东西进去,但是并没有考虑目标用户是否需要。如果把公众号视作一个小应用的话,自定义菜单的功能可以类比App里的Tabbar,主要是实...

    2018-02-12
  • 破局在即,用户体验将成银行翻盘利器?

    今年,BATJ纷纷与国有四大行牵手,这种破冰式的历史性合作传递了两个信息,一是专注线上的互联网巨头们开始重视线下场景的价值,这也表明在未来的金融行业中,我们将能看到更多线上线下相结合的产品和服务场景;二是在与互联网巨头的磨合中,银行的角色即将产生质的突破,也彰显了银行在当前金融局势下的求变决心。当然,银行们寻求自我突破的决定必然不是空穴来风。众所周知,在互联网+潮流下,以线下为主的银行们失去了对部分年轻用户的影响力,而且银行基因中强大的...

    2018-03-03
  • 交互设计| 谁说只有APP这一亩三分地儿?上天入地都有它!

    ▽什么是交互设计?APP呗!NONONO,太狭隘!人家已经上天啦!大到航天科技,小到手机APP,都会涉及到交互设计,真可谓是“上天入地”,无所不及。小编通过“四个了解、一个目的、一个原则、一个步骤、一个标准、一个区别”告诉你到底什么是交互设计。▽【交互设计专业概述】“四个了解”交互设计又称互动设计,英文Interaction Design, 缩写 IxD 或者 IaD。它是定义、设计人造系统行为的设计领域。交互设计是一种如何让产品易用、...

    2018-02-08
  • 从用户体验的视角评析《CSR赛车》手游

    我最近一直在玩《CSR赛车(CSR Racing)》和《CSR赛车:经典(CSR Classics)》,在近期的游戏中我发现,Natural Motion在该系列的核心玩法、货币体系、社交机制和盈利模式中都引入了许多新的花样和用户体验功能,这些新元素的加入为游戏的某些方面带来了更好、更流畅的玩家体验。CSR系列专为手游玩家设计,会话时间极短(10-15秒),玩家们可以在忙碌的间隙进行一场快速竞赛,这是一个非常好的设计。在《CSR赛车》中...

    2018-03-07
  • 交互设计 | UX设计想法表达太难?——试试故事版StoryBoard

    UX设计中一些针对用户调研的方法Workshop、Observation、Interview调研结束后需要将调研结果整合反馈单纯以文字去呈现无法将设计信息最大化故事板、线框图等视觉化的信息传达方式直观准确的解决设计问题下面小编将为同学们详细介绍故事板在交互设计作品集创作中的应用及优点,帮助大家在设计过程中能更高效的完成设计想法的交流和沟通。故事板的应用故事板可看作代表镜头的插画,同学们在设计时需要把图像排列在一起,使自己的设计能够故事化...

    2018-03-17
  • 涨姿势 | 这份交互设计纲领,已被我内定!

    最近一个月的电影市场完全被《头号玩家》支配,身边清一色的“自来水”,那票房蹭蹭涨,眼瞅着都十好几亿了!所以斯芬克趁此良机跟大家说说交互这门自带特效的技术!往期内容一览:服装设计出国学?看这一篇就够了!(点击此处查看详情)学平面设计前,给你一份须知!(点击此处查看详情)怎样做准备,才能当上室内设计玩家?(点击此处查看详情)交互设计适合你吗?我们往往会觉得,交互设计不就是做个网站、搞个APP么,最多再玩玩特效啥的……其实咧,交互可不仅仅存在...

    2018-04-27
  • 你真的了解交互设计吗?

    回顾2017年,我们发现交互设计受到越来越多学生的青睐,这个新型专业在国内的认知度与外国并不完全同步。为了给更多学生带来交互信息的普及,设想决定带大家预测一下在2018年,信息体验设计会如何发展、还有哪些值得我们关注的趋势。更简单的导航方式导航体验是2017年的热点话题之一。为了设计出顺畅的用户体验,导航扮演的角色至关重要。线性导航Linear Navigation为了简化导航体验,很多app和网站致力于创造线性的导航体验(即分布式),...

    2018-03-19
  • 用户体验要素,商品介绍,它们两竟发生了这种关系!

    有人去电影院是为了看电影,而有些人……上次我们讲到,网络课程的课程介绍的工作流程问题。广泛来说可以是网购中任何商品或服务的介绍的撰写或制作过程,这个工作流程和用户体验要素十分相似 ▼这一次我们来探讨用户体验要素具体对商品介绍的指导作用,先来看看一下详细的用户体验要素 ▼关于上图的模型,在《用户体验要素》一书中有详细的阐述,这里只讲与本文内容有关的部分。先来看到这个模型的右上方,有功能型和信息型两种分类。基于我当时的工作任务是商品介绍,那...

    2018-03-20
  • 色彩在交互设计中的应用

    UI设计微课堂关注将获得一对一解答,设计、资源、分享😛听说很多同学都置顶了我的公众号这样就能第一时间收到我精选的UI设计精品教程感谢大家的支持!↓↓下方高能↓↓对于交互设计师来说,通常交互原型都做为黑白稿。为什么要做黑白稿呢?那是因为在前期交互设计中,交互设计师为了更专注于产品的流程、跳转,避免前期投入更多的精力在UI效果制作方面。对于很多小公司或小团队来说,通常只有一个设计师或者设计资源很少,设计师拿到需求后,直接就出高保真效果图了(...

    2018-04-24