AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

文 | 何忞来自雷锋网(leiphone-sz)的报道雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路。雷锋网将其编译如下正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角...

 
雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路,来自雷锋网(leiphone-sz)的报道 雷锋网将其编译如下
文 | 何忞

正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角下,我们在思考机器学习(ML)如何在解决人类的需求时发挥自身的独特性。我们的团队集合了 Google 整个公司的各种人才,为 UX 用户带来机器学习的核心概念,让用户了解如何将机器学习和人工智能完美地融合到交互设计中。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

由谷歌AI相机Google Clips camera捕捉的父母、孩子和宠物的真实时刻

Google Clips 是谷歌的一款 AI 相机,专门用于捕捉身边人的精彩时刻。设备自带的人工智能可以通过机器学习了解到谁是你最亲密的身边人,并且知道如何才能拍出一张漂亮又令人难忘的照片。今天,我们将以这款 A I相机为例,详细阐释在这三年中,我们是如何构建出产品模型、进行工业设计和用户界面的。通过这篇文章,我们希望大家能够了解如何用以人为本的方法来设计 AI 产品。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

AI 相机可以放置在固定的框架上,并保持静止。上图中,我把相机夹在了篮筐上,抓拍到了我儿子打篮的精彩时刻。

只是将更多的 UX 用户分配到机器学习的项目中是远远不够的。更加关键的是让更多人了解到机器学习的核心概念,充分理解 AI 的能力,并能够围绕最佳实践产品来构建和维护信任。其实,从确定在产品构建中哪些模型是有用的,到数据的收集和注解,以及新颖的原型机的建造和测试,机器学习生命周期中的每一个阶段都是创新的时机。

首先第一个问题是,为什么采用以人为本的方法来构建机器学习产品和系统是非常重要的呢?我们认为有以下几个原因:

  • 机器学习本身并不会找出现实中需要解决的问题。如果你在设计中没有考虑到人的需求,那么你只是建立一个非常强大的系统来解决一个非常小或者根本不存在的问题。

  • 如果 AI 系统的目标不明确,并且用户对自身在调教系统中的角色认识不清,那么用户就会根据自己对 AI 的理解或想象来看待系统,这会让他们的信心受到影响。

  • 为了迅速发展,机器学习必须适应多学科的任务,即使不需要太多学科,但如何适应人类社会系统应该是一个需要面临的技术问题。机器学习是根据它在数据中自动发现的模式和关系进行预测的技术。一个 ML 模型的工作是要弄清楚这些自动发现的这些模式有多大可能出错,从而尽可能地保证通常的预测尽可能地正确。但这是远远不够的。从一开始建立模型的思路,到选择训练用的数据源到样本数据本身、以及用于描述和标记数据的方法,一直到模式关系对错的判断标准,机器学习系统的方方面面都是依靠人的判断来调整和修正的。总之,那句 UX 的公理“你永远不如用户了解他自己”,在这里显得异常重要。

三种以人为本提升AI设计的方法

解决人类的真正需求

今年,人们将会使用我们的相机拍摄大约一万亿张照片。在面对如此庞大的数字照片库时,我们中的很多人实际上并不会仔细浏览。新手父母尤其如此,感受宝宝的每一个第一次就是他们的日常生活。在那些珍贵而短暂的时刻,人们已经习惯使用他们的手机相机,希望能够为未来捕捉和保留一些回忆。但最终的结果是,人们用一个小小的屏幕来取代所有的感官,与世界的互动反而更低了。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

作为一个新手父母,你的照片库可能看起来很像我的上面手机照片——连续地拍摄,以捕捉孩子最完美最可爱的表情。

因此,我们在想,能不能创建一个产品,帮助我们更加关注我们关心的人呢?能不能让我们出现在照片中,而不是总躲在照相机后面呢?我们能不能“即时”拍摄照片,而不必停下来,拿出电话,打开相机,在镜头中对焦,保持这一刻的真实呢?我们能不能让一个摄影师在我们身边随时捕捉更多真实的生活时刻,比如孩子们的真正微笑呢?那些真实而转瞬即逝的时刻,往往让我们觉得甚至永远背着相机都不可能全部捕捉得到,而这就是我们这款 AI 相机打算满足的人类需求。

引导机器智能

产品设计之初,最迫切的问题是:如果人们拍摄了大量的照片,但其实并不想回头去整理它们,那么我们要如何标注数据呢?这就是基础的“以人为本的机器学习”项目诞生的起点:描述理论上的人类“专家”执行任务的方式。这个理论有两层含义:第一,如果连人类也无法完成这个任务,那么 AI 也不可能完成; 第二,通过深入研究专家完成任务的方法,我们可以找到一些信号来指导数据的收集、标记和组件模型的架构。

当时我们能想到的最接近“专家”就是一位婚礼摄影师,所以我开始了采访工作。我们通过代理进行招聘,并且使用了一个非常模糊的招聘信息“秘密项目!摄影!”。经过一番筛选加上一些运气,我们最终发现了一个宝库——一个纪录片制作人、一个摄影记者和一个美术摄影师的专业素材。我们一起开始收集团队成员的镜头材料,试图回答“什么是令人难忘的时刻?”

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

在评估我们的照片和视频的质量时,我们必须意识到很多细微之处、人们的审美本能和个人的生活历史,这些在过去都被我们所忽视了。例如,每当我看到我的小儿子在探索一根弯曲的吸管(左边),或者我去偷亲他(中间)时,我的心情就会泛起涟漪。当我看到我的大儿子在公园里骑自行车的时候(右边),我便非常自豪,因为我记得那一天是他第一次独自骑车。

建立信任

这个项目的初始假设是:我们可以向机器学习模型展示我们认为美丽而有趣的东西,然后它会学习如何找到更多这样的东西。我们对于图像的景深、构图原则、光线强弱、视频剪辑、情节设计等方面的处理显得较为随意,但遗憾的是,我们发现,永远不能低估人类运用常识和本能的能力。

这些早期的实验暴露出一些关键的技术差距,也帮助我们重新评估了我们对产品的假设,让我们真正明白了这项工作的本质。我们转变了工作方式,机器学习并不是我们所认为的那样“神圣”,它只有在相当简化的框架下才能有效地学习。打个比方,当时的我们就像在用莎士比亚而不是“Go,dog,go!”来教一个两岁的孩子英语。对我来说,这就是 AI 这个“庞然大物”走下“神坛”的时刻——AI 并不意味着一种可以理解所有事物、并且可以将学到的知识自行推广的单一“智能”。不,它差远了。

回归基础

“一致性”是教授任何东西时秘诀。比如我们在教孩子们英语时,为了正确发音,我们会不断地重复同一类词汇(如 tough, through, thorough 中的 O-U-G-H,或 cat, bat, sat 中的 A-T),通过一致性,我们可以预测更多同类的词汇发音和拼写。

而信心便来自一致性。试想一下,当一位老师提供两个似乎并不一致的例子时,大多数学生会立刻指出其中的不协调。但是算法并不会提供这样的反馈。就算法而言,除非另有指示,否则为算法提供的所有内容对算法而言都具有相同的价值。对于 Clips Camera 来说,这意味着我们不仅需要示例间的一致性,而且还需要每个示例中的一致性。AI 需要对每一个单独的框架进行具体预测。同时我们还需要教会它哪些内容可以被忽略。

捕获图像

我们需要训练模型学习什么是不好的图像:比如手挡在镜头前、快速晃动、镜头模糊。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我们使用上面的例子来训练机器学习模型来识别相机是在口袋或钱包里面(左图),或者相机被手指挡住时(右图)。虽然训练模型去忽视某些东西的好处并不能立即体现,但随着时间的推移,它会成为我们设计中的关键战略部分。这种训练能够让相机减少无效照片的拍摄浪费,捕获图像的总体质量将会显著上升。

构图问题

我们需要训练模型以保持图像的稳定性、清晰度,还要正确的取景。如果不稍加注意,面部探测模型就会将画框中心和边缘检测到的面部同等对待。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

为了训练模型保持对某个对象的连续性,需要特别强调一些特殊的例子。比如上图中,左边是我的小儿子全程都处在焦点范围内,而右图中我的大儿子只有 5% 左右的时间处在焦点中。

确定人物

熟悉你是为你拍摄的前提:你将相机对准某人时,他们通过微笑或摆姿势来暗示同意,你才能按下快门。并且,摄影师才是那个决定取景和构图的人。所以对自动相机而言,我们必须根据社交线索来确定你想要和谁一起拍照,我们可以根据你和他人相处的时间长短来确定是否拍摄有关他的照片。

编辑

多样性和冗余问题在我们拍照时并不是什么大问题,因为 我们脑海里总会有一个小小的声音说:“我们还没见过这个,需要拍下来!” 或者 “你已经拍了太多孩子的照片,可以停下来了。”,但是我们的 AI模型在这方面则需要很多的帮助。

我们从三个方面来处理多样性:

  • 时间:时间是最简单的图像捕捉信号。相机不能停工太久。

  • 视觉: 颜色微妙或戏剧性的变化可以说明环境和活动的变化。可以据此捕捉独特的精彩时刻。

  • 人物: 你正在一大群人当中,还是独自一人?让相机理解你正在和多少不同的熟悉面孔在一起,是不错过你人生重大时刻的关键。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我把 AI 相机放在书架的边缘,镜头朝下,这个角度正好可以看到我的孩子们搭积木的场景。同时,这也意味着我在相当长的一段时间里,向相机展示了一堆非常相似的内容。既要避免不必要的冗余又不能错过太多的精彩时刻,这在很长一段时间里都将会是一个非常复杂的 UX 挑战。

用户信任和自我效能

我们投资在 AI 相机上的一个原因是想要向大家展示出,设备自带的用户私人机器学习系统有多么重要,当然还有它其他非常强大的功能特点(例如,它只需要很少的电量,设备不会发烫,而且设备处理器不需要网络连接就可以快速而可靠地工作)。相机是一个非常私人化的物品,而我们一直在努力保证这一特性——相机硬件内容和机器智能都只属于你一个人。所有的一切都会永远保留在你的相机里,除非你自己将它公之于众。

概念设计

我们着眼于用户的信任和自我效能,在用户界面设计中也非常强调这一点。这意味着,在项目开始的时候,我们就在不断假设一个 AI 产品应该如何“存在”。

当我们开始考虑与未来相关的科技时,许多设计师都会一下子跳跃到“少数派报告”或“刀锋战士”这类电影中的沉浸式体验中。但是请你想象一下,“少数派报告”中的 UI 是多么疯狂:  只需伸出手臂,等待两秒后,抓一把空气,然后大手一挥反方向一转就搞定了,多么简单!几乎每个科幻片中的用户界面都有类似的东西,仿佛产品的交互模式必须要体现出科幻系统的无敌复杂性。虽然在我们早期的设计中曾经有过这样的一段时间,但是我们最终尽量避免了这样的幻想,其中的原因是这样的:

  • 我们在一个明显的模拟环境中向人们展示了虚假内容,人们并没有与图像进行真正的交互。请注意,这个问题不是AI独有的;可用性实验室中常有发生。

  • 我们每天都和同行们在一起,对AI的未来想法一致。我们的错误在于,忘记了普罗大众才是我们产品设计的参照点。

  • 我们总认为我们的新设计非常酷,所以总觉得即使产品无法尽快实现也说得过去。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

大多数产品都有一些学习曲线,但是随着 AI 的火热,我们需要着重考虑到用户的认知负担。对用户来讲,当产品的内容相对新颖时(图A),可靠性非常重要。当UI界面非常新颖需要用户学习时(图B),需要特别考虑到初级用户的使用体验。而当产品的功能特别新奇时(图C),你的用户界面应该向人们熟悉的模式靠近。

随着时间的推移,我们放弃了那些不实用的幻想。我们开始大幅降低用户界面的复杂性,并为我们的体验框架提供了用户控制,增加用户的熟悉感。我们在相机上增加了一个软件取景器和一个硬件捕捉按钮。从相机中的最佳取景框到理想的持续时间,我们都确保用户有最终决定权。同时,我们让相机拍摄了更多的照片,因为实际上,让用户看到更多照片,自己删除一些不那么精彩的照片,才让他们更好地理解相机所能拍摄的画面,才能提升他们对相机的信任。

经过这个过程,我们发现了另一个关于测试 AI 产品的重要原则:使用用户的真实内容来创建用户体验模式比使用 ML 模型进行测试更加有用。后者需要花费很长时间来构建和部署(与传统的软件开发相比,ML 模型的灵活性和适应性也差得多,所以错误的的代价也更高),而前者则能提供真正的人类视角,人们才能真正从你的产品中获得价值。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

用户通过从相机流式传输来预览他们的照片。左图中,用户可以选择他们想要保存在收集中的图片。中间图中,用户可以切换到建议的视图。右图中,用户可以精确定位出他们想要保存的静态图片。

在主观性和个性化的背景下,完美是不可能的,我们甚至不应该以此为目标。与传统的软件开发不同,机器学习系统永远不会“没有 bug”,因为预测是本身就是一种模糊科学。但正是这种模糊的特性才让机器学习变得非常有用!这正是帮助我们制造更为强大和动态的“IF”语句的真谛所在,我们可以用它来设计一些东西——“如果看起来像 X,则执行 Y 任务”。我们不仅要背离僵硬的逻辑规则,还需要抛弃传统的用户参与方式。谷歌 AI 相机的成功不仅仅在于“保留,删除,点击和编辑”(尽管这些都很重要),但更关键的是,用户的作者身份、机器和用户的共同学习和不断的改进。我们很希望通过这个产品,让用户可以忘掉拍照,尽情玩耍。

带着目的去设计

通过对传统 AI 范例的重新定位,找到让机器变得更加智能的方法,探索提升人类能力的方法,我们可以释放出机器学习的更多潜力。它会成为一个前所未有的探索创新工具; 一个帮助我们找出自己和周围世界内在模式的工具。在“以人为本的机器学习”项目中,我们有无数的机会用 AI 来塑造一个更加人性化、更加包容的世界。而这一切要从我们的本源出发:寻找和解决人类真正的需求,维护人类的价值。要始终记住:我们是为了增强人类的能力而设计,不是为了机器的自动化。

人工智能的作用不是帮我们在杂草里寻找丢失的针,而是帮助我们清除杂草,好让我们自己找到那根针。

via design.google 雷锋网编译

  ◆  ◆
推荐阅读

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

    NLP工程师入门实践班

     

 

三大模块,五大应用,手把手快速入门NLP、海外博士讲师,丰富项目经验、算法+实践,搭配典型行业应用、随到随学,专业社群,讲师在线答疑,详情点戳阅读原文链接或长按识别下方二维码~

 

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

原创文章,作者:交互精选,如若转载,请注明出处:https://www.iamue.com/35073/

(0)
交互精选交互精选
上一篇 2018-02-03
下一篇 2018-02-03

相关推荐

  • 用户体验与结婚教练

    我的朋友文敏,在做一个工作——结婚教练。具体就是指导30岁以上,下定决心要结婚的女生,如何在一年半之内搞定结婚。而且她的这套方法,已经帮助30多个30多岁的女生结婚了。我就很好奇,想了解她的核心方法,然后发现,几乎她是严格按照产品方法论,来培训想结婚的熟女,如何做判断、做交互、做优化。而判断、交互和优化三者,判断肯定是第一位的。古人云“男怕入错行,女怕嫁错郎”。第一步的判断和选择,决定了一个人在一个点线面体上的位置。而她做判断的方法,基...

    2018-02-02
  • UED 戊戌狗年第一波招聘已送达!

    14载,我们初心不变,依然要做行业最有力的的发声者。从一张纸到一串电波,媒介在变,我们的眼光始终如一大家都在说AI是未来,然而在这里,我们依然需要你无可代替的头脑。WE ARE HIRING这次招聘我们为什么要做这次公开招聘?信息爆炸,百家争鸣,越是瞬息万变,媒体的价值愈发凸显。我们不会随便说满意,而是希望在诸多嘈杂的背景声中,发出属于新时代建筑媒体人独到的观点,让关于建筑的解读,走进公众的视野;我们希望以全新的面貌去呈现UED对于中国...

    2018-02-28
  • 作品集总结|本科建筑跨专业申请交互设计?Dream School还是皇艺?这可能吗?

    PS-ONE#20180504建筑背景,申请交互设计跨专业申请结果如何?本科建筑,转专业申请交互设计Master?并且Dream School还是世界第一的RCA皇家艺术学院?在经历了PS-ONE历时8个月的内部评审后她如愿以偿了吗?。。。。。。8个月后爱丁堡大学,get拉夫堡,get交互设计,是细节非常复杂的专业涉及到的知识点、设计思维,对转专业申请者来说,是很苛刻的所以拿到爱丁堡、拉夫堡这样强势院校的Offer已经是很不错的结果了但...

    2018-05-04
  • 交互设计,应该从哪学起?

    交互设计行业感觉很火嘛,我也很有兴趣,甚至想转型做交互设计,需要具备什么条件吗?什么职业都可以转型做交互设计吗?网络上很多培训内容都太宽泛,我到底该学什么呢?想职业转型,想拿到高薪,想提升生活品质,如果只是停留在“想”,永远都不会获得成功。不如从今天、从此刻开始,开启你的交互设计之路,从职业规划到求职面试,本课程带你走上职场进阶的坦途。课程139课时,超过1500分钟,800MB课程资料,全面讲解交互设计知识!商业实战案例,1年私人顾问...

    2018-01-30
  • 广告与用户体验如何共存?

    今天给大家分享的是来自UI中国会员-海舟Ocean关于广告营销相关设计的一些经验总结。最近公司的移动端产品在优化广告投放,其中也遇到了不少的困惑,我翻看了部分APP的广告展现形式并结合了几位设计师&产品经理的想法之后,整理总结出了这篇文章。本文将结合实际案例就常见的广告形式以及它们如何合适地呈现与大家进行分享。遇到的困惑我们知道无论是自身的品牌活动宣传还是第三方的商业广告都能为公司和产品带来不小的收益,但与此同时不恰当的广告也会对用户体...

    2018-04-20
  • Axure RP 8 入门手册 – 第3章

    第3章元件功能概述第1节鼠标的操作第2节元件的使用第1节鼠标的操作麦子:老师,老师!小楼:干吗,干吗?麦子:不......小楼:呃......麦子:我想做一个页面,但是那些元件都怎么用啊?小楼:点住了拖到画布里面用呀!麦子:我知道是拖进去,但是我想要一个向左倾斜的圆形。小楼:你是仇人派来玩儿我的吗?圆形怎么倾斜?麦子:对不起,老师!少打个“椭”字。小楼:艹。在Axure中,如果需要一个椭圆形,可以放入一个矩形元件到画布中,然后,点击矩形...

    2018-04-05
  • 【用户体验】从了解用户的注意力开始,创造更优秀的用户体验

    【点击上方蓝字↑↑↑关注「艺恋优梦」获得每晚推送】刚下班回家,今天又没时间写教程了。。。委屈这是一篇源自心理学家和 UX设计师的关于人类注意力研究的文章。在产品团队中,用户体验设计师的工作是输出高可用性、易用性的可交互数字产品。当我们在设计这些产品的时候,我们花费了大量的时间来探索不同的研究方法,了解不同用户的行为、习惯和需求。对于绝大多数的用户而言,在行为模式和心理结构上有着相似的地方,只要有意识地探索,我们能够更好地了解人类的认知过...

    2018-04-04
  • 如何识别和避免“暗黑用户体验”

    作者:Emily Stevens | 翻译:沙喵〜 审校:Moli用户体验设计是一门创造独特奇妙体验的学问——但设计的产出并不都是像彩虹一样美好灿烂的。即便是本质上强调用户友好的设计产业也会有黑暗的一面,而这些黑暗的欺骗性的设计模式比你想象的更为普遍。去年,用户体验设计公司Sigma点名指出,好几家知名零售商利用欺验性的暗黑用户体验设计从用户那儿赚了更多的钱。出现在耻辱榜上的有电商巨头Amazon、快时尚电商Boohoo.com(英国)...

    2018-03-20
  • 关于Axure8.0中继器的使用1

    废话少说,请开始你的表演!!!1.拖入一个中继器,将中继器多余的行删除;2.在中继器中添加三列(可以直接双击编辑),分别命名:name、sex、age;3.双击拖入的中继器会跳转类似动态面板的“(中继器)(page2)”新页面;4.在(中继器)(page2)中再添加两个和已有矩形大小一直的矩形,分别命名:name、sex、age;关于中继器的准备工作完毕,因为中继器需要存放动态数据,所以需要在页面增加动态数据的输入入口。5.回到拖入中继...

    2018-03-10
  • 写给产品经理和设计师的用户体验知识4(大结局)

    从2015年起,我陆续写了《写给产品经理和设计师的用户体验知识》系列文章,当时的写作提纲如下:第一部分:先纠结两个概念「用户体验」和「设计」第二部分:设计原则概览原则1:符合用户使用需求原则2:基于用户的心理模型设计原则3:一致性原则4:及时有效的反馈和解释原则5:形式追随功能原

    微信热点 2018-02-12