• 1452595308@qq.com

作者归档

【CDC翻客】移动用户体验要素(下篇)

译者注:对于移动用户体验的从业人员,本文可以说是一部宝典。文章不仅提纲挈领地概要了移动用户体验的12大要素及其规范,更提供了详实而丰富的参考文献。Queen的上篇介绍了功能、信息框架、内容、设计、用户输入,下篇将介绍移动情景、可用性、信任感、反馈、帮助、社交、营销。相信对大家肯定有帮助的。

英文原文: The Elements Of The Mobile User Experience

{移动情景}

我们可以在任何时间、任何地点使用移动设备,因此,移动情景指的是用户使用时的环境和状态——也就是任何可以影响用户与设备进行交互的内容。由于这些情境持续而快速地变化,对移动设备而言就显得尤为重要。我们在考虑用户分心、多任务、手势操作、低电量条件和糟糕的连接环境的同时,也要考虑极端好的情景——假设在一个快速Wi-Fi环境下使用平板电脑。

《移动交互的情景》(参见:The Context of Mobile Interaction),Nadav Savio

规范

  1. 根据设备功能和硬件能力来预测和支持用户的使用情景。iCookbook应用中,用户可以用语音来查看食谱——就再也不用担心手上糊满面糊怎么办了。
  2. 根据一天不同的时段或用户使用过程,来适应情景的变化。Navfree GPS应用能在白天、夜间模式下自动切换,夜间采用低眩光的地图,开车会更安全。

  1. 判断用户当前位置并展示附近相关的内容和帮助。用户在移动设备上用Google搜索电影,可以搜到附近正在热映的电影以及当天的电影场次,如果有票的话,还能看到买票的链接。
  2. 权衡用户提供的信息,并且尊重用户的喜好和设置。在完成多线航班的第一站后,TripIt应用向我展示了下一个航班、登机信息以及必须要花费的时间。而United应用并没有做这样的事情,尽管它知道得更多。我就纳闷了,既然知道我是会员,它为什么不向我展示如何从当前飞机前往下一班飞机,另外明确标明途中United的贵宾休息区,好让我舒适地度过这等待的两小时呢?
  3. 默认为用户提供最合适的体验(例如:一种适合小屏幕的移动体验,也可能是适合平板电脑的桌面产品体验),但还要提供高级选项。最近一次关于如何向用户展示这些信息的大型的讨论会上,Jakob Nielsen建议将移动网页与Web网页分开(参见Jakob Nielsen recommending a separate mobile website),Josh Clark则觉得自适应的移动网页设计更好(链接:Josh Clark arguing instead for a responsive design),而其他人认为Nielsen和Clark都错了(参见believe that Nielsen and Clark are both wrong)。

拓展阅读

  1. The Context of Mobile Interaction” (0.2 MB, PDF), Nadav Savio, Jared Braiterman
  2. On Mobile Context,” Jason Grigsby
  3. When and Where Are People Using Mobile Devices?,” Luke Wroblewski

{可用性}

可用性指的是全面衡量信息架构、设计、内容和其他元素是否让用户很好地完成任务的标准。

规范

  1. 让用户清晰地知道什么是可选的、什么是可点击的或可滑动的,尤其是在触摸屏设备上。尼尔森诺曼团队在iPad的可用性调研(参见Nielsen Norman Group’s usability studies of the iPad)中发现,用户通常不知道什么是可点击的,有时也被滑动这个手势搞得迷糊,尤其同一个滑动手势在同一界面的不同区域滑动却有不同的功能。所以,请确保可点击的内容是清晰的,比如链接、icon和按钮,要一看上去就是可点的。
  2. 在触摸屏上,确保点击对象的尺寸和位置以避免误操作。另外,将点击对象放在合适的区域,比如:把“删除”等具有破坏性的功能对象放在下图所示的“Reach”区域,Luke Wroblewski在《移动为先》(Mobile First)中提及。

Luke Wroblewski , 《移动为先》

  1. 遵守规范和模式来减少用户的学习成本,也能让移动体验更加自然。App的设计应该遵守特定平台规范标准和指南。在Breaking the Mobile Web网站中,《移动设备和平板电脑的网页应用设计指南》一文的作者综合收集了很多来自官方的UI和UX指南链接(参见UI Guidelines for Mobile and Tablet Web App Design)。
  2. 通过设计元素比如对比度、颜色、排版和字体大小,确保产品在情景变化下的可用性,变化的情景包括白天刺眼的阳光下,以及改变设备的物理角度和朝向时。
  3. 不要依赖那些不被移动设备广泛支持的的技术,比如Java、JavaScript, cookies, Flash, frames, 弹出框和自动刷新。当需要打开一个新窗口,或者从应用跳转到网页上时,要提醒用户避免重新加载已打开的页面。

拓展阅读

  1. Usability of iPad Apps and Websites,” Nielsen Norman Group
  2. UI Guidelines for Mobile and Tablet Web App Design,” Max Firtman
  3. Mobile Usability Update,” Jakob Nielsen, Alertbox

{信任感}

这里讨论的是当用户使用移动网站或App的自信心、信任感以及舒适度的问题。根据Truste和Harris Interactive两家公司在2011年的研究,隐私和安全是智能手机用户最关心的两个问题。

规范

  1. 在未经用户明确许可下,不要使用移动设备里的个人信息(比如地理位置和通讯录)。今年的头几个月中,已经有不少关于从手机中私自复制通讯录的报告,文章watchdogs up in armsusers retaliating中有所提及。
  2. 让用户轻松掌控App如何分享个人信息,比如访问位置前询问用户,允许他们退出目标广告。
  3. 在合适的情况下,清楚地阐述你们公司的商业行为(包括隐私、安全和投资回报)(比如在注册页面告知隐私和安全条款)。这些条款应作为次要元素出现(比如可以放在底部栏或是“more”标签里)。通过显示受信任的标记来加强用户的信任感,尤其当用户需要提供个人或财务信息时。
  4. 在移动设备上适当地为用户提供条款,包括简洁的概述和是否发送到邮箱的选项。众所周知,隐私和安全条款通常冗长而无趣,用户往往都会盲目地点击同意继续下去,因此我们要尽量让这个过程容易一些。
  5. 当提供条款的时候,不要打断用户的任务流程。在被打断之前,让用户返回到之前的位置(参见:Take them back to where they were),而不是重新开始。

拓展阅读

  1. Layered Policy Design“, TRUSTe Blog

{反馈}

这指的是如何吸引用户的注意力以及如何展示重要信息。

规范

  1. 将提醒次数降低到最少,确保每一次的提醒都提供了重要的信息和有用的选项。可以去看看Chris Crutchfield的文章视频上过多的信息和提示(参见:video on notification and alert overload)。
  2. 确保提醒简短而清晰,解释为什么会有这样的提示,用户可以做什么。另外,按钮标记要清晰。
  3. 消息提示应该简短而带有告知性,不要干扰用户的操作,并且很容易操作和离开。
  4. 在界面上提供的反馈和确认信息不要打扰用户的操作流程。
  5. 如果这个App有消息标记或是在状态栏上有提醒,就要保持这个标记和消息的更新。当用户添加新消息时要清除这个标记。当用户访问到消息标记时提醒要被清除,即使用户还没有发现究竟是哪个账号触发了消息提醒,这也会迫使用户一个个账号去试探。

拓展阅读

  1. Mobile Notifications,” Fred Wilson
  2. The Future of Mobile Notifications,” True Ventures
  3. Chapter 8: Feedback and Affordance,” Theresa Neil

{帮助}

这指的是能帮助用户使用网页或者应用的相关选项、产品和服务。

规范

  1. 让用户能轻松进入帮助和支持选项。用户通常会在移动网页的底部和应用的工具栏,或tab栏寻找帮助选项。
  2. 帮助的形式要多样化,尽量与移动应用场景相关,比如自助服务式的常见问题,现场帮助式的点击通话,接近实时的直接消息推送。美国运通(American Express)和花旗银行(Citibank)这两家金融服务公司都积极地通过Twitter提供支持。
  3. 在用户首次进入应用的时候,提供快速的介绍和简短的教程,但也要提供跳过和稍后查看的选项。
  4. 当首次引入新的或者特别的功能时(比如首次介绍如何使用移动应用检查支票),需要提供给用户情景化的帮助和提示,这也是对不经常使用的功能的回顾。
  5. 在合适的情况下,提供视频指导,但是要允许用户可以按自己意愿开始、暂停、停止和控制音量,并记住上文“内容”中提到的多媒体相关的规范。

拓展阅读

  1. Chapter 7: Invitations” and “Chapter 9: Help,” Theresa Neil
    Chapter 7 is available online at UX Booth.
  2. Top 6 Help Design Patterns for iPhone Apps,” Catriona Cornett, inspireUX

{社交}

这指的是有社交元素的内容和功能,从而让用户在已有的社交网络上进行分享和交互。

规范

  1. 创建和维护社交网络(如Facebook)和本地服务(如综合的服务页面,像谷歌地图、Bing商业门户和雅虎本地)。在搜索结果和基于位置的社交网络服务中重点突出它们,除了你的商业名称,也包括了你的家庭住址、电话号码、URL和营业时间。
  2. 将社交活动和移动体验进行融合:如在网上展示最新活动,提供简单的方式关注或喜欢。
  3. 将社交网络的特性与网站的移动体验进行融合,用户可快速连上社交网,这就像使用APIs(using APIs)支持社区分享、书签、加标签、喜欢和评论一样简单。
  4. 邀请用户使用移动设备创建能展示你品牌、产品和服务的内容,并提供一些激励作为回报。例如,汉堡连锁店红罗宾向用户发起邀请:只要分享一张孩子在店里读书的照片,就能获取一杯免费的奶昔。

5.让移动端的内容可以被分享和病毒式的传播。比如,美国运通公司(American Express)最近提供的信用卡的储蓄和折扣优惠,只要你将个人信息同步到Facebook、Twitter和Foursquare上,就可获得。

  1. 那些依靠用户创建内容的App,应该要探索出一套让初始内容有用并最终能进行不断维护的方法。比如:My TSA应用有一个用户创建内容的功能,展示了安检站等待的时间,但是它常常显示一些过时的消息,尽管机场工作人员已经将等待时间贴了出来。

拓展阅读

  1. The Definitive Guide to Adding Social Features to Your Mobile Apps“, Verious

{营销}

这指的是如何让用户发现一个网站和应用的途径以及鼓励反复使用的因素。

规范

  1. 通过优化移动端搜索和发现来确保产品的可寻性,比如保持URL简短。如果你有一个独立的移动网站,请遵循URL命名约定(m.site.com或mobile.site.com)。在移动搜索结果里,提供快速访问本地的内容的入口(如当前位置的方向)以及系统自带功能(比如点击快速拨号)。

左边是移动端对UPS搜索结果优化后的网页,右侧是没有优化的

  1.  二维码的出现让移动设备的登录得到很大的优化,我们不需要到传统的那种需要放大才看得清楚的页面上,更加不需要到网站首页上寻找登录入口。另外,附在产品上的二维码(参见QR codes painted on buildings)应该清晰明确,这样移动设备才能辨识和解读。
  2. 给用户发送的邮件应当以移动设备支持的格式,内容应该包含一条可以查看产品相关信息的链接——而不要回到设备自身的网站首页上去。
  3. 可能情况下,在其他平台上(如电视、纸媒、店内广告)推销你的App,并且激励用户下载使用,通常可采取打折的办法。如果你的App有价格标签,那么可以在过度拥挤的市场中通过限时促销来吸引用户。另外你还可以通过每日限免市场来吸引用户。
  4. 提示使用过你App的用户进行评价打分,或是分享到社交平台,但是要给延迟或停止提示的选项。虽然这不是唯一产生口碑的途径,但能让你洞察到用户喜欢什么不喜欢什么。Smalltech在控制你的评论(参见Taking Control of Your Reviews)一文中讨论了如何让用得爽的用户进行评价,以及让不爽的用户用邮件反馈意见的策略。

拓展阅读

  1. iPad App Marketing Case Study: Flickpad,” Chad Podoski, Mobile Orchard
  2. The Art of Launching an App: A Case Study,” John Casey, Smashing Magazine
  3. How to Market Your Mobile Application,” Michael Flarup, Smashing Magazine

{总结}

移动用户体验是一个正在蓬勃发展的领域,也不断涌现更多可完善的契机。本文作者已经概述了移动用户体验的要素以及每个要素的规范,这些内容必将帮助我们创建更好的移动用户体验。

感谢你的阅读,本文出自 Tencent CDC,转载时请注明出处,谢谢合作。

huangjiahui

【CDC翻客 】移动用户体验要素(上篇)

译者注:对于移动用户体验的从业人员,本文可以说是一部宝典。文章不仅提纲挈领地概要了移动用户体验的12大要素及其规范,更提供了详实而丰富的参考文献。我和Nina将分别从上篇和下篇带来此篇译文,希望我们提供的译文能为从业者带来系统思考和思维启发。

英文原文: The Elements Of The Mobile User Experience

--------------------------------------------------

移动用户数和手机使用量都在逐年增加。随着越来越多的用户使用手机完成任务(参见The Future of Mobile),如何改进移动用户体验的各个影响要素,便成为值得关注的焦点。

移动用户体验是指用户使用低端功能机到高清平板电脑间的任意设备中,与移动产品(浏览器或App)互动之前、之时及之后的认知和感受。

为了创建令移动用户愉悦的体验,我们必须重新思考那些长期以来被认为理所当然的桌面端设计。移动用户体验的复杂性源于移动设备的特性,主要包括:小屏幕,设备特性的巨大差异,电量和网络的限制,难以定位又永远变化的移动使用场景。

通过解析移动用户体验的重要组成部分,我们可以得到一个概念框架来构建和评估好的移动体验。这些部分在文章《以用户为中心的移动设计方法》中有所提及 (参见user-centered approach to designing for mobile)。下图组成要素决定了移动用户体验,包括:功能、情境、用户输入、内容和营销等等。

以上这些要素的重要性会根据设备类型不同(如非智能手机、智能手机、平板电脑)和界面显示不同(如App和Web)发生变化。本文将简要介绍这些要素,并详细说明相关的重要准则。

{功能}

功能是指帮助用户完成任务、实现目标的工具和特性。

规范

  1. 优先考虑和展示其他平台上与移动环境高度相关的核心功能。如对于航空公司,应具有航班状态查询和自助登机功能。对于化妆品连锁店Sephora,用户可以在移动设备上方便地访问产品评论,然后到店内购物。
  2. 提供移动设备特有的功能(如条形码扫描和图像识别),必要时利用设备的硬件能力增强功能特性,从而提高用户的参与感及乐趣。在”Old Navy”的老版本中,用户在商店中拍下商标的照片后,可以获得有惊喜的游戏或折扣。
  3. 确保为移动设备优化基本功能和内容。例如,查找商店时显示最近的商店,并确保点击号码便能与商店通话。
  4. 提供与业务相关的功能。对于零售网站和App来说,主要包括产品搜索,订单状态和购物车。
  5. 提供所有平台都会有的关键功能。无论在何种设备或平台上,注册用户应该看到他们的个性化设置。如果移动端没有某些功能,那么要将用户引到合适的平台上,如TripIt,引导用户去web端设置个人网络。

{信息架构}

它是指将功能和内容组织成一种逻辑化的结构,以帮助用户查找信息,完成任务,包括:导航,搜索和标签栏。

规范

  1. 起始页应该优先考虑用户需求,展示产品主要特性和功能链接。《移动设计模式库》(参见MOBILE DESIGN PATTERN GALLERY)中提供了移动设备中的主要导航模式和辅助导航模式的样例,其中不少为垂直导航,而非桌面端网站的的水平导航。
  2. 让用户导航至最重要的内容和功能时,所需点击次数尽可能少。小屏幕上的导航通常情况下应该数量多、层级浅,一定不能有太深的层级。我们知道,每一个内容模块的访问不能超过三次点击(参见THREE CLICKS (OR TAPS) IS NOT THE MAGIC NUMBER),同时用户还需要知道每一次点击都在帮助他们完成任务。因为每一个附加的层级意味着:更多的点击、更多的页面加载和带宽消耗。
  3. 要同时考虑触摸屏和非触摸屏用户的导航需求。当为触摸屏设计时,需确保导航项的点击区域至少有30个像素的宽度或高度。而对于非触摸屏手机(非智能手机),需提供按键快捷键,这样用户可以通过输入0-9中的一个数字来快速访问。

CNN所做的快捷键(左图),很迎合非智能手机用户。而DELTA做的并不好,用户需要先连按9次下方向键才能开始使用其APP(中图和右图)。

  1. 提供导航提示让用户知道他们在哪里,如何返回,以及如何跳回到开始的地方。“移动面包屑”常被用于取代“返回”按钮,它用标签的形式展示了用户是从哪部分或类别而来。对于移动网站,尤其是当每个屏幕上的导航都不重复的时候,可使用标准规范,如“HOME”图标链接到首页。
  2. 使用简洁、明确、一致和描述性的标签作为导航和链接。这通常是一个很好的做法,尤其是在小型移动设备上更为重要。

{内容}

内容并不是LOU ROSENFELD和PETER MORVILLE在《万维网信息架构》中提及的“网站中展示的那堆东西”,而是能为用户提供信息的、以不同样式存在的多种类型的内容,比如文本、图片和视频。

规范

  1. 提供适当而大众的内容给用户(如产品信息,社交内容,指导和支持的内容,营销内容)。
  2. 若多媒体在移动环境下对用户的操作有帮助,能增加内容价值或支持该网站的目标,那就用它吧。大多数时候,当用户需要消遣或娱乐(如新闻或有趣的片段),或指导(例如,如何使用APP或新功能)时,提供多媒体内容是最好的选择。
  3. 让用户控制多媒体:不要自动播放视频或音频、允许用户跳过或停止多媒体内容、让用户知晓多媒体内容占用的带宽。
  4. 确保内容适用于移动环境。正如从印刷转化为互联网文章使用的分块规则,应该缩短移动设备上的文章,以使用户能在较短的注意力集中时间读完。为移动设备优化图像和媒体;也就是在小设备上等比缩小图像和媒体内容,并确保图像在新IPAD上足够清晰(参见SHARP ENOUGH FOR THE NEW IPAD)。
  5. 确保主要内容是目标设备支持的格式。即使是现在,大众官网仍然让IOS用户下载FLASH。

{设计}

这是指视觉呈现和互动体验,包括平面设计、品牌包装和排版。

规范

  1. 记住名言“移动化,而非小型化”(BARBARA BALLARD)和“不缩小,重新思考”(诺基亚)。它们都提到:移动设计并不仅仅是完全移植台式电脑的设计。
  2. 为了预览和快速扫描而设计。预览设计指的是视觉设计如何能快速、轻松地传达信息。
  3. 通过色彩、排版和个性化设计,在视觉上保持设计元素和体验(手机,应用程序,网络,印刷和现实世界)统一。如下堆积的图片中,即使看不到品牌名称,辨识亚马逊仍然很容易。

  1. 引导用户从最开始最突出的元素着手,帮助他们完成任务,这就是所谓的视觉流。一个好的设计既包含视觉元素,还包含信息结构,内容和功能,以传达品牌形象、引导用户。
  2. 设计过程中需考虑纵向和横向的设计。越来越多的设备能支持多个方向,并自动调节以适配到用户的物理方向。当用户改变设备方向时,确保用户的位置位于画面中。如果方向变化后有附加或不同功能,需要明确指示,如下图应用ING所示。

{用户输入}

这是指用户输入数据的难度。应尽量降低移动设备上输入数据的难度,同时避免双手操作。

规范

  1. 限制必填部分的输入。正如LUKE WROBLEWSKI在著作《移动为先》(MOBILE FIRST)中提到的那样,“涉及到移动设备上的表格,需要残忍而有效地减少,减少,再减少。”限制登记表,使其只包含最少的必填部分,可能情况下,替换为更短内容。比如,使用ZIP号码,而不是城市和国家。针对这个规范,我最喜欢举的反例是大众的试驾预约表格,移动版必填的字段居然比桌面版还多(高亮部分显示为多余字段):

  1. 尽可能显示默认值。它可能是用户最近所选项(如机场或火车站),或是常选项(如检查飞行状态时选择当天日期):

  1. 可能的情况下,根据设备特性提供备用输入机制。APP可以利用设备内置的很多输入机制,包括手势,摄像头,陀螺仪和声音,但移动网站才刚刚开始使用这些特性,尤其是地理位置。
  2. 使用适当的输入机制,并显示合适的触摸式键盘,以减少用户的切换。请记住,在只有数字键盘上的非智能手机上,数据输入更加繁琐乏味。对于无需过度保密的APP,允许用户保持移动设备上的登录状态,并保存电子邮件地址和用户名等信息,因为手机往往是个人设备,不像平板电脑,往往由多人共同使用。

  1. 考虑提供自动匹配,拼写检查和预测技术,让数据输入更加容易并减少错误– 必要时数据可恢复。应禁用一些不恰当的功能,如验证码的输入。
huangjiahui

如何对定性人物角色进行定量验证

By xiaoqin

首先,要对定性研究、定量研究做一个简单的定义:

定性研究是指从小规模的样本量中发现新事物的方法,例如用户访谈、可用性测试、焦点小组等;

定量研究是用大量的样本来测试和证明某些事情的方法,例如问卷调查、网站流量/日志文件分析等。
然后,为什么在得到定性人物角色后还要进行定量研究呢?目的有以下两个:

1,用大量的样本来验证定性研究中得到的分类变量以及人物角色类型

2,获得定性研究(小规模的样本量)时无法得到的数据,例如各类用户的产品使用情况、人口统计学指标,可以帮助产品方更方便的辨认各类用户,判断各类用户的活跃程度、占比等

那么,我们应该何时进行定量验证呢?视具体情况而定:

1,在定性研究完成之后,何时进行均可;

2,也可以在得到定性人物角色类型后就立即进行定量研究,具体如下图所示:

最后,我们该如何进行定量研究来验证定性人物角色呢?下面将要分享的是问卷调查后用聚类分析进行验证的一般步骤以及一些心得:

第1步,进行问卷调查:获得数据

问卷需要测量以下两部分变量:

(1)定性研究中得到的分类变量(a,b,c…),用于对分类变量、人物角色类型进行验证。所谓分类变量就是在定性研究中我们用于定义人物角色的关键差异(他们的明确的目标、行为和观点)。我们需要设计观测变量(a1-an,b1-bn, c1-cn…)来对每个分类变量(a,b,c…)进行测量,每个观测变量和一个问卷题目或选项对应。观测变量主要是根据定性研究进行设计的,因此定性研究的研究人员最好参与此过程。

以下以消费者对某公司业务的满意度为例来说明分类变量和观测变量:

(2)产品使用情况、人口统计学指标等其他变量,用于获得定性研究(小规模的样本量)时无法得到的数据,也可以用于在分类后对各个类别进行描述。

对于产品使用情况,我们一般都会考虑如下变量:使用年限、登录频率、功能偏好等

对于人口统计学指标,我们一般都会考虑如下变量:性别、年龄、学历、职业、行业、收入等

在此步,产品人员可能会提很多他们关心的产品问题,我们需要根据情况进行取舍,有一些问题并不适合在定量验证人物角色时进行调查,例如用户是否会使用快捷键等,就需要和产品人员进行沟通留待以后的研究中加以解决

第2步,对变量聚类:对观测变量的有效性进行检验

此步是后面的分析的基础,是为了回答这个问题:这些观测变量(a1-an,b1-bn, c1-cn…)能否有效的对分类变量(a,b,c…)进行测量?

解决的方法为:将观测变量(a1-an,b1-bn,c1-cn…)作为聚类变量,对变量进行聚类,若聚类结果得到的变量分类(1,2,3…)和分类变量(a,b,c…)基本一致,也就是说a1-an聚为变量分类1,b1-bn聚为变量分类2,c1-cn聚为变量分类3等,则说明这些观测变量可以用于测量分类变量。

需要说明的是,虽然在检验测量的信度和效度上有着更为严谨、科学的方法,但出于操作上的复杂性以及对产品的实际价值较小,我们仅仅是用对变量进行聚类来检验这些观测变量的有效性。

第3步,对用户聚类:对人物角色进行验证

此步通过回答如下两个问题来对人物角色进行验证:

(1)用这些分类变量可以把用户分为几类?得到的分类和人物角色类型是一致的吗?—-解决的方法为:用分类变量对用户进行聚类

(2)这些分类变量中的哪些变量可以有效的区分几类用户?—–解决的方法为:检查不同分类在各分类变量上的差异的显著性

在用分类变量对用户进行聚类时,有两种选择:

(1)将观测变量(a1-an,b1-bn,c1-cn…)作为聚类变量,对用户进行聚类

(2)将分类变量(a,b,c…)(需要将观测变量(a1-an,b1-bn,c1-cn…)进行分别加权)作为聚类变量,对用户进行聚类

两种方法都可以通过最后得到的用户分类来验证定性人物角色,不同的是:第1种方法比较适用于想要了解不同分类在各观测变量(a1-an,b1-bn,c1-cn…)上的差异的情况;第2种方法比较适用于想要了解不同分类在分类变量(a,b,c…)上的差异的情况

解释一下,此处所说的“对用户聚类”和上一步的“对变量聚类”的差异在于聚类的对象不同,“对用户聚类”是通过分类变量将用户细分为几类,聚类的对象是用户;“对变量聚类”是将分类变量聚为几类,聚类的对象是变量。

在分析所得到的用户分类时,可能会发现一些和定性研究的结论不一样的情况,一般可以分为以下3种情况:

(1)得到先前定性研究中没有的人物角色类型。这是很有可能出现的一种情况,因为在定性研究的用户招募时很容易招到那些使用产品程度较深、对产品十分忠诚的用户,导致我们可能会忽略某些类型的用户,例如使用产品程度较浅、动机不强的用户。此类用户对于产品来说一般是较不重要的用户,在报告中加以说明即可;

(2)没有得到先前定性研究中的某个人物角色类型。这可能是问卷样本有偏或者在用户群体中该类用户数量过少导致的,应该根据这类用户对产品的重要性来进行取舍;

(3)先前定性研究中的某个人物角色类型需要分拆为几类。如果在定量验证中发现分拆后的几类用户确实在分类变量上存在较大差异,对于产品来说是属于几类有着不同需求的用户,则需要分拆为几类用户。

总之,是否需要增删某类用户,都是根据该类用户对产品的重要性来决定的。对产品是否重要则可以综合定性研究、定量研究以及和产品人员进行讨论后进行判断。

第4步,对各类用户进行描述

在进行2、3步骤之后,就已经完成了对定性人物角色的验证,然后就可以用人口统计学、产品使用情况等变量对几类用户进行描述。在确保问卷样本无偏的情况下,此步骤可以回答我们的如下一些问题:

(1)哪类用户在用户中占比最高?—-解决的方法为:计算各类用户的人数比例

(2)如何从人口统计学指标来对几类用户进行辨认?—-解决的方法为:对各类用户的人口属性进行描述,计算各类用户在人口统计学指标上是否具有显著差异

(3)如何判断哪类用户是我们的活跃用户?—-解决的方法为:计算各类用户的产品或重要功能的使用频率

(4)如何判断哪类用户是我们的重要用户?—-解决的方法为:分析各类用户的功能使用情况或功能需求后,结合定性研究并与产品人员沟通后进行判断

。。。。。。

这些问题可能是在做定性研究时产品人员就在强调的一些需求,而定量研究可以用大量的数据来帮助我们找到答案。

PS:一个误解:

和产品人员沟通人物角色报告时,产品人员对于人物角色经常会有如下的误解:

是否每一个人都可以对应到某一个人物角色?我不知道自己是哪一类,是不是大家都是混合型用户?

实际上,虽然是通过对用户分类来验证定性人物角色,但人物角色并不能和真实的用户完全对应。因为人物角色只是一个原型,某类人物角色具有一群真实用户中某些共同的行为模式,而某个真实用户可能同时具有某几类人物角色所代表的行为模式。

huangjiahui

可用性测试中的任务设计方法

lingbo_chan /

可用性是用来衡量产品质量的重要指标,从用户角度来判断产品的有效性、学习性、记忆性、使用效率、容错程度和令人满意的程度。可用性测试是在迭代设计中不断获得用户反馈,根据用户反馈不断优化产品设计的一种方法。其目的是是建立评价标准,尽可能多的发现可用性问题,并指导产品界面的设计和改进,尽可能地提高产品的可用性质量。

如果想进一步了解可用性测试的计划、执行和分析过程,《简单快速的可用性测试》一文会给您一些介绍和启发。本文仅针对可用性测试工作的重要组成部分——测试任务的设计,进行深入讨论。

为什么要单独说说测试任务的设计,这是因为,测试计划的好坏直接影响到测试效果和工作效率,而任务设计则是测试计划中的重中之重,也是最考验用研人员经验度的部分。

参与过可用性测试的童鞋都知道,测试中,主持人经常会给用户布置一系列的任务,通过用户的操作来发现产品中存在的问题。

为什么需要任务设计?

测试任务是在实验室环境中给予用户使用产品的动机,目的是让用户在合理动机的驱动下,展示他们的操作过程。

任务设计如何做?

通常,测试经验较少的用研人员的习惯做法是,对照产品上的各项功能,逐项写成任务,常见的方式是“请你××××”。这种方式本身并没有错,但是容易让人陷入为了让用户使用某项功能而设计任务的错误之中。其实,比功能本身更重要的是用户的使用目标。所以,在设计任务的时候,必须不断地拷问自己:“我设计的测试任务是真的反映了用户的实际目标么?”尤其是在面对陌生产品的时候。

比如,在网易手机邮箱智能版的测试中,我曾经遇到过一些障碍。由于我自己并不是手机邮箱的目标用户,我经常在办公室环境下使用电脑登录邮箱,对手机邮箱几乎没有需求,所以,很难想象用户是出于什么样的动机来使用这款产品的。这时候,我脑里浮现的几个疑问:

  • 什么样的人有可能使用这款产品?
  • 哪些功能最可能是他们的常用功能?
  • 他们会怎样使用这些功能?
  • 对他们来说,功能与功能之间有什么样的关系?

为了厘清头绪,我请教了邮件部门一位长期负责手机产品的同事,从她的反馈得知,对手机邮箱有需求的用户,他们在工作时间户外活动较多,邮件往来频繁。比较突出的一个群体是外贸行业人员,他们经常有关于产品报价的邮件往来。于是,便有了以下的任务设计:

关于任务设计的详细步骤请参看《简单快速的可用性测试》一文。

设计任务时应注意些什么?

  • 全面覆盖所关注的功能范围

在设计任务前预先列一个任务清单,如下图,在任务设计好之后,逐项对照,确 保任务覆盖到所有关注点。

  • 用户操作舒适自然,符合常态

任务的顺序尽量符合典型用户的典型操作流。还是以上面的例子说话,用户在邮箱中的操作流一般是【登录-查看收件箱-阅读未读邮件-处理一些邮件-(写邮件-保存邮件-发邮件)】,尽量避免让用户感觉到突兀。

  • 适当添加一些剧情

前面说过,测试任务是在实验室环境中给予用户使用产品的动机,为了让动机描述得更加合理化,我们经常会把任务设计得“剧情化”一些,帮助用户更好地融入到产品使用中。

如何评价任务设计的好坏?

任务设计出来后,一定要经历1-2次试测。这点和做产品是一样的道理。我们自己不一定是目标用户,所以,任务设计的好坏需要由目标用户来检验。在试测中,如果用户看到任务设计后对你说,“这种情况我平时经常遇到!” 窃喜吧,你成功了!

一句话总结一下任务设计的要点:关注用户的实际使用目标。

huangjiahui

Web交互设计优化的简易check list

网易用户体验中心

 

“优化已有产品的体验”,这是用户体验相关岗位职责中常见的描述。我们的产品常常是在快速的迭代过程中不断完善的,就像孩子生下来需要养育才能长大一样,优化已有功能/产品,和设计新功能/产品同样重要,不可偏废。

 

但是,相比实现新功能,已有功能的优化总是显得没有那么紧迫而且很零散,导致了迭代优化的计划总是被归入“重要不紧急”甚至是“不重要不紧急”的象限,变成了东一棒子西一榔锤的买卖。我们可以通过可用性测试来发现问题,但是测试往往受到时间、用户邀约、场地和设备等条件的限制,可能无法进行。更多时候,设计师需要根据一定的原则(例如可用性准则)进行走查,以快速地发现并解决问题。

 

这篇小文章关心的问题是:如果想对非娱乐导向产品已有的交互设计进行优化,我们需要从哪些方面考虑

遵从什么样的原则

如何开始检查现有的设计

如何确定优化的优先级

 

而不涉及:

新功能/产品的交互设计过程

娱乐导向产品的设计优化

产品概念、功能层次的优化

适合每一类型产品的tips

 

具体的优化方法

一、需要优化什么 (Considerations)

“设计原则的主要目的之一就是优化用户的产品体验。对于生产工具和其他非娱乐导向的产品而言,这意味着将工作负荷降至最低。”——《交互设计精髓》

行为和界面层面的设计原则告诉我们,应该为降低用户的工作负荷而设计。但是我们常常不够贴心,不知不觉就对用户设下了种种考验,让他们抓狂:

1.视觉负担 visual work

需要分解布局

需要区分内容层次

需要区分视觉元素

需要努力定位目标信息

需要识别阅读起点

需要经常变换视线

视觉流被干扰、打断

 

2.认知负担 cognitive work

需要理解不熟悉的概念和模式

需要理解冗长、生涩的文本内容

需要理解混乱的结构和布局

需要理解模棱两可的操作

需要猜测系统状态、行为、结果

 

3.记忆负担 memory work

需要记住对象的各种属性(名字、位置、大小、颜色)

需要记住对象的关联

需要记住操作的命令、步骤、结果

需要记住以往的操作

 

4.物理负担 physical work

需要长距离移动鼠标

需要进行(多次)点击

需要执行不同的鼠标手势

需要多种操作组合

需要切换输入模式

需要进出不同的页面/区域

需要长时间等待

 

 

二、优化目标 (Goal)

仔细检查已有的设计,或多或少总是能发现问题。在解决问题之前,我们应该清楚要往什么方向进行优化:

1.基于可用性的目标

易于识别/定位/阅读

易于理解/学习/记忆

易于操作

 

优化的最重要的目的,是让产品更好用,使设计符合Jakob Nielsen的十条可用性准则

通过有效的反馈信息提供显著的系统状态

符合用户的真实世界

用户自由控制权

一致性和标准性

预防出错

识别而不是回忆

灵活、便捷的使用

美观,精简的设计

协助用户认识,分析和改正错误

帮助和说明

 

2.基于产品的目标

需要根据不同产品进行定义。例如,对于快速注册流程的优化,目的是让用户用最方便完成注册进入目标页面,优化目标可能是最小化输入、最短等待时间等。

 

三、快速检查清单 (Check list)

为了达到优化的目标,整理了一个简易的checklist(pdf版本下载链接请见文末),方便在走查时对架构、布局、内容、行为四个方面对照检查:

1.架构和导航Architecture and navigation

¨  是否采用了用户熟悉或容易理解的结构?

¨  是否能识别当前在网站中的位置?

¨  是否能清晰表达页面之间的结构?

¨  是否能快速回到首页/主要页面?

¨  链接名称与页面名称是否相对应?

¨  当前页面的结构和布局是否清晰?

2.布局和设计Layout and design

¨  是否采用了用户熟悉的界面元素和控件?

¨  界面元素和控件的文字、位置、布局、分组、大小、颜色、形状等是否合理、容易识别、一致?

¨  界面元素/控件之间的关系是否表达正确?

¨  主要操作/阅读区域的视线是否流畅?

¨  其他文本(称谓、提示语、提供反馈)是否一致?

3.内容和可读性Content and readability

¨  文字内容的交流对象是用户吗?

¨  语言是否简洁、易懂、礼貌?

¨  内容表达的含义是否一致?

¨  重要内容是否处于显著位置?

¨  是否在需要时提供必要的信息?

¨  是否有干扰视线和注意力的元素?

4.行为和互动Behavior and interaction

¨  是否告知、引导用户可以做什么?

¨  是否告知需要进行哪些步骤?

¨  是否告知需要多少时间完成?

¨  是否告知第一步做什么?

¨  是否告知输入/操作限制?

¨  是否有必要的系统/用户行为反馈?

¨  是否允许必要的撤销操作?

¨  是否页面上所有操作都必须由用户完成?

¨  是否已将操作步骤、点击次数减至最少?

¨  是否所有跳转都是必须的(无法在当前页面呈现)?

 

以上只是一个不完全的清单,同学们可以根据自己的实践经验修改,也可以参考更全面、权威的可用性测试检查表,如普渡大学可用性测试检查列表

 

四、确定优先级 (Priority)

当我们通过checklist将需要优化的问题筛选出来以后,可以根据问题的严重性和解决的问题的成本(时间、人力等)来综合考虑问题的优先级,例如,问题严重性得分高而且优化成本低的问题,应该优先解决。

 

五、小结

Considerations:为降低用户的视觉负担、认知负担、记忆负担以及物理负担而优化设计

Goal:使设计易于识别/定位/阅读,易于理解/学习/记忆,易于操作,符合可用性原则和产品目标

 

huangjiahui

Persona——Web人物角色介绍

网易用户体验中心

一、什么是人物角色?

人物角色,即persona([pə:’səunə]),这里讨论的主要是web persona,是指针对网站目标群体真实特征的勾勒,是真实用户的综合原型。我们对产品使用者的目标、行为、观点等进行研究,将这些要素抽象综合成为一组对典型产品使用者的描述,以辅助产品的决策和设计。

来看看人物角色的例子~

人物角色一般会包含一些个人基本信息,家庭、工作、生活环境描述,与产品使用相关的具体情境,用户目标或产品使用行为描述等。一个产品通常会设计3~6个角色代表所有的用户群体。

人物角色不是什么?

人物角色不是用户细分

人物角色看起来像我们比较熟悉的用户市场细分。用户细分是市场研究中常用的方法,通常基于人口统计特征(如性别,年龄,职业,收入)和消费心理,分析消费者购买产品的行为。与消费者-商品的对应关系不同,我们更加关注的是用户如何看待、使用产品,如何与产品互动,这是一个相对连续的过程,人口属性特征并不是影响用户行为的主要因素。而人物角色关注用户的目标、行为和观点,能够更好地解读用户需求,以及不同用户群体之间的差异。

人物角色不是平均用户

某个人物角色能代表多大比例的用户?首先,在每一个产品决策问题中,“多大比例”的前置条件是不一样的。是“好友数大于20的用户”?是“从不点击广告的用户”?不一样的具体问题,需要不一样的数据支持。人物角色并不是“平均用户”,也不是“用户平均”,我们关注的是“典型用户”或是“用户典型”。创建人物角色的目的,并不是为了得到一组能精确代表多少比例用户的定性数据,而是通过关注、研究用户的目标与行为模式,帮助我们识别、聚焦于目标用户群。

人物角色不是真实用户

人物角色实际上并不存在。我们不可能精确描述每一个用户是怎样的、喜欢什么,因为喜好非常容易受各种因素影响,甚至对问题不同的描述就会导致不同的答案。如果我们问用户“你喜不喜欢更快的马?”用户当然回答喜欢,虽然给ta一辆车才是更好的解决办法。所以,我们需要重点关注的,其实是一群用户他们需要什么、想做什么,通过描述他们的目标和行为特点,帮助我们分析需求、设计产品。

创建人物角色的前提

人物角色能够被创建出来、被设计团队和客户接受、被投入使用,一个非常重要的前提是:我们认同以用户为中心的设计理念。人物角色创建出来以后,能否真正发挥作用,也要看整个业务部门/设计团队/公司是否已经形成了UCD的思路和流程,是否愿意、是否自觉不自觉地将人物角色引入产品设计的方方面面,否则,人物角色始终是一个摆设、是一堆尘封的文档,纸上画画,墙上挂挂。

所以,在创建人物角色之前,我们需要明确几个问题:谁会使用这些人物角色?他们的态度如何?将会如何使用?做什么类型的决策?可以投入的成本有多少?明确这些问题,对人物角色的创建和使用都很关键。

二、为什么要创建人物角色?

创建人物角色的目的是:尽可能减少主观臆测,理解用户到底真正需要什么,从而知道如何更好为不同类型用户服务。

使用人物角色的好处

1.带来专注
人物角色的第一信条是“不可能建立一个适合所有人的网站”。成功的商业模式通常只针对特定的群体。一个团队再怎么强势,资源终究是有限的,要保证好钢用在刀刃上~

2.引起共鸣
感同身受,是产品设计的秘诀之一。

3.促成意见统一
帮助团队内部确立适当地期望值和目标,一起去创造一个精确的共享版本。人物角色帮助大家心往一处想,力往一处使,用理解代替无意义的PK~

4.创造效率
让每个人都优先考虑有关目标用户和功能的问题。确保从开始就是正确的,因为没有什么比无需求的产品更浪费资源和打击士气了。

5.带来更好的决策
与传统的市场细分不同,人物角色关注的是用户的目标、行为和观点。

什么时候可以用到人物角色?

  • 在制定产品策略时
    •在讨论产品需求时
    •在项目优先级排序时
    •在进行任务分析时
    •在琢磨交互流程时
    •在选择设计风格时
    •在用研项目招募用户时
    •在锁定推广目标时
    •在完善运营方案时
    …………

总之,在各种讨论、脑暴、pk时,在我们想冲口而出”用户xxx”的时候,人物角色都可以派上用场。

三、如何创建人物角色

按用研类型和分析方法来区分,人物角色可以分为:定性人物角色,经定量检验的定性人物角色,定量人物角色。三者的步骤、优缺点和适用性如下表:

Alen Cooper的“七步人物角色法”:

Lene Nielsen的“十步人物角色法”:

四、如何使用人物角色?

人物角色清晰揭示用户目标,帮助我们把握关键需求、关键任务、关键流程,看到产品必须做的事,也知道产品不该做什么。人物角色不是精确的度量标准,它更重要的作用是作为一种决策、设计、沟通的可视化的交流工具。

丰满而有真实感的人物角色比正确的人物角色更有用。所谓正确的100%符合实际情况的角色是不存在的,我们应该尽可能丰富、形象化我们的目标用户群,让它在设计决策过程中发挥作用。

如何保持人物角色的活力?这个问题绝对不容忽视,尤其是当团队首次创建和使用人物角色。人物角色不只是未某个项目、某次特殊需求而创建的。持续使用和更新,将核心用户的形象融入到每个成员开发、设计思维中,才是人物角色的使命。我们需要不断地完善、展示、解释、使用它:

  • 建立人物角色文档
  • 展示人物角色
  • 与人物角色一起生活
huangjiahui

解读眼动的12个误区

学术界和商界对眼球追踪技术应用(以下简称眼动)的关注度,每隔一段时间便会出现一次高潮的讨论。随着技术的革新和推广,越来越多的用户研究行业人员开始在产品设计和研发过程中引入眼球追踪技术,尝试读懂用户眼中的产品和体验。

但是由于对眼动技术认知的不足、信息的不对称,导致对该研究方法的误区不断出现。本文将列举一些用户研究领域对眼动的误区,并试图解答正确的应用。

1  “先做个眼动,看看用户在看什么?”

对眼动有所了解的人,通常会向研究员抛来这样的问题。假如盲目地接下这样的任务,不经过需求细分和策划的眼动测试,最终所有人得到的也只是几张漂亮的浏览轨迹图和关注密度热区图。
试想当软件界面需要做出大的调整时,用眼动来记录“软件的静态设计稿”和“可点击、有交互”的软件demo稿时,用户的关注点会有多大不同?在分析眼动结果时,不明确的测试目标会难以回答“应该这样/可能是这样”的问题。通常不明显的结论,又要引发新一轮附加的测试任务。在理解和沟通测试前,就应该明确测试的目的、希望通过眼动配合数据解答的问题。
每个任务有明确的测试开始、完成节点,使结果易于分析和对比,才是眼动数据的意义所在。

2 “眼动就是热区图和轨迹图。”

Nielsen在06年发现人们浏览网页时有字母“F”型的阅读习惯。这个F型的热区图在很多场合都被引用,但很少有深究热区是基于用户的眼睛停留次数、停留时间,在什么时间范围内生成的呢?用户浏览习惯是否会因为网站结构和时间的变化,而不是呈现F型呢?通常阅读报告中眼动数据的人,也常常会说“我要一张关于xxx的热区图”,而不去考虑背后的各种限制因素。同样的不幸也会降临在“轨迹图”身上。

眼动热区图

按关注点次数                                                         按关注时间长度

这并不能怪读报告的人,只因为通常为了更直观的理解和展现结果,报告中常会出现这两种图。实际上,每一个项目都可以从不同的侧面和角度来分析、阐述用户的认知行为,而每一种角度和衡量指标都会带来对用户浏览和认知行为的理解。因此,配合恰当眼动指标的热区图/轨迹图更容易让读者把握问题之所在。

3 “眼动的红点就是人们看的确切位置。”

无论是查看眼动视频还是轨迹图时,有人会以为红点/十字点100%就是用户看到的地方。实际情况并非全是这样。
首先,目前常见的商用非接触式眼动仪的数据采样率并没有我们想像的那么高,所以显示出的注视点可能会与用户实际看到的点有些偏差。而且,当用户在测试过程中变换了相对屏幕的位置,记录眼动数据的摄像头就非常有可能“记偏了”用户的眼动情况。当数据叠加在测试素材上时,就会发生眼动轨迹的“漂移”。

(眼动轨迹漂移:轨迹显示读者正在阅读文字,但区域不符。)

其次,大体上人眼的视觉分为高清晰度的视觉区(中央窝视觉:foveal vision)和低清晰度视觉区(边缘视觉:peripheral vision)。而对应在屏幕上的高清晰度区域,通常大于红点显示出来的关注点(fixation)。
例如,当我们看电脑屏幕的时,可见的高清区域差不多有两个指甲盖那么大。
人眼在看较熟悉或较大的物体时,依然可以注意到较为模糊的影像区域(parafoveal& peripheral vision)。

如下图所示,尽管用户没有直接看广告中的相机和皮包,但是用户注意到相机和皮包的的可能性很高。

因此,我们不能说用户人们没有看到什么,而只能说他们没有直接看到什么东西上去。

4  “眼动数据很容易解释。”

“我想知道用户会看什么地方”——经常听到的这句话一般会成为研究目的。
说这句话的人好像心里十分清楚一个情况:假如我知道用户在看什么,那我就知道这个东西怎么改了。实际上最终当我们把浏览顺序、用户看的热区图拿出来之后,有时候可能我们自己也懵住了。某些地方热区图很红,就说明用户很喜欢看这个地方吗?还是说这个地方用户根本没有看懂是什么意思?

看到眼动结果后,对方可能会问:
“那又怎么样呢?”
“基于眼动的结果,你有什么修改的建议?”
……
其实,眼动只能回答你“看了什么”,却不能告诉“为什么看了”。

举个例子:从一款App横、竖版的眼动热区图分布来看,横版设计中红色的区域较多,用户似乎更青睐横版。仅凭眼动数据很难解释清楚。测试内容的影响、用户个人浏览习惯等因素,可能会导致用户看横版更多,也有可能是用户在横版中需要花费更多时间来提取信息。

单凭眼动的数据,很难作出合理和全面的解释。

5  “所有的可用性测试都能从眼动中受益。”

一种对眼动的常见理解是:如果可用性测试加上眼动的话,效果和结果会更利于找出问题。但从每个项目所拥有的时间和人力资源上看,眼动测试在后期分析中会占用过多成本进行区域划分、场景切片分析等工作,而最后得出的结论可能仅仅是浏览轨迹和关注度,更多的具体原因仍需要深度访问才能得知。相比之下,传统的可用性测试这种低成本-高效率的分析显得更适宜。

在正式的可用性测试中,眼动数据带来的结论在整体结论中的占比会较小。以网站测试为例,如果想知道网页的某个功能入口用户是否会注意,而进入更多的网站后用户对网站的整体影响如何,指示性的文字是否容易理解。在这种情况下,眼动只能告诉你他/她看过,但具体的理解无法从眼动数据中解读,这时眼动的价值就显得较低。

相比之下,眼动更适合解答传统可用性测试中无法解释的具体疑问。(比如在确认在线支付前,用户在这个页面上纠结什么)倘若后台数据显示某些链接的点击率和页面跳出率很高,眼动可以告诉你用户真正在找什么。

6  “学会操作就可以做眼动测试。”

目前市场上各类眼动仪在功能上大同小异,最终可供的分析数据也相差不大。看起来只要学会了眼动测试的操作,从大家都用的角度来分析就可以做眼动了。但是,会使用眼动仪并不意味着你就可以做眼动了。有效的眼动数据才是研究的前提,而这不仅仅是点两下鼠标就能完成了。

大至人眼工作的模式、视觉认知和信息加工的过程、研究方法论、数据眼动的处理和统计等,小至项目的流程设计、分析的参数、甚至提示语的修改等都需要提前心中有数。等眼动项目结束后,才能从整体上看到热区图、轨迹图以及看似毫无规律的眼动数据结合起来,发现用户的浏览习惯和产品的问题。

7  “眼动就是等用户看完后分析数据。”

通常在眼动研究项目过程中,用户研究员在旁边观察、记录,同时防止测试过程中各种风险(程序意外退出、电脑死机等)的出现。测试开始后,研究员的工作似乎就变成了看稀奇一样查看用户浏览时眼睛的关注点、移动轨迹等情况,直至测试顺利结束。

用户眼动的情况是实时展现给研究员/产品相关同事的,所以大家脑海中会随时出现诸如此类的问题:

“哦,她/他原来是这样看的啊!”
“ 怪不得这里没有去点击……”。

若不及时进行有效地记录,或根本不知道应该记些什么的话,则会错失用户的操作习惯和犯错缘由。事后再看眼动数据时也无从解释。

这类通过对用户眼动轨迹的发现和疑惑,应当立即记录下来,待测试结束后针对用户浏览时的表现,询问用户的理解和操作行为。有需要时,播放眼动的轨迹录像让用户重温操作场景,借助有声思维(think alound)反馈问题。这种方式通常会暴露问题的根源、挖掘到用户的真实需求。

总而言之,不要让用户带着疑问离开了你的眼动测试项目。

8 “眼动可以通过看轨迹视频来分析。”

在提倡敏捷用研的节奏下,快速从测试中输出结论是眼动价值所在。而最快的方法是在测试中实时观看用户的眼动轨迹,或测试后回放眼动轨迹的录像。有人认为不需要做正式的分析,通过看视频也可以得出眼动的结论,同时配上几张热区图便能解释用户的浏览习惯。

然而,我们的眼球每秒进行多次的注视,每分钟可以产生200-300个眼动的数据点。仅仅通过看眼动视频,单凭我们的记忆是无法记住和处理这么大的数据量。就更不用说看眼动轨迹的视频来分析用户习惯(个体/人群)和眼动数据了。更糟糕的是,我们可能会带着个人的偏好来看视频。因为我们已经知道项目研究的目的,所以可能会过分强调用户浏览的顺序、在兴趣区域上停留的时间等等。

注:视频中反映了用户眼动注视点的变化情况,但实际上产生的眼动数据会多于视频中的注视点。

(眼动轨迹视频)                                    (眼动轨迹可视化数据)

眼动轨迹视频适用于结论例证,而非数据分析。

9  “所有的眼动测试都可以通用一个样本量。”

“30!30就够了。”

我们常听别人说眼动测试不需要很多人,30个样本量就可以了。这似乎已成为眼动的标准样本量。其实眼动的样本量取决于测试的目的和实验的设计,30并非全部适用于所有的测试。

在决定眼动测试的样本量前,研究员心里应该清楚“我是要通过眼动来了解一个“总体情况”还是“比较不同设计之间的差异”。如果有不同的设计方案,希望通过眼动来生成一个“总体情况”的话:比较被试组内差异(within-subjects),30样本就够了;比较被试组间差异(between-subjects),这时眼动结果很容易受到个体差异的影响,30样本很显然已经不够了。

假如想配合眼动找出产品可用性方面的问题,8-10个样本已经可以发现70-80%的问题。而此时30个样本的眼动数据足以说明可用性方面的问题了。

10  “眼动数据分析参数的适用于所有案例。”

常见的眼动报告中,总少不了用户视线的浏览轨迹、停留时间等方面的比较,似乎眼动的价值在这里就画上句号了。分析数据时,我们容易受到其他案例分析角度的影响,导致最终的分析更像是一份眼动数据报表。除了自己,没人能从中读懂用户的浏览习惯和其中反映的问题。数据分析取决于你想透过哪些眼动相关的数据,来佐证可用性的问题、不同设计之间的浏览差异等。因此并非用了一些别人通用的分析参数,就可以有效地说明问题。

从常见的停留时间、视线访问次数、视线轨迹等,到较少使用的瞳孔大小、眼球运动速度、扫视路径等参数,丰富的眼动指标使得描述用户浏览行为维度具有时空的立体性。配合定性和定量数据分析,会让你的眼动结果更容易理解,也能更真实的还原用户的认知和操作行为。

比如让用户完成“在订票页面上购买一张机票”的任务。

时间上: 订票页面的注意力的时间分布(注视时长、注视次数、首次注视时长等);
空间上: 最吸引用户注意力的区域(兴趣区域上的时间和空间分布、首次注视区域、视线访问区域和次数等)、订票过程中的浏览轨迹等;

信息检索效率:总体的注视次数(次数越低,效率越高)
决策效率:首次注视到首次鼠标点击的时耗
内容布局:订票相关的信息和功能区之间眼跳次数、浏览顺序
任务的成功率、完成率、完成时耗、满意度等。

通过上面的一个小例子尝试说明,没有一套公式化的参数供所有的项目分析。
真正重要的是,你希望通过眼动数据向观众讲述一个怎样的故事,基于此来选择合适的数据进行分析。
独立存在的眼动数据不具有说服力。

11  “所有人的眼动数据都可以拿来分析。”

通常在大样本数据中需要清洗一部分不符合逻辑/数据缺失的样本,而一般小样本的眼动测试,人们容易忽视测试过程中眼动数据采集的质量。最常见的数据质量问题是由于个体差异导致的——测试时眼睛位置的偏差、摄像头没有很好的记录眼动数据、个人原因导致看了很长时间等情况。个别用户不正常的眼动数据(与其他用户平均眼动数据有显著差异)、眼动数据采样率较低的数据也应考虑清洗掉。

如果仅仅从数字上,很难判断这些“问题数据”的产生原因。也许是因为用户的眼球运动没有被捕捉到,也许只是用户的个人习惯,还有可能是用户在测试时忘记了当时的任务。配合眼动轨迹的回放录像 ,我们可以确定这些数据是否应该从总体样本中去除。在数据分析时,这些质量较差的数据会造成浏览行为的错误解读。

12  “眼动结果的可视化结果是可靠的。”

热区图/轨迹图已成为眼动数据可视化的一种标准输出形式,人们甚至会认为没有看到这种图的话,就不算是一个眼动分析。眼动数据的可视化使人们即使没有相关知识,也能很快速地了解用户关注点和浏览次序。

眼动轨迹图

自由浏览网页的眼动轨迹                                                      在网页上查找特定信息的眼动轨迹

通常我们看到这些可视化结果时,较少会考虑到这是什么情况下生成的图片。同一个网页,让用户自由浏览和找一个感兴趣的新闻,最终得到的眼动结果会截然不同。在适当的情景下产生的数据和眼动结果才会有意义。
所以当下次看到热区图/其他形式的眼动可视化结论时,要记得问清楚是在什么时间范围内、做什么事情时的眼动结果。

感谢你的阅读,本文出自 Tencent CDC,转载时请注明出处,谢谢合作。

huangjiahui

先行动,再研究

作者Arrietty

本文译自唐纳德诺曼的“Act First, Do the Research Later.”

在行动之前先思考,听上去很对,不是吗?在设计之前思考清楚。是的,做一些调查,研究更多的需求,用户,情景,然后设计。这听上去很对,也是为什么我(唐纳德.诺曼)要挑战这个固有思维的原因。但是,先做起来,之后再仔细想,有时候这么做也是有道理的。

在现实的产品开发世界里,时间总是很紧迫,预算总是受限。所以很多时候在有研究的基础上做设计是不可能的事情。“是的,”产品经理会说,“我知道我们应该先做一些研究,但是我们没有时间。我们已经落后计划日程很远了。但是下个项目,我们会先做研究,可以吗?”但这个下次从来没有发生过。下次项目还是时间紧迫的开始了。实际上,让我来创造一个准则:

诺曼的产品发展准则:项目的开始总是落后于计划而且超出预算。

我们总是教育别人先做研究再经历构思、模型和反复提炼的过程的重要性。我们大多数都喜欢这个方法,我也是,而且我也这么教别人。但是当现实指示我们不能这么做的时候,这些教条就变得没有意义了。如果我们从来没有足够多的时间来开展研究,那么我们为什么要宣扬这么一个不实际的方法?我们需要针对现实调整我们的方法,而不是一些冠冕堂皇的,只能应用在理想世界的纸上谈兵的理论。我们要开发一些灵活多变的设计策略。

为什么先做研究不是那么必要

下面有五个支持现实中先设计再研究的五个不同的论据。

第一,好的设计的存在不是先由研究产生的。

第二,有经验的设计师已经掌握了很多从研究中来的知识。

第三,研究对于一个公司来说应该是一个不间断的工作,那么,在任何时候都应该是有相对研究结果的。

第四个,也是最矛盾的一个论据,研究可能会阻碍创造力。

第五,当项目开始,团队建立的时候,做研究已经太迟了。

没有经过设计研究的产品案例研究

首先,我们可以简单地看一看大量现有的产品,他们中很多没有经过设计研究,但都非常完美的合乎情理、启发灵感和受人追捧,设计研究不一定都是必要的 。纸上谈兵的设计师可能故意忽略这些产品例子,但是忽略他们不能让他们消失。

有经验的设计师已经有很多储备知识

其次,我们可以理解为,有经验的设计师从来都不是凭空设计产品的。老练的设计师已经有了很多先前总结的经验,这些经验在没有新的研究和调查的情况下,提供了大量的知识。这就是为什么设计专家们有时可以如此迅速地开始设计。

我发现,在我的设计咨询中,我有时候会跳过研究阶段。先动手做,再去思考它。我之所以这么做是因为我在之前的几年中就做了很多必要的研究,以此掌握了很多预备的知识。

实际上,预先建立的知识储备是如此重要以至于它在很多其他的实践领域被编写成手稿、图表等等。Ed Hutchins(圣地亚哥加州大学认知科学系,人类学家,《荒野中的认知》的作者)让我第一次感知到了这种知识的重要性。他定义这种知识为“预先推断的知识”,同时举了一些例子如地图、潮汐表、手册以及一些我们日常工具从,手动六分仪到复杂的计算工具。这些工具在被使用的时候都立即提供了可用的答案而不需要去做研究和调查。每一个领域都有大量的预先储备的知识以允许熟练的从业者不需要明显的调查研究就能开始做东西。所以,其他人已经帮我们思考了很多,我们可以简单地依靠已经存在的智慧来指导我们怎么做。

工业设计领域并没有很多图表或者手册、电脑工具,但是我们确实有很多累积的知识。

研究人员应该一直处于研究其具体领域中的状态

在先前的一篇文章“why doing user observations first is wrong”中(发表于ACM interactions,人机交互的电脑科学杂志),我坚决主张我们不应该费尽心思从研究开始做。其实,设计研究者应该一直在研究与其领域相关的各种问题。总之,一个公司的设计研究者应该知道什么样的产品公司是喜欢的。所以当一个项目启动的时候,研究结果应该是一个水到渠成的事情。

第四个,也是最矛盾的一个论据。我强烈认为,太多的研究会阻碍想象力和创造力。我对此深信不疑以至于在最近一次的客户见面中我感到非常沮丧,他们的设计团队正在做非常多的研究。我非常怕他们实际上根本没做什么东西,如果他们有做,他们也可能被完全束缚于各种调研。“停止思考,开始行动!”我劝告他们,“建立东西起来,画画草图,把你们的点子表达出来,再回去分析。先做,再思考!”

当我作为一个认知科学的专家的时候,我认识到当我不断地学习现有的研究资料,并变成其中专家的时候,一种非常微妙的折中主义产生了。太多的知识有时候很有害。我所有学生的博士论文的重点在于对一个命题的认知上有一个明显的发展。当你读了太多现有的有关先前研究者怎么想怎么做的资料之后,你就会跟着他们的步伐亦步亦趋了。这就意味着你会和先前的研究者一样遇到死胡同。当你不局限于这些资料的时候,你就可以更加的有创造力,发现更多有价值的思维和方向。但是(这也是一个最重要的“但是”),每当我这么做和要求学生这么做的时候,我会要额外的资料报告,当他们的工作开始进行的时候。这是为了阻止他们去做别人已经做了的东西,去阻止他们陷入别人已经描述过的陷阱,同时也是阻止当他们需要解释给别人自己在做什么的时候反而别忽略的情况。深入的研究、思考和理解是需要的,但是,很多时候,在原始的行动和决定之后再做这些是非常有利的。

当产品已经启动,队伍已经组建之后,一切都太晚了。

一个项目启动、团队组建的决定已经包含了需要建立什么基本元素的决定,一般都会伴随着时间规划、市场定位、目标价格、交货日期等等。这个决定经常伴随着一大堆的需求。

但是开展用来建议新的方法以及确定设计是否真正达到了用户需求的设计研究的一个重要的原因就是去影响并塑造一些关键决定。设计研究的用武之地应该是在这些决定被确定的决策台面。在这个时候,设计者应该和市场团队、工程师、商业分析师有一样的影响力。比如在市场研究方面,市场方面的代表在这个领域应该已经做的很好了,除非设计师能有市场潜力方面的相关看法,不然他们没有能力去赢得这个决策层面上自己的位置。我们需要的设计研究的结果要包括类似计算潜在销售的表格以及推荐方向不被采纳的时候所有潜在的将失去的机会的分析报告。

如果设计者没有被包括在决策制定的台面上,那么他们已经被人从重要设计决策制定的圈内省略了。当一个团队被建立的时候,主要的一些决定应该已经被决定了。这时候要介绍研究已经太迟了,不管这些研究结果是从一直延续的研究上来,从设计团队的经验来还是其他地方。

需要研究和谨慎的地方

当设计成为有非常重要的影响因素,有非常大的影像范围的时候,犯了错是非真的很致命?明显的,我们应该谨慎地行使当我们的行动会有非常大范围的影响。不管什么决策、行为或者试验设计,当他们有非常高的影响力和大的范围的时候,我们总是应该在小的范围内先尝试一下。就像我说的,只有在做东西的人有相当多的经验的情况下,研究阶段被跳过才是合适的。你可以说,他们已经早就做了很多研究了。

总结

让我来总结一下,是的,我相信研究是非常重要的,但是这并不意味着设计项目一开始的时候就要介入设计研究。这些研究可以在非常早之前就被完成了,或者甚至在项目开始以后做也可以。好的设计师应该总是专注于观察、思索、创作设计表现产物、手绘、书写、计划 等等。最后,所谓的“用兵一时”,好的设计师完全不需要研究来做设计,依靠的只是不断积累的智慧。

明显的,如果涉及的领域是非常陌生的,设计师马上要转换自己的角色,去当以为学生,去快速吸收相关领域的知识,和这个领域的专家紧密合作。但是,研究和设计活动的联系不需要是时间性的必然前后联系。很多时候,这些活动可以被拆分开来,时间性上的顺序有时完全可以颠倒。

先行动,后研究?嗯,不尽然。一直研究,一直行动!

附:诺曼最后的总结,在我看来,权且把它理解为老爷子在各种历练之后顿悟到教条的界限都是可以被打破的,有种悟禅悟道的微妙的感觉。其实现在在做的项目也遇到行动和研究先后的问题,虽然我是半路插到团队中来,但是还是感觉得出来当时项目的研究做的不多,主要从竞品分析开始做的,根据老爷子之前说到的,很容易陷入到亦步亦趋的问题中。在总体设计上来说,现在在做的产品设计体验上有很大的进步空间。

文章之前看了,但是这次翻译一遍之后感悟到的东西还是比光光浏览一遍文章多的多,每字每句翻译之后很多细节的东西都有顾及到。仔细看完文章之后发现自己要完成一个新的课题,就是先行动,再研究,那什么时候再具体研究,怎么研究?这也是自己做的产品现在遇到的问题,要好好总结和规划一下产品新的定位和方向,之前虽然做过,但是感觉还是比较片面。也许这种总结和规划过每过一段时间做做总有新的体会和发现,总会往更成熟的方向发展。

原文链接:http://www.core77.com/blog/columns/act_first_do_the_research_later_20051.asp

huangjiahui

可用性测试的权衡之道(二)

Bo-jian

继续讨论可用性测试中各种原则的灵活运用和注意事项。

五.发现问题:真的 VS 假的

判断发现问题的真假,初看上去似乎不是个困难。多数或全部参与者都遇到的问题毫无疑问是明显的可用性问题。或许有人会建议,根据参与者中发现该问题的人数比例来判断:比例高是真问题,比例低是假问题。前半句话可以接受,后半句话则有待商榷。
虽然可用性测试是相对严谨的用户研究方法,但是其对无关变量控制的严格程度和真正的心理学实验还是有一定的差距;并且心理学实验对每组参与者数量的最低要求是30人,这样得出的结论(数量比例)才具有推论至一般的意义。而可用性测试一般才8人左右的参与人数(尽管招募的参与者在质的方面非常具有代表性),但却无法把可用性测试中出现的所有数量比例简单推论至一般。8个参与者中有1人发现某个问题,不代表现实中出现同样问题的真实用户只有12.5%,更不代表这个问题不是真正的/严重的可用性问题。

问题的真假除了根据问题出现的次数比例,还有很重要的考虑点是:用户“错误行为”背后的认知/思考方式是否合乎逻辑?

这里顺便借用一下诺曼《设计心理学》里谈到的理论:概念模型——系统表象——心理模型。概念模型可认为是产品设计人员对产品的设计思想;系统表象可认为是产品展现出的交互界面;而心理模型则是用户按照既往经验对如何操作该产品的设想。从这个角度来认识,可用性问题则是“概念模型、系统表象、心理模型”三者的不吻合或矛盾。

 

通过分析用户行为背后的认知是否符合逻辑,来判断发现的问题的真假,主要体现在以下几点:

1.“概念模型、系统表象”的不一致

产品设计人员突然发现,界面的交互形式根本没有反映出他原先的设计思想!

2.“系统表象、心理模型”的不一致

(1)用户的思维方式受已有的同类产品的影响,并内化接受,而新产品的“系统表象”和已有同类产品并不一致。

(2)用户在日常生活经验中形成了许多并不科学地通俗理解世界的方式(比如通俗物理学、通俗心理学),但产品设计人员没有意识到用户在以这样一种“自认正确”的错误方式来理解和使用产品。

如果发现的可用性问题属于以上情况,那么即使只有一个参与者碰到,它也非常可能是一个真正的可用性问题。

例如:让用户登录购彩网站,查看自己上次购彩结果。大多数用户点击【个人中心】去查看,有2个用户点击【开奖公告】去查看,发现只有开奖号码,没有任何购彩结果信息后,再去点击【个人中心】。仅2个人出现了稍微的偏差,而且很快就找到了正确的页面,这貌似应该不算什么问题。

但若追究其行为背后的逻辑,并与其他用户的反馈(“我上次买的号码没有直接显示出来?”“这里看不到开奖的号码啊?”)联系起来,可以判断用户的心理模型和产品的系统表象不一致。用户希望能同时对照着开奖号码和自己买的号码很方便地核对,而网站却割裂两部分放在不同的页面,因此需要将这2个用户碰到的问题当作真正的可用性问题来对待。

六.研究方法:定性 VS 定量

可用性测试,很多时候被认为是一种定性研究方法;但也有人说它是一种定量研究方法。究竟是怎么回事呢?

个人认为,可用性测试实质上结合了定性和定量两种方法的特点,到底哪种成分更多,要看你的使用目的以及细节上如何操作。

定量研究的思路是基于对一定数量样本的测量,以将研究所得的结论推广至总体。除了强调样本的代表性,还对样本的数量有具体的要求,同时会考虑抽样误差、置信度、置信区间的度量。并且定量研究过程中非常注重对某些自变量操控、及无关变量的控制。

而定性研究重视对主观意义的理解(如背后隐藏的原因),采用解释建构的方法,比如访谈法等。

 

平时工作中以“形成式可用性”测试为主,即便它稍微偏向于定性研究,但在允许的范围内,我个人还是尽可能地遵循着定量研究的方法去实施。这样整个测试过程的严谨性能得到保证,结论的客观程度相对更高(近几个世纪来,量化研究一直是科学研究的主要范式,也正是这个原因)。具体做法如下:

1.在任务的设置上:因为参与者可能存在差别较大的亚群体,不可能要求完成完全相同的任务。但必定会设置大部分基本的、都需要完成的公共任务,再针对不同亚群体设置少量的特殊任务。在后期统计分析的时候,基本的公共任务则可以进行数量化的统计,并横向比较。

2.在测试过程中:关注参与者完成任务时的相关行为,用数字来记录(以0、0.5、1分别表示失败、帮助/提示下成功、成功)。主试尽量少地言语及体态姿势的干扰,只在必要时进行适当地言语交流。

3.在报告呈现:对任务完成情况(效率、完成率)统计呈现,对不同任务的完成情况进行比较,对亚群体间的任务完成情况进行比较,对所有可用性问题按数量化指标进行排序等。或者比较迭代前后独特问题的频次是否减少,以及严重程度高的等级里面可用性问题数量的变化情况。

4.测试过后,我们通常还会收集用户自我报告式的数据,作为“感知可用性”的一个总体反映。

(1)推荐使用系统可用性量表(SUS),因为有研究表明SUS在少量样本时即可产生较为一致的评分结果。

(2)为减少用户在填写这些量表时的反应心向,不要求填写任何个人信息,且主试最好暂时回避。

(3)只统计分析所有参与者SUS量表总分的平均值,切勿再拆分比较亚群体之间的差异,因为即便信效度再高的量表,当样本量极小时都会变得很不靠谱!

七.问题优先级:单指标 VS 多指标

除了在可用性测试过程中,最终报告也必须体现出量化、客观地特点。例如,报告发现的可用性问题的列表,我也会以量化的方式排列出问题的优先级别。

这样做的好处在于:首先,发现的可用性问题肯定有一些比另一些更严重;其次,考虑到产品和设计人员的精力和资源总是有限的,必须帮助他们梳理出最亟需整改的问题。站在别人的角度考虑问题,这样他们才能更“友好地”接受我们的报告。

可用性问题列表的排序,涉及到采用单指标还是多指标、以及指标分为几级的问题。

 

先就量化的客观性而言,“出现频率”指标是最客观、最易量化的;而其它三个指标都需分析人员的主观判断。

就指标的代表意义而言,“严重程度”、“出现频率”与用户体验最相关,与用研人员的职责也最相关。另两个指标可能更多地是产品人员的职责。

就指标的价值而言,多个指标的综合显然比单一指标更有价值。

基于上述考虑,实际工作中我会选择“严重程度”和“出现频率”两个指标的综合,作为可用性问题的优先级指标。“严重程度”分为3级,而不是5级(分析人员主观判断时,3级指标的误差率要低于5级指标);“出现频率”采用计算的具体数值,而非4级分类。这两个指标合并时,采用1:1的权重,具体公式为:

问题优先级=严重程度的级别+出现频率的具体值×3

八.报告呈现:优点 VS 问题 VS 建议

当产品设计人员辛辛苦苦做出的产品却被你报告上罗列的各种问题批评得一无是处时,即便理智上认可你的成果,情感上也很难接受。因此报告中列出哪怕一条最重要的优点,也会让产品设计人员感到欣慰、感受到你中立的态度,增加对报告的接纳程度。列出优点的另一个好处是,在测试中被参与者多次自发提及的优点确实带给用户某种惊喜;当你在报告中再次强调时,可以避免在后期迭代开发中丢失掉原本的优点。

问题的列举肯定是报告中非常重要的部分,但切勿罗列出清单就草草了事,因为:

1.某个(些)问题和另一个(些)问题是有关联的,但是报告中的问题列表部分却割裂了这些联系。

2.产品设计人员无法一直参与旁听/观察可用性测试的过程,导致对报告中文字描述的问题缺乏感性认识。

3.只提问题却不提供解决方案,就不是“建设性地提问”!

因此,我们需要在可用性测试报告的后半部分提出针对重要问题的解决方案。其目标并非是强迫产品设计人员一定要采纳我们提出方案,而是:(1)把一些相关问题联系起来看,(2)加深报告阅读者对于问题的感性认识和背后原因的理解,(3)使整个报告的思路更清晰、完整,(4)我们还可学到一些交互设计和产品的知识。

 

总之,可用性测试施行起来既简单又复杂。简单是因为不管你如何施行,终究能发现一些问题;复杂则在于发现可用性问题的质量、重要性、对测试的利用效率、对产品设计人员的帮助程度可能相距甚远。一次成功的可用性测试体现在从前期策划、测试过程、后期报告等整个过程中是否遵循了这些原则,并在某些难以两全的原则面前做到合理的权衡取舍。

 

huangjiahui

可用性测试的权衡之道(一)

Bo-jian

对于可用性测试,业内人士存在一些普遍认可的原则。它们神圣地如同自然科学里的理论,似乎我们只能对其言听计从、俯首称臣才能践行出“好的可用性测试”。其实,即便是科学,它的一个特征也是“可证伪性”——理论的正确性总是存在前提条件的。真理再向前一步就成为谬误!
可用性测试中的原则同样如此,需要根据目的、资源、环境的不同,灵活把握、权衡取舍,而非一味恪守某一个或某几个原则,也许这才是可用性从业人员经验重要性的体现。

一.任务设置:精细 VS 宽泛

制定的任务过于精细,一般原则上是反对的。理由很清楚,如果你的任务精细到一步一步“引导”用户进行操作,那太不符合用户现实中的使用情境,平时没有人在旁边“引导”用户的每一步操作;而且过于控制用户的操作步骤,用户缺乏真实使用时的灵活性。

是不是我们设置的任务只能是宽泛的,不能细化呢?这就必须根据研究的目的来做抉择。如果产品处在设计的初期,我们需要关注一些宏大的问题(如:网站的整体架构、导航和分类的合理性、页面的逻辑关系),此时就需要通过宽泛而有弹性的任务,来查找宏观层面的问题。如果产品的设计已经非常完善,开始进行细节的修改迭代,此时就需要通过设置相对具体的任务来查找特定的细节问题(如:对某个命名的理解、按钮的使用、链接的点击、表单的填写)。按照《Don’t make me think》一书的观点:一般用户使用互联网产品时满足于能用就行,不会寻求最好的使用方法;只扫描网页,不会仔细阅读。所以,如果完全宽泛有弹性地设置任务,虽然更吻合实际使用情况,但是很可能用户直接跳过你想考察的细节。

实际工作中,由于时间和资源的限制,无法做到每个产品从设计初期到上线前后进行多次可用性测试。可能在一次的可用性测试中即需要同时关注宏观方面和细节上的问题。此时,还是需要和产品经理、交互设计师反复沟通,确认测试的主要目的,同时通过对任务设置精细程度的权衡把握,使次要目的也尽量得以满足。

不过,即便是想考察细节的任务,也要尽量避免“直接指导操作”式的语言描述方式,这样能让任务与真实使用情境不会相距太远。例如:想考察豆瓣读书页面【想要】按钮是否能被看到、是否具备可点击感。下面列出两种表述方式,以作对比:

A.请找到您喜欢的那本书,并在该页面点击【想要】。(×)

B.请找到您喜欢的那本书,并在该页面对其作个标记。(√)

二.任务数量:多VS少

任务数量的多少与可用性测试考察范围有关,与任务的精细程度也有关。如果对网站全站进行考察和只对其中某个页面、某个操作流程进行考察,所需的任务数量自然不一样。在同样的考察范围下,如果任务设置得越精细,所需任务数量也就越多。

Lindgaard和Chattratichart(2007)的研究发现任务数量与发现可用性问题比例存在显著的相关关系(r=0.82,p<0.01)。为了尽可能多地发现可用性问题,我们就尽量多地设置任务给用户吗?

此时要考虑任务数量过多可能带来的弊端:学习效应和疲劳效应,尤其是靠后的任务更可能会受影响。心理学实验中处理此问题的方法是顺序平衡,抵消影响。但是可用性测试中设置的场景和任务存在特定的先后次序,不适合采用顺序平衡的方法。基于我们的经验,还是通过对测试的任务数量进行控制,确保正式测试环节最多不超过1小时,加上前后的欢迎语、访谈、问答等,整个过程不超过1.5小时。

此外,任务数量的多少还会间接影响到测试所需参与者数量的多少。

三.用户人数:5个足够VS  5个不够

Nielsen的研究发现,5个用户可以发现80%以上的可用性问题。这个结论得到许多人的推崇,因此称之为“魔法数字5”。这个结论的来源依据是每个用户平均可以发现30%的可用性问题,且假设所有问题都有同等被发现的概率。不过,当设置的任务数量过多,且任务的精细程度和难度多种多样时,这个前提有可能不成立。

Lindgaard和Chattratichart(2007)的研究发现测试用户数量与发现的可用性问题比例并不存在显著的相关关系。这个结论似乎又支持我们选择少量用户进行测试即可。

其实,在用户招募阶段,比用户数量更需要重视是用户的代表性的问题。能否招募到有代表性的用户将直接影响可用性测试的成败。如测试一个医疗软件产品,招募到医护人员和患者作为测试用户,那5个用户可能就足够了;但如果只招募到医学实习生来测试,就必须超过5个以上的用户(即便这样,也未必能推论到整个产品的用户群)。

由此看来,招募用户的人数和任务的数量、精细程度、用户的代表性也是息息相关的。参考Tom Tullis(2009)和本人经验:当可用性测试范围限定在一定的范围(20个任务内、或30个网页之内),且招募到很强代表性的用户,那么5个足够了。如果存在着差别较大的亚群体,争取做到每个亚群组有5个左右的代表性的用户(当然,目标用户的特征及分类应该是在可用性测试之前的用户调研阶段就解决的问题);一次测试最多不会超过12个用户。

四.用户表现:行为VS言语

在可用性测试中强调对用户操作行为的关注,是毋庸置疑的。因为:

1.用户的行为指标更明确、具体、客观,易观察和记录。

2.如果完全把关注点放在用户的操作行为上,那么就无需跟用户进行多余的(指导语之外的)语言交流。类似于心理学研究规范,对实验或测试中的指导语进行统一,对一切无关变量(包括主试的语言、体态表情)进行控制,以减少对研究过程的干扰。

3.即便你直接询问用户某些问题,也极可能得到错误的答案。30年前Richard Nisbett和Timothy Wilson的实验、2年前Peter Johansson在《science》的文章,都证实了某些情况下人们无法解释清楚自己行为的真正原因。另外,用户还可能揣摩主试的喜好,回答他们认为主试期望的答案。

因此,有必要强调在可用性测试过程中关注的重点永远应该是用户的操作行为,而且尽量减少任何无关变量的干扰。但这个原则被有些人引申到极端,认为只有观察用户的操作行为才有意义,其他信息都是无需关注的,甚至轻率地怀疑用户的话都是不可信的。

可用性测试的主要目的虽然是发现问题,但也需要了解问题背后的原因,而仅仅依靠观察用户的操作行为是无法获悉所有问题背后的原因的,此时,我们就希望用户能采用“出声思维法”,出声思维就是集中于如何与产品进行交互的意识流。如果测试中的氛围比较平等、自然、融洽,用户又特别愿意表达,那么用户就会在进行任务操作同时,表达他们想做什么、打算如何做、背后的原因是什么。此时,不仅是操作行为、用户表达出来的想法和原因、以及语言中透露出的疑惑、失望、不满、惊讶、犹豫等情绪同样是需要我们加以关注的。但是,有些用户比较内向,不善于主动表达自己的想法,此时就需要主试跟他进行简单的交流,以引导用户说出背后的原因(注:不是引导用户说出你期望得到答案)。

所以,在实际的可用性测试,基本应该以关注用户的行为为主,少量、适时地进行询问交流也是需要的。但这个度如何把握呢?

1.当用户出现犹豫、惊讶、任务失败(过程节点上出现自然而然地稍微中断/暂停)的时候才进行简单的询问。

2.询问采用一般疑问句的句式,重复用户刚才的行为表现(要具体客观):“你刚才没有……,是吗?”——虽然没有直接问“为什么”,但暗示了希望听到他进一步的解释。

3.如果用户没有自己主动说出原因,可以“顺便”问一下“为什么?”或通过身体前倾、目光注视等非语言方式来暗示用户你希望能听到更多内容。若用户很快、坚定地说出原因,则该理由的可信度较高;如果用户犹豫、或难以说出原因,就不要继续追问。

除了上述的语言、情绪、行为都需要得到关注,还有一种特殊情况是需要听懂用户“没有说的”语言。例如,我们预计网站的某二级导航标签和一级导航标签存在分类逻辑上的不合理;但用户在测试中,导航相关的操作步骤进行得很流畅,用户也什么都没说。这通常表明用户认为这些是理所当然的、不影响操作的——此时你需要听懂用户“没有说的”语言。如果你简单粗暴地打断用户并询问:“你觉得这两个导航标签如何?”,则变成了一种诱导性地提问。

总结一下关于此部分内容的实践应用:

1.用户的操作行为永远是可用性测试的重点。

2.鼓励用户采用“出声思维法”。

3.适时、少量地向用户提问,禁止对同一个问题反复追问“为什么”。

4.采用真正地“倾听”技术保持和用户的交流状态,而非通过过多的话语。

5.开放、不预设立场地观察、倾听用户“没有说的”语言。

在可用性测试中考虑需要遵循的原则时,一定要理解它的适用条件,以及它和其它原则之间的互相影响,并结合本次用户研究的目的、资源、环境综合考虑,以尽可能形成一个最优方案。由于博文长度所限,先总结这么多,在下次的文章中会继续总结其它几方面的原则。

 

huangjiahui