形成式可用性

当进行一个形成式可用性研究时,可用性专家很像一个厨师,在菜肴的准备过程中定期检查并作出对最终结果有积极影响的调整。厨师可以加一点盐,然后多放一点香料,最后在上桌前加少量的辣胡椒。厨师定期评估、调整,然后再次评价。而形成式可用性研究与此如出一辙。可用性专家就像厨师一样,要定期评估一个产品或设计,发现其中的缺点、提供修改建议,然后重复此评估、修改的过程,在理想的情况下直至最终完成的产品尽可能接近完美的方案。

    形成式可用性区别于其他类型可用性研究的是其迭代式测试。其目标是对设计进行改进,即发现或分析问题、提出修改建议,然后待完成修改后再次评估。形成式可用性总是在设计最终确定之前进行。事实上,越早进行形成式可用性评估,可用性评估对设计的影响就越大。

基于问题的度量需注意的几点

许多可用性从业人员都以发现可用性问题和提供可操作的改进建议来谋生。虽然提供可用性问题方面的度量并不是经常操作的任务,但却可以轻松地整合到任何人的日常工作中。测量可用性问题可以帮助你回答一些基础问题,比如,设计有多好(或坏)、每次的迭代设计是如何变化的以及应当把资源集中在哪些方面以解决一些突出的问题。

    在发现、测量和呈现可用性问题时,你应当紧记如下几点:

    1、面对面的实验室研发是发现可用性问题的最简单方式,但也可以通过自动式研究中参加者的评论来发现可用性问题。你对相关领域知道得越多,就会越容易发现问题所在。同时,有多位观察者参与也非常有益于发现可用性问题。

挖掘你的数据

挖掘你的数据是你可以做的最有价值的事情之一。卷起袖子投入到原始数据中去。对它们进行探索性统计分析,寻找那些不是很明显的模式或趋势,尝试以不同的方式整理和分割你的数据,让自己有足够多的时间及不畏惧尝试新事物或方法,这两点对探察数据来说是很总要的。

    当我们探察数据时,特别探察是比较大的一组数据时,我们首先要做的是确保我们正在处理的数据是整洁的。我们要检查是否有不一致的回答并要剔除极值,同时我们应着手在原始数据的基础上设立一些新的变量。例如,我们可以计算自我报告式问题的前两个最高分和后两个最低分。我们也经常计算多个任务的均值,比如任务成功的总数。我们还可以计算专家绩效的比率及根据不同程度的可接受完成时间对时间数据进行分类。这样,可以设立许多新的变量。事实上,我们最有价值的度量中有许多都来源于数据的探索性分析。

不要误用度量

可用性度量虽然非常重要,但是我们也不能过分的依赖于可用性度量,因为可用性度量(的使用)有其自身的时间和场合。误用度量会存在破坏你整个可用性项目的潜在危险。误用表现的形式可以是:在不需要度量的地方使用了度量,一次呈现了太多的数据、一次测量得太多或者过于依赖于某个度量。

    在有的情境中,不涉及到度量可能会更好。如果你只是想在项目之处查看一些定性的反馈,或者该项目可能正在进行一系列快速的设计迭代,那么度量可能就不适合。这些情境下的度量可能只是一个干扰而不能带来任何价值。很清楚何时何地度量适合某种目的,这是很重要的。如果度量不能带来价值,就不要去碰它们。

度量不被管理层所理解或赞赏

 虽然有的经理认为,可用性只提供了关于某设计或产品的定性反馈,但是大多数管理者已看到了测量的价值。以我们的经验,可用性度量不但能被上层管理所理解,还能被他们非常地赞赏。他们能理解度量。度量可以给你的团队、产品和设计过程提供真实的情况。度量可以用来计算ROI。大多数管理者喜欢度量,可用性是他们将会很快就能接受的一种度量。可用性度量也能引起管理层的注意。说在线结账过程有问题是一回事情,但说有52%的用户一旦碰到这个问题就不能成功地在线购买产品就是完全不同的另一件事情了。

度量不适用于新产品

有的人在评估新产品时会含羞地远离于度量。他们会认为,因为没有可比较的点,所以度量就没有意义。但我们的观点应恰恰相反。当评论某个新的产品时,构建一系列基线度量是很重要的,据此,将来设计的迭代产品就可以进行比较。这是可以如实了解新设计是否有提高的唯一途径。另外,这也有助于为新的产品确定目标性的度量。在某产品发布之前,它应该满足这个基本的可用性度量,诸如任务成功、满意度和效率。

可用性数据的噪音太多

对于可用性度量的猛烈批评之一是认为度量数据的“噪音”太多:太多的变量对获得所发生事情的清晰原貌造成了阻碍。“噪音”数据的经典例子是:在一个自动化的可用性研究中,当测试参加者出去喝咖啡或者回家过周末时,还在继续测量任务完成时间。尽管这种情况是偶然的,但这不应该妨碍你收集任务完成时间的数据或其他类型的可用性数据。有一些简单可行的办法可以用来减小甚至剔除数据中的噪音。可用性数据可以被整理,这样在分析中就不会用到极端的数值。定义完备的流程可以用来确保在评估任务或可用性问题时保持恰当的一致水平。很多标准的可用性问卷已经被不少研究人员给予了广泛地验证。所以基本情况是:如果给予一些周全的考虑和几个简单的方法,可用性数据中的众多噪音都可以被显著地被减少,直到显示用户行为和态度的清晰原貌。

当集中在细小改进上时,可用性度量是没有用的

当只对一些相当细微的改进感兴趣时,项目团队中的有些成员就会置疑度量是否有用。他们会说最好的做法是集中关注一类有限的小改进,而不是担心可用性度量。他们可能也没有任何额外的时间或预算去收集任何的可用性度量。他们还会说在快速迭代设计过程中,度量没有自身的位置。但是分析可用性问题是一个显而易见且颇有价值的解决方案。例如,关注可用性问题的严重程度和频率及其出现的原因是在设计过程中可以集中资源的极好途径,这种方法可以同时节省项目的经费和时间。以往有些研究可以帮助你回答关键性的可用性问题。在此基础之上,你可以容易地就能获得一些可用性度量。不论项目大小,可用性度量都是同样有用的。

度量需要花太多的时间而难以收集

在最理想的情况下,可用性度量可以加速设计进程,在最坏的情况下至少应该不会影响整个时间表。作为正常迭代式可用性评估的组成部分,度量可以快速而容易地收集。项目团队成员可能认为,需要启动成熟完备的调查,或者不得不在实验室中用整整两个星期进行测试以收集甚至为基本的可用性度量。事实上,有一些相当简单的可用性度量可以作为你每天测的组成部分而加以收集。在每个可用性单元的开始或结束,增加几个额外的问题不会影响该单元的时长。作为典型背景问卷或测试后继活动安排的一部分,参加者可以很快地回答几个重要的问题。

关于数据图的一些建议

即使你收集和分析的一组可用性数据是当前最好的,但是如果你不能就其与其他人进行有效地交流,那么这些数据的价值就有限了。在某些情况下,数据表肯定有用,但是在大多数情况下,你将需要用图形化的方式呈现数据。在使用这种图形化的方式时,你需要注意以下几点。

    首先,为坐标轴和单位添加标题。对于你而言,数据的0%至100%显然表示的是任务完成率,但是对于你的读者而言,这也许是不明确的。或者你知道图中显示的时间单位是分钟,但是你读者却可能在考虑这个单位是不是秒或小时。有时候,坐标轴上的标签已经能够清晰地表示出刻度的含义(如“任务1”和“任务2”)。在这种情况下,给坐标轴本身加标签将是多余的。