Criterios Ergonómicos: métodos de evaluación

Criterios Ergonómicos: métodos de evaluación

Este artículo trata sobre los métodos de evaluación ergonómica aplicados a las características de la interfaz. Estos están basados en modelos formales, en la evaluación de un experto, los métodos de inspección, la inspección cognitiva, entre otros. A continuación una guía completa sobre los criterios ergonómicos.

¿Qué métodos se aplican a las características de la interfaz?

Esta categoría de métodos se distingue básicamente por la ausencia de interacción directa entre usuario y sistema. En estos métodos, tanto los usuarios como sus tareas son representados. Serán tratados los modelos, los métodos y lenguajes formales, la evaluación de un experto y los métodos de inspección.

¿Qué son los métodos basados en modelos formales?

Las evaluaciones que se apoyan en modelos teóricos y/o formales (tratados en el capítulo 3 de la obra de Kolski [4]) permiten predecir la complejidad de un sistema que debe conocer un usuario ideal para realizar una tarea con el sistema que le es propuesto y por consiguiente predecir el rendimiento de los usuarios. Por ejemplo, por el número de reglas de producción del tipo “Para hacer esto entonces hay que proceder así”. Sin embargo, la evaluación a partir de estos modelos es una tarea que requiere mucho tiempo, muy costosa y difícil de implementar para los que no son especialistas.

¿Qué es la evaluación de un experto?

La evaluación de un experto generalmente es definida como una evaluación informal en la que el experto compara los rendimientos, atributos y características de un sistema (presentado bajo la forma de especificaciones, maquetas o prototipos) con las recomendaciones o normas existentes con el propósito de detectar defectos de concepción.

¿Cuáles son los métodos de inspección?

Los métodos de inspección de usabilidad reagrupan un conjunto de métodos que recurren a la opinión de evaluadores, ya sean estos expertos o no. A pesar de que todos estos métodos tienen objetivos diferentes, por lo general todos intentan detectar características de las interfaces que puedan ocasionar dificultades en su uso o hacer pesado el trabajo de los usuarios. Los métodos de inspección se distinguen entre ellos por el modo en que la opinión de los evaluadores es derivada y por los criterios de evaluación en los que se basan sus opiniones.

Entre los métodos de inspección los que más nos interesan de manera particular son: la inspección cognitiva (Cognitive walkthrough), la evaluación de la conformidad con las recomendaciones (guideline reviews), la inspección de conformidad con los estándares (standards inspection), principios, dimensiones, heurística. El interés se debe en parte al hecho que estos últimos están bien documentados y han sido objeto de test y comparaciones.

¿Qué es la inspección cognitiva?

La inspección cognitiva es un método de inspección que consiste en evaluar la facilidad de aprendizaje, a través de la exploración de un sistema interactivo. Esta evaluación requiere una descripción detallada de la interfaz (idealmente bajo forma de maquetas, programas o prototipos), una descripción de la tarea a realizar, una descripción de las características de los usuarios potenciales y del entorno en que será usado y una descripción precisa de la secuencia de las acciones que el usuario debe efectuar para realizar las tareas descritas.

Durante la inspección, los evaluadores examinan cada una de las acciones que el usuario debe efectuar. En cada una de estas deben preguntarse sobre lo que el usuario final estará tentado a hacer, basándose en los objetivos de uso y los conocimientos de estos últimos y deben comparar estas acciones hipotéticas con las acciones que permite el sistema en esta etapa de interacción.

Si la interfaz está bien concebida, las acciones permitidas u ofrecidas por el sistema deberían corresponder a las que el usuario espera. En otros términos, la inspección cognitiva busca identificar las opciones de concepción que pueden dificultar el aprendizaje por exploración.

¿Cómo es la evaluación de la conformidad con las recomendaciones?

La evaluación de la conformidad con las recomendaciones consiste en evaluar la conformidad de los elementos de la interfaz con relación a las recomendaciones (ergonómicas o de estilo) contenidas en diversos tipos de guías de recomendaciones. Es así que encontramos guías de estilo, es decir recomendaciones que proponen los fabricantes, desarrolladores, o los consorcios, y guías de recomendaciones. Las recomendaciones de estilo por lo general permiten distinguir las interfaces de programas desarrollados para entornos diferentes (por ejemplo para entornos Unix, Windows y Macintosh).

La “Macintosh Human Interface Guidelines” de Apple, o la “Window interface: An Application Design Guide” de Microsoft son ejemplos de guías de estilo.

Las recomendaciones generalmente son presentadas en guías de recomendaciones (por ejemplo ver Scapin [11], Smith [12] y Vanderdonckt [13]) o guías generales (ver por ejemplo Mayhew [9]). Las guías de recomendación constituyen probablemente la fuente más importante de guías de concepción.

¿Qué es la evaluación de la conformidad con relación a dimensiones ergonómicas (normas, principios, heurística)?

De manera paralela a las guías de recomendaciones, los conocimientos ergonómicos están disponibles bajo distintas formas. Por ejemplo, podemos encontrar guías de concepción, de principios, heurísticas y de normas.

Las numerosas guías de concepción disponibles responden a diversos objetivos. Al leer estas guías podemos constatar claramente una ausencia de uniformidad en la presentación de las recomendaciones y un número muy variable de recomendaciones presentadas. Estas últimas, a veces están organizadas por criterios, principios o temas del más alto nivel que buscan organizarlas y sintetizarlas (por ejemplo la homogeneidad, la compatibilidad estímulo-respuesta, la facilidad de aprendizaje, etc.), o en ocasiones por temas nacidos de la división de la interfaz (por ejemplo, lenguaje del comando, selección de menús, ingreso de datos, visualización de datos, etc.).

Mientras que algunas guías abordan específicamente la concepción de la interfaz de los usuarios, otras tratan principalmente acerca de la evaluación. Estas últimas pueden ser más o menos complejas y detalladas. También podemos encontrar capítulos de libros, resumidos y bastante generales (Marshall, Nelson & Gardiner [8]) o también guías más detalladas conteniendo check-lists. Por ejemplo, Clegg & al. [1].

La distinción entre las diversas dimensiones, al menos entre los principios, normas y heurísticas a veces se mantiene. En algunos casos, la distinción proviene de su carácter oficial (es el caso de las normas); en otros, puede estar ligado a la precisión de las definiciones e incluso al número de ejemplos de recomendaciones que acompañan a estas dimensiones.

Las normas de concepción y evaluación (design standards) presentan normalmente una serie de enunciados generales sobre la concepción de sistemas interactivos. Lo que distingue estos documentos de otros documentos que presentan también enunciados generales, como los principios, es su carácter oficial y su origen; estos documentos provienen de organismos de estandarización. Podemos encontrar normas nacionales (DIN para Alemania o AFNOR para Francia, por ejemplo) y normas internacionales (estilo ISO).

Los principios son enunciados generales que se basan en datos que provienen de la investigación acerca de la manera en la que la gente aprende y trabaja. Es así que el principio “ser coherente en la elección de las palabras, formatos y procedimientos” proviene de estudios que han mostrado que la gente aprende más rápidamente y transfiere mejor lo aprendido cuando la información que se le presenta y los procedimientos que deben seguir son coherentes. Por lo tanto- los principios constituyen objetivos a ser alcanzados, sin que sea precisado cómo.

¿Cuáles son las herramientas de evaluación automática?

Diversos programas de ayuda a la evaluación ya han sido propuestos. Algunos son las versiones en programas de documentos, otros son herramientas de acompañamiento para la evaluación, es decir que ayudan al evaluador a estructurar y a organizar la evaluación, finalmente otros permiten hacer una evaluación automática.

De esta última categoría hablaremos aquí. Se trata de describir las herramientas que permitan obtener archivos de descripción de la interfaz sobre los que son hechos análisis que permiten evaluar la conformidad de algunas recomendaciones ergonómicas, principios, criterios o recomendaciones de estilo (ERGOVAL, KRI/AG, CHIMES, SYNOP, la herramienta de Mahajan y Shneiderman, etc.). No se trata de herramientas de captura de hechos ocurridos a los usuarios como los presentados en la primera parte de este artículo.

ERGOVAL

ERGOVAL (Farenc [2]) es un sistema de evaluación basado en conocimiento. Las reglas ergonómicas integradas en la base de conocimientos son relativas a las interfaces gráficas y no necesitan recurrir a conocimientos profundos sobre el trabajo. Estas reglas provienen de diversos compendios de recomendaciones y son clasificadas en categorías que se parecen a los Criterios Ergonómicos (que veremos en la 3ra parte de este artículo). Además de reglas ergonómicas, ERGOVAL contiene una descomposición estructural de los objetos de la interfaz, establecida a partir de la norma CUA (Common User Access). Esta tipología de objetos permite entre otras cosas relacionar conjuntos de reglas a cada tipo de objeto. ERGOVAL proporciona, al final del diagnóstico, el texto justificativo de cada una de las reglas no respetadas.

KRI/AG

KRI/AG (Löwgren & Nordqvist [6]) es un sistema experto conectado a un UIMS (TeleUse, bajo entorno X-Window) que evalúa los archivos generados por este último. Este sistema se apoya en una base de alrededor cien recomendaciones ergonómicas y de estilo (Motivo) sobre los aspectos sintácticos y de presentación de la interfaz.

CHIMES

CHIMES (Jiang & al. [3]) es un sistema capaz de evaluar la conformidad de la interfaz en relación a las recomendaciones de estilo OSF/Motivo y a las recomendaciones relativas al uso del color. Durante la evaluación, CHIMES propone mejoras.

SYNOP

SYNOP (Kolski & Millot [5]) es un sistema experto de evaluación automático de la presentación estática de sinópticos industriales a partir de recomendaciones relativas a la presentación de la información en pantalla. La evaluación es hecha sobre una descripción de pantallas creadas con el programa gráfico IMAGIN.

Este sistema también permite efectuar modificaciones automáticas y cuando estas últimas son imposibles, son propuestas recomendaciones. Por lo tanto este sistema permitiría detectar errores relacionados a ciertas dimensiones ergonómicas. Por ejemplo, Agrupación/Distinción entre ítems para la localización y el formato, Legibilidad, Densidad de la información, y Coherencia.

Mahajan y Shneiderman

Mahajan y Shneiderman [7] han desarrollado una herramienta para la evaluación de la coherencia de la interfaz. La herramienta convierte la interfaz creada con la ayuda de Visual Basic bajo forma de un archivo canónico de descripción de objetos. Después, la herramienta permite evaluar la coherencia de la interfaz.

Exactamente, la herramienta evalúa: el estilo y el tamaño de las fuentes de los caracteres utilizados en las ventanas de diálogo a fin de detectar incoherencias; los colores utilizados para los fondos de pantalla; la interfaz, con el propósito de detectar el uso incoherente de mayúsculas en las palabras que aparecen en los botones, pestañas, títulos, menús, etc.y esto en todas las ventanas de diálogo; la coherencia de las características de los botones de comando, sus títulos, el empleo de mayúsculas, su posición relativa, su tamaño (altura, ancho); y la ortografía de las palabras utilizadas en todos los objetos, así como una evaluación de sinónimos.

¿Qué podemos concluir?

A pesar de que todas las herramientas mencionadas no hagan ninguna referencia a las tareas y a las características de los usuarios estas no dejan de ser útiles.

Recordemos, por ejemplo, que la sola evaluación de una interfaz desde el punto de vista de la coherencia, y con mayor razón si ésta es compleja, es una tarea extremadamente difícil de realizar. Esta evaluación requiere que el valor de los parámetros de un objeto o un conjunto de objetos sea coherente en toda la interfaz. Es más, para que esta evaluación sea exhaustiva, el evaluador debe tener una buena representación del diálogo, lo que tampoco es algo fácil de conseguir.

De este modo, cualquier herramienta que facilite este tipo de evaluación permitirá al evaluador dedicar más tiempo a los aspectos relacionados a las tareas.

Estas herramientas muestran que algunas dimensiones ergonómicas, algunas recomendaciones o reglas se prestan bastante bien a una evaluación automática. Sin embargo, estas herramientas deberán, a fin de permitir una evaluación de aspectos más semánticos, articularse a herramientas de descripción de tareas y a herramientas de descripción de la interfaz. Desde ya podemos imaginar la magnitud de la tarea. Por ejemplo, cómo a partir de la descripción de una tarea, podemos determinar automáticamente que el diálogo corresponde a su estructura. Para ello habrá que disponer de una buena descripción del diálogo de la interfaz y articular esta última a la descripción de la tarea.

Webmaster