MUZA \ исследования \ Лаборатория юзабилити

А.Крамер
Юзабилити и переоценка роли языка

В 1976-м году никто про "юзабилити" слыхом не слыхивал. Была эргономика. Была инженерная психология. И еще был промышленный дизайн. Слово usability появилось где-то в середине 90-х с легкой руки Якоба Нильсена и обозначало - применительно к интернету - своего рода "плюсплюс" (с) к "эффективности взаимодействия между оператора и системой" - а именно субъективное удобство этого взаимодействия. Интересно, что аккурат в 1994-м появился язык php, который как раз и стал в конечном итоге эдаким универсальным средством обеспечения этого взаимодействия. А еще в 94-м появились: концепция "Electronic money" и Amazon.com. Вот как бы два ключевых обстоятельства, без которых юзабилити даже и не возникла: динамические сайты плюс электронная коммерция. Ключевая задача юзабилити определилась уже тогда: сделать так, чтобы необходимые действия на сайте были для пользователя очевидными и удобными.

Тут надо помнить, что в то время интернет был почти сплошь текстовым (точнее, гипертекстовым, что сути не меняет); картинки были иллюстрациями к словам, за исключением разве что картинок-ссылок и картинок-кнопок. Никакого видео, почти никакого аудио. Чистая визуальность: буквы и картинки. Поэтому ключевыми теоретическими концептами юзабилити стали представления о визуальной метафоре и метафорическом интерфейсе (напомню, что интерфейс - это совокупность правил и процедур взаимодействия). Совершенно очевидным образом юзабилити приравнялось к графическому дизайну, а дизайнеры стали изобретать визуальные метафоры. Тут все еще совпало с появлением Windows-95, конкуренцией "Винды" и "МакОси", работами по совершенствованию системных и программных графических пользовательских компьютерных интерфейсов.

Собственно говоря, к концу 90-х вдруг выяснилось, что лингвистический по сути концепт метафоры не решает самой важной задачи - научить пользователя действовать в новой среде по новым и непривычным правилам. И что научить пользоваться компьютером и научить совершать покупки в интернете - звенья одной цепи. Характерный пример того времени: системная "корзина" есть метафора удаления ненужного, "корзина" в интернет-магазине - с точностью до наоборот. А называется по-русски одинаково - "корзина"... хотя в отечественных привычных универмагах и универсамах никаких корзин не было. "Корзина покупателя" - это элемент супермаркета, который (как класс) стал привычным магазином только изрядно после кризиса 1998-го, когда появились первые сетевые дискаунтеры. А в конце 90-х, помнится, наши дизайнеры всерьез предлагали (как альтернативу) понятную и привычную визуальную метафору "кассы". Н-да... это вам не разница между basket и trash.

Это серьезнее, на самом деле, чем представляется: это проблема теоретической подоплеки. Метафора и лингвистический подход - это подоплека, по сути, антропологическая, акцентирующая осознаваемые и проговариваемые (или не-осознаваемые и не-проговариваемые, что сути не меняет) смыслы. И антропологию, по большому счету, не волнует, что именно происходит, когда новые смыслы "навешиваются" на привычные вещи или действия, и особенно - как именно эти новые смыслы преобразуют эти самые привычные вещи или действия. И наоборот: может ли привычный смысл быть реализован через новые вещи или действия - и как именно это происходит. Несколько огрубляя, именно об этом - вышедшая все в том же 94-м книга Пьера Бурдьё "Практический разум" (Raisons pratiques : sur la th?orie de l'action, Paris, Seuil, 1994, англ. перевод - 1998, на русском языке издана в 2001). Ключевой момент этой, фактически новой парадигмы - понятие "фоновой практики" - привычных социально обусловленных действий, совершаемых автоматически. Вот примерно с этого момента, где-то 2002-й, юзабилити постепенно сдвигается от "креативного дизайна" к прикладной социологии; ключевым методом становится трансформация привычного - все через те же метафоры, только теперь это метафоры поведенческие. С примерно 2005 по 2010-й методы усложняются, появляется eyetracking (предшественником которого была известная еще в 70-е электроокулография), появляется метод "персон" - эдакое социологическое усреднение групп пользователей...

И все бы хорошо, да только примерно к 2008-му (WinXP SP3) стало очевидно, что интернет стал вполне привычной средой, где совершаются вполне привычные и уже изрядно стандартизированные действия. Юзабилити превратилась в систему стандартов де-факто, и в начале 2010-х плавно переместилась обратно, в эргономику.

Так вот, собственно, к чему я... в 1976-м в издательстве "Мир" была издана написанная в 1972-м книга Майкла Арбиба (Michael A. Arbib) "Метафорический мозг". Одна из ключевых тем исследования - о "переоценке роли языка" в понимании природы человеческих действий.

Ниже - небольшой, но очень важный фрагмент этой работы.

* * *

"I.

(...) По сути дела, наше понимание функций организма основано на представлении, согласно которому восприятие всегда нацелено на действие. При этом предполагается, что система, которая собирается взаимодействовать с переменчивой окружающей средой новым и адаптивным образом, должна построить и постоянно корректировать свою внутреннюю модель взаимодействий с миром; поэтому восприятие в значительной мере зависит от этой модели и направлено на ее совершенствование — а тем самым и на совершенствование будущих действий — в той же степени, в какой оно определяет текущее действие.

Изучая последствия такой направленности восприятия на действие и на построение моделей, мы выяснили, что среди всех соотношений между организмом и окружающим миром особую роль должны играть пространственные отношения. Мы обнаружили также, что восприятие именно в силу того, что оно открывает системе различные возможности действия, одновременно и создает для него дополнительные трудности, связанные с необходимостью устранения избыточности потенциальных команд, или, иначе говоря, с необходимостью выбрать не более одного из целого множества доступных организму действий.

II.

Мы выделили несколько аспектов, по которым мозг существенно отличается от машин, созданных человеком. Один из таких аспектов связан с элементной базой: мы спрашиваем, что следует из того, что мозг представляет собой сеть нейронов.

Мы добавляем к этому, что мозг — это живая система и вместе с остальными частями организма развился из одного яйца. Многие свойства мозга легче понять, исходя из требований биологического развития, а не из функции взрослой особи. Другое отличие имеет исторический характер: мы не можем не делать различия между мозгом человека, возникшего из мозга других животных в процессе эволюции, одним из последних достижений которой было развитие речи, и управляющими устройствами робота, который даже в простейшем случае умеет в полном смысле слова манипулировать символьной информацией.

Слишком часто вследствие переоценки роли языка мы считаем, что любое наше взаимодействие с внешним миром требует языкового опосредования приблизительно следующего вида:

  1. увидев объект, назови его,
  2. по названию объекта назови подходящее действие,
  3. действуй согласно этому названию.

Эта простейшая схема усложняется, однако, учетом таких соображений, как необходимость взвешивания альтернатив. Но так или иначе такой подход приводит к структурам типа показанной на рис. 102,А. Многие специалисты по искусственному интеллекту идут именно по такому пути, изыскивая алгоритмы, рассчитанные на обычные «последовательные» ЭВМ и основанные на преобразованиях цепочек символов, а не пытаются понять механизмы мозга, лежащие в основе человеческого разума.

Центральная (и, как мне кажется, ошибочная) идея, заложенная в схеме 102,А, состоит в том, что все входные сигналы можно свести к различным сочетаниям нескольких удачно выбранных слов, которые можно преобразовывать с помощью некоторого централизованного руководящего органа в команды, управляющие нашими мышцами. И хотя, добавив к этому несколько подходящих контуров обратной связи, можно получить модели, позволяющие анализировать многие аспекты человеческого поведения, нам хотелось бы подчеркнуть, что существуют весьма совершенные стратегии обеспечения сенсомоторных отношений, не требующие такого суперрегулятора; поэтому может оказаться весьма полезным рассматривать вербальное опосредование лишь как еще один уровень иерархической структуры (рис. 102,Б). Здесь вербальное опосредование может непосредственно управлять выходом системы, но во многих аспектах разумного поведения, не носящих явно языкового характера, без него можно вполне обойтись. Это достигается либо путем передачи управления низшим центрам, либо путем перестройки лежащих в основе такого поведения сенсомоторных механизмов, которые, вообще говоря, при вычислении действий не пользуются в явном виде вербальными кодами.

В этой книге мы обычно игнорируем «лингвистический уровень» и вместо этого опираемся на мысль, что «смысл» входа для организма определяется теми взаимодействиями, в которые он может вступать с объектом, представляемым этим входом, а эти действия зависят не только от того, что это за объект, но и от того, где он находится.

Система, представленная на рис. 102,Б, анархична в том смысле, что в ней нет головы или центра, который единовластно руководил бы ее вычислениями. Это распределенная вычислительная машина с высокой степенью распараллеливания действий. В связи с этим необходимо понять, как можно производить вычисления в сложной сети динамически взаимодействующих подсистем с высокой степенью распараллеливания".

Источник: М.Арбиб. Метафорический мозг. М.:Мир, 1976, с. 231-233.

P.S. 2-е издание книги можно скачать отсюда.

CC-BY А.Крамер, 2012