Пример использования визуального анализа данных. Лица Чернова: многофакторный анализ простым наглядным способом

Chernoff faces ) - отображение многомерных данных в виде человеческого лица , его отдельных частей. Люди легко распознают лица и без затруднения воспринимают небольшие изменения в нём.

Для каждого наблюдения рисуется отдельное «лицо», где относительные значения выбранных переменных представлены как формы и размеры отдельных черт лица (например, длина носа, угол между бровями, ширина лица). Таким образом, наблюдатель может идентифицировать уникальные для каждой конфигурации значений наглядные характеристики объектов.

Параметры лица

Может использоваться, например, 18 параметров: размер глаза, размер зрачка, позиция зрачка, наклон глаза, горизонтальная позиция глаза, вертикальная позиция глаза, изгиб брови, плотность брови, горизонтальная позиция брови, вертикальная позиция брови, верхняя граница волос, нижняя граница волос, обвод лица, темнота волос, наклон штриховки волос, нос, размер рта, изгиб рта.

В 1981 году Бернард Флури и Ганс Ридвил (Bernhard Flury and Hans Riedwyl) улучшили концепцию и добавили лицам Чернова асимметрию , что позволило увеличить вдвое количество переменных (до 36).

Применение лиц Чернова

Лица Чернова нашли широкое применение для анализа ситуации в самых разных областях. Этот метод позволяет быстро оценивать состояние многофакторных систем (10-30-мерные множества), используя врожденную способность человека быстро оценивать изменения в лице человека по многим параметрам: оценка методов лечения , массива статистических данных, оценки режима на атомных электростанциях, в

Лица Чернова (Chernoff Faces) - это схема визуального представления мультивариативных данных в виде человеческого лица. Каждая часть лица: нос, глаза, рот - представляет собой значение определенной переменной, назначенной для этой части (всего 18).

Основная идея в том, что для человека очень естесственно смотреть на лица, ведь все люди делают это каждый день. Поэтому анализ данных получается эдаким «натуралистичным». Легко делать сравнения и легко выявлять отклонения. Даже блондинки смогут производить мультивариативный анализ значительного количества данных.

В 1981 году Бернард Флури и Ганс Ридвил (Bernhard Flury and Hans Riedwyl) улучшили концепцию и добавили лицам Чернова асимметрию. Таким образом количество переменных увеличилось вдвое - до 36.

Итак, каждое лицо - это массив из 18 элементов, каждый из которых принимает значение от 0 до 1. Значению соответствует внешний вид соответствующей части лица. Параметры исследуемых объектов приводятся к этим значениям. Экстремумы реальных данных будут приняты как 0 и 1. Все остальное - лежащим в этом промежутке. По полученному массиву конструируется лицо.

Или под катом


Вот какие параметры задаются у лица:

1. Размер глаза
2. Размер зрачка
3. Позиция зрачка
4. Наклон глаза
5. Горизонтальная позиция глаза
6. Вертикальная позиция глаза
7. Изгиб брови
8. Плотность брови
9. Горизонтальная позиция брови
10. Вертикальная позиция брови
11. Верхняя граница волос
12. Нижняя граница волос
13. Обвод лица
14. Темнота волос
15. Наклон штриховки волос
16. Нос
17. Размер рта
18. Изгиб рта

Сложность заключается в правильном сопоставлении исследуемых переменных с частями лица. При ошибке важные закономерности могут остаться незамеченными.

Флури приводит пример удачного анализа с помощью лиц. Он проанализировал 100 реальных и 100 поддельных банкнот по параметрам размера границ, отступов и диагоналей. Вот что получилось:

Поддельные банкноты четко выделились в отдельную группу. Таким образом анализ позволил выявить различающиеся группы объектов.

Асимметрия позволяет рассматривать объекты в прогрессе. Второй пример показывает различные параметры у пациентов, к которым применялось лечение. Левая сторона лица показывает значения параметров до, а правая - после лечения.

Посмотрите как изменилось состояние параметров. Легко можно понять кому и насколько стало лучше, даже не вникая в сущность исследуемых параметров.

Статью Graphical Representation of Multivariate Data by Means of Asymmetrical Faces (by Bernard Flury and Hans Riedwyl) можно почитать на JSTOR

Если у вас нет доступа, я могу вам ее прислать в обмен на интересую ссылку, о которой я еще не знаю.

Легко распознают лица и без затруднения воспринимают небольшие изменения в нём. Американский математик Герман Чернов в 1973 году опубликовал работу, в которой изложил концепцию использования этой способности восприятия лица человека для построения пиктографиков. Их применяют, как правило, в двух случаях: 1) когда нужно выявить характерные зависимости или группы наблюдений и 2) когда необходимо исследовать предположительно сложные взаимосвязи между несколькими переменными. Лица Чернова являются одним из самых эффективных способов визуализации многомерных данных, и позволяет легко оценивать одновременно большое их количество.

«Из всех зрительных навыков у человека сильнее всего развита способность к восприятию лиц других людей. Особый участок коры головного мозга узнает лицо, определяет направление взгляда и т. д. Другие части мозга (миндалевидное тело и островковая доля) анализируют выражение лица, а участок в префронтальной зоне лобной доли и система мозга, отвечающая за чувство удовольствия, оценивают его красоту».

Для каждого наблюдения рисуется отдельное «лицо», где относительные значения выбранных переменных представлены как формы и размеры отдельных черт лица (например, длина носа, угол между бровями, ширина лица). Таким образом, наблюдатель может идентифицировать уникальные для каждой конфигурации значений наглядные характеристики объектов.

Параметры лица

Может использоваться, например, 18 параметров: размер глаза, размер зрачка, позиция зрачка, наклон глаза, горизонтальная позиция глаза, вертикальная позиция глаза, изгиб брови, плотность брови, горизонтальная позиция брови, вертикальная позиция брови, верхняя граница волос, нижняя граница волос, обвод лица, темнота волос, наклон штриховки волос, нос, размер рта, изгиб рта.

Ссылки

  • Herman Chernoff (1973). «The Use of Faces to Represent Points in K-Dimensional Space Graphically». Journal of the American Statistical Association 68 (342): 361-368
  • Соболева А. Г. Когнитивная визуализация знаний с помощью Лиц Чернова

Wikimedia Foundation . 2010 .

  • Лица (фильм)
  • Лица в толпе

Смотреть что такое "Лица Чернова" в других словарях:

    Чернова - весьма известная в свое время драматическая актриса Симферопольского театра, умерла в Симферополе 16 го марта 1877 года, на двадцатом году жизни. Не получив никакого сценического образования и не имея перед собой примеров, достойных подражания,… … Большая биографическая энциклопедия

    Чернов, Герман - В Википедии есть статьи о других людях с такой фамилией, см. Чернов. Герман Чернов Дата рождения: 1 июля 1923(1923 07 01) (89 лет) Место рождения: Нью Йорк Научная сфера: Прикладная математика, п … Википедия

    Физиогномика - Это статья о неакадемическом направлении исследований. Пожалуйста, отредактируйте статью так, чтобы это было ясно как из её первых предложений, так и из последующего текста. Подробности в статье и на странице обсуждения … Википедия

Лица Чернова (Chernoff Faces) - это схема визуального представления многофакторных данных в виде человеческого лица. Каждая часть лица: нос, глаза, рот - представляет собой значение определенной переменной, назначенной для этой части (всего 18).

Основная идея в том, что для человека очень естесственно смотреть на лица, ведь все люди делают это каждый день. Поэтому анализ данных получается эдаким "натуралистичным". Легко делать сравнения и легко выявлять отклонения. Даже блондинки смогут производить многофакторный анализ значительного количества данных.

В 1981 году Бернард Флури и Ганс Ридвил (Bernhard Flury and Hans Riedwyl) улучшили концепцию и добавили лицам Чернова асимметрию. Таким образом количество переменных увеличилось вдвое - до 36.

Итак, каждое лицо - это массив из 18 элементов, каждый из которых принимает значение от 0 до 1. Значению соответствует внешний вид соответствующей части лица. Параметры исследуемых объектов приводятся к этим значениям. Экстремумы реальных данных будут приняты как 0 и 1. Все остальное - лежащим в этом промежутке. По полученному массиву конструируется лицо.

Вот какие параметры задаются у лица:

  1. Размер глаза
  2. Размер зрачка
  3. Позиция зрачка
  4. Наклон глаза
  5. Горизонтальная позиция глаза
  6. Вертикальная позиция глаза
  7. Изгиб брови
  8. Плотность брови
  9. Горизонтальная позиция брови
  10. Вертикальная позиция брови
  11. Верхняя граница волос
  12. Нижняя граница волос
  13. Обвод лица
  14. Темнота волос
  15. Наклон штриховки волос
  16. Размер рта
  17. Изгиб рта

Сложность заключается в правильном сопоставлении исследуемых переменных с частями лица. При ошибке важные закономерности могут остаться незамеченными.

Флури приводит пример удачного многофакторного анализа с помощью лиц. Он проанализировал 100 реальных и 100 поддельных банкнот по параметрам размера границ, отступов и диагоналей. Вот что получилось:

Поддельные банкноты четко выделились в отдельную группу. Таким образом анализ позволил выявить различающиеся группы объектов.

Асимметрия позволяет рассматривать объекты в прогрессе. Второй пример показывает различные факторы у пациентов, к которым применялось лечение. Левая сторона лица показывает значения параметров до, а правая - после лечения.

Посмотрите как изменилось состояние параметров. Легко можно понять кому и насколько стало лучше, даже не вникая в сущность исследуемых параметров.

Статью Graphical Representation of Multivariate Data by Means of Asymmetrical Faces (by Bernard Flury and Hans Riedwyl) можно почитать на JSTOR

Если у вас ее нет, я могу вам ее прислать в обмен на интересую ссылку, о которой я еще не знаю.

лицах Чернова " состоит в кодировании значений различных переменных в характеристиках или чертах человеческого лица . Пример такого "лица" приведен на рис.16.2 .


Рис. 16.2. "Лицо Чернова"

Для каждого наблюдения рисуется отдельное "лицо". На каждом "лице" относительные значения переменных представлены как формы и размеры отдельных черт лица (например, длина и ширина носа, размер глаз, размер зрачка, угол между бровями).

Анализ информации при помощи такого способа отображения основан на способности человека интуитивно находить сходства и различия в чертах лица.

На рис. 16.3 представлен набор данных, каждая запись которого выражена в виде " лица Чернова ".


Рис. 16.3. Пример многомерного изображения данных при помощи "лиц Чернова"

Перед использованием методов визуализации необходимо:

  • Проанализировать, следует ли изображать все данные или же какую-то их часть.
  • Выбрать размеры, пропорции и масштаб изображения.
  • Выбрать метод, который может наиболее ярко отобразить закономерности, присущие набору данных.

Многие современные средства анализа данных позволяют строить сотни типов различных графиков и диаграмм. Поэтому выбор метода визуализации, если он самостоятельно осуществляется пользователем, не так прост и легок, как может показаться на первый взгляд. Наличие большого количества средств визуализации, представленных в инструменте, который применяет пользователь , может даже вызвать растерянность.

Одну и ту же информацию можно представить при помощи различных средств. Для того чтобы средство визуализации могло выполнять свое основное назначение - представлять информацию в простом и доступном для человеческого восприятия виде - необходимо придерживаться законов соответствия выбранного решения содержанию отображаемой информации и ее функциональному назначению. Иными словами, нужно сделать так, чтобы при взгляде на визуальное представление информации можно было сразу выявить закономерности в исходных данных и принимать на их основе решения.

Среди двухмерных и трехмерных средств наиболее широко известны линейные графики, линейные, столбиковые, круговые секторные и векторные диаграммы.

При помощи линейного графика можно отобразить тенденцию, передать изменения какого-либо признака во времени. Для сравнения нескольких рядов чисел такие графики наносятся на одни и те же оси координат.

Гистограмму применяют для сравнения значений в течение некоторого периода или же соотношения величин.

Круговые диаграммы используют, если необходимо отобразить соотношение частей и целого, т.е. для анализа состава или структуры явлений. Составные части целого изображаются секторами окружности. Секторы рекомендуют размещать по их величине: вверху - самый крупный, остальные - по движению часовой стрелки в порядке уменьшения их величины. Круговые диаграммы также применяют для отображения результатов факторного анализа, если действия всех факторов являются однонаправленными. При этом каждый фактор отображается в виде одного из секторов круга.

Выбор того или иного средства визуализации зависит от поставленной задачи (например, нужно определить структуру данных или же динамику процесса) и от характера набора данных.



Понравилась статья? Поделиться с друзьями: