Нечисловые признаки

Курс „Элементы теории вероятностей и математической статистики”

Качественные, или нечисловые, признаки не выражаются в числах. Таковы, к примеру, цвет глаз, марка автомобиля, оценка красоты, пол, уровень знаний и т. п.

Некоторые из качественных признаков таковы, что их значения нельзя разумным способом упорядочить. Например, цвет глаз, которые могут быть голубыми, карими, зелеными и т. д., или марка автомобиля. Такие признаки называются номинальными[понятие: Номинальный признак (nominaalne tunnus) – нечисловой признак, значения которого нельзя упорядочить. Например, национальность.].

Другие качественные признаки позволяют упорядочить множество их значений и называются упорядоченными признаками[понятие: Упорядоченный признак (järjestatud tunnus) – качественный признак, значения которого можно упорядочить. Например, школьные оценки „отлично“, „хорошо“, „удовлетворительно“, „неудовлетворительно“ или же частота наблюдения чего-либо: „часто“, „редко“, „никогда“.]. Например, при оценке красоты чего-либо возможные ответы очень красиво, красиво, трудно сказать, некрасиво, безобразно можно упорядочить в только что приведенном или в противоположном порядке. Для обработки упорядоченных данных эти данные нужно по соглашению представить некоторыми числами, например, 2, 1, 0, –1, –2, либо 5, 4, 3, 2, 1 и т. п. Приписывание некоторых числовых значений (5, 4 и т. д.) первоначальным значениям (очень красиво, красиво и т. д.) признака называется кодированием[понятие: Кодирование (kodeerimine) – преобразование множества значений признака, при котором каждому первоначальному значению приписывается некоторое новое значение, или код. Кодированием пользуются, в первую очередь, при анализе качественных признаков. Например, значения признака "как часто", т. е. "часто", "редко", "никогда" можно закодировать числами 2, 1 и 0.], а новые значения – кодами[понятие: Коды (koodid) – числа, приписываемые значениям признака при кодировании.].

Такой признак, как оценка знаний является, по существу, упорядоченным, так как в школе его значениям отлично, хорошо, удовлетворительно, неудовлетворительно приписываются, например, коды 5, 4, 3, 2, а в высшем образовании применяется даже более развернутая система: А (5), В (4), С (3), D (2), E (1) и F (0).

В случае числового признака можно найти все рассмотренные выше величины: xmin, xmax\overline{x}, Me, Mo, σ2, σ.

Следующая таблица показывает, какие характеристики имеют смысл в случае качественных признаков. Знаком + отмечены величины, которые всегда могут быть вычислены и использованы при анализе статистических данных, знаком (+) – величины, которыми можно пользоваться только в отдельных случаях, а знаком – отмечены величины, которые не имеют смысла и которыми наверняка нельзя пользоваться при анализе данных. Неотмеченные величины можно при желании найти.

В случае упорядоченного признака уровень знаний (или оценка) естественно вычислить среднюю оценку (с помощью числовых кодов) и оценить рассеяние оценок.

Хотя значения номинального признака можно закодировать (например, личный код), этими кодами нельзя пользоваться таким же образом, как и значениями числового признака.

Упражнения

Источник: Департамент статистики