Шкалы измерения в статистике примеры. Измерительные шкалы. Примеры количественных непрерывных данных

При статистическом исследованиисоциально-экономических процессов мы встречаемся с двумя типами данных: пространственные данные (cross-sectional data ) и временные ряды (time-series data ).

Примером пространственных данных является, например, набор сведений (объем производства, количество работников, доход и др.) по разным фирмам в один и тот же момент времени (пространственный срез). Пространственные данные часто используются для построения моделей классификации, регрессионных моделей.

Примерами временных данных могут служить ежеквартальные данные по инфляции, средней заработной плате, национальному доходу за последние годы, ежедневный курс доллара США на ММВБ и т.п. Отличительной чертой временных данных является то, что они естественным образом упорядочены во времени. Часто наблюдения в близкие моменты времени бывают зависимыми.

Наиболее информативными видами представления данных являются временные ряды , многоугольники и гистограммы распределения (частотные и кумулятивные ), диаграммы (подробный анализ видов представления данных будет представлен в выпуске 2 данного тома).

Вид представления данных определяется типом шкалы измерения. Различают четыре основные вида данных, отличающихся по тому, как наблюдаемый объект измеряется или описывается (табл. 2.1).

Таблица 2.1

Основные виды данных

Номинальная шкала (шкала наименований, классификационная шкала) является наиболее «слабой» качественной шкалой, по которой объектам дается некоторый признак. Этот тип шкал соответствует простейшему виду измерения, при котором шкальные значения используются лишь как имена объектов. Единственная цель таких измерений - выявление различий между объектами разных классов. Однако не следует пренебрегать значением этих имен; так, одной из задач кластерного анализа является назначение удачных названий выявленных групп близких по совокупности свойств объектов.

Шкала называется ранговой (шкала порядка), если множеству измеряемых объектов можно присвоить монотонно возрастающие шкальные значения. Тем самым допускается не только номинальное различение объектов, но и их упорядочение по измеряемым свойствам. Таковы балльные, рейтинговые оценки.

Измерение в шкале порядка может применяться в различных ситуациях:

Необходимо упорядочить объекты во времени или пространстве, когда интересуются не сравнением степени выраженности какого-либо свойства объектов, а лишь их взаимным пространственным или временным расположением;

Необходимо упорядочить объекты по степени выраженности какого-либо их свойства, при этом не требуется производить его точное измерение;

Какое-либо свойство в принципе измеримо, но измерение невозможно по причинам практического или теоретического характера.

Шкалы интервалов являются одним из наиболее важных типов шкал. Их отличительная особенность - возможность положительного линейного преобразования, когда меняется масштаб и начало отсчета, но сохраняется направленность измеряемого свойства. Классическим примером служат температурные шкалы Цельсия t °C и Фаренгейта t °F, связанные линейным преобразованием шкальных значений

t °F = 1,8 t °C + 32. (2.1)

Шкалы интервалов сохраняют не только различие и упорядочение объектов, но и отношение «расстояний» между парами. Однако отношение самих шкальных значений при этом не сохраняется. Например, в случае температурных шкал Цельсия и Фаренгейта нельзя сказать, что вода, нагретая до 80 °C вдвое горячее, чем вода при 40 °C, поскольку в шкале Фаренгейта соотношение температур воды будет уже другим: 176 °F и 104°F соответственно. В то же время отношение разностей этих температур в обеих шкалах сохраняется. Так, если отсчитывать разность температур двух упомянутых объектов в обеих шкалах относительно третьего объекта, охлажденного до 0 °C (32 °F), то отношение разностей в обеих температурных шкалах составляет одну и ту же величину 2:

(80 °C - 0 °C)/(40 °C - 0 °C) = (176 °F - 32 °F)/(104 °F - 32 °F) = 2.

Частным случаем шкал интервалов являются шкалы отношений, когда нулевая точка означает отсутствие измеряемого свойства. Шкалы отношений сохраняют не только отношения свойств объектов, но и отношения «расстояний» между парами объектов. Примерами измерений в шкалах отношений являются стоимостные измерения.

Иногда рассматривают также шкалы разностей и абсолютные шкалы . Первые являются частным случаем шкал интервалов; примерами служат измерения прироста продукции в абсолютных единицах, увеличение численности учреждений и т.п. Абсолютные шкалы характеризуются единственностью измерения и применяются, например, для измерения количества объектов.

Шкалы измерения следует учитывать при вычислении средних величин. В общей теории статистики различают структурные и степенные средние . К первым относятся мода и медиана , ко вторым - арифметическая , геометрическая , квадратическая и гармоническая средние.

Наименее информативная номинальная шкала допускает лишь один вид средних - моду. При переходе к более информативной порядковой шкале в моде добавляется медиана как мера центральной тенденции . Эти средние являются частными случаями средних по Коши - функции, ставящей в соответствие совокупности измерений (х 1 , х 2 , …, х n ) любое число, заключенное между наибольшим и наименьшим членом вариационного ряда.

Обобщением понятия степенных средних является средние по Колмогорову F y n , задаваемые строго монотонными функциями y:

F y n (х 1 , х 2 , …, х n ) = y -1 (1/n )S y (х i ), (2.2)

где y -1 - функция, обратная y; х i - значение i -го измерения показателя Х ; n - объем выборки. При y(х ) = х ; ln х ; х –1 ; х 2 формула (2.2) определяет соответственно среднее арифметическое, среднее геометрическое, среднее гармоническое и среднее квадратическое.

В шкале интервалов и разностей центральную тенденцию адекватно отражает среднее арифметическое, в шкале отношений - среднее геометрическое, однако среднее геометрическое не рекомендуется применять при обработке данных, измеренных в шкале интервалов и разностей. В абсолютной шкале можно пользоваться любым средним, т.е. с усложнением типа шкалы измерения число средних, адекватных в этой шкале, увеличивается.


В эмпирическом исследовании могут встречаться, к примеру, следующие переменные (указано их наиболее вероятное кодирование):

Pol: 1 = мужской

2 = женский

Семейное положение: 1 = холост/не замужем

2 = женат/замужем

3 = вдовец/вдова

4 = разведен(а)

Курение 1 = некурящий

2 = изредка курящий

3 = интенсивно курящий

4 = очень интенсивно курящий.

Вес. И т.д.

Рассмотрим сначала графу Пол. Мы видим, что назначение соответствия цифр 1 и 2 обоим полам абсолютно произвольно, их можно было поменять местами или обозначить другими цифрами.

Мы, конечно, не имеем в виду, что женщины стоят на ступеньку ниже мужчин, или мужчины значат меньше, чем женщины. Следовательно, отдельным числам не соответствует никакою эмпирического значения. В этом случае говорят о переменных, относящихся к номинальной шкале . В нашем примере рассматривается переменная с номинальной шкалой, имеющая две категории. Такая переменная имеет еще одно название- дихотомическая.

Такая же ситуация и с переменной Семейное положение. Здесь также соответствие между числами и категориями семейного положения не имеет никакого эмпирического значения. Но в отличии от Пола, эта переменная не является дихотомической - у нее четыре категории вместо двух.

Возможности обработки переменных, относящихся к номинальной шкале очень ограничены. Собственно говоря, можно провести только частотный анализ таких переменных. К примеру, расчет среднего значения для переменной Семейное положение, совершенно бессмысленен. Переменные, относящиеся к номинальной шкале часто используются для группировки, с помощью которых совокупная выборка разбивается по категориям этих переменных. В частичных выборках проводятся одинаковые статистические тесты, результаты которых затем сравниваются друг с другом.

В качестве следующего примера рассмотрим переменную Курение. Здесь кодовым цифрам присваивается эмпирическое значение в том порядке, в котором они расположены в списке. Переменная Курение, в итоге, сортирована в порядке значимости снизу вверх: умеренный курильщик курит больше, нежели некурящий, а сильно курящий - больше, чем умеренный курильщик и т.д. Такие переменные, для которых используются численные значения, соответствующие постепенному изменению эмпирической значимости, относятся к порядковой шкале .

Однако эмпирическая значимость этих переменных не зависит от разницы между соседними численными значениями. Так, несмотря на то, что разница между значениями кодовых чисел для некурящего и изредка курящего и изредка курящего и интенсивно курящего в обоих случаях равна единице, нельзя утверждать, что фактическое различие между некурящим и изредка курящим и между изредка курящим и интенсивно курящим одинаково. Для этого данные понятия слишком расплывчаты.

Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы. В некоторых случаях возможно вычисление среднего значения. Если должна быть установлена связь (корреляция) с другими переменными такого рода, для этой цели можно использовать коэффициент ранговой корреляции.

Для сравнения различных выборок переменных, относящихся к порядковой шкале, могут применяться непараметрические тесты, формулы которых оперируют рангами.

Рассмотрим теперь переменную Рост. Его абсолютные значения отображают порядковое отношение между респондентами, но и разница между двумя значениями также имеет эмпирическую значимость. Например, если у Ивана рост равен 180, а у Федора - 170, а у Петра - 160, можно сказать, что Иван в сравнении с Федором выше, и еще выше Петра. Такие переменные, у которых есть разность (интервал) между двумя значениями и она имеет эмпирическую значимость, относятся к интервальной шкале . Они могут обрабатываться любыми статистическим методами без ограничений. Так, к примеру, среднее значение является полноценным статистическим показателем для характеристики таких переменных. К таким переменным относятся Вес, Размер и т.д.

Очень часто переменныеинтервальной шкалы , к которой относятся данные, могут называться шкалой отношений . Поэтому в настройках Define Variable (определение переменных) обе эти шкалы определяютсяя как Scale (Метрическая).

Теперь необходимо обосновать и определить тип шкал для наших переменных:Vozrast (Возраст); Ves (Вес); Rost (Рост); Noga (Размер буви); Pol (Пол); Volos (Цвет волос); Glaz (Цвет глаз).

Vozrast (Возраст),Ves (Вес), Rost (Рост) - интервальная шкала .

Pol (Пол), Volos (Цвет волос); Glaz (Цвет глаз).- номинальная шкала.

После выяснения этого важнейшего вопроса необходимо ввести тип шкалы в таблицу для наших переменных. Делается все очень просто: двойной клик по наименованию переменной и появляется окно Define Variable (определение переменных). В этом окне выбираем рамку Measurement (измерение) и устанавливаем кнопку в одно из трех состояний для каждой переменной.

Переменные: Vozrast (Возраст),Ves (Вес), Rost (Рост) будут иметь значение Scale.

Переменные: Pol (Пол), Volos (Цвет волос); Glaz (Цвет глаз) будут иметь значение Nominal.

Переменных относящихся к шкале Ordinal (порядковая) у нас не будет.

Со шкалой переменных мы разобрались. Теперь продолжим дальше определение переменных.

Type (тип переменных), чтобы задать тип переменной, щелкните по кнопке Туре . Откроется диалоговое окно Define Variable Type (Определение типа переменной). Примите предлагаемую настройку Numeric (Численный) и установите длину "2" для переменной Vozrast и количество десятичных разрядов "0", так как в этой переменной будут храниться только значения возраста. Подтвердите настройку кнопкой ОК и перейдите к следующему полю переменной Ves. Учитывая цифровую кодировку значений переменных, наши переменные все будут Numeric.

Labels ..(Метка переменной) - это название, позволяющая описать переменную более подробно. После клика по кнопке Labels .. появляется диалоговое окно, и в него вы можете занести до 256 символов. В метках переменных различаются прописные и строчные буквы. Они отображаются в том виде, в каком были введены. Для переменной Vozrast введите в качестве метки «данные о возрасте студента (ки)».

В этой же опции введем Метки значений (Values). Метки значений - это название, позволяющее более подробно описать возможные значения переменной. Так, например, в случае переменной Pol можно задать метку "женский" для значения "1" и метку "мужской" для значения "2". Подтвердите настройку по умолчанию. Впрочем, ввод данных также можно подтвердить клавишей .

Missing values (Пропущенные значения). В SPSS допускаются два вида пропущенных значений:

Пропущенные значения, определяемые системой (System-defined missing values): Если в матрице данных есть незаполненные численные ячейки, система SPSS самостоятельно идентифицирует их как пропущенные значения. Этот факт отображается в матрице данных с помощью запятой (,).

Пропущенные значения, задаваемые пользователем (User-defined missing values): Если в определенных случаях у переменных отсутствуют значения, например, если на вопрос не был дан ответ, ответ неизвестен, или существуют другие причины, пользователь может с помощью кнопки Missing объявить эти значения как пропущенные. Пропущенные значения можно исключить из последующих вычислений. В нашем примере пропущенным значением, определяемым пользователем мы объявим вариант ответа "0" (нет данных) для переменной Pol.

Column Format (формат столбцов). Поле Columns определяет ширину, которую будет иметь в таблице данный столбец при отображении значений. Ширину столбца также можно изменить непосредственно в окне редактора данных. Для этого поместите указатель мыши на разделитель между двумя заголовками столбцов с именами переменных. Вид указателя изменится. Появившаяся двойная стрелка указывает, что соответствующий столбец можно расширить или сузить путем перетаскивания.

Таким образом, определив все параметры переменных вы можете приступать к вводу собранных данных по своей группе.

  • Туровец О.Г. Маркетинговые исследования рынка: практикум (Документ)
  • Беляев В.И. Маркетинг: основы теории и практики (Документ)
  • Зубец А.Н. Маркетинговые исследования страхового рынка (Документ)
  • Методическое пособие - SPSS: компьютерная обработка данных (Документ)
  • Беляевский И.К. Маркетинговые исследования (Документ)
  • Алексеев А.А. Маркетинговые исследования на рынке услуг (Документ)
  • n1.doc

    2.3. ТИПЫ ШКАЛ ИЗМЕРЕНИЯ ПЕРЕМЕННЫХ

    Для работы с данными в SPSS важно знать, по шкале какого типа измеряются исследуемые переменные. Это необходимо для выбора метода анализа данных и определения возможности расчета статистических показателей (табл. 2.3).

    Существует четыре типа шкал измерения переменных:

    Номинальная шкала.

    Порядковая шкала.

    Интервальная шкала.

    Примеры переменных, измеряемых по шкалам разных типов

    Относительная шкала.

    Таблица 2.3


    Шкала

    Переменная

    Значения переменной

    Номинальная

    Пол

    (дихотомическая переменная)


    • «1» = мужской

    • «2» = женский

    Производитель продукта

    «X»


    • «1» = производитель А

    • «2» производитель В

    • «3» производитель С

    Порядковая

    Класс полета

    • «1» = первый класс

    • «2» = бизнес-класс

    • «3» =эконом-класс

    Категории потребителей по уровню дохода

    • «1» = до 1000 евро

    • «2» = от 1001 до 3000 евро

    • «3» = свыше 3000 евро

    Интервальная

    Коэффициент интеллекта

    (IQ)


    ...«120»...

    Относительная

    Уровень дохода

    ... «2100» евро...


    Номинальная шкала характеризуется самым низким уровнем измерения переменных. Все значения переменной, измеряемой по номинальной шкале, находятся на одном уровне. По этой шкале измеряются, как правило, качественные характеристики объекта исследования. Между значениями переменной, измеряемой по номинальной шкале, не существует логического порядка. Например, в качестве ответа на вопрос анкеты: «Какого производителя продукта «X» вы предпочитаете?» - может быть предложено несколько вариантов: «Производитель А», «Производитель В», «Производитель С» и т.д. В этом случае, с точки зрения исследователей, все предложенные производители являются рав нозначными. Числовые коды («1», «2», «3»...) могут присваиваться значениям метки переменной в любом порядке.

    Переменные, измеряемые по номинальной шкале и имеющие всего два значения (например, «мужчины» и «женщины»), называются дихотомическими.

    Порядковая шкала является второй по уровню измерения переменных. Значения переменной, измеряемой по порядковой шкале, не являются равнозначными, они находятся на равных уровнях по отношению друг к другу и подчиняются логическому числовому порядку.

    Порядковая шкала характеризуется низким уровнем измерения переменных, поскольку является шкалой с неравными интервальными отрезками. Совершенно четко можно утверждать, что уровень обслуживания авиапассажиров первого класса выше, чем бизнес-класса, но насколько именно, неизвестно. Также разница в обслуживании между первым и бизнес-клас- сом, между бизнес- и эконом-классом может быть различной (см. табл. 2.3).

    Низкий уровень измерения переменных по порядковой шкале можно проиллюстрировать на примере переменной «Категории потребителей по уровню дохода». Потребители примерно с одинаковым уровнем дохода (например, 950 и 1050 евро) оказываются в разных категориях, а потребители с существенной разницей по уровню дохода (например, 1050 и 2950 евро) оказываются в одной категории.

    Интервальная шкала является третьей по уровню измерения переменных. В отличие от порядковой шкалы она является шкалой с равными интервальными отрезками. Это позволяет осуществлять количественное сравнение значений переменной, т.е. можно определить, насколько одно значение больше или меньше (лучше или хуже, длиннее или короче и т.д.) другого.

    Характерной чертой интервальной шкалы является отсутствие «естественного нуля», т.е. исходная точка измерения является относительной. Примерами интервальной шкалы являются шкала Цельсия и календарь. По шкале Цельсия за «0» принята температура замерзания воды, однако за «0» можно было принять любую другую температуру. Существуют также различные календари с одинаковым количеством дней в году, но разным временем начала года.

    В маркетинговых исследованиях очень часто используется рейтинговая шкала, когда респондентам предлагается оценить по балльной шкале (например, от 1 до 7 баллов) утверждение, продукт, бренд и т.п. Строго говоря, рейтинговая шкала является порядковой, поскольку балльные оценки субъективны. Одинаковые балльные оценки в действительности отображают разный уровень измеряемой переменной. Например, студенты, получившие одинаковые оценки на экзамене, в действительности могут иметь разный уровень знаний.

    Очень часто при проведении исследований шкала бапльных оценок рассматривается как интервальная. В основе этого лежит предположение, что интервальные отрезки шкалы балльных оценок одинаковы. Это дает возможность рассчитать соеднее значение переменной (например, средний балл успеваемости студентов). Расчет средней величины (среднеарифметической) для показателя, измеряемого по порядковой шкале, невозможен. Например, не существует показателя «средний класс» полета (см. табл. 2.3).

    Относительная шкала характеризуется самым высоким уровнем измерения переменных. Ее основное отличие от интервальной шкалы заключается в существовании «естественного нуля», который можно интерпретировать как отсутствие значения переменной. Например, если заработная плата равна нулю, это значит, что ее не выплачивают.

    По относительной шкале измеряются количественные характеристики. Это могут быть как физические характеристики (объем, вес, скорость и пр.), так и экономические характеристики (доход, издержки, цена и пр.).

    Относительная шкала получила свое название благодаря возможности сравнения значений переменной по отношению друг к другу, что невозможно при использовании интервальной шкалы измерения. Например, нельзя сказать, что человек, у которого коэффициент интеллекта (iQ) равен 160, в два раза умнее человека у которого этот показатель составляет 80. Но можно сказать, что заработная плата 1000 евро в два раза больше заработной платы 2000 евро.

    При выборе типа шкалы измерения переменных в SPSS (столбец « Measure » во вкладке редактора данных «Variable View ») интервальная шкала и шкала отношений объединяются в один вид - метрическую шкалу ( Scale ).

    При построении в SPSS интерактивных графиков номинальная ( Nominal ) и порядковая ( Ordinal ) шкалы объединяются в «категориальный» тип (табл. 2.4).

    Таблица 2.4


    Шкала

    Характеристики

    Категориаль-ная

    Номинальная {Nominal)

    Служит для классификации качественных показателей. Все значения измеряемой переменной равнозначны

    Порядковая ( Ordinal )

    Служит для построения значений измеряемой переменной в определенной последовательности. Шкала с неравными интервальными отрезками

    Метрическая (Scale)

    Интервальная

    Шкала с равными интервальными отрезками и условной точкой отсчета

    Относительная

    Шкала с равными интервальными отрезками и безусловной точкой отсчета


    Чем выше уровень измерения переменной, тем богаче ее информационная содержательность и тем больше возможностей осуществления расчетов и определения статистических показателей.

    Числовые коды («1», «2», «3»...) значений метки переменной, измеряемой по номинальной или порядковой шкале, не могут рассматриваться как числа, они представляют собой лишь некие числовые символы. Поскольку они не являются числами, с ними нельзя производить никаких арифметических операций (сложение, вычитание, деление, умножение).

    Что касается статистических показателей, характеризующих распределение величины, измеряемой по номинальной шкале, можно провести частотный анализ (Frequencies ) и определить моду ( Mode ). Частоты показывают, например, сколько респондентов предпочитают того или иного производителя продукта «Л». Мода обозначает самую многочисленную группу респондентов, предпочитающих определенного производителя продукта «Л».

    Для переменных, измеряемых по порядковой шкале, кроме вышеуказанных статистических показателей можно определить медиану и средневзвешенное. Значения меток переменной, измеряемой по интервальной шкале, рассматриваются как числа. С ними можно производить такие арифметические операции, как сложение и вычитание.

    Что касается возможности расчета статистических показателей, характеризующих распределение переменной, измеряемой по интервальной шкале, кроме моды и медианы можно также определить стандартное отклонение ( Std . deviation ) и среднеарифметическое ( Mean ). (Средневзвешенное значение переменных с интервальной шкалой равно среднему арифметическому.)

    При расчете статистических показателей, характеризующих распределение переменной, измеряемой по интервальной шкале, не рассчитывается такой показатель, как сумма ( Sum ). Например, не рассчитывается «суммарный коэффициент интеллекта» для группы студентов, такого показателя не существует.

    Значения меток переменной, измеряемой по шкале отношений, выражаются в числах, с ними можно производить любые арифметические операции. Также можно определять любые статистические показатели, характеризующие распределение переменной.

    Возможна трансформация имеющихся данных, измеряемых по шкале более высокого уровня, в данные, измеряемые по шкале более низкого уровня, но не наоборот. Например, значения переменной «Уровень дохода», измеряемой по относительной шкале, можно трансформировать в значения переменной «Категории потребителей по уровню дохода», измеряемой по порядковой шкале (см. табл. 2.3). Подобная трансформация данных, производимая в целях упрощения процедуры анализа и наглядности представления результатов, неизбежно связана с частичной потерей информации и снижением точности расчетов.

    На практике, в том числе при применении SPSS , различие между переменными, измеряемыми по интервальной и относительной шкалам, обычно несущественно.

    Во многих учебниках по SPSS метрические переменные (Scale) определяются как интервальные.

    ип шкалы измерения переменных определяет возможность применения того или иного метода анализа данных. Все методы статистического анализа делятся на две группы:

    методы оценки связи между переменными;

    методы выявления структуры данных.

    Методы выявления структуры данных характеризуются тем, что исходные данные для проведения анализа не содержат информации (предположений) о существовании взаимосвязей между исследуемыми переменными. К таким методам относятся, например, кластерный и факторный анализ.

    Методы оценки связи между переменными устанавливают влияние одной или нескольких независимых переменных на одну или несколько зависимых переменных. С точки зрения теории статистики существуют правила применения того или иного метода оценки связи между переменными в зависимости от типа шкалы их измерения (табл. 2.5).


    Таблица 2.5

    Методы оценки связи между переменными и типы шкал измерения переменных

    (Backhaus, Erichson, Ptinke, Weiber, 2000.S. Ш )


    Независимые переменные

    Метрическая шкала

    Номинальная шкала

    Зависимые переменные

    Метрическая шкала

    Регрессионный анализ

    Дисперсионный анализ

    Номинальная шкала

    Дискриминантный анализ

    Таблицы сопряженности

    Применение некоторых основных методов статистического анализа в SPSS будет более подробно рассмотрено в следующих подразделах.

    КОНТРОЛЬНЫЕ ВОПРОСЫ

    Что представляют собой таблицы, содержащиеся во вкладках редактора данных SPSS «Свойства переменных» ( Variable View ) и «Значения переменных» ( Data View )?

    Каким образом осуществляется процедура занесения в исходный файл данных SPSS меток переменных?

    Чем отличаются пропущенные значения, определяемые системой ( system - defined truss , ig values ) от пропущенных значений, задаваемых пользователем программы { user - defined missing values )!

    Какие три типа шкал измерения переменных используются в SPSS и каким образом задается тип шкалы измерения переменной при формировании исходного файла данных?

    Чем отличаются дихотомическая и категориальная кодировка данных?

    Почему при занесении в исходный файл данных SPSS ответов ка многовариантные (безальтернативные) вопросы необходимо использовать дихотомическую кодировку данных?

    С какой целью и в каких случаях применяется двойная запись данных при создании исходного файла SPSS ?

    По шкале какого типа измеряются следующие переменные: а) частота приобретения товара « A »

    реже 1-го раза в неделю;

    1 - 3 раза в неделю;

    чаще 3-х раз в неделю;

    Б) семейное положение

    Замужем/женат;

    Не замужем/ холост;

    Разведена/разведен;

    В) оценка уровня сервисного обслуживания

    Очень высокая;

    Высокая;

    Средняя;

    Очень низкая;

    Г) возраст (23 года, 24 года, 32 года, 57 лет)?

    1. Как отличаются друг от друга переменные, измеряемые по разным типам шкал, относительно возможности произведения арифметических операций и расчета статистических показателей?

    Переменные различаются между собой тем, «насколько хорошо» они могут быть измерены или, другими словами, как много измеряемой информации обеспечивает шкала их измерений. Известно, что в каждом измерении присутствует некоторая ошибка, определяющая границы «количества информации», которое можно получить в данном измерении. Тип шкалы, в которой проведено измерение, является еще одним фактором, определяющим количество информации, содержащейся в переменной. Различают следующие типы шкал: номинальная, порядковая (ординальная), интервальная относительная (шкала отношения). Соответственно мы имеем четыре типа переменных.

    Шкала наименований (номинальная шкала) фактически не связана с понятием «величина» и используется только для качественной классификации с целью отличить один объект от другого: номер животного в группе или присвоенный ему уникальный шифр и т.п. Данные переменные могут быть измерены только как принадлежность к некоторым, существенно различным классам; при этом вы не сможете упорядочить эти классы. Например, индивидуумы принадлежат к разным национальностям. Типичные примеры номинальных переменных - пол, национальность, цвет, город и т.д. Часто номинальные переменные называют категориальными. Категориальные переменные часто представляют в виде частот наблюдений, попавших в определенные категории и классы. Если классов всего два, то переменная будет называться дихотомической. Например, при исследовании выборки было установлено, что к первой категории Пол женский отнесено 30 испытуемых с повышенным АД, а ко второй категории Пол мужской отнесено 25 испытуемых с повышенным АД. Возможности обработки переменных, относящихся к номинальной шкале, очень ограничены. Собственно говоря, можно провести только частотный анализ таких переменных. К примеру, расчет среднего значения для переменной Пол , совершенно бессмыслен.

    Порядковая шкала (шкала рангов) – шкала, относительно значений которой нельзя говорить ни о том, во сколько раз измеряемая величина больше (меньше) другой, ни на сколько она больше (меньше). Такая шкала только упорядочивает объекты, приписывая им те или иные баллы (результатом измерений является нестрогое упорядочение объектов). При этом указывается, какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. Однако они не позволяют сказать «на сколько больше» или «на сколько меньше». Порядковые переменные иногда также называют ординальными. Номера домов на улице измерены в порядковой шкале. Типичный пример порядковой переменной - социоэкономический статус семьи. Для размера одежды используют следующую порядковую шкалу: S, M, L, XL,XXL, XXXL, XXXXL. Шкала твердости минералов Мооса также является порядковой. Аналогично построены шкалы силы ветра Бофорта и землетрясений Рихтера. Шкалы порядка широко используются в педагогике, психологии, медицине и других науках, не столь точных, как, скажем, физика и химия. В частности, повсеместно распространенная шкала школьных отметок в баллах (пятибалльная, двенадцати балльная и т.д.) может быть отнесена к шкале порядка. В медико-биологических исследованиях шкалы порядка встречаются сплошь и рядом и подчас весьма искусно замаскированы. Например, для анализа свертывания крови используется тромботест: 0 – отсутствие свертывания в течение времени теста, 1 –«слабые нити», 2 – желеподобный сгусток, 3 – сгусток, легко деформируемый, 4 – плотный, упругий, 5 – плотный, занимающий весь объем и т.п. Понятно, что интервалы между этими плохо отличимыми и очень субъективными позициями произвольны. В этом случае сравнивать средние значения в двух выборках не имеет смысла!! Масса подобных шкал все еще встречается в экспериментальной токсикологии, экспериментальной хирургии, экспериментальной морфологии. Порядковыми шкалами в медицине являются шкала стадий гипертонической болезни (по Мясникову), шкала степеней сердечной недостаточности (по Стражеско-Василенко-Лангу), шкала степени выраженности коронарной недостаточности (по Фогельсону), и т.д. Все эти шкалы построены по схеме: заболевание не обнаружено; первая стадия заболевания; вторая стадия; третья стадия. Каждая стадия имеет свойственную только ей медицинскую характеристику. При описании групп инвалидности числа используются в противоположном порядке: самая тяжелая - первая группа инвалидности, затем - вторая, самая легкая - третья. Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы. В некоторых случаях возможно вычисление среднего значения. Для сравнения различных выборок переменных, относящихся к порядковой шкале, могут применяться непараметрические тесты, формулы которых оперируют рангами.

    Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выразить и сравнить различия между ними. Например, температура, измеренная в градусах Фаренгейта или Цельсия, образует интервальную шкалу. Шкала Цельсия, как известно, была установлена следующим образом: за ноль была принята точка замерзания воды, за 100 градусов – точка ее кипения, и, соответственно, интервал температур между замерзанием и кипением воды поделен на 100 равных частей. Здесь утверждение, что температура 40°С в два раза больше, чем 20°С, будет неверным. В шкале интервалов сохраняется отношение длин интервалов. Вы можете не только сказать, что температура 40°С выше, чем температура 30°С, но и что увеличение температуры с 20°С до 40 градусов вдвое больше увеличения температуры от 30 до 40 градусов. Такие переменные могут обрабатываться любыми статистическими методами без ограничений. Так, к примеру, среднее значение является полноценным статистическим показателем для характеристики таких переменных.

    Шкалами отношений измеряются почти все физические величины – время, линейные размеры, площади, объемы, сила тока, мощность и т.д. Это самая мощная шкала. К этой шкале относятся все интервальные переменные, которые имеют абсолютную нулевую точку. В медико-биологических исследованиях шкала отношений будет иметь место, например, когда измеряется время появления того или иного признака после начало воздействия (порог времени, в секундах, минутах), интенсивность воздействия до появления какого-либо признака (порог силы воздействия в вольтах, рентгенах и т.п.). Естественно, к шкале отношений относятся все данные в биохимических и электрофизиологических исследованиях (концентрации веществ, вольтажи, временные показатели электрокардиограммы и т.п.). Сюда же, например, относятся и количество правильно или неправильно выполненных «заданий» в различных тестах по изучению высшей нервной деятельности у животных. Например, температура по Кельвину образует шкалу отношения, и при этом можно утверждать, что температура 200 градусов не только выше, чем 100 градусов, но при этом она вдвое выше. Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы отношения. Заметим, что в большинстве статистических процедур не делается различия между свойствами интервальных шкал и шкал отношения. Для двух последних шкал возможно вычисление таких числовых показателей, как среднее значение, стандартное отклонение.

    Рассмотрим еще несколько конкретных примера переменных в эмпирическом исследовании. Пусть они кодируются следующим образом:

    Таблица 1.1

    Типы шкал

    Мы видим, что кодирование переменной пол с помощью цифр 1 и 2 абсолютно произвольно, их можно было поменять местами или обозначить другими цифрами. Это не значит, что женщины стоят на ступеньку ниже мужчин. В этом случае говорят о переменных, относящихся к номинальной шкале. Такая же ситуация и с переменной семейное положение . Здесь также соответствие между числами и категориями семейного положения не имеет никакого эмпирического значения. Но в отличии от пола, эта переменная не является дихотомической - у нее четыре кодовых цифры вместо двух.

    Переменная курение отсортирована в порядке значимости снизу вверх: умеренный курильщик курит больше, нежели некурящий, а сильно курящий - больше, чем умеренный курильщик и т.д. Эти переменные относятся к порядковой шкале. Однако эмпирическая значимость этих переменных не зависит от разницы между соседними численными значениями. Так, несмотря на то, что разница между значениями кодовых чисел для некурящего, редко курящего и интенсивно курящего в обоих случаях равна единице, нельзя утверждать, что фактическое различие между некурящим, изредка курящим и интенсивно курящим одинаково. Для этого данные понятия слишком расплывчаты. Классическими примерами переменных с порядковой шкалой являются также переменные, полученные в результате объединения величин в классы, такие, как месячный доход в нашем примере.

    Рассмотрим теперь коэффициент интеллекта (IQ). И его абсолютные значения отображают порядковое отношение между респондентами, и разница между двумя значениями также имеет эмпирическую значимость. Например, если у Федора IQ равен 80, у Петра – 120 и у Ивана – 160, можно сказать, что Петр в сравнении с Федором настолько же интеллектуальнее насколько Иван в сравнении с Петром (а именно – на 40 единиц IQ). Однако, основываясь только на том, что значение IQ у Федора в два раза меньше, чем у Ивана, нельзя сделать вывод, что Иван вдвое умнее Федора. Такие переменные относятся к интервальной шкале.

    Наивысшей статистической шкалой, на которой эмпирическую значимость приобретает и отношение двух значений, является шкала отношений. Примером переменной, относящейся к такой шкале, является возраст: если Андрею 30 лет, а Алексею 60, можно сказать, что Алексей вдвое старше Андрея. Шкалой отношений является температурная шкала Кельвина с абсолютным нулём температур.

    На практике, в том числе при обработке данных в пакете Statistica, различие между переменными, относящимися к интервальной шкале и шкале отношений обычно несущественно.

    От более богатой или мощной шкалы всегда можно перейти к более бедной. Так, непрерывные переменные можно категоризировать. Например, непрерывную случайную величину (СВ) Рост можно из шкалы отношений перевести в порядковую шкалу с градациями: низкий, средний, высокий.

    Допустим, весь диапазон изменения интервальной переменной был разделен на область высоких, средних и низких значений и каждое наблюдение было отнесено к одной из трех категорий. Это означает, что явление, которое вначале описывалось в интервальной шкале, может быть описано также и в шкале наименований, а, следовательно, можно использовать для анализа этого явления все те статистические методы, которые требуют использования переменных в шкале наименований. Но надо учитывать, что при переходе к шкале наименований от шкал более высокого порядка, мы теряем часть информации о наблюдениях. Наблюдения, которые отличались друг от друга при описании их в интервальной шкале, могут восприниматься как одинаковые при описании их в шкале наименований. Поэтому рекомендуется применять шкалу наименований лишь тогда, когда нет возможности использовать шкалу более высокого порядка.


    5.2. Типы статистических шкал

    В эмпирическом исследовании могут встречаться, к примеру, следующие переменные (указано их наиболее вероятное кодирование):

    Пол 1 = мужской
    2 = женский
    Семейное положение 1 = холост/не замужем
    2 = женат/замужем
    3 = вдовец/вдова
    4 = разведен(а)
    Курение 1 = некурящий
    2 = изредка курящий
    3 = интенсивно курящий
    4 = очень интенсивно курящий
    Месячный доход 1 = до 3000 DM
    2 = 3001 - 5000 DM
    3 = более 5000 DM
    Коэффициент интеллекта (I.Q.)
    Возраст (лет)

    Рассмотрим сначала графу "Пол" . Мы видим, что назначение соответствия цифр 1 и 2 обоим полам абсолютно произвольно, их можно было поменять местами или обозначить другими цифрами. Мы, конечно, не имеем в виду, что женщины стоят на ступеньку ниже мужчин, или мужчины значат меньше, чем женщины. Следовательно, отдельным числам не соответствует никакою эмпирического значения. В этом случае говорят о переменных, относящихся к номинальной шкале . В нашем примере рассматривается переменная с номинальной шкалой, имеющая две категории. Такая переменная имеет еще одно название - дихотомическая .

    Такая же ситуация и с переменной "Семейное положение" . Здесь также соответствие - между числами и категориями семейного положения не имеет никакого эмпирического значения. Но в отличии от Пола, эта переменная не является дихотомической - у нее четыре категории вместо двух. Возможности обработки переменных, относящихся к номинальной шкале очень ограничены. Собственно говоря, можно провести только частотный анализ таких переменных. К примеру, расчет среднего значения для переменной Семейное положение, совершенно бессмысленен. Переменные, относящиеся к номинальной шкале часто используются для группировки, с помощью которых совокупная выборка разбивается по категориям этих переменных. В частичных выборках проводятся одинаковые статистические тесты, результаты которых затем сравниваются друг с другом.

    В качестве следующего примера рассмотрим переменную "Курение" . Здесь кодовым цифрам присваивается эмпирическое значение в том порядке, в котором они расположены в списке. Переменная Курение, в итоге, сортирована в порядке значимости снизу вверх: умеренный курильщик курит больше, нежели некурящий, а сильно курящий - больше, чем умеренный курильщик и т.д. Такие переменные, для которых используются численные значения, соответствующие постепенному изменению эмпирической значимости, относятся к порядковой шкале .

    Однако эмпирическая значимость этих переменных не зависит от разницы между соседними численными значениями. Так, несмотря на то, что разница между значениями кодовых чисел для некурящего и изредка курящего и изредка курящего и интенсивно курящего в обоих случаях равна единице, нельзя утверждать, что фактическое различие между некурящим и изредка курящим и между изредка курящим и интенсивно курящим одинаково. Для этого данные понятия слишком расплывчаты.

    К классическими примерами переменных с порядковой шкалой относятся также переменные, полученные в результате объединения величин в классы, как "Месячный доход" в нашем примере.

    Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы. В некоторых случаях возможно вычисление среднего значения. Если должна быть установлена связь (корреляция) с другими переменными такого рода, для этой цели можно использовать коэффициент ранговой корреляции .

    Для сравнения различных выборок переменных, относящихся к порядковой шкале, могут применяться непараметрические тесты , формулы которых оперируют рангами.

    Рассмотрим теперь "Коэффициент интеллекта (IQ) ". Не только его абсолютные значения отображают порядковое отношение между респондентами, но и разница между двумя значениями также имеет эмпирическую значимость. Например, если у Ганса IQ равен 80, у Фрица - 120 и у Отто - 160, можно сказать, что Фриц в сравнении с Гансом настолько же интеллектуальнее насколько Отто в сравнении с Фрицем (а именно - на 40 единиц IQ). Однако, основываясь только на том, что значение IQ у Ганса в два раза меньше, чем у Отто, исходя из определения IQ нельзя сделать вывод, что Отто вдвое умнее Ганса.

    Такие переменные, у которых разность (интервал) между двумя значениями имеет эмпирическую значимость, относятся к интервальной шкале . Они могут обрабатываться любыми статистическим методами без ограничений. Так, к примеру, среднее значение является полноценным статистическим показателем для характеристики таких переменных.

    Наконец, мы достигли наивысшей статистической шкалы, на которой эмпирическую значимость приобретает и отношение двух значений. Примером переменной, относящейся к такой шкале является "Возраст ": если Максу 30 лет, а Морицу 60, можно сказать, что Мориц вдвое старше Макса. Шкала, к которой относятся данные называется шкалой отношений . К этой шкале относятся все интервальные переменные, которые имеют абсолютную нулевую точку. Поэтому переменные относящиеся к интервальной шкале, как правило, имеют и шкалу отношений.

    Подводя итоги, можно сказать, что существует четыре вида статистических шкал, на которых могут сравниваться численные значения:

    На практике, в том числе в SPSS, различие между переменными, относящимися к интервальной шкале и шкале отношений обычно несущественно. То есть в дальнейшем практически всегда речь будет идти о переменных, относящихся к интервальной шкале .

    error: