Методы математической статистики. Основы математической статистики Методы математической статистики для обработки данных

Математическая статистика - это раздел математики, изучающий приближенные методы сбора и анализа данных по результатам эксперимента для выявления существующих закономерностей, т.е. отыскания законов распределения случайных величин и их числовых характеристик.

В математической статистике принято выделять два основных направления исследований :

1. Оценка параметров генеральной совокупности.

2. Проверка статистических гипотез (некоторых априорных предположений).

Основными понятиями математической статистики являются: генеральная совокупность, выборка, теоретическая функция распределения.

Генеральной совокупностью является набор всех мыслимых статистических данных при наблюдениях случайной величины.

Х Г = {х 1 , х 2 , х 3 , …, х N , } = { х i ; i=1,N }

Наблюдаемая случайная величина Х называется признаком или фактором выборки. Генеральная совокупность - есть статистический аналог случайной величины, ее объем N обычно велик, поэтому из нее выбирается часть данных, называемая выборочной совокупностью или просто выборкой.

Х В = {х 1 , х 2 , х 3 , …, х n , } = { х i ; i=1,n }

Х В Ì Х Г, n £ N

Выборка - это совокупность случайно отобранных наблюдений (объектов) из генеральной совокупности для непосредственного изучения. Количество объектов в выборке называется объемом выборки и обозначается n. Обычно выборка составляет 5%-10% от генеральной совокупности.

Использование выборки для построения закономерностей, которым подчинена наблюдаемая случайная величина, позволяет избежать ее сплошного (массового) наблюдения, что часто бывает ресурсоемким процессом, а то и просто невозможным.

Например, популяция представляет собой множество индивидуумов. Изучение целой популяции трудоемко и дорого, поэтому собирают данные по выборке индивидуумов, которых считают представителями этой популяции, позволяющими сделать вывод относительно этой популяции.

Однако, выборка обязательно должна удовлетворять условию репрезентативности , т.е. давать обоснованное представление о генеральной совокупности. Как сформировать репрезентативную (представительную) выборку? В идеале стремятся получить случайную (рандомизированную) выборку. Для этого составляют список всех индивидуумов в популяции и случайно их отбирают. Но иной раз затраты при составлении списка могут оказаться недопустимыми и тогда берут приемлемую выборку, например, одну клинику, больницу и исследуют всех пациентов в этой клинике с данным заболеванием.

Каждый элемент выборки называется вариантой . Число повторений варианты в выборке называется частотой встречаемости . Величина называется относительной частотой варианты, т.е. находится как отношение абсолютной частоты варианты ко всему объему выборки. Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом .


Рассмотрим три формы вариационного ряда: ранжированный, дискретный и интервальный.

Ранжированный ряд - это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака.

Дискретный вариационный ряд представляет собой таблицу, состоящую из граф, либо строк: конкретного значения признака х i и абсолютной частоты n i (или относительной частоты ω i) проявления i-го значения признака x.

Примером вариационного ряда служит таблица

Написать распределение относительных частот.

Решение : Найдем относительные частоты. Для этого разделим частоты на объем выборки:

Распределение относительных частот имеет вид:

0,15 0,5 0,35

Контроль: 0,15 + 0,5 + 0,35 = 1.

Дискретный ряд можно изобразить графически. В прямоугольной декартовой системе координат отмечаются точки с координатами () или (), которые соединяются прямыми линиями. Такую ломаную называют полигоном частот.

Построить дискретный вариационный ряд (ДВР) и начертить полигон распределения 45 абитуриентов по числу баллов, полученных ими на приемных экзаменах:

39 41 40 42 41 40 42 44 40 43 42 41 43 39 42 41 42 39 41 37 43 41 38 43 42 41 40 41 38 44 40 39 41 40 42 40 41 42 40 43 38 39 41 41 42.

Решение : Для построения вариационного ряда различные значения признака x (варианты) располагаем в порядке их возрастания и под каждым из этих значений записываем его частоту.

Построим полигон этого распределения:

Рис. 13.1. Полигон частот

Интервальный вариационный ряд используется при большом числе наблюдений. Для построения такого ряда надо выбрать число интервалов признака и установить длину интервала. При большом числе групп величина интервала будет минимальна. Число групп в вариационном ряду можно найти по формуле Стерджеса : (k-число групп, n - объем выборки), а ширину интервала -

где - максимальное; - минимальное значения вариант, а их разность R носит название размаха вариации .

Исследуется выборка из 100 человек из совокупности всех студентов медицинского ВУЗа.

Решение : Рассчитаем число групп: . Таким образом, для составления интервального ряда данную выборку лучше разбить на 7 или 8 групп. Совокупность групп, на которые разбиваются результаты наблюдений и частот получения результатов наблюдений в каждой группе, называют статистической совокупностью .

Для наглядного представления статистического распределения пользуются гистограммой.

Гистограмма частот - это ступенчатая фигура, состоящая из смежных прямоугольников, построенных на одной прямой, основания которых одинаковы и равны ширине интервала, а высота равна или частоте попадания в интервал или относительной частоте ω i .

Наблюдения за числом частиц, попавших в счетчик Гейгера, в течение минуты дали следующие результаты:

21 30 39 31 42 34 36 30 28 30 33 24 31 40 31 33 31 27 31 45 31 34 27 30 48 30 28 30 33 46 43 30 33 28 31 27 31 36 51 34 31 36 34 37 28 30 39 31 42 37.

Построить по этим данным интервальный вариационный ряд с равными интервалами (I интервал 20-24; II интервал 24-28 и т.д.) и начертить гистограмму.

Решение : n = 50

Гистограмма этого распределения имеет вид:

Рис. 13.2. Гистограмма распределения

Варианты заданий

№ 13.1. Через каждый час измерялось напряжение тока в электросети. При этом были получены следующие значения (В):

227 219 215 230 232 223 220 222 218 219 222 221 227 226 226 209 211 215 218 220 216 220 220 221 225 224 212 217 219 220.

Построить статистическое распределение и начертить полигон.

№ 13.2. Наблюдения за сахаром крови у 50 человек дали такие результаты:

3.94 3.84 3.86 4.06 3.67 3.97 3.76 3.61 3.96 4.04

3.82 3.94 3.98 3.57 3.87 4.07 3.99 3.69 3.76 3.71

3.81 3.71 4.16 3.76 4.00 3.46 4.08 3.88 4.01 3.93

3.92 3.89 4.02 4.17 3.72 4.09 3.78 4.02 3.73 3.52

3.91 3.62 4.18 4.26 4.03 4.14 3.72 4.33 3.82 4.03

Построить по этим данным интервальный вариационный ряд с равными интервалами (I - 3.45-3.55; II - 3.55-3.65 и т. д.) и изобразить его графически, начертить гистограмму.

№ 13.3. Построить полигон частот распределения скорости оседания эритроцитов (СОЭ) у 100 человек.

Одесский национальный медицинский университет Кафедра биофизики, информатики и медицинской аппаратуры Методические указания студентам 1 курса по теме “Основы математической статистики” Одесса 2009 г.

1.Тема: “ Основы математической статистики”.

2. Актуальность темы.

Математическая статистика – это раздел математики, которая изучает методы собирания, систематизации и обработки результатов наблюдений массовых случайных событий с целью выяснения и практического применения существующих закономерностей. Методы математической статистики нашли широкое применение в клинической медицине и здравоохранении. Они используются, в частности, при разработке математических методов медицинской диагностики, в теории эпидемий, в планировании и обработке результатов медицинского эксперимента, в организации здравоохранения. Статистические концепции, сознательно или бессознательно, используются при принятии решений в таких вопросах, как клинический диагноз, прогнозирование течения болезни у отдельного больного, прогнозирование возможных результатов осуществления тех или других программ в данной группе населения и выбор надлежащей программы в конкретных обстоятельствах. Знакомство с идеями и методами математической статистики является необходимым элементом профессионального образования каждого работника здравоохранения.

3. Целые занятия. Общая цель занятия есть научиться студентам сознательно использовать математическую статистику при решении задач медико-биологического профиля. Конкретные целые занятия:
  1. ознакомить студентов с основными идеями, понятиями и методами математической статистики, уделяя внимание, главным образом, вопросам, по"язанним с обработкой результатов наблюдений массовых случайных событий с целью выяснения и практического применения существующих закономерностей;
  2. научить студентам сознательно применять основные понятия математической статистики при решении простейших проблем, которые возникают в профессиональной деятельности врача.
Студент должен знать (2 уровень):
  1. определение частоты класса (абсолютной и относительной)
  2. определение генеральной сукупністі и виборки, объема виборки
  3. точечное и інтервальне оценивание
  4. надежный интервал и достоверность
  5. определение моды, медианы и выборочного среднего
  6. определение размаха, міжквартильного размаха, квартильного отклонение
  7. определение среднего абсолютного отклонения
  8. определение выборочной коваріації и дисперсии
  9. определение выборочных стандартного отклонения и коэффициенту вариации
  10. определение выборочных коэффициентов регрессії
  11. эмпирические уравнения линейной регрессії
  12. определение выборочного корреляційного коэффициенту.
Студент должен овладеть элементарными привычками вычисления (3 уровень):
  1. моды, медианы и выборочного среднего
  2. размаха, міжквартильного размаха, квартильного отклонение
  3. среднего абсолютного отклонения
  4. выборочной коваріації и дисперсии
  5. выборочных стандартного отклонения и коэффициенту вариации
  6. надежного интервала для математического ожидания и дисперсии
  7. выборочных коэффициентов регрессії
  8. выборочного корреляційного коэффициенту.
4. Пути реализации целей занятия: Для реализации целей занятия Вам необходимые такие исходные знания:
  1. Определение распределения, ряд распределения и многокутника распределения дискретной случайной величины
  2. Определение функциональной залежністі между случайными величинами
  3. Определение корреляционной залежністі между случайными величинами
Вам необходимые также уметь вычислять вероятностей несовместимых и совместных событий с помощью соответствующих правил. 5. Задача для проверки студентами своего исходного уровня знаний . Контрольные вопросы
  1. Определение випадковоі события, ее относительную частоту и вероятность.
  2. Теорема составления вероятностей несовместимых событий
  3. Теорема составления вероятностей совместных событий
  4. Теорема умножения вероятностей независимых событий
  5. Теорема умножения вероятностей зависимых событий
  6. Теорема полной вероятности
  7. Теорема Байеса
  8. Определение случайных величин: дискретной и непрерывной
  9. Определение распределения, ряд распределения и многоугольника распределения дискретной случайной величины
  10. Определение функции распределения
  11. Определение мер положения центра распределения
  12. Определение мер вариабельности значений случайной величины
  13. Определение щільністі распределения и кривой распределения непрерывной случайной величины
  14. Определение функциональной зависимости между случайными величинами
  15. Определение корреляционной зависимости между случайными величинами
  16. Определение регрессии, уравнение и линии регрессии
  17. Определение коваріації и коэффициента корреляции
  18. Определение уравнения линейной регрессии.
6. Информацию для упрочения исходных знаний-умений можно найти в пособиях:
  1. Жуматій П.Г. Лекция “Теория вероятностей”. Одесса, 2009.
  2. Жуматій П.Г. “ Основы теории вероятностей”. Одесса, 2009.
  3. Жуматій П.Г., Сеницька Я.Р. Элементы теории вероятностей. Методические указания для студентов медицинского института. Одесса, 1981.
  4. Чалый О.В., Агапов Б.Т., Цехмістер Я.В. Медицинская и биологическая физика. Киев, 2004.
7. Содержание учебного материала из данной темы с выделением основных узловых вопросов.

Математическая статистика - это раздел математики, которая изучает методы сбора, систематизации, обработки, изображение, анализа и интерпретации результатов наблюдений с целью выявления существующих закономерностей.

Применение статистики в здравоохранении необходимо как на уровне сообщества, так и на уровне отдельных пациентов. Медицина имеет дело с индивидуумами, которые отличаются друг от друга по многим характеристикам, и значение показателей, на основе которых человека можно считать здоровой, варьируются от одного индивидуума к другому. Нет двух абсолютно одинаковых пациентов или двух групп пациентов, поэтому решение, которые касаются отдельных больных или групп населень, приходится принимать, исходя из опыта, накопленного на других больных или популяціних группах с похожими биологическими характеристиками. Необходимо осознавать, что учитывая существующие расхождения эти решения не могут быть абсолютно точными - они всегда связаны с некоторой неопределенностью. Именно в этом состоит ймовірносна природа медицины.

Некоторые примеры применения статистических методов в медицине:

трактовка вариации (вариабельность характеристик организма при решении вопроса о том, какое значение той или другой характеристики будет идеальным, нормальным, средним и т.і., делает необходимым использование соответствующих статистических методов).

диагностика заболеваний в отдельных больных и оценка состояния здоровья группы населения.

прогнозирование конца болезни в отдельных больных или возможного результата программы борьбы по той или другой болезнью в любой группе населения.

выбор пригодного влияния на больного или на группу населения .

планирование и проведение медицинских исследований , анализ и публикація результатов, их чтение и критическая оценка.

планирование здравоохранения и руководство им .

Полезная медицинская информация обычно скрыта в массе необработанных данных. Необходимо сконцентрировать информацию, которая содержится в них, и представить данные так, чтобы структуру вариации было хорошо видно, а потом уже выбрать конкретные методы анализа.

Изображение данных предусматривает знакомство с такими понятиями и сроками:

вариационный ряд (упорядоченное расположение) - простое упорядочение отдельных наблюдений за величиной.

класс - один из интервалов, на которые делят весь диапазон значений случайной величины.

крайние точки класса - значение, которые ограничивают класс, например 2,5 и 3,0, нижняя и верхняя границы класса 2,5 - 3,0.

(абсолютная) частота класса - число наблюдений в классе.

относительная частота класса - абсолютная частота класса, выраженная в виде частные общего числа наблюдений.

кумулятивная (накопленная) частота класса - число наблюдений, которое равняется сумме частот всех предыдущих классов и данного класса .

стовпцева диаграмма - графическое изображение частот данных для номинальных классов с помощью столбцов, высоты которых прямо пропорциональные частотам классов.

круговая диаграмма - графическое изображение частот данных для номинальных классов с помощью секторов круга, площади которых прямо пропорциональные частотам классов.

гістограма - графическое изображение частотного распределения количественных данных площадями прямоугольников, прямо пропорциональных частотам классов.

полигон частот - график частотного распределения количественных данных; точку, соответствующую частоте класса, располагают над серединой интервала, каждое две соседние точки соединяют отрезком прямой.

огива (кумулятивная кривая) - график распределения кумулятивных относительных частот.

Всем медицинским данным присущий вариабельность, тому анализ результатов измерений основанный на изучении сведений о том, каких значениях принимала случайная величина, которая исследуется.

Совокупность всех возможных значений случайной величины называется генеральной.

Часть генеральной совокупности, зарегистрированная в результате испытаний, носит название виборкою.

Число наблюдений, включенное в виборку, зовут объемом виборки (обычно обозначается n ) .

Задача выборочного метода заключается в том, чтобы по полученной избирателю сделать правильную оценку случайной величины, которая изучается. Поэтому основное требование, которое пред"яв-ляється к виборки, это максимальное отображение всех черт генеральной совокупности. Виборка, что удовлетворяет этому требованию, называется репрезентативной. От репрезентативности виборки зависит обгрунтованість оценки, то есть степень соответствия оценки параметру, который она характеризует .

При оценивании параметров генеральной совокупности по избирателю (параметрическом оценивании) пользуются такими понятиями:

точечное оценивание - оценка параметра генеральной совокупности в виде единичного значения, которое он может принять с самой большой вероятностью.

интервальне оценивание - оценка параметра генеральной совокупности в виде интервала значений, который имеет заданную вероятность накрыть его истинное значение.

При інтервальному оценивании используют понятие:

надежный интервал - интервал значений, который имеет заданную вероятность накрыть истинное значение параметра генеральной совокупности при інтервальному оценивании.

достоверность (надежная вероятность) - вероятность, с которой надежный интервал накрывает истинное значение параметра генеральной совокупности.

надежные границы - нижняя и верхняя границы надежного интервала.

Выводы, которые получаются методами математической статистики, всегда основываются на ограниченном, выборочном числе наблюдений, поэтому природньо, что для второй виборки результаты могут быть другими. Это обстоятельство определяет ймовірносний характер выводов математической статистики и, как следствие, широкое использование теории вероятностей в практике статистического исследования.

Типичный путь статистического исследования такой :

оценивши величины или зависимости между ними по данным наблюдений, выдвигают допущение о том, что явление, которое изучается, можно описать той или другой стохастичною моделью

используя статистические методы, можно это предположение подтвердить или отвергнуть; при подтверждении цель достигнута - найдена модель, которая описывает исследуемые закономерности, в противоположном случае продолжают работу, выдвигая и проверяя новую гипотезу.

Определение выборочных статистических оценок:

мода - это значения, которое чаще всего встречается в избирателе ,

медиана - центральное (срединное) значение вариационного ряда

размах R - разность между самым большим и наименьшим значениями в серии наблюдений

процентилі - значение в вариационном ряде, которые делят распределение на 100 равных частей (таким образом, медиана будет п"ятидесятим процентилем)

первый квартиль - 25- ий процентиль

третий квартиль - 75- ий процентиль

міжквартильний размах - разность между первым и третьим квартилями (охватывает центральных 50% наблюдений)

квартильне отклонение - половина міжквартильного размаха

выборочное среднее - среднее арифметическое всех выборочных значений (выборочная оценка математического ожидания)

среднее абсолютное отклонение - сумма отклонений от соответствующего начала (без учета знака), разделенная на объем виборки

среднее абсолютное отклонение от выборочного среднего вычисляют за формулой

выборочная дисперсия ( X ) - (выборочная оценка дисперсии) определяется формулой

выборочная коваріація -- (выборочная оценка коваріації К ( Х,Y )) равняется

выборочный коэффициент регрессии Y на X (выборочная оценка коэффициента регрессии Y на X ) равняется

эмпирическое уравнение линейной регрессии Y на X имеет вид

выборочный коэффициент регрессии X на Y (выборочная оценка коэффициента регрессии X на Y) равняется

эмпирическое уравнение линейной регрессии X на Y имеет вид

выборочное стандартное отклонение s(Х) - (выборочная оценка стандартного отклонения) равняется корню квадратному из выборочной дисперсии

выборочный корреляційний коэффициент - (выборочная оценка корреляционного коэффициента) равняется

выборочный коэффициент вариации  - (выборочная оценка коэффициента вариации CV) равняется

.

8. Задача для самостоятельной подготовки студентов . 8.1 Задача для самостоятельного изучения материала с темы.

8.1.1 Практическое вычисление выборочных оценок

Практическое вычисление выборочных точечных оценок

Пример 1 .

Продолжительность заболевания (в днях) в 20 случаях пневмонии сложила:

10, 11, 6, 16, 7, 13, 15, 8, 9, 10, 11, 13, 7, 8, 13, 15, 16, 13, 14, 15

Определить моду, медиану, размах, міжквартильний размах, выборочное среднее, среднее абсолютное отклонение от выборочного среднего, выборочную дисперсию, выборочный коэффициент вариации.

Розв"зок.

Вариационный ряд для виборки имеет вид

6, 7, 7, 8, 8, 9, 10, 10, 11, 11, 13, 13, 13, 13, 14, 15, 15, 15, 16, 16

Мода

Наиболее часто в избирателе встречается число 13. Поэтому значением моды в избирателе будет это число.

Медиана

Когда вариационный ряд содержит парное число наблюдений, медиана равняется среднему двух центральных членов ряда, в данном случае это 11 и 13, поэтому медиана равняется 12.

Размах

Минимальное значение в избирателе равняется 6, а максимальное 16, итак, R = 10.

Міжквартильний размах, квартильне отклонение

В вариационном ряде четверть всех данных имеет значение меньшие, или уровне 8, поэтому первый квартиль 8, а 75% всех данных имеют значение меньшие, или уровне 12, поэтому третий квартиль 14. Итак, міжквартильний размах равняется 6, а квартильне отклонение составляет 3.

Выборочное среднее

Среднее арифметическое всех выборочных значений равняется

.

Среднее абсолютное отклонение от выборочного среднего

.

Выборочная дисперсия

Выборочное стандартное отклонение

.

Bибірковий коэффициент вариации

.

В следующем примере рассмотрим простейшие средства изучения стохастичної зависимости между двумя случайными величинами.

Пример 2 .

При обследовании группы пациентов получены данные о росте Н (см) и объем циркулирующей крови V (л) :

Найти эмпирические уравнения линейной регрессії.

Розв"зок.

Первое, что необходимо вычислить, это:

выборочное среднее

выборочное среднее

.

Второе, что необходимо подсчитать, это:

выборочную дисперсию (Н)

выборочную дисперсию (V)

выборочную коваріацію

Третье, это вычисления выборочных коэффициентов регрессии:

выборочный коэффициент регрессии V на H

выборочный коэффициент регрессии H на V

.

Четвертое, записать искомые уравнения:

эмпирическое уравнение линейной регрессии V на H имеет вид

эмпирическое уравнение линейной регрессии H на V имеет вид

.

Пример 3 .

Используя условия и результаты примера 2, высчитать коэффициент корреляции и проверить достоверность существования корреляционной зависимости между ростом человека и объемом циркулирующей крови с 95% надежной вероятностью.

Розв"зок.

Коэффициент корреляції связан с коэффициентами регрессии и практически полезной формулой

.

Для выборочной оценки коэффициента корреляції эта формула имеет вид

.

Используя вираховані в примере 2 значение выборочных коэффициентов регрессії и, получим

.

Проверка достоверности корреляційної зависимости между случайными величинами (полагает нормальное распределение у каждой из них) осуществляется таким образом:

  • вычисляют величину Т

  • находят в таблице распределения Стьюдента коэффициент

  • существование корреляционной зависимости между случайными величинами подтверждается при выполнении неровности

.

Поскольку 3,5 > 2,26, то с 95% надежной вероятностью существования корреляционной зависимости между ростом пациента и объемом циркулирующей крови можно считать установленным.

Інтервальні оценки для математического ожидания и дисперсии

Если случайная величина имеет нормальное распределение, то інтервальні оценки для математического ожидания и дисперсии вычисляют в такой последовательности:

1.находят выборочное среднее;

2.подсчитывают выборочную дисперсию и выборочное стандартное отклонение s ;

3.в таблице распределения Стьюдента за надежной вероятностью  и объемом виборки n находят коэффициент Стьюдента;

4.надежный интервал для математического ожидания записывают в виде

5.в таблице распределения "> и объемом виборкиn находят коэффициенты

;

6.надежный интервал для дисперсии записывают в виде

Величина надежного интервала, надежная вероятность и объем виборкиn зависят друг от друга. На самом деле, отношение

уменьшается с ростомn, итак, при постоянной величине надежного интервала с ростомn растет и . При постоянной надежной вероятности с ростом объема виборкип уменьшается величина надежного интервала. При планировании медицинских исследований эта связь используют для определения минимального объема виборки, который обеспечит нужны по условиям решаемой задачи величины надежного интервала и надежной вероятности.

Пример 5.

Используя условия и результаты примера 1, найдите інтервальні оценки математического ожидания и дисперсии для 95% надежной вероятности.

Розв"зок.

В примере 1 вираховані точечные оценки математического ожидания (выборочное среднее =12), дисперсии (выборочная дисперсия =10,7) и стандартного отклонения (выборочное стандартное отклонение). Объем виборки равняетсяп = 20.

Из таблицы распределения Стьюдента найдем значение коэффициента

дальше вычислим полуширинуd надежного интервала

и запишем інтервальну оценку математического ожидания

10,5 < < 13,5 при = 95%

Из таблицы распределения Пірсона " хи-квадрат " найдем коэффициенты

вычислим нижнюю и верхнюю надежные границы

и запишем інтервальну оценку для дисперсии в виде

6,2 23 при = 95% .

8.1.2. Задачи для самостоятельного решения

Для самостоятельногорешения предлагаются задачи5.4 С 1 – 8 (П.Г.Жуматій. “Математическая обработка медико-биологических данных. Задачи и примеры”. Одесса, 2009, с. 24-25)

8.1.3. Контрольные вопросы
  1. Частота класса (абсолютная и относительная).
  2. Генеральная совокупность и выборка, объем выборки.
  3. Точечное и інтервальне оценивание.
  4. Надежный интервал и достоверность.
  5. Мода, медиана и выборочное среднее.
  6. Размах, міжквартільний размах, квартальное отклонение.
  7. Среднее абсолютное отклонение.
  8. Выборочные коваріація и дисперсия.
  9. Выборочные стандартное отклонение и коэффициент вариации.
  10. Выборочные коэффициенты регрессии.
  11. Эмпирические уравнения регрессии.
  12. Вычисление корреляционного коэффициента и достоверности корреляционной связи.
  13. Построение інтервальних оценок нормально распределенных случайных величин.
8.2 Основная литература
  1. Жуматій П.Г. “Математическая обработка медико-биологических данных. Задачи и примеры”. Одесса, 2009.
  2. Жуматій П.Г. Лекция “Математическая статистика”. Одесса, 2009.
  3. Жуматій П.Г. “ Основы математической статистики”. Одесса, 2009.
  4. Жуматій П.Г., Сеницька Я.Р. Элементы теории вероятностей. Методические указания для студентов медицинского института. Одесса, 1981.
  5. Чалый О.В., Агапов Б.Т., Цехмістер Я.В. Медицинская и биологическая физика. Киев, 2004.
8.3 Дополнительная литература
  1. Ремізов О.M. Медицинская и биологическая физика. М., “Высшая школа”, 1999.
  2. Ремізов О.M., Ісакова Н.Х., Максіна О.Г.. Сборник задач из медицинской и биологической физики. М., .,“Высшая школа”, 1987.
Методические указания сложилдоц. П. Г. Жуматій.
  • 7. Базовая аппаратная конфигурация персонального компьютера. Системный блок: понятия, виды. Внутреннее устройство системного блока.
  • 8.Метеринская плата компьютера: понятие, назначение, хар-ка, логические схемы.
  • 9.Структура и основная хар-ка процессора как основной микросхемы комп-ра.Связь процессора с др устройствами. Компоненты магистрали комп-ра.
  • 10. Внутренняя память компьютера: оперативная и кэш-память, микросхема пзу и система bios, энергонезависимая память cmos. Носители и устройства внешней памяти.
  • 11. Конструкция, принцип действия, основные параметры жесткого диска.
  • 1. Протокол передачи данных.
  • 12. Классификация устройств ввода и вывода информации, порты комп-ра для подключения периферийных устройств.
  • 13. Виды и основные пользовательские характеристики современных мониторов.
  • 14. Принтеры: понятие, назначение, виды, принципы работы.
  • 15. Клавиатура: группы клавиш, назначение клавиш.
  • 16. Виды, принцип действия, регулируемые параметры мыши. Доп. Устройства комп-ра: модем, тв-тюнер, звуковая карта.
  • 17. Понятие и структура программного обеспечения персонального компьютера.
  • 18. Назначение, типы, ведущие функции операционной системы пк. Основные компоненты операционной системы: ядро, интерфейс, драйверы устройств.
  • 19. Понятие и типы файлов. Файловая структура комп-ра. Обслуживание файловой структуры персонального комп-ра.
  • 20. Прикладное по: понятие, значение, структура, виды, программы.
  • 21. Назначение и виды языков программирования. Составные компоненты системы программирования.
  • 22. Назначение и классификация служебных программных средств.
  • 23. Компьютерный вирус. Признаки вирусного заражения.
  • 24. Классификация вирусов.
  • 25. Виды антивирусных программ. Меры по защите эвм от вирусов.
  • 26. Понятие архивации. Методы и форматы сжатия информации. Основные идеи алгоритмов rle, Лемпеля-Зива, Хаффмана.
  • 27. База данных. Классификация. Модели баз данных. Достоинства и недостатки.
  • 28. Субд. Виды. Основные принципы создания.
  • 29. Автоматизированное рабочее место мед специалиста. Назначение, основные требования и принципы разработки.
  • 30. Совокупность решаемых с помощью арм задач и основные направления применения автоматизированных рабочих мест мед персоналом.
  • 31. Структурные компоненты и функциональные модули автоматизированных рабочих мест медицинских работников. Классификация автоматизированных рабочих мест сотрудников медицинских организаций.
  • 32. Знания как основа функционирования экспертных систем. Понятие, свойства и виды знаний.
  • 33. Экспертная система: понятие, назначение и структурные компоненты. Основные этапы разработки экспертной системы
  • 34. Базовые функции экспертных систем и требования к работе медицинских экспертных систем.
  • 35. Режимы функционирования и виды современных экспертных систем. Экспертная система и специалист: сравнительные преимущества и недостатки
  • 36. Понятие компьютерной сети. Основные требования, предъявляемые к современным компьютерным сетям
  • 37. Основные компоненты компьютерной сети
  • 38. Классификация компьютерных сетей. Топология кс. Виды. Преимущества и недостатки.
  • 39. Глобальная сеть Интернет. История создания. Общая характеристика Интернет. Принцип коммутации пакетов
  • 40. Протокол сети интернет. Возможности сети. «Всемирная паутина». Язык html.
  • 41. Телемедицина, задачи телемедицины. История развития. Основные направления телемедицины
  • 42. Предмет, цели и задачи медицинской информатики. Виды медицинской информации
  • 43. Классификация медицинских информационных систем (мис). Задачи мис
  • 44. Информационные технологии. Информационные системы
  • 45. Виды технологических информационных медицинских систем. Уровни развития мис
  • 46. История развития эвм. Поколения эвм. Современный этап развития вычислительной техники и ее перспективы
  • 47. Математическая статистика ее методы. Основные этапы статистической работы.
  • 48. Генеральная совокупность и выборка. Способы формирования выборки
  • 49. Вариационный ряд и его наглядное изображение. Построение гистограммы (алгоритм)
  • 50. Характеристики статистического распределения: характеристики положения; характеристики формы; характеристики рассеяния.
  • 51. Оценка параметров генеральной совокупности. Точечная и интервальная оценка. Доверительный интервал. Уровень значимости
  • 52. Дисперсионный анализ. Градации факторов и анализ. Простейшая схема варьирование при различий по одному фактору
  • 53. Дисперсионный анализ. Рабочая формула для вычисления средних квадратов
  • 54. Вычисление f-критерия для определения влияния изучаемого фактора. Количественная оценка влияния отдельных факторов.
  • 55. Понятие корреляции. Функциональная и корреляционная зависимости. Графики рассеяния.
  • 56. Коэффициент корреляции и его свойства.
  • 57. Регрессионный анализ. Линейная регрессия
  • 58. Ряды динамики. Понятие временного ряда. Виды ряда. Определение тренда
  • 59. Выравнивание динамических рядов: метод скользящей средней
  • 60. Выравнивание динамических рядов: метод наименьших квадратов
  • 61. Выравнивание динамических рядов: метод удлинения периодов
  • 62. Анализ динамических рядов. Хронологическая средняя. Абсолютный прирост ряда. Коэффициент роста
  • 63. Анализ динамических рядов. Хронологическая средняя. Темп роста. Темп прироста
  • 47. Математическая статистика ее методы. Основные этапы статистической работы.

    Математическая статистика - это научная дисциплина, предметом изучения которой является разработка методов регистрации, описания и анализа статистических экспериментальных данных, полученных в результате наблюдений массовых случайных явлений.

    Основными задачами математической статистики являются:

      определение закона распределения случайной величины или системы случайных величин;

      проверка правдоподобия гипотез;

      определение неизвестных параметров распределения.

    Все методы математической статистики основаны на теории вероятностей. Однако в силу специфичности решаемых задач математическая статистика выделяется из теории вероятностей в самостоятельную область. Если в теории вероятностей считается заданной модель явления и производится расчет возможного реального течения этого явления (рис.1), то в математической статистике подбирается подходящая теоретико-вероятностная модель, исходя из статистических данных (рис.2).

    Рис.1. Общая задача теории вероятностей

    Рис.2. Общая задача математической статистики

    Как научная дисциплина математическая статистика развивалась вместе с теорией вероятностей. Математический аппарат этой науки построен во второй половине XIX века.

    Основные этапы статистической работы.

    Любое статистическое исследование в себя 3 основных этапа:

      сбор – это массовое научно-организованное наблюдение, посредством которого получают первичную информацию об отдельных фактах (единицах) изучаемого явления. Данный статистический учет большого числа или всех входящих в состав изучаемого явления единиц является информационной базой для статистических обобщений, для формулирования выводов об изучаемом явлении или процессе;

      группировка и сводка. Под этими данными понимают распределение множества фактов (единиц) на однородные группы и подгруппы, итоговый подсчет по каждой группе и подгруппе и оформление полученных итогов в виде статистической таблицы;

      обработка и анализ. Статистический анализ заключает стадию статистического исследования. Он содержит в себе обработку статистических данных, которые были получены при сводке, интерпретацию полученных результатов с целью получения объективных выводов о состоянии изучаемого явления и о закономерностях его развития.

    48. Генеральная совокупность и выборка. Способы формирования выборки

    Генеральная совокупность (в англ. - population) - совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы.

    Генеральная совокупность состоит из всех объектов, которые подлежат изучению. Состав генеральной совокупности зависит от целей исследования. Иногда генеральная совокупность - это все население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объект исследования. Например, мужчины 30-50 лет, использующие бритву определённой марки не реже раза в неделю, и имеющие доход не ниже $100 на одного члена семьи.

    Выборка или выборочная совокупность - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

    Характеристики выборки:

      Качественная характеристика выборки – кого именно мы выбираем и какие способы построения выборки мы для этого используем

      Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

    Необходимость выборки

      Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.

      Существует необходимость в сборе первичной информации.

    Объём выборки

    Объём выборки - число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30 – 35.

    Основные способы формирования выборки

    Формирование выборки прежде всего основывается на знании контура выборки, под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.

    Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полно официального списка всех автосервисных мастерских г. Москвы. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.

    При формировании выборки используются вероятностные (случайные) и невероятностные (неслучайные) методы.

    Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной. Если эта вероятность неизвестна, то выборка называется невероятностной. К сожалению, в большинстве маркетинговых исследований из-за невозможности точного определения размера совокупности не представляется возможным точно рассчитать вероятности. Поэтому термин «известная вероятность» скорее основан на использовании определенных методов формирования выборки, чем на знании точных размеров совокупности.

    Вероятностные методы включают в себя:

      простой случайный отбор;

      систематический отбор;

      кластерный отбор;

      стратифицированный отбор.

    Невероятностные методы:

      отбор на основе принципа удобства;

      отбор на основе суждений;

      формирование выборки в процессе опроса;

      формирование выборки на основе квот.

    Смысл метода отбора на основе принципа удобства заключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например с позиций минимальных затрат времени и усилий, с позиций доступности респондентов. Выбор места исследования и состава выборки производится субъективным образом, например, опрос покупателей осуществляется в магазине, ближайшем к месту жительства исследователя. Очевидно, что многие представители совокупности не принимают участия в опросе.

    Формирование выборки на основе суждения основано на использовании мнения квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.

    Формирование выборки в процессе опроса основано на расширении числа опрашиваемых исходя из предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку намного меньшую, чем требуется для исследования, затем она по мере проведения расширяется.

    Формирование выборки на основе квот (квотный отбор) предполагает предварительное, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам). Например, в целях исследования было принято решение, что в универмаге должно быть опрошено пятьдесят мужчин и пятьдесят женщин. Интервьюер проводит опрос, пока не выберет установленную квоту.

    Рассмотрим некоторые понятия и основные подходы к классификации погрешностей. По способу вычисления погрешности можно подразделить на абсолютные и относительные.

    Абсолютная погрешность равна разности среднего измерения величины х и истинного значения этой величины:

    В отдельных случаях, если это необходимо, рассчитывают погрешности еди­ничных определений:

    Заметим, что измеренной величиной в химическом анализе может быть как содержание компонента, так и аналитический сигнал. В зависимости от того, завышает или занижает погрешность результат анализа, погрешности могут быть положительные и отрицательные.

    Относительная погрешность может быть выражена в долях или про­центах и обычно знака не имеет:

    или

    Можно классифицировать погрешности по источникам их происхождения. Так как источников погрешностей чрезвычайно много, то их классификация не может быть однозначной.

    Чаще всего погрешности классифицируют по характеру при­чин, их вызывающих. При этом погрешности делят на систематиче­ ские и случайные, выделяют также промахи (или грубые погрешности).

    К систематическим относят погрешности, которые вызваны постоянно действующей причиной, постоянны во всех измерениях или меняются по постоянно действующему закону, могут быть выявлены и устранены.

    Случайные погрешности, причины появления которых неизвестны, могут быть оценены методами математической статистики.

    Промах - это погрешность, резко искажающая результат анализа и обычно легко обнаруживаемая, вызванная, как правило, небрежностью или некомпетентностью аналитика. На рис. 1.1 представлена схема, поясняющая понятия систематических и погрешностей и промахов. Прямая 1 отвечает тому идеальному случаю, когда во всех N определениях отсутствуют систематические и случайные погрешности. Линии 2 и 3 тоже идеализированные примеры химического анализа. В одном случае (прямая 2) полностью отсутствуют случайные погрешности, но все N определений имеют постоянную отрицательную систематическую погрешность Δх; в другом случае (линия 3) полностью отсутствует систематическая погрешность. Реальную ситуацию отражает линия 4: имеются как случайные, так и систематические погрешности.

    Рис. 4.2.1 Систематические и случайные погрешности химического анализа.

    Деление погрешностей на систематические и случайные в известной степени условно.

    Систематические погрешности одной выборки результатов при рассмотрении большего числа данных могут переходить в случайные. Например, систематическая погрешность, обусловленная неправильными показаниями прибора, при измерении аналитического сигнала на разных приборах в разных лабораториях переходит в случайную.

    Воспроизводимость характеризует степень близости друг к другу единичных определений, рассеяние единичных результатов относительно среднего (рис. 1.2).

    Рис. 4.2..2. Воспроизводимость и правильность химического анализа

    В отдельных случаях наряду с термином «воспроизводимость» используют термин «сходимость». При этом под сходимостью понимают рассеяние результатов параллельных определений, а под воспроизводимостью - рас­сеяние результатов, полученных разными методами, в разных лабораториях, в разное время и т. п.

    Правильность - это качество химического анализа, отражающее близость к нулю систематической погрешности. Правильность характеризует отклонение полученного результата анализа от истинного значения измеряемой величины (см. рис.1.2).

    Генеральная совокупность - гипотетическая совокупность всех мыслимых результатов от -∞ до +∞;

    Анализ экспериментальных данных показывает, что большие по значению погрешности наблюдаются реже , чем малые. Отмечается также, что при увеличении числа наблюдений одинаковые погрешности разного знака встречаются одинаково часто. Эти и другие свойства случайных погрешностей описываются нормальным распределением или уравнением Гаусса, которое описывает плотность вероятности
    .

    где х -значение случайной величины;

    μ – генеральное среднее (математическое ожидание -постоянный параметр);

    Математическое ожидание - для непрерывной случайной величины представляет собой предел, к которому стремится среднее при неограниченном увеличении выборки. Таким образом, математическое ожидание является средним значением для всей генеральной совокупности в целом, иногда его называют генеральным средним.

    σ 2 -дисперсия (постоянный параметр) - характеризует рассеяние случайной величины относительно своего математического ожидания;

    σ – стандартное отклонение.

    Дисперсия – характеризует рассеяние случайной величины относительно своего математического ожидания.

    Выборочная совокупность (выборка) - реальное число (n) результатов, которое имеет исследователь, n = 3 ÷ 10.

    Нормальный закон распределения неприемлем для обработки малого числа изменений выборочной совокупности (обычно 3 – 10) – даже если генеральная совокупность в целом распределена нормально. Для малых выборок вместо нормального распределения используют распределение Стьюдента (t – распределение) , которое связывает между собой три основные характеристики выборочной совокупности –

    Ширину доверительного интервала;

    Соответствующую ему вероятность;

    Объем выборочной совокупности.

    Перед обработкой данных с применением методов математической статистики необходимо выявить промахи (грубые ошибки) и исключить их из числа рассматриваемых результатов. Одним из наиболее простых является метод выявления промахов с применением Q – критерия с числом измерений n < 10:

    где R = х макс - х мин – размах варьирования; х 1 – подозрительно выделяющееся значение; х 2 – результат единичного определения, ближайший по значению к х 1 .

    Полученное значение сравнивают с критическим значением Q крит при доверительной вероятности Р = 0,95. Если Q > Q крит, выпадающий результат является промахом и его отбрасывают.

    Основные характеристики выборочной совокупности . Для выборки из n результатов рассчитывают среднее, :

    и дисперсию , характеризующую рассеяние результатов относительно среднего:

    Дисперсия в явном виде не может быть использована для количественной характеристики рассеяния результатов, поскольку ее размерность не совпадает с размерностью результата анализа. Для характеристики рассеяния используют стандартное отклонение, S .

    Эту величину называют также средним квадратичным (или квадратическим) отклонением или средней квадратичной погрешностью отдельного результата.

    О тносительное стандартное отклонение или коэффициент вариации (V) вычисляют по соотношению

    Дисперсию среднего арифметического вычисляют:

    и стандартное отклонение среднего

    Следует отметить, что все величины – дисперсия, стандартное отклонение и относительное стандартное отклонение, а так же дисперсия среднего арифметического и стандартное отклонение среднего арифметического – характеризуют воспроизводимость результатов химического анализа.

    Используемое при обработке небольших (n<20) выборок из нормально распределенной генеральной совокупности t – распределение (т.е. распределение нормированной случайной величины) характеризуется соотношением

    где t p , f распределение Стьюдента при числе степеней свободы f = n -1 и доверительной вероятности Р=0,95 (или уровня значимости р=0,05) .

    Значения t - распределения приведены в таблицах, по ним рассчитывают для выборки в n результатов величину доверительного интервала измеряемой величины для заданной доверительной вероятности по формуле

    Доверительный интервал характеризует как воспроизводимость результатов химического анализа, так и – если известно истинное значение х ист – их правильность.

    Пример выполнения контрольной работы № 2

    Задание

    При а нализе воздуха на содержание азота хроматографическим методом для двух серий опытов получены следующие результаты:

    Решение :

    Проверяем ряды на наличие грубых ошибок по Q-критерию. Для чего их располагаем результаты в ряд по убыванию (от минимума к максимуму или наоборот) :

    Первая серия:

    77,90<77,92<77,95<77,99<78,05<78,07<78,08<78,10

    Проверяем крайние результаты ряда (не содержат ли они грубую ошибку).

    Полученное значение сравниваем с табличным (табл.2 приложения). Для n=8, p=0,95 Q таб =0,55.

    Т.к. Q таб >Q 1 расчет, левая крайняя цифра не является «промахом».

    Проверяем крайнюю правую цифру

    Q расч

    Крайняя правая цифра так же не является ошибочной.

    Располагаем результаты второго ря да в порядке их возрастания:

    78,02<78,08<78,13<78,14<78,16<78,20<78,23<78,26.

    Проверяем крайние результаты опытов - не являются ли они ошибочными.

    Q (n=8, p=0,95)=0,55. Табличное значение.

    Крайнее левое значение – не ошибочное.

    Крайняя правая цифра (не является ли она ошибочной).

    Т.е. 0,125<0,55

    Крайнее правое число не является «промахом».

    Подвергаем результаты опытов статистической обработке.

      Вычисляем средневзвешенные результатов:

    - для первого ряда результатов.

    - для второго ряда результатов.

      Дисперсия относительно среднего:

    - для первого ряда.

    - для второго ряда.

      Стандартное отклонение:

    - для первого ряда.

    - для второго ряда.

      Стандартное отклонение среднего арифметического:

    При небольших (n<20) выборках из нормально распределенной генеральной совокупности следует использовать t – распределение, т.е. распределение Стьюдента при числе степени свободы f=n-1 и доверительной вероятности p=0,95.

    Пользуясь таблицами t – распределения, определяют для выборки в n – результатов величину доверительного интервала измеряемой величины для заданной доверительной вероятности. Этот интервал можно рассчитать:

    Сравниваем дисперсии и средние результаты двух выборочных совокупностей.

    Сравнение двух дисперсий проводится при помощи F- распределения (распределения Фишера). Если мы имеем две выборочные совокупности с дисперсиями S 2 1 и S 2 2 и числами степеней свободы f 1 =n 1 -1 и f 2 =n 2 -1, соответственно, то рассчитываем значение F:

    F=S 2 1 / S 2 2

    Причем в числителе всегда находится большая из двух сравниваемых выборочных дисперсий. Полученный результат сравнивают с табличным значением. Если F 0 > F крит (при р=0,95; n 1 , n 2), то расхождение между дисперсиями значимо и рассматриваемые выборочные совокупности различаются по воспроизводимости.

    Если расхождение между дисперсиями незначимо, возможно сравнить средние x 1 и х 2 двух выборочных совокупностей, т.е. выяснить, есть ли статистически значимая разница между результатами анализов. Для решения поставленной задачи используют t – распределение. Предварительно рассчитывают средневзвешенное двух дисперсий:

    И средневзвешенное стандартное отклонение

    а затем – величину t:

    Значение t эксп сравнивают с t крит при числе степеней свободы f=f 1 +f 2 =(n 1 +n 2 -2) и выборочной доверительной вероятности р=0,95. Если при этом t эксп > t крит ,то расхождение между средними и значимо и выборка не принадлежит одной и той же генеральной совокупности. Если t эксп < t крит, расхождение между средними незначимо, т.е. выборки принадлежат одной и той же генеральной совокупности, и, следовательно, данные обеих серий можно объединить и рассматривать их как одну выборочную совокупность из n 1 +n 2 результатов.

    Контрольное задание № 2

    Анализ воздуха на содержание компонента Х хроматографическим методом для двух серий дал следующие результаты (таблица-1).

    3. Принадлежат ли результаты обеих выборок и одной и той же генеральной совокупности. Проверить по критерию Стьюдента t (р = 0,95; n = 8).

    Таблица-4.2.1- Исходные данные по контрольному заданию № 2

    № варианта

    Ком-понент

    * Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.

      Введение.

      Использованная литература.

    Методы математической статистики

      Введение.

      Основные понятия математической статистики.

      Статистическая обработка результатов психолого-педагогических исследований.

      Использованная литература.

    Методы математической статистики

      Введение.

      Основные понятия математической статистики.

      Статистическая обработка результатов психолого-педагогических исследований.

      Использованная литература.

        Введение.

    Применение математики к другим наукам имеет смысл только в единении с глубокой теорией конкретного явления. Об этом важно помнить, чтобы не сбиваться на простую игру в формулы, за которой не стоит никакого реального содержания.

    Академик Ю.А. Митропольский

    Теоретические методы исследования в психологии и педагогике дают возможность раскрыть качественные характеристики изучаемых явлений. Эти характе­ристики будут полнее и глубже, если накопленный эмпирический ма­териал подвергнуть количественной обработке. Однако, проблема количественных измерений в рамках психолого-педагогических исследований очень сложна. Эта сложность заключается прежде всего в субъективно-причинном многообразии педагогической деятельности и ее результатов, в самом объекте измерения, находящимся в состоянии непрерывного движения и изменения. Вместе с тем введение в исследование количественных показателей сегодня является необходимым и обязательным компонентом получения объективных данных о результатах педагогического труда. Как правило, эти данные могут быть получены как путем прямого или опосредованного измерения различных составляющих педагогического процесса, так и посредством количественной оценки соответствующих параметров адекватно построенной его математической модели. С этой целью при исследо­вании проблем психологии и педагогики применяются методы математической статистики. С их помощью решаются различные задачи: обработка факти­ческого материала, получение новых, дополнительных данных, обоснование научной организации исследования и другие.

    2. Основные понятия математической статистики

    Исключительно важную роль в анализе многих психолого-педагогических явлений играют средние величины, представляющие собой обобщенную характеристи­ку качественно однородной совокупности по определенному количественно­му признаку. Нельзя, например, вычислить среднюю специальность или среднюю национальность студентов вуза, так как это качест­венно разнородные явления. Зато можно и нужно определить в среднем числовую характеристику их успеваемости (средний балл), эффек­тивности методических систем и приемов и т. д.

    В психолого-педагогических исследованиях обычно применяются различные виды средних величин: средняя арифметическая, сред­няя геометрическая, медиана, мода и другие. Наиболее распространенными являются средняя арифметическая, медиана и мода.

    Средняя арифметическая применяется в тех случаях, когда между определяю­щим свойством и данным признаком имеется прямо пропорциональная зави­симость (например, при улучшении показателей работы учебной группы улучшаются показатели работы каждого ее члена).

    Средняя арифметическая представляет собой частное от деления сум­мы величин на их число и вычисляется по формуле:

    где Х - средняя арифметическая; X1, X2, Х3 ... Хn - результаты отдельных наблюдений (приемов, действий),

    n - количество наблюдений (приемов, действий),

    Сумма результатов всех наблюдений (приемов, действий).

    Медианой (Ме) называется мера среднего положения, характеризующая значение признака на упорядоченной (построенной по признаку возрастания или убывания) шкале, которое соответствует середине исследуемой совокупности. Медиана может быть определена для порядковых и количественных признаков. Место расположения этого значения определяется по формуле: Место медианы = (n + 1) / 2

    Например. По результатам исследования установлено, что:

    – на “отлично” учатся – 5 человек из участвующих в эксперименте;

    – на “хорошо” учатся – 18 человек;

    – на “удовлетворительно” – 22 человека;

    – на “неудовлетворительно” – 6 человек.

    Так как всего в эксперименте принимало участие N = 54 человека, то середина выборки равна человек. Отсюда делается вывод, что больше половины обучающихся учатся ниже оценки “хорошо”, то есть медиана больше “удовлетворительно”, но меньше “хорошо” (см. рисунок).

    Мода (Мо) – наиболее часто встречающееся типичное значение признака среди других значений. Она соответствует классу с максимальной частотой. Этот класс называется модальным значением.

    Например.

    Если на вопрос анкеты: “укажите степень владения иностранным языком”, ответы распределились:

    1 – владею свободно – 25

    2 – владею в достаточной степени для общения – 54

    3 – владею, но испытываю трудности при общении – 253

    4 – понимаю с трудом – 173

    5 – не владею – 28

    Очевидно, что наиболее типичным значением здесь является – “владею, но испытываю трудности при общении”, которое и будет модальным. Таким образом, мода равна – 253.

    Важное значение при использовании в психолого-педагогическом исследовании математических методов уделяется расчету дисперсии и среднеквадратических (стандартных) отклонений.

    Дисперсия равна среднему квадрату отклонений значения варианты от среднего значения. Она выступает как одна из характеристик индивидуальных результатов разброса значений исследуемой переменной (например, оценок учащихся) вокруг среднего значения. Вычисление дисперсии осуществляется путем определения: отклонения от среднего значения; квадрата указанного отклонения; суммы квадратов отклонения и среднего значения квадрата отклонения (см. табл. 6.1).

    Значение дисперсии используется в различных статистических расчетах, но не имеет непосредственного наблюдаемого характера. Величиной, непосредственно связанной с содержанием наблюдаемой переменной, является среднее квадратическое отклонение.

    Таблица 6.1

    Пример вычисления дисперсии

    Значение

    показателя

    Отклонение

    от среднего

    отклонения

    2 – 3 = – 1

    Среднее квадратичное отклонение подтверждает типичность и показательность средней арифметической, отражает меру колебания численных значений признаков, из которых выводится средняя величина. Оно равно корню квадратному из дисперсии и определяется по формуле:

    где: – средняя квадратическая. При малом числе наблюдения (действий) – менее 100 – в значении формулы следует ставить не “N”, а “N – 1”.

    Средняя арифметическая и средняя квадратическая являются основны­ми характеристиками полученных результатов в ходе исследования. Они позволяют обобщить данные, сравнить их, установить преимущества одной психолого-педагогической системы (программы) над другой.

    Среднее квадратическое (стандартное) отклонение широко применяется как мера разброса для различных характеристик.

    Оценивая результаты исследования важно определить рассеивание случайной величины около среднего значения. Это рассеивание описывается с помощью закона Гауса (закона нормального распределения вероятности случайной величины). Суть закона заключается в том, что при измерении некоторого признака в данной совокупности элементов всегда имеют место отклонения в обе стороны от нормы вследствие множества неконтролируемых причин, при этом, чем больше отклонения, тем реже они встречаются.

    При дальнейшей обработке данных могут быть выявлены: коэффициент вариации (устойчивости) исследуемого явления, представляющий собой процентное отношение среднеквадратического отклонения к средней ариф­метической; мера косости , показывающая, в какую сторону направлено преимущественное число отклонений; мера крутости , которая показывает степень скопления значений случайной величины около среднего и др. Все эти статистические данные помогают более полно выявить признаки изучаемых явлений.

    Меры связи между переменными. Связи (зависимости) между двумя и более переменными в статистике называют корреляцией. Она оценивается с помощью значения коэффициента корреляции, который является мерой степени и величины этой связи.

    Коэффициентов корреляции много. Рассмотрим лишь часть из них, которые учитывают наличие линейной связи между переменными. Их выбор зависит от шкал измерения переменных, зависимость между которыми необходимо оценить. Наиболее часто в психологии и педагогике применяются коэффициенты Пирсона и Спирмена.

    Рассмотрим вычисление значений коэффициентов корреляции на конкретных примерах.

    Пример 1. Пусть две сравниваемые переменные X (семейное положение) и Y (исключение из университета) измеряются в дихотомической шкале (частный случай шкалы наименований). Для определения связи используем коэффициент Пирсона.

    В тех случаях, когда нет необходимости подсчитывать частоту появления различных значений переменных X и Y, удобно проводить вычисления коэффициента корреляции с помощью таблицы сопряженности (см. табл. 6.2, 6.3, 6.4), показывающей количество совместных появлений пар значений по двум переменным (признакам). А – количество случаев, когда переменная X имеет значение равное нулю, и, одновременно переменная Y имеет значение равное единице; В – количество случаев, когда переменные X и Y имеют одновременно значения, равные единице; С – количество случаев, когда переменные X и Y имеют одновременно значения равные нулю; D – количество случаев, когда переменная X имеет значение, равное единице, и, одновременно, переменная Y имеет значение, равное нулю.

    Таблица 6.2

    Общая таблица сопряженности

    Признак X

    В общем виде формула коэффициента корреляции Пирсона для дихотомических данных имеет вид

    Таблица 6.3

    Пример данных в дихотомической шкале

    Подставим в формулу данные из таблицы сопряженности (см. табл. 6.4), соответствующей рассматриваемому примеру:

    Таким образом, коэффициент корреляции Пирсона для выбранного примера равен 0,32, то есть зависимость между семейным положением студентов и фактами исключения из университета незначительная.

    Пример 2. Если обе переменные измеряются в шкалах порядка, то в качестве меры связи используется коэффициент ранговой корреляции Спирмена (Rs). Он вычисляется по формуле

    где Rs – коэффициент ранговой корреляции Спирмена; Di – разность рангов сравниваемых объектов; N – количество сравниваемых объектов.

    Значение коэффициента Спирмена изменяется в пределах от –1 да + 1. В первом случае между анализируемыми переменными существует однозначная, но противоположено направленная связь (с увеличением значений одной уменьшается значения другой). Во втором – с ростом значений одной переменной пропорционально возрастает значение второй переменной. Если величина Rs равна нулю или имеет значение, близкое к нему, то значимая связь между переменными отсутствует.

    В качестве примера вычисления коэффициента Спирмена используем данные из таблицы 6.5.

    Таблица 6.5

    Данные и промежуточные результаты вычисления значения коэффициента

    ранговой корреляции Rs

    Качества

    Ранги, присвоенные экспертом

    Разность рангов

    Квадрат разности рангов

    –1
    –1
    –1

    Сумма квадратов разностей рангов Di = 22

    Подставим данные примера в формулу для коэффициента Смирмена:

    Результаты вычисления позволяют утверждать о наличии достаточно выраженной связи между рассматриваемыми переменными.

    Статистическая проверка научной гипотезы. Доказательство статистической достоверности экспериментального влияния существенно отличается от доказательства в математике и формальной логике, где выводы носят более универсальный характер: статистические доказательства не являются столь строгими и окончательными – в них всегда допускается риск ошибиться в выводах и потому статистическими методами не доказывается окончательно правомерность того или иного вывода, а показывается мера правдоподобности принятия той или иной гипотезы.

    Педагогическая гипотеза (научное предположение о преимуществе того или иного метода и т. п.) в процессе статистического анализа переводится на язык статистической науки и заново формулируется, по меньшей мере, в виде двух статистических гипотез. Первая (основная) называется нулевой гипотезой (Н 0), в которой исследователь говорит о своей исходной позиции. Он (априори) как бы декларирует, что новый (предполагаемый им, его коллегами или оппонентами) метод не обладает какими-либо преимуществами, и потому с самого начала исследователь психологически готов занять честную научную позицию: различия между новым и старым методами объявляются равными нулю. В другой, альтернативной гипотезе (Н 1) делается предположение о преимуществе нового метода. Иногда выдвигается несколько альтернативных гипотез с соответствующими обозначениями.

    Например, гипотеза о преимуществе старого метода (H 2). Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в случаях, когда различия, скажем, в средних арифметических экспериментальной и контрольной групп настолько значимы (статистически достоверны), что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода:

    – первый уровень – 5% (в научных текстах пишут иногда р = 5% или а?0,05, если представлено в долях), где допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;

    – второй уровень – 1%, т. е. соответственно допускается риск ошибиться только в одном случае из ста (а?0,01, при тех же требованиях);

    – третий уровень – 0,1%, т. е. допускается риск ошибиться только в одном случае из тысячи (а?0,001). Последний уровень значимости предъявляет очень высокие требования к обоснованию достоверности результатов эксперимента и потому редко используется.

    При сравнении средних арифметических экспериментальной и контрольной групп важно не только определить, какая средняя больше, но и насколько больше. Чем меньше разница между ними, тем более приемлемой окажется нулевая гипотеза об отсутствии статистически значимых (достоверных) различий. В отличие от мышления на уровне обыденного сознания, склонного воспринимать полученную в результате опыта разность средних как факт и основание для вывода, педагог-исследователь, знакомый с логикой статистического вывода, не будет торопиться в таких случаях. Он скорее всего сделает предположение о случайности различий, выдвинет нулевую гипотезу об отсутствии достоверных различий в результатах экспериментальной и контрольной групп и лишь после опровержения нулевой гипотезы примет альтернативную.

    Таким образом, вопрос о различиях в рамках научного мышления переводится в другую плоскость. Дело не только в различиях (они почти всегда есть), а в величине этих различий и отсюда – в определении той разницы и границы, после которого можно сказать: да, различия неслучайны, они статистически достоверны, а значит, испытуемые этих двух групп принадлежат после эксперимента уже не к одной (как раньше), а к двум различным генеральным совокупностям и что уровень подготовленности учащихся, потенциально принадлежащих этим совокупностям, будет существенно отличаться. Для того чтобы показать границы этих различий, используются так называемые оценки генеральных параметров .

    Рассмотрим на конкретном примере (см. табл. 6.6), как с помощью математической статистики можно опровергнуть или подтвердить нулевую гипотезу.

    Допустим, необходимо определить зависит ли эффективность групповой деятельности студентов от уровня развития в учебной группе межличностных отношений. В качестве нулевой гипотезы выдвигается предположение, что такой зависимости не существует, а в качестве альтернативной – зависимость существует. Для этих целей сравниваются результаты эффективности деятельности в двух группах, одна из которых в этом случае выступает в качестве экспериментальной, а вторая – контрольной. Чтобы определить, является ли разность между средними значениями показателей эффективности в первой и во второй группе существенной (значимой), необходимо вычислить статистическую достоверность этой разницы. Для этого можно использовать t – критерий Стьюдента. Он вычисляется по формуле:

    где X 1 и X 2 – среднее арифметическое значение переменных в группах 1 и 2; М 1 и М 2 – величины средних ошибок, которые вычисляются по формуле:

    где - средняя квадратическая, вычисляемая по формуле (2).

    Определим ошибки для первого ряда (экспериментальная группа) и второго ряда (контрольная группа):

    Находим значение t – критерия по формуле:

    Вычислив величину t – критерия, требуется по специальной таблице определить уровень статистической значимости различий между средними показателями эффективности деятельности в экспериментальной и контрольной группах. Чем выше значение t – критерия, тем выше значимость различий.

    Для этого t расчетное сравниваем с t табличным. Табличное значение выбирается с учетом выбранного уровня достоверности (p = 0,05 или p = 0,01), а также в зависимости от числа степеней свободы, которое находится по формуле:

    где U – число степеней свободы; N 1 и N 2 – число замеров в первом и во втором рядах. В нашем примере U = 7 + 7 –2 = 12.

    Таблица 6.6

    Данные и промежуточные результаты вычисления значимости статистических

    Различий средних значений

    Экспериментальная группа

    Контрольная группа

    Значение эффек-тивности деятельности

    Для таблицы t – критерия находим, что значение t табл. = 3,055 для однопроцентного уровня (p

    Однако педагогу-исследователю следует помнить, что существование статистической значимости разности средних значений является важным, но не единственным аргументом в пользу наличия или отсутствия связи (зависимости) между явлениями или переменными. Поэтому необходимо привлекать и другие аргументы количественного или содержательного обоснования возможной связи.

    Многомерные методы анализа данных. Анализ взаимосвязи между большим количеством переменных осуществляется путем использования многомерных методов статистической обработки. Цель применения подобных методов – сделать наглядными скрытые закономерности, выделить наиболее существенные взаимосвязи между переменными. Примерами таких многомерных статистических методов являются:

      – факторный анализ;

      – кластерный анализ;

      – дисперсионный анализ;

      – регрессионный анализ;

      – латентно-структурный анализ;

      – многомерное шкалирование и другие.

    Факторный анализ заключается в выявлении и интерпретации факторов. Фактор – обобщенная переменная, которая позволяет свернуть часть информации, т. е. представить ее в удобообозримом виде. Например, факторная теория личности выделяет ряд обобщенных характеристик поведения, которые в данном случае называются чертами личности.

    Кластерный анализ позволяет выделить ведущий признак и иерархию взаимосвязей признаков.

    Дисперсионный анализ – статистический метод, используемый для изучения одной или нескольких одновременно действующих и независимых переменных на изменчивость наблюдаемого признака. Его особенность состоит в том, что наблюдаемый признак может быть только количественным, в тоже время объясняющие признаки могут быть как количественными, так и качественными.

    Регрессионный анализ позволяет выявить количественную (численную) зависимость среднего значения изменений результативного признака (объясняемой) от изменений одного или нескольких признаков (объясняющих переменных). Как правило данный вид анализа применяется тогда, когда требуется выяснить насколько изменяется средняя величина одного признака при изменении на единицу другого признака.

    Латентно-структурный анализ представляет совокупность аналитико-статистических процедур выявления скрытых переменных (признаков), а также внутренней структуры связей между ними. Он дает возможность исследовать проявления сложных взаимосвязей непосредственно ненаблюдаемых характеристик социально-психологических и педагогических явлений. Латентный анализ может являться основой для моделирования указанных взаимосвязей.

    Многомерное шкалирование обеспечивает наглядную оценку сходства или различия между некоторыми объектами, описываемыми большим количеством разнообразных переменных. Эти различия представляются в виде расстояния между оцениваемыми объектами в многомерном пространстве.

    3. Статистическая обработка результатов психолого-педагогических

    исследований

    В любом исследовании всегда важно обеспечить массовость и предста­вительность (репрезентативность) объектов изучения. Для решения этого вопроса обычно прибегают к математическим методам расчета минимальной величины подлежащих исследованию объектов (групп респондентов), чтобы на этом основании можно было сделать объ­ективные выводы.

    По степени полноты охвата первичных единиц статистика делит исс­ледования на сплошные, когда изучаются все единицы изучаемого явления, и выборочные, если изучению подвергается только часть интересующей со­вокупности, взятая по какому-либо признаку. Исследователю не всегда представляется возможность изучить всю совокупность явлений, хотя к этому постоянно следует стремиться (не хватает времени, средств, необ­ходимых условий и т. д.); с другой стороны, часто сплошное исследование просто не требуется, так как выводы будут достаточно точными после изучения определенной части первичных единиц.

    Теоретической основой выборочного способа исследования является теория вероятностей и закон больших чисел. Чтобы исследование распола­гало достаточным количеством фактов, наблюдений, используют таблицу достаточно больших чисел. От исследователя в данном случае требуется установление величины вероятности и величины допускаемой ошибки. Пусть, например, допускаемая ошибка в выводах, которые должны быть сделаны в результате наблюдений, по сравнению с теоретическими предпо­ложениями, не должна превышать 0,05 как в положительную, так и в отри­цательную стороны (иначе говоря, мы можем ошибиться не более чем в 5 случаев из 100). Тогда по таблице достаточно больших чисел (см. табл. 6.7) находим, что правильное заключение может быть высказано в 9 случа­ев из 10 тогда, когда число наблюдений будет не менее 270, в 99 случа­ев из 100 при наличии не менее 663 наблюдений и т. д. Значит, с увели­чением точности и вероятности, с которой мы предполагаем сделать выво­ды, число требуемых наблюдений возрастает. Однако в психолого-педагогическом исследовании оно не должно быть чрезмерно большим. 300–500 наблюдений часто является вполне достаточным для основательных выводов.

    Данный способ определения величины выборки является наиболее простым. Математическая статистика располагает и более сложными мето­дами вычисления требуемых выборочных совокупностей, которые подробно освещены в специальной литературе.

    Однако соблюдение требований массовости еще не обеспечивает на­дежности выводов. Они будут достоверны тогда, когда выбранные для наб­людения (бесед, эксперимента и т. д.) единицы являются достаточно представительными для изучаемого класса явлений.

    Таблица 6.7

    Краткая таблица достаточно больших чисел

    Величина

    вероятности

    Допустимая

    Репрезентативность единиц наблюдения обеспечивается прежде всего их случайным выбором с помощью таблиц случайных чисел. Положим, требу­ется определить 20 учебных групп для проведения массового эксперимента из имеющихся 200. Для этого составляется список всех групп, который нумеруется. Затем из таблицы случайных чисел выписывается 20 номеров, начиная с какого-либо числа, через определенный интервал. Эти 20 случайных чисел по соблюдению номеров определяют те группы, которые нужны исследователю. Случайный выбор объектов из общей (гене­ральной) совокупности дает основание утверждать, что полученные при исследовании выборочной совокупности единиц результаты не будут резко отличаться от тех, которые имелись бы в случае исследования всей сово­купности единиц.

    В практике психолого-педагогических исследований применяются не только простые случайные отборы, но и более сложные методы отбора: расслоенный случайный отбор, многоступенчатый отбор и др.

    Математические и статистические методы исследования являются так­же средствами получения нового фактического материала. С этой целью используются приемы шаблонирования, повышающие информативную емкость анкетного вопроса и шкалирования, дающего возможность более точно оце­нивать действия как исследователя, так и исследуемых.

    Шкалы возникли из-за необходимости объективно и точно диагности­ровать и измерять интенсивность определенных психолого-педагогических явлений. Шкалирование дает возможность упорядочить явления, количественно оце­нить каждое из них, определить низшую и высшую ступени исследуемого явления.

    Так при исследовании познавательных интересов слушателей можно установить их границы: очень большой интерес – очень слабый интерес. Между этими границами ввести ряд ступеней, создающих шкалу познаватель­ных интересов: очень большой интерес (1); большой интерес (2); средний (3); слабый (4); очень слабый (5).

    В психолого-педагогических исследованиях используются шкалы разных видов, например,

    а) Трехмерная шкала

    Очень активный……..…………..10

    Активный…………………………5

    Пассивный…...…………………...0

    б) Многомерная шкала

    Очень активный…………………..8

    Среднеактивный………………….6

    Не слишком активный…………...4

    Пассивный………………………..2

    Полностью пассивный…………...0

    в) Двусторонняя шкала.

    Очень интересуется……………..10

    Достаточно интересуется………...5

    Равнодушен……………………….0

    Не интересуется…………………..5

    Совершенно нет интереса………10

    Числовые оценочные шкалы дают каждому пункту определенное число­вое обозначение. Так, при анализе отношения студентов к учебе, их настойчивости в работе, готовности к сотрудничеству и т.п. можно сос­тавить числовую шкалу на основе таких показателей: 1 – неудовлетвори­тельно; 2 – слабо; 3 – средне; 4 – выше среднего, 5 – намного выше среднего. В таком случае шкала приобретает следующий вид (см. табл. 6.8):

    Таблица 6.8

    Если числовая шкала биполярна, используется биполярная упорядо­ченность с нулевой величиной в центре:

    Дисциплинированность Недисциплинированность

    Ярко выраженная 5 4 3 2 1 0 1 2 3 4 5 Не ярко выраженная

    Оценочные шкалы могут быть изображены графически. В этом случае они выражают категории в наглядной форме. При этом каждое деление (ступень) шкалы характеризуется вербально.

    Рассматриваемые методы играют большую роль в анализе и обобще­нии полученных данных. Они позволяют установить различные соотношения, корреляции между фактами, выявить тенденции в развитии психолого-педагогических явлений. Так, теория группировок математической статистики помогает определить, какие факты из собранного эмпирического материала сопоста­вимы, по какому основанию их правильно сгруппировать, какой степени достоверности они будут. Все это позволяет избежать произвольных мани­пуляций с фактами и определить программу их обработки. В зависимости от целей и задач обычно применяют три вида группировок: типологичес­кую, вариационную и аналитическую.

    Типологическая группировка используется, когда необходимо разбить полученный фактический материал на качественно однородные единицы (распределение количества нарушений дисциплины между различными категориями студентов, разбивка показателей выполнения ими физических упражнений по годам учебы и т.п.).

    В случае необходимости сгруппировать материал по величине како­го-либо изменяющегося (варьирующего) признака – разбивка групп обучающихся по уровню успеваемости, по процентам выполнения заданий, однотип­ным нарушениям установленного порядка и т.п. – применяется вариацион­ная группировка , дающая возможность последовательно судить о структуре изучаемого явления.

    Аналитический вид группировки помогает устанавливать взаимосвязь между изучаемыми явлениями (зависимость степени подготовки студентов от различных методов обучения, качества выполняемых заданий от темпе­рамента, способностей и т.д.), их взаимозависимость и вза­имообусловленность в точном исчислении.

    Насколько важна работа исследователя по группировке собранных данных, свидетельствует тот факт, что ошибки в этой работе обесценива­ют самую исчерпывающую и содержательную информацию.

    В настоящее время математические основы группировки, типоло­гии, классификации получили наиболее глубокое развитие в социологии. Современные подходы и методы типологии и классификации в социологичес­ких исследованиях могут быть с успехом применены в психологии и педагогике.

    В ходе исследования используются приемы итогового обобщения дан­ных. Одним из них является прием составления и изучения таблиц.

    При составлении сводки данных относительно одной статистической величины образуется ряд распределения (вариационный ряд) значения этой величины. Примером такого ряда (см. табл. 6.9) может служить сводка данных относительно окружности груди 500 лиц.

    Таблица 6.9

    Сводка данных одновременно по двум и более статистическим величи­нам предполагает составление таблицы распределения, раскрывающей расп­ределение значений одной статической величины в соответствии со значе­ниями, которые принимают другие величины.

    В качестве иллюстрации при­водится таблица 6.10, составленная на основании статистических данных от­носительно окружности груди и веса этих людей.

    Таблица 6.10

    Окружность груди в см

    Таблица распределения дает представление о соотношении и связи, существующих между двумя величинами, а именно: при малом весе частоты располагаются в верхней левой четверти таблицы, что указывает на пре­обладание лиц с малой окружностью груди. По мере увеличения веса до среднего значения распределение частот передвигается в центр таблички. Это указывает, что люди, вес которых ближе к среднему, имеют окруж­ность груди, также близкую к среднему значению. При дальнейшем увели­чении веса частоты начинают занимать правую нижнюю четверть таблички. Это свидетельствует о том, что у человека с весом более среднего ок­ружность груди также выше среднего объема.

    Из таблицы следует, что установленная связь не строгая (функцио­нальная), а вероятностная, когда с изменениями значений одной величины другая изменяется как тенденция, без жесткой однозначной зависимости. Подобные связи и зависимости часто встречаются в психологии и педагогике. В настоя­щее время они выражаются обычно с помощью корреляционного и регрессивного анализа.

    Вариационные ряды и таблицы дают представление о статике явления, динамику же могут показать ряды развития, где первая строка содержит последовательные этапы или промежутки времени, а вторая – полученные на этих этапах значения изучаемой статистической величины. Так выявля­ются возрастание, убывание или периодические изменения изучаемого яв­ления, вскрываются его тенденции, закономерности.

    Таблицы могут заполняться абсолютными величинами, или сводными цифрами (средними, относительными). Результаты статистической работы – помимо таблиц часто изображаются графически в виде диаграмм, фигур и т. д. Основными способами графического изображения статистических вели­чин являются: способ точек, способ прямых и способ прямоугольников. Они просты и доступны каждому исследователю. Техника их использования – проведение осей координат, установление масштаба, и выписка обозна­чения отрезков (точек) на горизонтальных и вертикальной осях.

    Диаграммы, изображающие ряды распределения значений одной статис­тической величины, позволяют составить кривые распределения.

    Графическое изображение двух (и более) статистических величин да­ет возможность образовать некоторую кривую поверхность, называемую по­верхностью распределения. Ряд развития при графическом исполнении об­разуют кривые развития.

    Графическое изображение статистического материала позволяет глуб­же проникнуть в смысл цифровых величин, уловить их взаимозависимости и черты изучаемого явления, которые трудно заметить в таблице. Исследо­ватель освобождается от той работы, которую он вынужден был бы проде­лать, чтобы разобраться с обилием цифр.

    Таблицы и графики – важные, но только первые шаги в исследовании статистических величин. Основным же методом является аналитический, оперирующий математическими формулами, с помощью которых выводятся так называемые “обобщающие показатели”, то есть абсолютные величины, при­веденные в сравнимый вид (относительные и средние величины, балансы и индексы). Так, с помощью относительных величин (процентов) определяют­ся качественные особенности анализируемых совокупностей (например, отношение отличников к общему числу студентов; числа ошибок при работе на сложной аппаратуре, вызванных психической неус­тойчивостью обучающихся, к общему числу ошибок и т.п.). То есть выявля­ются отношения: части к целому (удельный вес), слагаемых к сумме (структура совокупности), одной части совокупности к другой ее части; характеризующие динамику каких-либо изменений во времени и др.

    Как видно, даже самое общее представление о методах статистичес­кого исчисления говорит о том, что эти методы располагают большими возможностями в анализе и обработке эмпирического материала. Разумеет­ся, математический аппарат может бесстрастно обработать все, что в не­го вложит исследователь и достоверные данные, и субъективные домыслы. Вот почему совершенное владение математическим аппаратом обработки на­копленного эмпирического материала в единстве с доскональным знанием качественных характеристик исследуемого явления является необходимым для каждого исследователя. Только в этом случае возможен отбор качест­венного, объективного фактического материала, его квалифицированная об­работка и получение достоверных итоговых данных.

    Такова краткая характеристика наиболее часто применяемых методов исследования проблем психологии и педагогики. Следует подчеркнуть, что ни один из рассмотренных методов, взятый сам по себе, не может претендовать на универсальность, на полную гарантию объективности получаемых данных. Так, элементы субъективизма в ответах, полученных путем опроса респондентов, очевидны. Результаты наблюдений, как правило, не свободны от субъективных оценок самого исследователя. Данные, взятые из различной документации, требуют одновременно проверки достоверности этой доку­ментации (особенно личных документов, документов из “вторых рук” и т.д.).

    Поэтому каждому исследователю следует стремиться, с одной сторо­ны, к совершенствованию техники применения любого конкретного метода, а с другой – к комплексному, взаимоконтролирующему использованию раз­ных методов для изучения одной и той же проблемы. Владение всей систе­мой методов дает возможность разработать рациональную методику иссле­дования, четко организовать и провести его, получить существенные тео­ретические и практические результаты.

      Использованная литература.

      Шевандрин Н.И. Социальная психология в образовании: Учебное пособие. Ч.1. Концептуальные и прикладные основы социальной психологии. – М.: ВЛАДОС, 1995.

    2. Давыдов В.П. Основы методологии, методики и технологии педагогического исследования: Научно-методическое пособие. – М.: Академия ФСБ, 1997.

    error: