Скачать 0.52 Mb.
|
Виды квантилей. 090309-matmetody.txt Разбиение числовой оси на равные интервалы называется квантованием, а полученные интервалы - интервалами квантования. Например, возраст - мы измеряем интервалом, равным одному году. Ряд различных психологических явлений мы измеряем квантованием. Есть ещё некоторые показатели, которые так или иначе делят выборку. Квантили - такие значения случайной величины, которые делят распределения на равные части. Их существует несколько видов. 1. Квартили - делят выборку на четыре равные части - по 25% на каждую часть. 2. Квинтили - делять выборку на 5 равных частей - по 20% на каждую часть. 3. Децили - делят выборку на 9 частей, то есть, девять децилей делят выборку на десять равных частей по 10% на каждую часть. 4. Процентили - 99 процентилей делят выборку на 100 равных частей по 1%. Процентили нельзя путать с процентами. Процентные показатели - это первичные показатели, которые определяют, например, количество правильно выполненных заданий. А процентиль - показатель производный, указывающий да долю от общего числа членов группы. с. 36 (43) Помимо мер центральной тенденции в психологии широко используются меры положения, которые называются квантилями распределения. Квантиль — это точка на числовой оси измеренного признака, которая делит всю совокупность упорядоченных измерений на две группы с известным соотношением их численности. С одним из квантилей мы уже знакомы — это медиана. Это значение признака, которое делит всю совокупность измерений на две группы с равной численностью. Кроме медианы часто используются про-центили и квартили. Процентили (Percentiles) — это 99 точек — значений признака (Ри ..., Р99), которые делят упорядоченное (по возрастанию) множество наблюдений на 100 частей, равных по численности. Определение конкретного значения про-центиля аналогично определению медианы. Например, при определении 10-го процентиля, Р10, сначала все значения признака упорядочиваются по возрастанию. Затем отсчитывается 10% испытуемых, имеющих наименьшую выраженность признака. Р]а будет соответствовать тому значению признака, который отделяет эти 10% испытуемых от остальных 90%. Квартили (Quartiles) — это 3 точки — значения признака (P2i, Pi0, P75), которые делят упорядоченное (по возрастанию) множество наблюдений на 4 равные по численности части. Первый квартиль соответствует 25-му проценти-лю, второй — 50-му процентилю или медиане, третий квартиль соответствует 75-му процентилю. Процентили и квартили используются для определения частоты встречаемости тех или иных значений (или интервалов) измеренного признака или для выделения подгрупп и отдельных испытуемых, наиболее типичных или нетипичных для данного множества наблюдений.
090309-matmetody.txt Характеристики рассеивания. К ним относятся: 1. Размах - это разность между максимальным и минимальным значением величины. (формула рис. 4 в тетради). 2. Дисперсия - характеризует разброс случайной величины вокруг среднего арифметического значения, то есть, насколько плотно значения случайной величины группируются вокруг среднего арифметического значения. Дисперсия обозначается буквой сигма и имеет квадратную размерность (формула на рис. 5 в тетради). Следует отличать теоретическую (генеральную) дисперсию и выборочную (эмпирическую). Первая формула указана для теоретической дисперсии (где просто N) для вычисления дисперсии во всей генеральной совокупности. Вторая формула - эмпирической дисперсии, которая и будет использоваться для вычислений (где N-1). 3. Стандартное отклонение (или среднеквадратическое) - положительная число квадратного корня из дисперсии. (рис 6) 4. Коэффициент вариаций - не имеет размерности и служит для сравнения вариативности, то есть, для изменчивости случайных величин, имеющих различную природу. Обозначается буквой V и считается по формуле (рис 7). Если коеффициент вариаций менее 40%, то говорят о низкой изменчивости признака. с. 36 (44) Меры центральной тенденции отражают уровень выраженности измеренного признака. Однако не менее важной характеристикой является выраженность индивидуальных различий испытуемых по измеренному признаку. Меры изменчивости (Dispersion) применяются в психологии для численного выражения величины межиндивидуальной вариации признака. Наиболее простой и очевидной мерой изменчивости является размах, указывающий на диапазон изменчивости значений. Размах (Range) — это просто разность максимального и минимального значений: Ясно, что это очень неустойчивая мера изменчивости, на которую влияют любые возможные «выбросы». Более устойчивыми являются разновидности размаха: размах от 10 до 90-го процентиля (Р90 — Р10) или междуквартильный размах (Р75 — P2s)- Последние две меры изменчивости находят свое применение для описания вариации в порядковых данных. А для метрических данных используется дисперсия — величина, название которой в науке является синонимом изменчивости. Дисперсия (Variance) — мера изменчивости для метрических данных, пропорциональная сумме квадратов отклонений измеренных значений от их арифметического среднего: Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии. Величина дисперсии получается при усреднении всех квадратов отклонении: Следует отличать теоретическую (генеральную) дисперсию — меру изменчивости бесконечного числа измерений (в генеральной совокупности, популяции в целом) и эмпирическую, или выборочную, дисперсию — для реально измеренного множества значений признака. Выборочное значение в статистике используется для оценки дисперсии в генеральной совокупности. Выше указана формула для генеральной (теоретической) дисперсии (Dx), которая, понятно, не вычисляется. Для вычислений используется формула выборочной (эмпирической) дисперсии (Dx), отличающаяся знаменателем: Стандартное отклонение (сигма, среднеквадратическое отклонение) - положительное значение квадратного корня из дисперсии: ![]() На практике чаще используется именно стандартное отклонение, а не дисперсия. Это связано с тем, что сигма выражает изменчивость в исходных единицах измерения признака, а дисперсия — в квадратах исходных единиц. Свойства дисперсии:
Прибавление константы к каждому значению переменной сдвигает график распределения этой переменной на эту константу (меняется среднее), но изменчивость (дисперсия) при этом остается неизменной. 3. Умножение каждого значения переменной на константу с изменяет дисперсию в с2 раз: ![]() При объединении двух выборок с одинаковой дисперсией, но с разными средними значениями дисперсия увеличивается.
090309-matmetody.txt Характеристики ассиметрии. Основная мера ассиметрии - это коэффициент ассиметрии. То есть, степерь отклонения графика распределения частот от симметричного вида относительно среднего значения. Обозначается буквой A с индексом s и считается по формуле (рис 8). Коэффициент ассиметрии изменяется от минус бесконечности до плюс бесконечности. Ассиметрия бывает левосторонняя (положительная), когда коэффициент больше нуля - As>0 и правосторонняя (отрицательная) - As<0. При левосторонней ассиметрии чаще встречаются значения ниже среднего арифметического. При правой, соответственно чаще всего встречаются значения, превосходящие среднее арифметическое. Для симметричных распределений коэффициент ассиметрии равен нулю, а мода, медиана и среднее арифметическое значение совпадают между собой. Характеристики эксцесса. Характеризует его коэффициент эксцесса (или островершинности) - рассчитывается по формуле. Островершинное распределение характеризуется положительным эксцессом, плосковершинное - отрицательным, средневершинное имеет нулевой эксцесс. с. 52 (59) Для проверки нормальности используются различные процедуры, позволяющие выяснить, отличается ли от нормального выборочное распределение измеренной переменной. Необходимость такого сопоставления возникает, когда мы сомневаемся в том, в какой шкале представлен признак — в порядковой или метрической. А сомнения такие возникают очень часто, так как заранее нам, как правило, не известно, в какой шкале удастся измерить изучаемое свойство (исключая, конечно, случаи явно номинативного измерения). Важность определения того, в какой шкале измерен признак, трудно переоценить, по крайней мере, по двум причинам. От этого зависит, во-первых, полнота учета исходной эмпирической информации (в частности, об индивидуальных различиях), во-вторых, доступность многих методов анализа данных. Если исследователь принимает решение об измерении в порядковой шкале, то неизбежное последующее ранжирование ведет к потере части исходной информации о различиях между испытуемыми, изучаемыми группами, о взаимосвязях между признаками и т. д. Кроме того, метрические данные позволяют использовать значительно более широкий набор методов анализа и, как следствие, сделать выводы исследования более глубокими и содержательными. Наиболее весомым аргументом в пользу того, что признак измерен в метрической шкале, является соответствие выборочного распределения нормальному. Это является следствием закона нормального распределения. Если выборочное распределение не отличается от нормального, то это значит, что измеряемое свойство удалось отразить в метрической шкале (обычно — интервальной). Существует множество различных способов проверки нормальности, из которых мы кратко опишем лишь некоторые, предполагая, что эти проверки читатель будет производить при помощи компьютерных программ. Графический способ (Q-Q Plots, Р-Р Plots). Строят либо квантильные графики, либо графики накопленных частот. Критерии асимметрии и эксцесса. Эти критерии определяют допустимую степень отклонения эмпирических значений асимметрии и эксцесса от нулевых значений, соответствующих нормальному распределению. Допустимая степень отклонения — та, которая позволяет считать, что эти статистики существенно не отличаются от нормальных параметров. Величина допустимых отклонений определяется так называемыми стандартными ошибками асимметрии и эксцесса. Для формулы асимметрии (4.10) стандартная ошибка определяются по формуле: ![]() где N — объем выборки. Выборочные значения асимметрии и эксцесса значительно отличаются от нуля, если не превышают значения своих стандартных ошибок. Это можно считать признаком соответствия выборочного распределения нормальному закону. Следует отметить, что компьютерные программы вычисляют показатели асимметрии, эксцесса и соответствующие им стандартные ошибки по другим, более сложным формулам.
090309-matmetody.txt Нормальное распределение. Нормальное распределение характеризуется тем, что крайние значения признаков встречаются относительно редко, близкие к среднему арифметическому - относительно часто. Кривая нормального распределения имеет колокообразную форму. Это одномодальное распределение, значения медианы, моды и среднего арифметического которого совпадают между собой, коэффициенты ассиметрии и эксцесса лежат в промежутке от нуля до двух (допустимое), но в идеале равны нулю. с. 44 (51) Начиная со второй половины XIX столетия измерительные и вычислительные методы в психологии разрабатываются на основе следующего принципа. Если индивидуальная изменчивость некоторого свойства есть следствие действия множества причин, то распределение частот для всего многообразия проявлений этого свойства в генеральной совокупности соответствует кривой нормального распределения. Это и есть закон нормального распределения. Закон нормального распределения имеет целый ряд очень важных следствий, к которым мы не раз еще будем обращаться. Сейчас же отметим, что если при изучении некоторого свойства мы произвели его измерение на выборке испытуемых и получили отличающееся от нормального распределение, то это значит, что либо выборка нерепрезентативна генеральной совокупности, либо измерения произведены не в шкале равных интервалов. К ![]() Рис 5.3. Семейство нормальных кривых, 1-е распределение отличается от 2-го стандартным отклонением (σ1< σ2), 2-е от 3-го средним арифметическим (M2< M3) Все многообразие нормальных распределений может быть сведено к одной кривой, если применить ^-преобразование (по формуле 4.8) ко всем возможным измерениям свойств. Тогда каждое свойство будет иметь среднее 0 и стандартное отклонение 1. На рис. 5.4 построен график нормального распределения для М= 0 и а = 1. Это и есть единичное нормальное распределение, которое используется как стандарт — эталон. Рассмотрим его важные свойства.
Последнее свойство объясняет название единичное нормальное распределение и имеет исключительно важное значение. Благодаря этому свойству площадь под кривой интерпретируется как вероятность, или относительная частота. Действительно, вся площадь под кривой соответствует вероятности того, что признак примет любое значение из всего диапазона его изменчивости (от -оо до +оо). Площадь под единичной нормальной кривой слева или справа от нулевой точки равна 0,5. Это соответствует тому, что половина генеральной совокупности имеет значение признака больше 0, а половина — меньше 0. Относительная частота встречаемости в генеральной совокупности значений признака в диапазоне от Z\ до Zi равна площади под кривой, лежащей между соответствующими точками. Отметим еще раз, что любое нормальное распределение может быть сведено к единичному нормальному распределению путем z-преобразования. Итак, наиболее важным общим свойством разных кривых нормального распределения является одинаковая доля площади под кривой между одними и теми же двумя значениями признака, выраженными в единицах стандартного отклонения. Полезно помнить, что для любого нормального распределения существуют следующие соответствия между диапазонами значений и площадью под кривой: Единичное нормальное распределение устанавливает четкую взаимосвязь стандартного отклонения и относительного количества случаев в генеральной совокупности для любого нормального распределения. Например, зная свойства единичного нормального распределения, мы можем ответить на следующие вопросы. Какая доля генеральной совокупности имеет выраженность свойства от — \о до +1о? Или какова вероятность того, что случайно выбранный представитель генеральной совокупности будет иметь выраженность свойства, на За превышающую среднее значение? В первом случае ответом будет 68,26% всей генеральной совокупности, так как от — 1 до +1 содержится 0,6826 площади единичного нормального распределения. Во втором случае ответ: (100-99,72)/2 = 0,14%. Существует специальная таблица, позволяющая определять площадь под кривой справа от любого положительного z (приложение 1). Пользуясь ею, можно определить вероятность встречаемости значений признака из любого диапазона. Это широко используется при интерпретации данных тестирования. Несмотря на исходный постулат, в соответствии с которым свойства в генеральной совокупности имеют нормальное распределение, реальные данные, полученные на выборке, нечасто распределены нормально. Более того, разработано множество методов, позволяющих анализировать данные без всякого предположения о характере их распределения как в выборке, так и в генеральной совокупности. Эти обстоятельства иногда приводят к ложному убеждению, что нормальное распределение — пустая математическая абстракция, не имеющая отношения к психологии. Тем не менее, как мы увидим в дальнейшем, можно указать по крайней мере на три важных аспекта применения нормального распределения:
|
![]() | Вопросы к контрольной работе и экзамену по дисциплине «Международное частное право» 8 | ![]() | Вопросы к экзамену по дисциплине «Психология и педагогика» для студентов специальности 010503 «Математическое обеспечение и администрирование... |
![]() | Вопросы к экзамену по дисциплине «История психологии» для студентов педагогического факультета специальности «Практическая психология»... | ![]() | Содержатся рабочая программа курса теории государства и права, задания к семинарским занятиям, тесты, краткий словарь основных терминов,... |
![]() | Вопросы к зачету по дисциплине «Профессионально-этические основы социальной работы» 16 | ![]() | |
![]() | ![]() | Для допуска к экзамену студентам-задолжникам дневного отделения, не посещавшим занятия по дисциплине «Метрология, стандартизация,... | |
![]() | Вопросы к экзамену по дисциплине «Кормопроизводство с основами ботаники и агрономии» для студентов 2 и 3 курсов по специальности... | ![]() | Приложение. Задания для практических занятий и самостоятельной работы |