Книги
чёрным по белому
Главное меню
Главная О нас Добавить материал Поиск по сайту Карта книг Карта сайта
Книги
Археология Архитектура Бизнес Биология Ветеринария Военная промышленность География Геология Гороскоп Дизайн Журналы Инженерия Информационные ресурсы Искусство История Компьютерная литература Криптология Кулинария Культура Лингвистика Математика Медицина Менеджмент Металлургия Минералогия Музыка Научная литература Нумизматика Образование Охота Педагогика Политика Промышленные производства Психология Путеводители Религия Рыбалка Садоводство Саморазвитие Семиотика Социология Спорт Столярное дело Строительство Техника Туризм Фантастика Физика Футурология Химия Художественная литература Экология Экономика Электроника Энергетика Этика Юриспруденция
Новые книги
Цуканов Б.И. "Время в психике человека" (Медицина)

Суворов С. "Танк Т-64. Первенец танков 2-го поколения " (Военная промышленность)

Нестеров В.А. "Основы проэктирования ракет класса воздух- воздух и авиационных катапульных установок для них" (Военная промышленность)

Фогль Б. "101 вопрос, который задала бы ваша кошка своему ветеринару если бы умела говорить" (Ветеринария)

Яблоков Н.П. "Криминалистика" (Юриспруденция)
Реклама

Статистика: Курс лекций - Харченко Л.П.

Харченко Л.П. Статистика: Курс лекций — М.: ИНФРА-М, 2000. — 310 c.
ISBN 5-86225-382-3
Скачать (прямая ссылка): statistikakurslexiy2000.djvu
Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 109 >> Следующая

Величина дисперсии не зависит от начала отсчета, т. е. все индивидуальные значения признака можно увеличить или уменьшить на одно и то же число А. Это свойство очевидно, ибо с увеличением или уменьшением значений признака X аналогично изменяется и показатель среднего уровня.
Численное значение дисперсии зависит от масштаба измерения признака X. При увеличении (или уменьшении) всех значений признака в С раз показатель дисперсии нового, увеличенного (или уменьшенного) признака будет больше (или меньше) дисперсии прежнего значения признака в С2 раз, т. е. а2(Х-С) = с2а2(Х).
Если первичные данные сгруппировать, то дисперсия признака может быть определена как сумма так называемой межгрупповой дисперсии — С72м гр и среднего значения внутригрупповых — 82, т. е.
Вывести эту формулу несложно, если учесть, что межгруп повая дисперсия рассчитывается как
где к — количество групп, на которые разбита вся совокупность; т| — количество объектов, наблюдений, включенных в группу j; Xj — среднее значение признака по группе j;
X — общее среднее значение признака.
Среднее значение внутригрупповых дисперсий рассчитывается по формуле
<*2МГр + S2.
к
к
^2«rP = (5:(X)-X)2-m1)/Emi,
1=1
86
г
к
5* =
i=i
к
Lm|
i=i
1=1
1=1
где 82 =
- (X,)2.
m
m
Подставляя С72мгр и 82 в формулу сложения дисперсий, выходим на формулу расчета дисперсии методом моментов, что и подтверждает правило сложения дисперсий. Свойство сложения дисперсий используется для измерения степени взаимосвязи признаков. Предыдущие два свойства способствуют ускорению расчетов, если первичные данные представлены в сгруппированном виде с равными интервалами. Вводя вместо прежних значений признака X новые, полученные по формуле
Если исходные данные представлены в форме интервального ряда распределения, т. е., по существу, первичные данные распределены по группам, то следовало бы и (Т2 рассчитывать по правилу сложения дисперсий. Но обычно это сделать невозможно из-за того, что точные средние значения признака в каждом интервале неизвестны. При замене средних значений серединами интервалов получающаяся межгрупповая дисперсия оказывается несколько больше общей дисперсии — ориентировочно на величину h2 /12 (поправка Шеппарда). На практике эту поправку вводят редко и подсчитываемая по данным интервального ряда распределения дисперсия считается достаточно точной оценкой искомой общей дисперсии:
х; = (х, - А) / h,
убеждаемся, что
а2(Х) = и2 • а2(Х') = h2 • (X'2 - X'2).
к
Щ -Х)*-т,
1=1
а2 =
к
Ет|
]=1
87
где к — количество интервалов; X — значение признака X в середине j-ro интервала.
Для приведенного ранее примера получаем
X' 1 -2 -1 0 1
m 1 0,09 0,18 0,24 0,49
(х;)2", 0,36 0,18 0 0,49
Таким образом,
КХ^гл - = 1,03.
Егп
Так как (X')2 = 0,132, то
а2 = 52 • (1,03 - 0,0169) = 25,3275.
Непосредственный расчет по исходным данным дает тот же результат, но оказывается более трудоемким.
Если вариация оценивается по небольшому числу наблюдений, взятых из неограниченной генеральной совокупности, то и среднее значение признака определяется с некоторой погрешностью. Расчетная величина дисперсии оказывается смещенной в сторону уменьшения. Для получения несмещенной оценки выборочную дисперсию, полученную по приведенным ранее формулам, надо умножить на величину п / (п - 1). В итоге при малом числе наблюдений (< 30) дисперсию признака рекомендуется вычислять по формуле
I(X, - X)2 п _
а2 -- или а2 =-(X2 - (X)2).
п - 1 п - 1
Обычно уже при п > (15 + 20) расхождение смещенной и несмещенной оценок становится несущественным. По этой же причине обычно не учитывают смещенность и в формуле сложения дисперсий.
Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле
а2(Х) = а2 / п,
где п — объем выборки; О2 — дисперсия признака, рассчитанная по данным выборки.
88
Величина |I = \] СТ2(Х) = \j <5г / п носит название средней ошибки выборки и является характеристикой отклонения выборочного среднего значения признака X от его истинной средней величины. Показатель средней ошибки используется при оценке достоверности результатов выборочного наблюдения.
Формулы
Xw = п, / п = W; а* = W (1 - W); |lw = \/w(1 - W) / п
используются для оценки точности выборочного значения доли (удельного веса) как средней величины альтернативного признака.
Под альтернативным понимается такой статистический показатель, который принимает одно из двух взаимоисключающих значений (пол — мужской или женский; изделие — годное или негодное; план по выпуску продукции — выполнен или не выполнен; заказ — выполнен менее чем на 90 % или более чем на 90 % и т. д.). Как видим, конкретное содержание альтернативного признака устанавливается самим исследователем. Обычно считают, что если признак X принял интересующее нас значение, то его величина равна 1, в противном случае X = 0. В результате в п, наблюдениях имеем интересующее нас явление (когда Х= 1), а в п2 случаях оно отсутствует (когда X = 0). Таким образом,
Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 109 >> Следующая