Вторичная перегруппировка для несложного примера
Объяснение связи между формулой сложения дисперсий и корреляционным отношением, разъяснение его статистического смысла. Сравнение вариации для двух распределений с различными средними. Изучение понятия репрезентативности выборки и ее необходимого объема.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 24.12.2013 |
Размер файла | 139,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Московская академия им. С.Ю. Витте
Факультет «Экономика»
Контрольная работа
Работу выполнила:
студентка 1го курса,
дистанционной формы обучения
Висляева М.Н.
г. Москва
2012
Задание:
При выполнении контрольного задания Вы должны сделать вторичную перегруппировку для несложного примера (пример выбрать самостоятельно) и объяснить, как и при выполнении каких условий справедлив такой перерасчет. При использовании компьютерных программ и более сложного примера указать также эффект и особенности применения ИТ.
В письменном ответе на задание Вы должны:
1. Объяснить связь между формулой сложения дисперсий и корреляционным отношением, разъяснить его статистический смысл.
2. Выполнить сравнение вариации для двух различных распределений с различными средними, объяснить условия сопоставимости при различии средних.
3. Дать наиболее полное объяснение смысла предельной ошибки, связать с понятием репрезентативности выборки и ее необходимым объемом.
4. Объяснить соотношение оценивания неизвестных параметров по МНК и проверку значимости полученных результатов по критериям проверки статистических гипотез.
Решение:
Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.
В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примере.
Произвести укрупнение интервалов на основе данных таблицы 1:
Таблица 1
Группы магазинов по размеру товарооборота за IV квартал, тыс. руб. |
Число магазинов |
Товарооборот за IV квартал, тыс. руб. |
|
До 10 |
15 |
93 |
|
10--15 |
8 |
112 |
|
15--20 |
13 |
200 |
|
20--30 |
3 |
68 |
|
30--50 |
9 |
378 |
|
50--60 |
7 |
385 |
|
60--70 |
3 |
180 |
|
70--100 |
8 |
600 |
|
100--200 |
22 |
2400 |
|
Свыше 200 |
12 |
3744 |
|
Итого |
100 |
8160 |
Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.
Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл. 2).
Таблица 2
Группы магазинов по размеру товарооборота за IV квартал, тыс. руб. |
Число магазинов |
Товарооборот за IV квартал, тыс. руб. |
Товарооборот в среднем на 1 магазин, тыс. руб. |
|
До 10 |
15 |
93 |
6,2 |
|
10--20 |
21 |
312 |
14,8 |
|
20--50 |
12 |
446 |
37,1 |
|
50--100 |
18 |
1165 |
64,8 |
|
100--200 |
22 |
2400 |
109,0 |
|
Свыше 200 |
12 |
3744 |
312,0 |
|
Итого |
100 |
8160 |
81,6 |
Совершенно четко видно, чем крупнее магазины, тем выше уровень товарооборота.
1. По аналитической группировке можно измерить связь с помощью эмпирического корреляционного отношения. Этот, показатель обозначается греческой буквой з (эта). Он основан на правиле разложения дисперсии, согласно которому общая дисперсия s2 равна сумме внутригрупповой и межгрупповой дисперсий.
Дисперсия результативного признака внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов. Эта дисперсия называется остаточной. Она определяется по формуле:
где уij - значение признака у для i-й единицы в j-й группе;
?j - среднее значение признака в j-й группе;
nj - число единиц j-й группе;
j = 1, 2, 3, ..., т.
Внутригрупповые дисперсии, рассчитанные для отдельных групп, объединяются в средней величине внутригрупповой дисперсии:
Межгрупповая дисперсия относится на счет изучаемого фактора (и факторов, связанных с ним), поэтому эта дисперсия называется факторной. Она определяется по формуле
Правило сложения дисперсий может быть записано:
или
Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Соответственно оно рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака:
Этот показатель принимает значения в интервале [0,1]: чем ближе к 1, тем теснее связь, и наоборот.
Таблица 3. Исходные данные
Количество деталей, изготовленных за смену |
Число рабочих |
|
280-300 |
3 |
|
300-320 |
9 |
|
320-340 |
15 |
|
340-360 |
12 |
|
360-380 |
6 |
|
380-400 |
6 |
Таблица 4. Рабочая таблица
X |
f |
X*f |
X - Xср |
(X-Xср)2 |
f*(X-Xср)2 |
|
290 |
3 |
870 |
-50,58 |
2558,336 |
7675,01 |
|
310 |
9 |
2790 |
-30,58 |
935,1364 |
8416,23 |
|
330 |
15 |
4950 |
-10,58 |
111,9364 |
1679,05 |
|
350 |
12 |
4200 |
9,42 |
88,7364 |
1064,84 |
|
370 |
6 |
2220 |
29,42 |
865,5364 |
5193,22 |
|
390 |
6 |
2340 |
49,42 |
2442,336 |
14654,02 |
|
ИТОГО |
51 |
17370 |
38682,36 |
Средний товарооборот = ?X*f / f= 17370/51 = 340,58 тыс. руб.
Дисперсия равна:
G2 =? f*(X-Xср)2 / ? f = 38682,36/51 = 758,48
Среднее квадратическое отклонение:
G = 2 = = 27,54
Коэффициент вариации равен:
V = G / Xср = 27,54/758,48 = 0,081; 8,1%.
Коэффициент вариации меньше 33%, следовательно, совокупность однородна.
Таблица 5. Исходные данные
Затраты времени на проезд к месту работы, мин |
Затраты времени на проезд к месту работы, мин, х |
Число рабочих f |
|
До 30 |
25 |
70 |
|
30-40 |
35 |
80 |
|
40-50 |
45 |
200 |
|
50-60 |
55 |
55 |
|
60-70 |
65 |
15 |
1) средние затраты времени на проезд к месту работы у рабочих = Х ср =? Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41,8 мин.
2) расчет дисперсии
х |
f |
X - Xср |
(X-Xср)2 |
f*(X-Xср)2 |
|
25 |
70 |
-16,8 |
282,24 |
19756,8 |
|
35 |
80 |
-6,8 |
46,24 |
3699,2 |
|
45 |
200 |
3,2 |
10,24 |
2048 |
|
55 |
55 |
13,2 |
174,24 |
9583,2 |
|
65 |
15 |
23,2 |
538,24 |
8073,6 |
|
ИТОГО |
420 |
16 |
1051,2 |
43160,8 |
Дисперсия равна:
G2 =? f отклонение:
G = 2 = 10,14
3) Коэффициент*(X-Xср)2 / ? f = 43160,8/420 = 102,8
Среднее квадратическое вариации равен:
V = G / Xср = 10,14/41,8 = 0,24; 24%
Коэффициент вариации меньше 33%, следовательно, рассмотренная совокупность однородна и средняя для нее достаточно типична.
Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит выборочная средняя величина, обозначаемая , а во втором -- выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно: генеральная средняя и генеральная доля р.
Разности -- и W -- р называются ошибкой выборки, которая делится на ошибку регистрации и ошибку репрезентативности. Первая часть ошибки выборки возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая часть ошибки возникает из-за постоянного или спонтанного несоблюдения принципа случайности отбора. Ее трудно обнаружить и устранить, она гораздо больше первой и потому ей уделяется основное внимание.
Исключительно важную роль для обоснования и применения выборочного наблюдения играет закон больших чисел. Использование законы больших чисел состоит в том, что при определенных условиях и при достаточно большом объеме наблюдений сводные характеристики, полученные на основе выборочного наблюдения, будут мало отличаться от соответствующих характеристик генеральной доверенности. Основываясь на этом, можно, увеличивая объем выборочной совокупности, уменьшить пределы возможных ошибок репрезентативности, довести их до наименьших размеров. С другой стороны, зная пределы ошибок репрезентативности, можно определить необходимую численность выборочной совокупности.
Одной из наиболее важных и ответственных задач при организации и проведении выборочного наблюдения является установление необходимой численности выборочной совокупности, т.е. такой ее численности, которая обеспечивала бы получение данных, достаточно правильно отражающих изучаемые свойства генеральной совокупности.
При этом должно быть учтено: 1) с какой степенью точности следует получить предельную ошибку выборки; 2) какова должна быть вероятность того, что будет обеспечена обусловленная точность результатов выборочного наблюдения; 3)степень колеблемости изучаемых свойств в исследуемой генеральной совокупности.
Это значит, что необходимая численность выборки устанавливается в зависимости от размеров предельной ошибки выборки, от величины коэффициента доверия (t) и от размеров величины дисперсии.
Метод оценивания параметров линейной регрессии, минимизирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции, называется методом наименьших квадратов.
Суть метода заключается в том, что критерием качества рассматриваемого решения является сумма квадратов ошибок, которую стремятся свести к минимуму. Для применения этого метода требует провести как можно большее число измерений неизвестной случайной величины (чем больше - тем выше точность решения) и некоторое множество предполагаемых решений, из которого требуется выбрать наилучшее. Если множество решений параметризировано, то нужно найти оптимальное значение параметров.
МНК используется в математике, в частности - в теории вероятностей и математической статистике. Наибольшее применение этот метод имеет в задачах фильтрации, когда необходимо отделить полезный сигнал от наложенного на него шума. Его применяют и в математическом анализе для приближённого представления заданной функции более простыми функциями. Ещё одна из областей применения МНК - решение систем уравнений с количеством неизвестных меньшим, чем число уравнений.
Этапы проверки статистических гипотез:
Формулировка основной гипотезы H0 и конкурирующей гипотезы H1. Гипотезы должны быть чётко формализованы в математических терминах.
Задание вероятности б, называемой уровнем значимости и отвечающей ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.
Расчёт статистики ц критерия такой, что:
её величина зависит от исходной выборки ;
по её значению можно делать выводы об истинности гипотезы H0;
сама статистика ц должна подчиняться какому-то известному закону распределения, т.к. сама ц является случайной в силу случайности .
Построение критической области. Из области значений ц выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство . Это множество и называется критической областью.
Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику ц и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы H0.
дисперсия корреляционный вариация
Размещено на Allbest.ru
...Подобные документы
Таблица значений выборки дискретных случайных величин в упорядоченном виде. Таблица интервального статистического ряда относительных частот. Задание эмпирической функции распределений и построение ее графика. Полигон и распределение случайной величины.
практическая работа [109,3 K], добавлен 26.07.2012Числовые характеристики для статистических распределений. Построение интервального вариационного ряда, многоугольника частостей, графика выборочной функции распределения и определения среднего значения выборки и выборочной дисперсии двумя способами.
презентация [140,3 K], добавлен 01.11.2013Среднее значение показателя (среднее арифметическое). Показатели вариации - размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициент вариации. Максимальное и минимальное значение статистического показателя.
контрольная работа [159,7 K], добавлен 14.11.2008Понятие генеральной совокупности, математического ожидания и дисперсии. Обеспечение случайности и репрезентативности выборки в статистическом планировании. Дискретный и интервальный вариационный ряд, точечные оценки параметров распределения признака.
реферат [259,1 K], добавлен 13.06.2011Сущность выборочного исследования. Способы отбора единиц в выборочную совокупность. Средняя и предельная ошибка для показателей средней величины и показателей доли. Определение необходимого объема выборки при заданной предельной ошибке среднего значения.
презентация [108,7 K], добавлен 16.03.2014Формы, виды и способы статистического наблюдения. Виды группировок, их интервал и частота. Структура ряда динамики. Абсолютные и относительные статистические величины. Представление выборки в виде статистического ряда. Точечное и интервальное оценивание.
курс лекций [1,1 M], добавлен 29.11.2013Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.
курсовая работа [179,8 K], добавлен 11.01.2012Диаграмма рассеивания как точки на плоскости, координаты которых соответствуют значениям случайных величин X и Y, порядок ее построения и назначение. Нахождение коэффициентов и построение графика линейного приближения, графика квадратичного приближения.
курсовая работа [1,1 M], добавлен 03.05.2011Упорядочение исходной выборки наработок до отказа. Проверка статистической гипотезы о соответствии экспоненциальному распределению и распределению Вейбулла. Оценивание параметров распределений и показателей безотказности, его главные методы и приемы.
курсовая работа [112,6 K], добавлен 22.01.2012Понятие вариационного ряда, статистического распределения. Эмпирическая функция и основные характеристики математического ожидания выборочной дисперсии. Точечные и интервальные оценки распределений. Теория гипотез - аналог теории доверительных интервалов.
контрольная работа [172,9 K], добавлен 22.11.2013Решение задач линейного программирования, построение графиков линий по точкам. Среднее время ожидания в очереди и исправленное среднее квадратичное отклонение для выборки. Корреляционный анализ связи между числом посетителей и выручкой магазина.
контрольная работа [609,0 K], добавлен 13.11.2011Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.
курс лекций [759,3 K], добавлен 13.06.2015Изучение абстрактных систем замыканий на множестве. Теорема о взаимосвязи между системами замыканий и операторами замыкания. Понятие и структура алгебраических систем замыканий. Анализ соответствия Галуа как наиболее важного примера систем замыканий.
дипломная работа [155,2 K], добавлен 27.05.2008Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.
курсовая работа [241,3 K], добавлен 10.04.2011Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.
контрольная работа [55,2 K], добавлен 23.07.2009Уравнения и способы их решения методом подбора переменных, на основе соотношения между частью и целым, зависимости между компонентами действий, знаний смысла умножения, приема с весами. Развитие познавательного интереса к математике в начальной школе.
курсовая работа [591,0 K], добавлен 24.10.2014Действие оператора точечной группы в двух- и трехмерном пространстве. Определение его порядка по матрице Система эквивалентных точек. Возможные порядки осей симметрии в кристаллографическом пространстве. Геометрическая интерпретация сложения операторов.
презентация [107,4 K], добавлен 23.09.2013Изучение наиболее типичных алгоритмов решения задач, имеющих вероятностный характер. Ознакомление с элементами комбинаторики, теорией урн, формулой Байеса, способами нахождения дискретных, непрерывных случайных величин. Рассмотрение основ алгебры событий.
методичка [543,1 K], добавлен 06.05.2010Основные понятия и определения. * - алгебры. Представления. Тензорные произведения. Задача о двух ортопроекторах. Два ортопроектора в унитарном пространстве, в сепарабельном гильбертовом пространстве. Спектр суммы двух ортопроекторов.
дипломная работа [303,0 K], добавлен 04.06.2002Перпендикулярные прямые в пространстве. Определение и признак прямой, перпендикулярной к плоскости. Теорема о перпендикулярности двух параллельных, двух перпендикулярных прямых к плоскости. Перпендикуляр и наклонные. Угол между прямой и плоскостью.
презентация [160,5 K], добавлен 20.11.2014