Ошибка выборки
Изучение ошибок выборочного наблюдения, которые подразделяются на ошибки выборки (случайные), ошибки, вызванные отклонением от схемы отбора (неслучайные) и ошибки наблюдения. Расчет дисперсии и коэффициента корреляции по уравнению Лапласа-Гаусса.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 03.12.2014 |
Размер файла | 242,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ГЛАВА 1. ОШИБКА ВЫБОРКИ
Все ошибки выборочного наблюдения подразделяются на ошибки выборки (случайные); ошибки, вызванные отклонением от схемы отбора (неслучайные); ошибки наблюдения (случайные и неслучайные). Плохо, когда ошибка выборки превышает допустимый размер погрешности, но слишком высокая точность также подозрительна и, как правило, свидетельствует об ошибках отбора.
Ошибки отбора приводят к неслучайным ошибкам. Так бывает, если объективный отбор подменяется «удобной» выборкой. Например, когда появляются добровольные респонденты - те, кто сами предлагают, чтобы их опросили.
Очевидно, что характеристики таких добровольцев и недобровольцев могут быть отличны и это приведет к ошибочному заключению о генеральной совокупности.
Такая же опасность возникает при замене по какой-либо причине единиц, попавших в выборку, другими единицами (например, вместо отобранного домохозяйства, где в момент прихода интервьюера никто не открыл дверь, был проведен опрос в соседней квартире; или интервьюер встретил решительный отказ участвовать в опросе и был вынужден пойти на замену домохозяйства).
Как отмечает социолог В. И. Паниотто, систематические ошибки представляют собой некоторое постоянное смещение, которое не уменьшается с увеличением числа опрошенных и вызвано недостатками и просчетами в системе отбора респондентов. Если, например, для изучения общественного мнения жителей города в архитектурном управлении получить сведения о жилом фонде и из всех имеющихся в городе квартир отобрать случайным образом 400 квартир, а затем предложить интервьюерам опросить всех, кого они застанут в момент посещения в этих квартирах, то полученные данные не будут репрезентативны. Допущена систематическая ошибка: более подвижная часть населения попадает в выборку в меньшей пропорции, а менее подвижная - в большей пропорции, чем в генеральной совокупности. Пенсионеров, например, можно чаще застать дома, чем студентов-вечерников. При увеличении выборки эта ошибка не устраняется: если мы проведем опрос в 800 квартирах или даже во всех квартирах города (сплошной опрос), то полученные данные будут репрезентативны для населения, находящегося дома в момент прихода интервьюера, а не для всех жителей города.
Неслучайные ошибки могут возникнуть из - за методов сбора данных: вопросов, слишком болезненных для опрашиваемых (об отношении к властям, если опрашиваются беженцы или пострадавшие от стихийных бедствий и т.д.) или формы задания вопроса (очень трудно, чтобы всем было все понятно), или времени опроса (например, на вопрос молодым родителям, не жалеют ли они о том, что у них есть дети, можно получить разное распределение ответов в зависимости от того, проводился ли опрос долгим зимним вечером, когда все утомлены приготовлением уроков, простудами и т.д., или прекрасным летним днём, когда дети находятся на даче, в оздоровительном лагере).
Случайные ошибки - те, которые изменяются по вероятностным законам. К случайным относится ошибка выборки.
Ошибка выборки или, иначе говоря, ошибка репрезентативности - это разница между значением показателя, полученного по выборке, и генеральным параметром. Так, ошибка репрезентативности выборочной средней равна
выборочной относительной величины
Дисперсии
коэффициента корреляции
Если представить, что было проведено бесконечное число выборок равного объема из одной и той же генеральной совокупности, тo показатели от-дельных выборок образовали бы ряд возможных значений: выборочных средних величин относительных величин дисперсии и т.д.
Каждая выборка имеет свою ошибку репрезентативности. Следовательно, можно построить ряды распределения выборок по величине ошибки репрезентативности для каждого показателя: для средней, относительной величины и т.д. В таких распределениях улавливается тенденция к концентрации ошибок около центрального значения. Число выборок с той или иной величиной ошибки репрезентативности может быть симметрично или асимметрично относительно этого центрального значения. При бесконечно большом числе выборок получится кривая частот, которая представляет кривую выборочного распределения. Свойства таких распределений используются для получения статистических заключений, установления вероятности той или иной величины ошибки репрезентативности.
Рассмотрим выборочное распределение средней величины. Такое распределение будет являться нормальным илу приближаться к нему .По мере увеличения объема выборки, независимо от того, имеет или нет нормальное распределение та генеральная совокупность, из которой взяты выборки. С увеличением числа выборок средняя для вcex выборок будет приближаться генеральной средней. По выборочному распределению может быть рассчитана средняя квадратическая ошибка репрезентативности:
Где
Среднее квадратическое отклонение выборочных средних от генеральной средней называется средней ошибкой выборочной средней:
Поскольку, как правило, генеральная средняя и неизвестна, этой формулой нельзя воспользоваться. Кроме того, в социально-экономических исследованиях из одной и той же совокупности выборки не проводятся многократно. Используют следующее соотношение:
квадрат средней ошибки (дисперсия выборочных средних) прямо про-порционален дисперсии признака х в генеральной совокупности о и обратно пропорционален объему выборки n:
Соответственно средняя ошибка выборочной средней равна:
Следовательно, средняя ошибка выборки тем больше, чем больше вариация в генеральной совокупности, и тем меньше, чем больше объем выборки.
Таким образом, можно утверждать, что отклонение выборочной средней х от генеральной средней ц в среднем равно ±s, . Ошибка конкретной выборки может принимать различные значения, но отношение ее к средней ошибке практически не превышает ±3, если величина n достаточно большая (и > 100).Отношение ошибки конкретной выборки к средней квадратической ошибке называется нормированным отклонением и обозначается как:
Распределение нормированного отклонения выборочной средней от генеральной средней при численности выборки n определяется уравнением Лапласа-Гаусса:
Поскольку средняя нормированных отклонений t=0,дисперсия ,т.е. , уравнение Лапласа - Гаусса может быть записано как:
Данное уравнение называют стандартным уравнением нормальной кривой. Величина f (t) достигает максимума при t=0,в этом случае
По мере увеличения t величина уменьшается и соответственно уменьшается f(t).На рис.1 приведён график кривой нормального распределения стандартизированных ошибок выборочных средних,t.Ординаты на графике соответствуют плотностям вероятностей при том или ином значении t.Для того чтобы определить вероятность значений в интервале от t до tследует найти отношение части площади кривой ,заключённой между ординатами ,соответствующими t и t,ко всей площади кривой. Вся площади под кривой нормального распределения вероятностей принимается за единицу.
Уравнение Лапласа - Гаусса предполагает непрерывное изменение t и неограниченное возрастание n. Поэтому площадь нормальной кривой, заключенную между ординатами t1 и t2, определяют, интегрируя функцию.
Имеются таблицы, которые содержат значения вероятностей для нормированных отклонений t или для интервалов от t1 до t2. Одна из таких таблиц приведена в приложении «Значение интеграла вероятностей». Эта таблица содержит пропорциональные доли площадей, заключенных между ординатами, соответствующими ± t. Зная нормированное отклонение t, можно определить вероятность или на основе определенной вероятности установить величину t. На пересечении строк и граф таблицы находится значение вероятности F(t), соответствующее данному значению t. Для краткости записи в таблице приводятся только десятичные знаки вероятности, следовательно, к табличному значению F(t) надо приписывать ноль целых. Например, чтобы определить, какая вероятность соответствует t= 1,96, надо взять строку 1,9 и графу 6 и на их пересечении прочитать значение вероятности, добавив перед первым знаком ноль целых. Если t = 1,96, то F(f)= 0,9500. По мере увеличения t (уже при t = ±3) значение интеграла вероятностей приближается к единице. Чем шире пределы t, тем большая площадь под кривой охватывается ординатами, восстановленными из соответствующих значений t. Поскольку вероятность -- это отношение части площади под кривой, заключённой между ординатами, ко всей площади, соответственно возрастает и вероятность. Распределение ошибок выборочных средних имеет характер нормального распределения или приближается к нему даже в случаях, когда генеральная совокупность имеет иную форму распределения. Из формулы нормированного отклонения следует, что отклонение выборочной средней от генеральной средней равно:
Нормированное отклонение может быть установлено по таблице «Зна-чение интеграла вероятностей».(Приложение 1) Для этого необходимо принять определённый уровень вероятности суждения о точности данной выборки. Вероятность, которая принимается при расчёте ошибки выборочной характеристики, называют доверительной. Чаще всего принимают доверител-ную вероятность равной 0,95, 0,954, 0,997 или даже 0,999. Доверительный уровень вероятности 0,95 означает, что только, в 5 случаях из 100 ошибка может выйти за установленные границы; вероятности 0,954 - в 46 случаях из 1000, при 0,997 - в 3 случаях, а при 0,999 - в 1 случае из 1000.
Чтобы вычислить ошибку выборки при принятой доверительной вероят-ности, нужно рассчитать величину средней ошибки . Формула для её определения
включает дисперсию признака в генеральной совокупности у2, которая, как правило, неизвестна. Может быть определена только выборочная дисперсия s2. Доказано, что соотношение между у2 и s2 определяется следующим равенством:
Отсюда
Если n велико, то сомножитель n/(n - 1) ? 1 и можно принять выборочную дисперсию в качестве оценки величины генеральной дисперсии. Подставив выражение
в формулу средней ошибки выборочной средней, получим:
Соответственно :
Рассмотрим пример.
Для определения скорости расчётов с кредиторами предприятий одного треста была проведена случайная выборка 50 платёжных документов, по которым средний срок перечисления денег оказался равен 28,2 дня со стандартным отклонением 5,4 дня.
Определим средний срок прохождения всех платежей в течение данного года с доверительной вероятностью F(t) = 0,95. Тогда t = 1,96; скорректированная дисперсия:
Средняя ошибка выборки:
Отклонение выборочной средней от генеральной с вероятностью 0,95 составит ?x = 1,96 • 0,77 = ± 1,51 дня.
? называется доверительной ошибкой выборки или предельной ошибкой выборки. Рассчитав величину ?, мы можем записать следующее неравенство:
28,2 - 1,51 ? м ? 28,2 + 1,51;
26,7 дня ? м ? 29,7 дня.
Таким образом, с вероятностью 0,95 можно утверждать, что средняя продолжительность расчётов предприятия данного треста с кредиторами составляет не менее 26,7 дня и не более 29,7 дня.
Ошибка выборки для выборочной относительной величины (доли) определяется аналогично. Дисперсия относительной величины по данным выборки :
Это выражение получено в соответствии с обычной формулой дисперсии. Поскольку имеется в виду альтернативная или дихотомическая переменная, обозначим её значение в одной категории единиц О, в другой - 1. Тогда среднее значение переменной составит:
Квадрат отклонения от средней
что соответствует выражению s2=p(1-p)
Средняя ошибка выборочной доли:
Предельная ошибка выборочной доли с принятой доверительной вероятностью имеет вид:
Рассмотрим пример.
По данным выборочного изучения 100 платежных документов предприятий одного треста оказалось, что в б случаях сроки расчётов с кредиторами были превышены. С вероятностью 0,954 требуется установить доверительный интервал доли платёжных документов треста без нарушения сроков: дисперсия корреляция выборка ошибка
Генеральная доля платежных документов р, не выходящих за установленные сроки, с вероятностью 0,954 находится в интервале
0,892 ? р ? 0,988, или 89,2% ? р ? 98,8%.
ГЛАВА 2. ВЛИЯНИЕ ВИДА ВЫБОРКИ НА ВЕЛИЧИНУ ОШИБКИ ВЫБОРКИ
Размещено на Allbest.ru
...Подобные документы
Порядок построения линейного регрессионного уравнения, вычисление его основных параметров и дисперсии переменных, средней ошибки аппроксимации и стандартной ошибки остаточной компоненты. Построение линии показательной зависимости на поле корреляции.
контрольная работа [75,1 K], добавлен 29.01.2010Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Характеристика способов определения средней арифметической вариационного дискретного ряда без испытуемого элемента. Анализ этапов расчета квадратичной ошибки коэффициента корреляции. Рассмотрение основных особенностей отбора факторных признаков.
контрольная работа [164,3 K], добавлен 18.10.2013Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.
контрольная работа [155,8 K], добавлен 11.12.2010Возможные ошибки спецификации модели. Симптомы наличия ошибки спецификации первого типа. Проблемы с использованием замещающих переменных. Построение функции Кобба-Дугласа. Проверка адекватности модели. Переменные социально-экономического характера.
презентация [264,5 K], добавлен 19.01.2015Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010Освоение методики организации и проведения выборочного наблюдения; статистических методов и методов компьютерной обработки информации; методов оценки параметров генеральной совокупности на основе выборочных данных. Проверка статистических гипотез.
лабораторная работа [258,1 K], добавлен 13.05.2010Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.
контрольная работа [261,1 K], добавлен 23.03.2010Ковариационная матрица оценок коэффициентов регрессии. Оценка дисперсии ошибок. Сущность теоремы Гаусса-Маркова. Проверка статистических гипотез, доверительные интервалы. Расчет коэффициента детерминации, скорректированного коэффициента детерминации.
контрольная работа [1,4 M], добавлен 28.07.2013Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.
контрольная работа [250,5 K], добавлен 11.04.2015Построение доверительного интервала для коэффициента регрессии в заданной модели. Оценка качества модели по анализу ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности спроса в зависимости от цены. Уравнение авторегрессии.
контрольная работа [156,8 K], добавлен 28.02.2011Сущность, цели и задачи выборочного обследования. Описание и особенности использования типического способа отбора выборочной совокупности. Формы статистических показателей выборочного наблюдения. Виды и методика расчета оценок статистических показателей.
курсовая работа [124,1 K], добавлен 13.03.2010Коэффициент парной линейной корреляции, формула его расчета. Вычисление коэффициента в MS Excel. Оценка достоверности выборочного коэффициента корреляции в качестве нулевой гипотезы. Выборочный критерий Стьюдента. Построение графика зависимости.
научная работа [622,6 K], добавлен 09.11.2014Построение ряда динамики. Расчет параметров линейного, степенного, экспоненциального (показательного), параболического, гиперболического трендов с помощью пакета Excel. Вычисление относительной ошибки аппроксимации. Оценка адекватности линейной модели.
практическая работа [165,9 K], добавлен 13.05.2014Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.
контрольная работа [136,3 K], добавлен 25.09.2014Поиск несмещенных оценок математического ожидания и для дисперсии X и Y. Расчет выборочного коэффициента корреляции, анализ степени тесноты связи между X и Y. Проверка гипотезы о силе линейной связи между X и Y, о значении параметров линейной регрессии.
контрольная работа [19,2 K], добавлен 25.12.2010Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.
контрольная работа [179,4 K], добавлен 25.03.2014Проведение корреляционно-регрессионного анализа в зависимости выплаты труда от производительности труда. Построение поля корреляции, выбор модели уравнения и расчет его параметров. Вычисление средней ошибки аппроксимации и тесноту связи между признаками.
практическая работа [13,1 K], добавлен 09.08.2010Оценка среднего количества окиси железа в руде, содержащей 25% закиси железа, с помощью уравнения регрессии. Выявление силы корреляции. Выборочное корреляционное отношение. Прямая криволинейная зависимость с высокой теснотой связи между величинами.
лабораторная работа [868,3 K], добавлен 14.05.2014Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [58,3 K], добавлен 17.10.2009