Методы математической статистики

Задачи и статистические функции выборочной дисперсии для интервального вариационного ряда. Статистические критерия поиска совокупности показателей. Математическое моделирование взаимозависимости уравнений регрессии. Параметры нахождения корреляции.

Рубрика Экономико-математическое моделирование
Вид реферат
Язык русский
Дата добавления 16.12.2014
Размер файла 71,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МЕТОДЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

1. Понятие вариационного ряда

Математическая статистика занимается изучением закономерностей, которым подчиняются массовые явления, на основе результатов наблюдений.

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных - результатов наблюдений.

Математическая статистика позволяет обосновать ответ на вопросы: о случайности и закономерности изучаемого явления, как зависит результативный признак от факторного (как зависит доходность акций от уровня инфляции, при прочих равных условиях), сколько необходимо провести наблюдений для объективного суждения об изучаемом явлении, какой фактор сильнее влияет на результат. Методы математической статистики можно разделить на описательные и аналитические.

Первая задача математической статистики - указать способы сбора и группировки статистических сведений, полученных в результате наблюдений за случайными процессами или в результате специально поставленных экспериментов, описать реальные наблюдения с помощью таблиц, графиков, числовых характеристик и т. д.

Вторая задача математической статистики - разработать методы анализа статистических данных в зависимости от целей исследования, т. е.:

а) оценка неизвестной вероятности события, оценка неизвестной функции распределения, оценка параметров распределения, вид которого известен, оценка зависимости случайной величины от одной или нескольких случайных величин и др.;

б) проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого известен.

Аналитические методы позволяют на основании выборочных наблюдений сделать статистически значимые выводы о наличии закономерностей для всей совокупности.

Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.

Исходным материалом всякого статистического исследования является совокупность результатов наблюдения, представляющая собой первичный статистический материал. Совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объектом наблюдения.

Всякий объект статистического наблюдения состоит из отдельных элементов - единиц наблюдения.

Результаты статистического наблюдения представляют собой числовую информацию - данные.

Статистические данные - это сведения о том, какие значения принял интересующий исследователя признак в статистической совокупности.

Значение признака при переходе от одного элемента к другому изменяются (варьируют), поэтому в статистике различные значения признака называют вариантами, а совокупность признака, расположенного в порядке возрастания или убывания - вариационным рядом.

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным - контролируемый размер детали.

Иногда проводят сплошное обследование, т. е., обследуют каждый из объектов совокупности относительно признак, которым интересуются. На практике сплошное обследование очень часто провести невозможно. В таких случаях случайно отбирают ограниченное число объектов из всей совокупности и подвергают их изучению.

Основные понятия, связанные с выборками.

Генеральной совокупностью называется совокупность объектов, из которых производится выборка. Понятие генеральной совокупности связано с понятием полного поля элементарных событий. Это поле может быть конечным или бесконечным.

Выборочной совокупностью (выборкой) называется совокупность случайно отобранных объектов из генеральной совокупности. Объемом совокупности (выборочной или генеральной) называют число её объектов.

N - V - это генеральной совокупности;

n - V - это выборочной совокупности.

N > n.

При составлении выборки объект после проведенного исследования может быть возвращен, а может быть не возвращен в генеральную совокупность.

Повторной называется выборка, при которой объект перед отбором следующего возвращается в генеральную совокупность.

Бесповторной называется выборка, при которой объект перед отбором следующего не возвращается в генеральную совокупность.

Чтобы по результатам выборки можно было охарактеризовать генеральную совокупность выборка должна быть репрезентативной (представительной).

Вариационные (статистические) ряды.

Пусть из генеральной совокупности сделана выборка Vn для обследования. Причем х1 наблюдалось п1 раз, х2 и п2 раз, также в хk, nk раз и Упi.

Наблюдаемые значения хi (х1, х2,…, хk) называют вариантами.

Числа наблюдений пi (п1, п2,…, nk) называют частотами вариант.

Последовательность вариант, записанных в порядке возрастания, называют ранжированным вариационным рядом.

Относительной частотой называют отношение частоты выборки к объему выборки. Статистическим распределением выборки называют перечень вариант и соответствующих им относительных частот:

Пример: В группе из 27 человек на экзамене получили следующие оценки «5» - 3, «4» - 6, «3» - 10, «2» - 8:

Статистическое распределение частот (п = 27):

Статистическое распределение относительных частот:

Вариационный ряд может быть дискретным и непрерывным.

Вариационный ряд называется дискретным, если любые варианты отличаются на постоянную величину.

Варианты, которые отличаются один от другого на сколь угодно малую величину, образуют непрерывный вариационный ряд.

Замечание: Если число различных значений хi велико или является непрерывной случайной величиной, то составляют интервальное распределение выборки, т. е., множество всех значений разбивают на интервалы одной длины (k - ширина интервала). Ширину интервала можно вычислить по формуле:

Где:

п - число вариант.

Затем подсчитывают число вариант, попавших в каждый из интервалов, и составляют статистическое распределение:

2. Эмпирические параметры для функции распределения

Пусть известно статистическое распределение частот количественного признака Х, п - число наблюдений (объем выборки), пх - число наблюдений, при которых наблюдалось значение признака, меньшее х. Относительная частота события Х < х равна пхп. Если изменяется х, то изменяется относительная частота, т. е., относительная частота пх/ п есть функция от х. Так как эта функция находится эмпирическим (опытным) путем, то её называют эмпирической. Эмпирической функцией распределения Fn(x) называется относительная частота того, что признак (случайная величина Х) примет значение, меньшее заданного х:

Fn(x) = щ (X < x) F * (x) = nx / n

Где:

nx - число вариант, меньших х;

n - объем выборки.

В отличие от эмпирической функции распределения выборки функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F(x) определяет вероятность события Х < х, а эмпирическая функция F*(x) определяет относительную частоту этого же события.

Из определения функции F*(x) вытекают следующие её свойства:

1. значения эмпирической функции принадлежат отрезку (1, 1);

2. F*(x) - неубывающая функция;

3. если х1 - наименьшая варианта, то F(x) = 0 при х будет ? х1, если хk - наибольшая варианта, то F(x) = 1 при х становится ? хk.

Эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.

Пример:

Построим эмпирическую функцию поданному распределению выборки:

Объем выборки п = 12 + 18 + 30 = 60.

Наименьшая варианта равна 2, следовательно, F(x) = 0 при х, который ? 2, значение Х становится < 6, а именно х1, теперь равен 2, наблюдалось 12 раз, следовательно F(x) уже равно = 12 / 60 = 0,2.

Так как х = 10 - наибольшая варианта, то F(x) = 1 при х ?10.

3. Графическое изображение вариационных рядов

Для наглядности строят различные графики статистического распределения. Полигоном частот называют ломаную, отрезки которой соединяют точки (х1, п1), (х2, п2),…,(хk, пk). Для построения полигона частот на оси абсцисс откладывают хЯ, а на оси ординат - соответствующие частоты пЯ. Точки (хЯ, пЯ) соединяют отрезками прямых и получают полигон частот. Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (х1, щ1), (х2, щ2),…,(хk, щk). Для построения полигона частот на оси абсцисс откладывают хЯ, а на оси ординат - соответствующие им относительные частоты щЯ. Точки (хЯ, щЯ) соединяют отрезками прямых и получают полигон относительных частот.

В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала пЯ - сумму частот, попавших в i-й интервал. Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотой пЯ/п.

Гистограммой плотности относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотой пЯ/пh.

Кумулятивная кривая (кумулята) - кривая накопленных частот (частостей). Для дискретного ряда кумулята представляет ломаную, соединяющую точки.

Для интервального вариационного ряда ломаная начинается с точки, абсцисса которой равна началу первого интервала, а ордината - накопленной частоте, равной нулю. Другие точки этой ломаной соответствуют концам интервалов.

4. Числовые характеристики вариационного ряда

Наиболее простыми и часто используемыми числовыми характеристиками выборки являются выборочная средняя, выборочная дисперсия Dв и выборочное среднее квадратическое отклонение (стандарт) ув, являющиеся аналогами математического ожидания М(Х), дисперсии D(X) и среднего квадратического отклонения у(Х) в теории вероятностей.

Модой Мо является значение пi (варианта) ряда, имеющее наибольшую частоту пi. Медианой Ме вариационного ряда называется значение признака пi, приходящегося на середину ранжированного ряда наблюдений. При нечетном объеме выборки медиана равна серединному значению элемента, а при четном - полу сумме двух серединных значений.

5. Статическая проверка гипотез

Во многих случаях результаты наблюдений используются для проверки предположений (гипотез) относительно либо самого вида распределения генеральной совокупности, либо значения параметров уже известного распределения - статистических гипотез.

Пусть известно распределение СВ Х, и по выборке необходимо проверить гипотезу о значении некоторого параметра (или уГ) этого распределения.

Выдвигаемую и проверяемую гипотезу называют нулевой (или основной) и обозначают Н0.

Наряду с Н0, рассматривают также одну из альтернативных (конкурирующих) гипотез Н1.

Например, гипотеза о равенстве параметра и некоторому заданному значению и0, т. е., Н0и = и0, то в качестве альтернативной гипотезы можно рассмотреть одну из следующих:

Где:

и1 - другое заданное значение параметра и.

При проверке гипотезы Н0 по результатам выборки могут быть допущены ошибки двух родов:

1) ошибка первого рода - отвергнута правильная гипотеза;

2) ошибка второго рода - принята неправильная гипотеза.

Вероятность допустить ошибку первого рода называется уровнем значимости б. Обычно берут б = 0,005, 0,01, 0,05.

Правило, по которому принимается решение принять или отклонить нулевую гипотезу, называется статистическим критерием К. Выбор К зависит от конкретной задачи.

Статистический критерий есть случайная величина, распределение которой заранее известно и которая характеризует отклонение выборочных характеристик от их гипотетических значений.

Наблюдаемое значение статистического критерия - это значение критерия, которое рассчитано по выборке.

Рассмотрим гипотезу о нормальном распределении генеральной совокупности Х.

При проверке гипотезы о нормальном распределении генеральной совокупности (объем выборки п 30) обычно используют критерий «хи-квадрат» Пирсона.

Сущность критерия Пирсона состоит в сравнении эмпирических и теоретических частот. Эмпирические частоты находят из опыта. Чтобы найти теоретические частоты, если предполагается, что генеральная совокупность распределена нормально.

6. Элементы теории корреляции

Корреляционный анализ - широко известный и эффективный метод математической статистики, позволяющий по совокупности значений показателей выявлять и описывать связи между показателями.

Если каждому значению величины Х соответствует несколько значений величины У, но число этих значений, как и сами значения, остается не вполне определенным, то такие связи называются статистическими.

Например, уровень продажи товара тем выше, чем больше он разрекламирован. Однако нет основания утверждать об однозначности этой зависимости. Если изменение одной из переменных сопровождается изменением условного среднего значения другой переменной величины, то такая зависимость является корреляционной.

Условным средним ух называют среднее арифметическое наблюдавшихся значений У, соответствующих Х = х.

Например, если при х = 2 величина У приняла значения 1 = 5, или 2 = 6, или 3 = 10, тогда условное среднее 2 = (5 + 6 + 10) / 3 = 7.

Условным средним ху называют среднее арифметическое наблюдавшихся значений Х, соответствующих У = у.

Корреляционной зависимостью У от Х называют зависимость условной средней ух от f(x) - это уравнение называют уравнением регрессии У на Х, функцию f(x) называют регрессией У на Х.

А её график - линией регрессии У на Х. Аналогично вводится корреляционной зависимостью Х от У:

х * у = ц(у)

- это уравнение называют уравнением регрессии Х на У, функцию (у) называют регрессией Х на У, а её график - линией регрессии Х на У.

Корреляционный анализ рассматривает две основные задачи:

Первая задача теории корреляции - установить форму корреляционной связи, т. е., вид функции регрессии (линейная, квадратичная…).

Вторая задача теории корреляции - оценить тесноту (силу) корреляционной связи. Теснота корреляционной связи У на Х оценивается по величине рассеивания значений У вокруг условного среднего.

Большое рассеивание свидетельствует о слабой зависимости У от Х, малое рассеивание указывает на наличие сильной зависимости.

Отыскание параметров выборочного уравнения прямой линии регрессии по не сгруппированным данным.

Пусть количественные признаки Х и У связаны линейной корреляционной таблицей и в результате независимых испытаний получены п пар чисел. Поэтому уравнение регрессии будем икать в виде:

ух = kx + b

Угловой коэффициент прямой линии регрессии У на Х называют выборочным коэффициентом регрессии У на Х и обозначают сух.

Параметры сух и b можно определить методом наименьших квадратов. Они имеют вид если ряд не сгруппированный. Величина rв = сухуху - называется коэффициентом корреляции. Величина rв является показателем тесноты линейной связи:

7. Свойства коэффициента корреляции

Главные свойства:

1. Коэффициент принимает значения на отрезке (-1, 1);

2. Если все значения переменных увеличить (уменьшить) на одно и то же число (в одно и тоже число раз), то величина коэффициента корреляции не изменится;

3. Если ±1, то корреляционная связь представляет линейную функцию. Линии регрессии у по х и х по у совпадают;

4. Если r = 0, то линейная корреляционная связь отсутствует.

Из того, что r = 0 не следует, что вообще отсутствует корреляционная связь, или статистическая зависимость.

Выборочный коэффициент корреляции является оценкой генерального коэффициента корреляции с.

Пример:

На основании полученных измерений величин Х и У.

Найти линейную регрессию У на Х и выборочный коэффициент корреляции нужно:

Получаем:

статистический математический регрессия

Подсчитав выборочный коэффициент корреляции и осуществив переход к основным переменным, получаем соответствующие уравнения регрессии.

Размещено на Allbest.ru

...

Подобные документы

  • Вычисление уравнений регрессии для различных показателей продукции. Определение выборочной корреляции между двумя величинами. Расчет коэффициента детерминации и статистики Дарбина-Уотсона. Вычисление выборочной частной автокорреляции 1-го порядка.

    контрольная работа [29,7 K], добавлен 07.05.2009

  • Применение метода аналитической группировки при оценке показателей розничного товарооборота. Определение эмпирического корреляционного отношения, издержек обращения и товарооборота с помощью уравнения линейной регрессии метода математической статистики.

    контрольная работа [316,4 K], добавлен 31.10.2009

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [58,3 K], добавлен 17.10.2009

  • Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.

    контрольная работа [173,8 K], добавлен 22.11.2010

  • Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.

    контрольная работа [298,2 K], добавлен 19.01.2011

  • Расчет уравнений линейной и нелинейной парной регрессии. Оценка тесноты связи расходов на перевозки и грузооборота с помощью показателей корреляции и детерминации. Оценка ошибки аппроксимации уравнений регрессии. Расчет прогнозного значения расходов.

    курсовая работа [2,5 M], добавлен 26.12.2014

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [3,6 M], добавлен 29.05.2010

  • Закон распределения генеральной совокупности. Вычисление вероятности при помощи распределения Гаусса. Срок действия декларации о соответствии и сертификата соответствия. Применение математической статистики при измерениях и испытаниях продукции.

    презентация [128,7 K], добавлен 30.07.2013

  • Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.

    контрольная работа [136,3 K], добавлен 25.09.2014

  • Построение интервального вариационного ряда распределения предприятий по объему реализации. Графическое изображение ряда (гистограмма, кумулята, огива). Расчет средней арифметической; моды и медианы; коэффициента асимметрии; показателей вариации.

    контрольная работа [91,1 K], добавлен 10.12.2013

  • Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.

    контрольная работа [2,0 M], добавлен 05.04.2014

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Описание оборудования предприятия автосервиса. Построение интервального ряда экспериментального распределения. Проверка адекватности математической модели экспериментальным данным. Расчет значений интегральной и дифференциальной функции распределения.

    курсовая работа [522,9 K], добавлен 03.12.2013

  • Использование методов линейного программирования для целей оптимального распределения ресурсов. Методы математической статистики в экономических расчетах. Прогнозирование экономических показателей методом простого экспоненциального сглаживания.

    курсовая работа [976,0 K], добавлен 13.08.2010

  • Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.

    контрольная работа [817,3 K], добавлен 01.04.2010

  • Определение средней фактической трудоемкости одной детали при поточном производстве. Алгоритм построения интервального вариационного ряда. Определение показателей динамики производства цемента. Вычисление агрегатных индексов себестоимости продукции.

    контрольная работа [152,0 K], добавлен 06.02.2014

  • Построение поля корреляции по данным, гипотеза о форме связи. Оценка тесноты связи с помощью показателей корреляции и детерминации. Определение коэффициента эластичности и индекса корреляции. Расчет критериев Фишера. Модель денежного и товарного рынков.

    контрольная работа [353,7 K], добавлен 21.06.2011

  • Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.

    курсовая работа [1,1 M], добавлен 22.05.2015

  • Параметры парной линейной, линейно-логарифмической функции. Оценка статистической надёжности. Ошибка положения регрессии. Расчёт бета коэффициентов, уравнение множественной регрессии в стандартизованном масштабе. Задача на определение тесноты связи рядов.

    контрольная работа [192,2 K], добавлен 23.06.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.