Математическая статистика

Применение различных вариационных рядов к выборкам сгруппированных и несгрупированных данных, для каждой из которых проводится свой анализ. Графическое отображение вариационных рядов. Коррелиционно-регрессивный анализ для выборки несгруппированных данных.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 10.05.2019
Размер файла 365,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

В данной расчетно-графической работе мы изучим один из разделов прикладной математики - математическую статистику.

Математическая статистика рассматривает методы отыскания законов и характеристик случайных величин по результатам наблюдений и экспериментов. Анализ статистических данных включает оценку вероятностей события, функции распределения вероятностей или плотности вероятностей, оценку параметров известного распределения, оценку связей между случайными величинами. Данный раздел опирается на теорию вероятностей, служит основой для разработки методов обработки и анализа статистических результатов в конкретных областях человеческой деятельности.

Расчетно-графическая работа включает в себя два задания.

Первое задание заключается в применении различных вариационных рядов к выборкам сгруппированных и несгрупированных данных, для каждой из которых проводится свой анализ, заключающийся в определении числовых характеристик и несмещенных оценок данных выборок, а также графическое отображение вариационных рядов с помощью полигона, гистограммы и эмпирической функции распределения.

Второе задание - для выборки несгруппированных данных проводится полный коррелиционно - регрессивный анализ, заключающийся в установлении результивного и факторного признаков, обоснования парной зависимости, определении параметров уравнения регрессии, теснотой между изучаемыми признаками и оценивания значимости уравнения связи.

Задание 1:

1) По выборкам А и В решить следующие подзадачи:

· Составить вариационный ряд (по выборке А - дискретный вариационный ряд, по выборке В - интервальный вариационный ряд);

· Построить графики вариационных рядов (полигон и гистограмму);

· Построить эмпирические функции распределения вариационных рядов;

· Вычислить числовые характеристики - xв, Dв, S2, у вариационных рядов;

2) Для столбцов выборки С (не сгруппированных данных) вычислить числовые характеристики xв, Dв, S2, у

Задание 2:

Найти соответствующие уравнения регрессии Xy и Yx, построить их графики. Найти выборочный коэффициент регрессии, проверить его значимость.

Задание 1.

1. Составим дискретный вариационный ряд по выборке А.

Задан статистический ряд. Определим объем выборки. Для этого введем формулу «=СЧЁТ(диапазон)». Количество исходных данных: 94.

Таблица 1 - Массив выборки А

2

0

2

6

2

3

5

3

8

3

6

4

5

2

6

6

5

5

8

8

3

5

6

2

4

5

2

1

7

9

7

6

7

4

5

6

5

6

8

3

6

5

5

1

7

6

4

1

5

3

4

7

2

8

8

2

8

2

1

6

5

2

3

6

3

3

5

3

3

7

5

4

6

3

4

6

7

4

6

2

7

7

1

2

3

6

6

3

2

6

4

2

4

8

Отсортируем массив данных выборки А по возрастанию.

Сортировку выполним с помощью MS Excel. Для этого используем команду «Сортировка/Сортировка по возрастанию».

Далее последовательно подсчитаем количество повторений каждого варианта. Для подсчета в пакете MS Excel используем формулу «=СЧЁТЕСЛИ(диапазон; критерий)».

Строим дискретный вариационный ряд.

Таблица 2 - Дискретный вариационный ряд для выборки А

Значение признака

Частота значения признака (ni)

0

1

1

5

2

14

3

14

4

10

5

14

6

18

7

9

8

8

9

1

2. Составим интервальный вариационный ряд по выборке В. Длина интервала 4.

Задан статистический ряд. Определим объем выборки. Для этого введем формулу «=СЧЁТ(диапазон)». Получаем количество исходных данных: 181.

Таблица 3 - Массив выборки В

57

61

60

63

66

68

64

72

69

59

71

62

69

57

61

58

60

66

98

62

64

53

50

50

55

70

61

77

70

65

66

72

71

76

74

62

49

62

76

66

64

62

60

53

65

49

79

58

54

61

63

64

59

55

70

62

61

68

69

67

64

42

73

54

69

60

64

69

62

67

67

72

57

51

77

58

63

71

76

68

80

54

64

53

64

68

58

73

68

61

54

73

59

69

60

67

57

54

69

55

70

65

61

65

62

71

55

67

57

64

70

55

65

69

65

65

60

66

63

74

60

54

75

62

74

63

64

76

59

71

68

55

68

61

57

73

54

57

56

65

53

64

58

67

48

66

68

55

77

59

58

58

62

58

52

62

65

71

64

66

65

58

66

73

73

72

43

63

59

76

67

63

71

66

59

69

65

66

50

65

57

Отсортируем массив выборки В по возрастанию.

Сортировку выполним с помощью MS Excel. Для этого используем команду «Сортировка/Сортировка по возрастанию».

Определим максимальное и минимальное значения, размах выборки, а также верхние и нижние границы интервалов, длина интервала = 4.

Для этого используем формулу «=МАКС(диапазон)» (максимальное значение) и «МИН(диапазон)» (минимальное значение).

Максимальное значение = 98. Минимальное значение = 42.

Размах выборки (R) рассчитаем по формуле:

,

(1)

где xn - максимальное значение, x1 - минимальное значение

Размах выборки = 56.

Далее последовательно подсчитаем частоту значений признака для каждого интервала. Для подсчета в пакете MS Excel используем формулу «=СЧЁТЕСЛИ(диапазон; критерий)».

Строим интервальный вариационный ряд.

Таблица 4 - Интервальный вариационный ряд для выборки В

Интервал значений признака

Частота значения признака (ni)

42-46

2

46-50

3

50-54

9

54-58

23

58-62

31

62-66

42

66-70

34

70-74

22

74-78

12

78-82

2

82-86

0

86-90

0

90-94

0

94-98

0

98-102

1

3. Построим графики вариационных рядов (полигон и гистограмму)

1) Построим полигон частот выборки А. Для этого выделим данные таблицы 2 и используем команду «Вставка/График».

График 1 - Полигон частот выборки А

Построим гистограмму выборки А. Для этого сформируем новую таблицу. Рассчитаем частости (pi*) по формуле:

,

(2)

где ni - частота значений признака, n - объем выборки.

Таблица 5 - Данные, необходимые для построения гистограммы выборки А

Значение признака

Частота значений признака (ni)

Частость значений признака (pi*)

0

1

0,011

1

5

0,053

2

14

0,149

3

14

0,149

4

10

0,106

5

14

0,149

6

18

0,191

7

9

0,096

8

8

0,085

9

1

0,011

Используя данные столбцов таблицы 5 - «Значение признака» и «Частость значений признака (pi*)» (ось абсцисс - «Значение признака», ось ординат - «Частоcть значений признака (pi*)»), построим полигон частостей выборки А. Для этого в пакете MS Excel выделим соответствующие столбцы и используем команду «Вставка/График».

График 2 - Полигон частостей выборки А

Используя данные столбцов таблицы 5 - «Значение признака» и «Частость значений признака (pi*)» (ось абсцисс - «Значение признака», ось ординат - «Частоcть значений признака (pi*)»), построим гистограмму интервальных распределений выборки А. Для этого в пакете MS Excel выделим соответствующие столбцы и используем команду «Вставка/Гистограмма».

График 3 - Гистограмма выборки А

2) Построим графики интервального ряда выборки В.

Для этого сформируем новую таблицу. Определим середины интервалов (xi). Рассчитаем частости (pi*) по формуле (2)

Таблица 6 - Данные, необходимые для построения графиков выборки В

Интервал значений признака

Середины интервалов значений признака (xi)

Частота значений признака (ni)

Частость значений признака (pi*)

42-46

44

2

0,011

46-50

48

3

0,017

50-54

52

9

0,050

54-58

56

23

0,127

58-62

60

31

0,171

62-66

64

42

0,232

66-70

68

34

0,188

70-74

72

22

0,122

74-78

76

12

0,066

78-82

80

2

0,011

82-86

84

0

0

86-90

88

0

0

90-94

92

0

0

94-98

96

0

0

98-102

100

1

0,006

Используя данные столбцов таблицы 6 - «Середины интервалов (xi)» и «Частота значений признака (ni)» (ось абсцисс - «Середины интервалов (xi), ось ординат - «Частота значений признака (ni)»), построим полигон частот выборки B. Для этого в пакете MS Excel выделим соответствующие столбцы и используем команду «Вставка/График».

График 4 - Полигон частот выборки В

Используя данные столбцов таблицы 6 - «Середины интервалов значений признака (xi)» и «Частость значений признака (pi*)» (ось абсцисс - «Середины интервалов значений признака (xi), ось ординат - «Частоcть значений признака (pi*)»), построим полигон частостей выборки B. Для этого в пакете MS Excel выделим соответствующие столбцы и используем команду «Вставка/График».

График 5 - Полигон частостей выборки В

Используя данные столбцов таблицы 6 - «Интервал значений признака» и «Частость значений признака (pi*)» (ось абсцисс - «Интервал значений признака», ось ординат - «Частоcть значений признака (pi*)»), построим гистограмму интервальных распределений выборки B. Для этого в пакете MS Excel выделим соответствующие столбцы и используем команду «Вставка/Гистограмма».

График 6 - Гистограмма интервальных распределений выборки В

4. Построим эмпирическую функцию распределения (Fn*(x)),

которая определяется по формуле:

,

(3)

где P* - частость значений признака

Таким образом, для выборки А получим:

Таким образом, для выборки В получим:

5. Вычислим числовые характеристики для каждого ряда.

· Выборочную среднюю (хв) рассчитаем по формуле:

,

(4)

где n - объем выборки, xi - значение признака или середина интервалов значений признака (для выборки В), ni - частота значений признака

Таким образом, рассчитаем выборочную среднюю (xв) для выборки А:

Таким образом, рассчитаем выборочную среднюю (xв) для выборки В:

· Выборочную дисперсию (Dв) рассчитаем по формуле:

,

(5)

где n - объем выборки, xi - значение признака или середина интервалов значений признака (для выборки В), xв - выборочная средняя, ni - частота значений признака.

Таким образом, для дискретного вариационного ряда А получим:

Для интервального вариационного ряда получим:

· Исправленную (эмпирическую) дисперсию (S2) рассчитаем по формуле:

,

(6)

где n - объем выборки, Dв - выборочная дисперсия.

Таким образом, для выборки А получим:

Для выборки В получим:

· Среднее квадратическое отклонение (у) рассчитаем по формуле:

(7)

где Dв - выборочная дисперсия.

Таким образом, для выборки А получим:

Для выборки В получим:

6. Вычислим числовые характеристики для столбца выборки С (не сгруппированные данные)

Задан статистический ряд. Определим объем выборки. Для этого введем формулу «=СЧЁТ(диапазон)». Количество исходных данных:19.

Таблица 7 - Столбец выборки С

Рассчитаем числовые характеристики:

· Выборочную среднюю (xв) рассчитаем по формуле:

,

(8)

где xi - значение признака, n - объем выборки

Таким образом, получим:

· Выборочную дисперсию (Dв) рассчитаем по формуле:

,

(9)

где xi - значение признака, xв - выборочная средняя, n - объем выборки.

· Среднее квадратическое отклонение (у) рассчитаем по формуле:

(10)

где Dв - выборочная дисперсия.

Таким образом, получим:

· Исправленную (эмпирическую) дисперсию (S2) рассчитаем по формуле:

,

(11)

где n - объем выборки, Dв - выборочная дисперсия.

Таким образом, для выборки А получим:

Задание 2

Дана двумерная выборка X,Y не сгруппированных данных:

Таблица 8 - Двумерная выборка X,Y

x

-11,0

-9,1

-7,4

-5,0

-3,3

y

-0,5

-1,1

-1,5

-2,2

-1,7

Построим корреляционное поле точек (График 9 - Корреляционное поле для двумерной выборки X,Y)

Для несгрупированных данных уравнения регрессии будут иметь вид:

y = a + bx;

(12)

x = c + dy.

(13)

Для определения параметров a, b, c, d используем метод наименьших квадратов. Составим системы уравнений, используя формулы:

(14)

(15)

Для уравнения регрессии Yx составим расчетную таблицу (Таблица 9 - Расчетная таблица для уравнения регрессии Yx

Таблица 9 - Расчетная таблица для уравнения регрессии Yx и Xy

i

xi

yi

xi2

yi2

xiyi

1

-11,0

-0,5

121,00

0,25

5,50

2

-9,1

-1,1

82,81

1,21

10,01

3

-7,4

-1,5

54,76

2,25

11,10

4

-5,0

-2,2

25,00

4,84

11,00

5

-3,3

-1,7

10,89

2,89

5,61

-35,8

-7,0

294,46

11,44

43,22

Используя данную таблицу 9 и формулу 14, составим систему уравнений:

Решим эту систему. Получаем коэффициенты a и b: a = -2,696; b = -0,181. Таким образом, получаем уравнение линейной регрессии Y на X: y = -2,696 - 0,181х.

Аналогично, используя ту же таблицу 9, а также формулу 15, построим уравнение линейной регрессии X на Y. Для этого составим систему уравнений:

Из системы находим коэффициенты с и d: с = -13,050; d = -4,207. Тогда уравнение линейной регрессии X на Y будет иметь вид: x = -13, 050 - 4,207y.

Построим графики реальных данных и полученных зависимостей (График 10 - Графики реальных данных и полученных зависимостей).

Определим коэффициент корреляции (r) по формуле:

(16)

Рассчитаем среднее значение для х и у:

Для расчета коэффициента корреляции (r) составим расчетную таблицу (Таблица 10 - Расчетная таблица для коэффициента корреляции (r)).

Таблица 10 - Расчетная таблица для коэффициента корреляции (r)

i

xi

yi

1

-11

-0,5

-3,84

0,9

14,7456

0,81

-3,456

2

-9,1

-1,1

-1,94

0,3

3,7636

0,09

-0,582

3

-7,4

-1,5

-0,24

-0,1

0,0576

0,01

0,024

4

-5

-2,2

2,16

-0,8

4,6656

0,64

-1,728

5

-3,3

-1,7

3,86

-0,3

14,8996

0,09

-1,158

38,132

1,64

-6,9

Таким образом, используя данные таблицы 10 и формулу 16, получим значение коэффициента корреляции (r):

Так как , то связь между величинами X и Y тесная, обратная (т.к. ).

Проверим значимость коэффициента корреляции . Ошибка m для выборки n = 5, n < 100 рассчитывается по формуле:

(17)

Таким образом, получим:

Проверим значимость:

По таблицам распределения Стьюдента tтабл при б = 0,05 и числе степеней свободы = 3 имеет вид tтабл(0,05;3) = 3,18. Так как tнаб < tтабл, коэффициент корреляции незначим, связь между признаками случайна.

вариационный выборка корреляционный регрессивный

Заключение

В данной расчетно-графической работе мы ознакомились с основными понятиями математической статистики, освоили основные способы выполнения статистического анализа, ознакомились с методом выявления корреляционной зависимости, закрепили данные теоретические знания на практике.

Размещено на Allbest.ru

...

Подобные документы

  • Построение и графическое изображение вариационных рядов. Дискретный вариационный ряд распределения урожайности зерновых, сельскохозяйственных предприятий по качеству почв. Показатели центра распределения. Показатели формы и колеблемости признака.

    лабораторная работа [208,0 K], добавлен 15.05.2014

  • Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.

    курсовая работа [179,8 K], добавлен 11.01.2012

  • Изучение изменений анализируемых показателей во времени как важнейшая задача статистики. Понятие рядов динамики (временных рядов). Числовые значения того или иного статистического показателя, составляющего ряд динамики. Классификация рядов динамики.

    презентация [255,0 K], добавлен 28.11.2013

  • Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.

    контрольная работа [62,6 K], добавлен 20.02.2011

  • Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.

    лабораторная работа [58,7 K], добавлен 14.03.2014

  • Табличный метод представления данных правовой статистики. Абсолютные и обобщающие показатели. Относительные величины, их основные виды и применение. Среднее геометрическое, мода и медиана. Метод выборочного наблюдения. Классификация рядов динамики.

    контрольная работа [756,5 K], добавлен 29.03.2013

  • Основные понятия теории рядов. Методы суммирования расходящихся рядов. Суть метода степенных рядов, теоремы Абеля и Таубера. Метод средних арифметических, взаимоотношение между методами Пуассона-Абеля и Чезаро. Основные методы обобщенного суммирования.

    курсовая работа [288,0 K], добавлен 24.10.2010

  • Статистика – наука о массовых явлениях в природе и обществе; получение, обработка, анализ данных. Демографическая статистика, прогноз численности населения России. Методы обработки статистических данных: элементы логики, комбинаторики, теории вероятности.

    презентация [2,3 M], добавлен 19.12.2012

  • Применение в статистике конкретных методов в зависимости от заданий. Методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод. Корреляционный и дисперсный анализ. Расчет средних статистических величин.

    контрольная работа [29,5 K], добавлен 21.09.2009

  • Область сходимости степенного ряда. Нахождение пределов, вычисление определенных интегралов. Применение степенных рядов в приближенных значениях. Изучение особенностей решения дифференциальных уравнений. Достаточное условие разложимости функции в ряд.

    курсовая работа [1,3 M], добавлен 21.05.2019

  • Решение неравенств и определение области сходимости рядов по признаку Даламбера и теореме Лейбница для знакопеременных рядов. Условия и пределы сходимости ряда. Исследование границ интервала. Проверка условия Лейбница при знакочередующемся ряде.

    контрольная работа [127,2 K], добавлен 07.09.2010

  • Правила выполнения и оформления контрольных работ для заочного отделения. Задания и примеры решения задач по математической статистике и теории вероятности. Таблицы справочных данных распределений, плотность стандартного нормального распределения.

    методичка [250,6 K], добавлен 29.11.2009

  • Особенности применения степенных рядов для вычислений с различной степенью точности значений функций и определенных интегралов. Рассмотрение примеров решения ряда задач этим математическим методом с условием принятия значений допустимой погрешности.

    презентация [68,4 K], добавлен 18.09.2013

  • Определение условий сходимости положительного ряда и описание свойств гармонических рядов Дирихле. Изучение теорем сравнения рядов и описание схемы Куммера для вывода из нее признаков сравнения ряда. Вывод признаков сравнения Даламбера, Раабе и Бертрана.

    курсовая работа [263,6 K], добавлен 14.06.2015

  • Исследование сходимости рядов. Степенной ряд интеграла дифференциального уравнения. Определение вероятности событий, закона распределения случайной величины, математического ожидания, эмпирической функции распределения, выборочного уравнения регрессии.

    контрольная работа [420,3 K], добавлен 04.10.2010

  • Понятия, связанные с рядами и дифференциальными уравнениями. Необходимый признак сходимости. Интегрирование дифференциальных уравнений с помощью рядов. Уравнение Эйри и Бесселя. Примеры интегрирования в Maple. Приближенные вычисления с помощью рядов.

    курсовая работа [263,9 K], добавлен 11.12.2013

  • Математическая статистика как наука, методы ее изучения, история становления и развития, новейшие направления исследований. Порядок и этапы статистической обработки экспериментальных данных. Установление законов распределения выборочных совокупностей.

    курсовая работа [122,3 K], добавлен 09.08.2009

  • Формы, виды и способы статистического наблюдения. Виды группировок, их интервал и частота. Структура ряда динамики. Абсолютные и относительные статистические величины. Представление выборки в виде статистического ряда. Точечное и интервальное оценивание.

    курс лекций [1,1 M], добавлен 29.11.2013

  • Длина интервала группирования. Графическое описание выборки. Гистограмма относительных частот. Кусочно-постоянная функция. Границы доверительного интервала математического ожидания. Вычисление коэффициента корреляции. Эмпирическая функция распределения.

    практическая работа [737,5 K], добавлен 14.02.2009

  • Изучение прямых методов решения вариационных и краевых задач математического анализа. Основные идеи методов Ритца и Галеркина для нахождения приближенного обобщенного решения задачи минимизации функционала. Особенности, сходство и отличие данных методов.

    презентация [187,9 K], добавлен 30.10.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.