Сбор, подготовка и анализ статистических данных
Формулировка цели исследования, выбор исследуемых признаков. Описательные статистики вариационного и интервального рядов. Связь между факторным и исследуемым признаком. Интервальная и точечная оценка среднего и доли. Выравнивание вариационного ряда.
Рубрика | Социология и обществознание |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 20.01.2013 |
Размер файла | 223,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ
НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ «ХАРЬКОВСКИЙ ПОЛИТЕХНИЧЕСКИЙ ИНСТИТУТ»
Индивидуальное домашнее задание
по дисциплине «Статистика»
«Сбор, подготовка и анализ статистических данных»
Выполнила: студент группы
ЭИМ-20 Брежнев С.В.
Проверила: Гринберг Г.Л.
Харків 2012
Формулировка цели исследования, выбор исследуемых признаков
Цель исследования - определить спрос на пиццу употребляемую студентами за учебный год.
Объектом статистического наблюдения будет совокупность граждан.
Единица совокупности - студент (человек).
Основной исследуемый показатель - количество съеденной пиццы.
В проведении наблюдения будут исследоваться показатели, которые влияют на количество покупаемой пиццы:
- доход студентов
- количество потраченных денег за учебный год
- студент младших курсов, или старших
Статистическое наблюдение
сбор подготовка анализ статистическое данное
Способ наблюдения - опрос
В опросе принимали участие 18 студентов (1-2 курс) и 12 студентов (3-5 курс).
Исследование проводилось на улице Пушкинская 14.10.2012 года.
Всего в выборке 30 единиц наблюдения. Выборка является собственно - случайной.
Таблица 1. Исходные данные
№ |
К-во покупаемой пиццы за год |
кол-во денег потраченных на пиццу за год |
доход за месяц |
Студент младших или старших курсов |
|
2 |
40 |
500 |
1000 |
Студент(3-5 курса) |
|
12 |
40 |
750 |
1500 |
Студент(3-5 курса) |
|
20 |
40 |
400 |
2000 |
Студент(3-5 курса) |
|
29 |
40 |
600 |
2000 |
Студент(3-5 курса) |
|
5 |
80 |
700 |
2000 |
Студент(1-2 курс) |
|
7 |
80 |
650 |
500 |
Студент(3-5 курса) |
|
10 |
80 |
800 |
850 |
Студент(1-2 курс) |
|
13 |
80 |
550 |
3000 |
Студент(3-5 курса) |
|
15 |
80 |
750 |
900 |
Студент(3-5 курса) |
|
18 |
80 |
1000 |
1500 |
Студент(3-5 курса) |
|
26 |
80 |
500 |
2000 |
Студент(3-5 курса) |
|
3 |
120 |
650 |
800 |
Студент(3-5 курса) |
|
8 |
120 |
1000 |
700 |
Студент(1-2 курс) |
|
22 |
120 |
700 |
1000 |
Студент(1-2 курс) |
|
25 |
120 |
1600 |
1500 |
Студент(1-2 курс) |
|
4 |
160 |
750 |
1500 |
Студент(1-2 курс) |
|
11 |
160 |
1300 |
2000 |
Студент(1-2 курс) |
|
16 |
160 |
800 |
850 |
Студент(1-2 курс) |
|
19 |
160 |
1800 |
1500 |
Студент(3-5 курса) |
|
24 |
160 |
900 |
800 |
Студент(3-5 курса) |
|
28 |
160 |
1000 |
3000 |
Студент(1-2 курс) |
|
1 |
180 |
700 |
800 |
Студент(1-2 курс) |
|
9 |
180 |
950 |
1000 |
Студент(1-2 курс) |
|
21 |
180 |
1600 |
2500 |
Студент(1-2 курс) |
|
23 |
180 |
1000 |
3000 |
Студент(1-2 курс) |
|
27 |
180 |
1500 |
1500 |
Студент(1-2 курс) |
|
6 |
200 |
2000 |
2500 |
Студент(1-2 курс) |
|
14 |
200 |
1400 |
700 |
Студент(1-2 курс) |
|
17 |
200 |
800 |
1500 |
Студент(1-2 курс) |
|
30 |
200 |
1500 |
2000 |
Студент(1-2 курс) |
Группировка данных
Взаимосвязь количества денег на пиццу и количества покупаемой пиццы.
К-во купленных пицц |
среднее |
|
40 |
562,5 |
|
80 |
707,1429 |
|
120 |
987,5 |
|
160 |
1091,667 |
|
180 |
1150 |
|
200 |
1425 |
|
итого |
5923,81 |
Таблица 2. Аналитическая группировка
Рисунок 1
Из предоставленного графика видим что на 160 пицц (это около 4 пицц в неделю в течении учебного года )в среднем студент тратит 2000 грн.
2. Определение структуры исследуемой совокупности по виду деятельности.
Таблица 3. Структурная группировка
Студенты |
К-во |
Доля |
|
студент(3-5) |
12 |
40% |
|
студент(1-2) |
18 |
60% |
|
Всего |
30 |
100% |
Рисунок 2
Из заданной гистограммы мы видим, что среди опрашиваемых преобладает количество студентов младших курсов 60%, а количество старших студентов составляет 40%.
3. Распределение студентов в зависимости от их дохода.
Таблица 4. Типологическая группировка
Доход |
К-во |
Доля |
|
500 |
1 |
3% |
|
500-1000 |
11 |
37% |
|
1000-1500 |
7 |
23% |
|
1500-2000 |
6 |
20% |
|
<2000 |
5 |
17% |
|
Итог |
30 |
100% |
Рисунок 3
На графике видим, что у большинства студентов 37% доход составляет от 500 до 1000 грн.
4. Распределения дохода студентов в зависимости от их курса.
Таблица 5. Комбинационная группировка
Студент |
||||
Доход |
студент (3-5) |
студент(1-2) |
Итог |
|
0-500 |
1 |
0 |
1 |
|
500-1000 |
4 |
7 |
11 |
|
1000-1500 |
3 |
4 |
7 |
|
1500-2000 |
3 |
3 |
6 |
|
2000-2500 |
0 |
2 |
2 |
|
2500-3000 |
1 |
2 |
3 |
|
Итог |
12 |
18 |
30 |
Из таблицы делаем вывод, что большинство студентов и старших и младших курсов имеют доход от 500 до 1000 грн.
Описательные статистики вариационного и интервального рядов
Таблица 6. Вариационный ряд
Вариационный ряд |
||
Среднее |
128,7 |
|
мода |
80 |
|
Медиана |
120 |
|
Макс |
200 |
|
Мин |
40 |
|
Размах |
160 |
|
Дисперсия |
3025,7 |
|
Коэф асциляции |
124% |
|
Среднее квадратическое отклонение |
55,0 |
|
Коэф вариации |
43% |
|
Среднее линейное |
48,7 |
|
Коэф линейного отклонения |
38% |
|
Асимметричность |
-0,3 |
|
Эксцесс |
-1,3 |
Количество пицц варьируется от 40 до 200, при этом их среднее составляет примерно 129; мода равна 80, а медиана равна 120, что не превышает среднее и свидетельствует о наличии правосторонней симметрии, что подтверждает коэффициент асимметрии. Его значение (-0,3) говорит о незначительной асимметрии. Эксцесс отрицательный, что свидетельствует о плосковершинности распределения. Оценка показателя вариации свидетельствует о существенной вариации (43%), что превышает 40%.
Так как размах исследуемого показателя малой и длина интервала незначительна, то интервальный прогноз не имеет смысла.
Выявление связи между факторным и исследуемым признаком
1.Условие: влияет ли количество потраченных денег на пиццу на количество купленной пиццы.
Таблица 8. Выявления связи между количеством денег и количеством пицц.
Критерий фишера |
2,55961434 |
|
Ф-критическое |
3,35413083 |
Fкр >F - нулевая гипотеза не отвергается, факторный признак не существенно влияет на результирующий.
Влияние количества потраченных денег на пиццу, на количество самой пиццы, превышающие 80 (шт/год).
Таблица 9. Выявления связи между количеством денег и количеством купленой дешевой еды
Среднее из групп |
0,183333333 |
|
Межгр дисперсия |
0,05 |
|
Общая дисперсия |
0,25 |
|
Коэф детермин |
27% |
|
Эмпир корел отн |
0,5 |
|
Критерий фишера |
4,93 |
|
Ф критическое |
3,35 |
27% дисперсии доли покупаемых пицц больше 80 (шт/год) объясняется количеством потраченных денег на них. Эмпирическое корреляционное отношение(0,5) говорит об умеренной связи между факторным и исследуемым признаками.
Критерий фишера |
4,93 |
|
Ф критическое |
3,35 |
F > Fкр - нулевая гипотеза отвергается, факторный признак влияет на результирующий, связь подтверждается
2. Условие: зависит ли количество приобретенных пицц от вида курса студентов.
Таблица 10. Выявления связи между количеством купленных студентами пицц и их учебным курсом
Студенты |
К-во показателей |
К-во купленных пицц в год |
Среднее |
Дисперсия |
|
Студенты(1-2) |
18 |
80, 80, 120, 180, 160, 160, 200, 160, 180, 120, 180, 200, |
158,8889 |
1443,20988 |
|
Студенты(3-5) |
12 |
40, 40, 80, 40, 120, 80 |
80 |
800 |
|
Итог |
30 |
Общее |
127,3333 |
2679,56 |
Среднее из групп |
1185,926 |
|
Межгруп дисперсия |
1493,63 |
|
Общая дисперсия |
2679,56 |
|
Коэф детерминации |
55,74% |
|
Эмпир коррел отн |
0,7 |
Эмпирическое корреляционное отношение (0,7) показывает сильную связь между показателями.
Критерий Фишера |
35,26496 |
|
Ф-критическое |
4,195972 |
Fкр<F - нулевая гипотеза отвергается, факторный признак существенно влияет на результирующий.
Таблица 11. Влияние вида деятельности граждан на количество приобретенных пицц больше 80 шт/год.
студенты |
К-во показателей |
К-во книг |
m |
P |
Дисперсия |
|
Студенты(1-2) |
18 |
80,80,120,180,160,160,200 |
16 |
0,8888889 |
0,09876543 |
|
Студенты(3-5) |
12 |
40,40,80,40,120,80 |
3 |
0,25 |
0,1875 |
|
Итог |
30 |
Общее |
19 |
0,6333333 |
0,23222222 |
Среднее из групп |
0,134259259 |
|
Межгруп дисперсия |
0,097962963 |
|
Общая дисперсия |
0,232222222 |
|
Коэф детерминации |
42% |
|
Эмпир коррел отн |
0,6 |
Эмпирическое корреляционное отношение (0,6) показывает сильную связь между показателями.
Критерий Фишера |
20,43034 |
|
Ф-критическое |
4,195972 |
Fкр<F - нулевая гипотеза не подтверждается, факторный признак существенно влияет на результирующий
Интервальная и точечная оценка среднего и доли
Определим интервальную и точечную оценку среднего количества пицц с вероятностью 95%.
Таблица 12. Сравнение собственно случайной и стратифицированной выборки для среднего
1) собственно случайная выборка |
2) стратифицированная выборка |
|||||
T |
1,96 |
t |
1,96 |
|||
P |
95% |
P |
95% |
|||
Mx |
0,091287 |
Mx |
0,076578049 |
|||
выб среднее |
3,4 |
выб среднее |
3,4 |
|||
дельта х |
0,58204141 |
дельта х |
0,480703055 |
|||
3,1 |
Х |
3,7 |
3 |
Х |
3,9 |
С вероятностью 95% среднее количество пицц лежит в интервале от 3,1 до 3,7 в собственно случайной выборке, и в интервале от 3 до 3,9 в стратифицированной. Определить долю граждан, количество книг которых больше среднего с доверительной вероятностью 95%
Таблица 13. Сравнение собственно случайной и стратифицированной выборки для доли
1) собственно случайная выборка |
2) стратифицированная доля |
|||||
t |
1,96 |
t |
1,96 |
|||
P |
95% |
P |
95% |
|||
Mр |
0,091287 |
Mр |
0,076578049 |
|||
выб среднее |
3,4 |
выб среднее |
3,4 |
|||
дельта р |
22% |
дельта р |
15% |
|||
28% |
Р |
64% |
35% |
Р |
65% |
Доля граждан, количество потребляемых пицц которых превышает среднее колеблется от 28% до 64%. Стратифицированная выборка не дала более точную оценку.
Выравнивание вариационного ряда
Выполняем выравнивание по распределению Пуассона.
Выдвигаем нулевую гипотезу о Пуассоновском распределении количества потребляемых пицц.
Таблица 14. Пуассоновское распределение, Пусть 1х=40,2х=80,3х=120,4х=160,5х=180,6х=200
x |
f |
S |
Px |
f' |
S' |
a |
|
1 |
4 |
4 |
0,212764 |
6 |
6 |
3,4 |
|
2 |
7 |
11 |
0,365244 |
11 |
17 |
11,78778 |
|
3 |
4 |
15 |
0,418002 |
13 |
30 |
40,47137 |
|
4 |
6 |
21 |
0,358785 |
11 |
41 |
138,9517 |
|
5 |
5 |
26 |
0,246366 |
7 |
48 |
477,0675 |
|
6 |
4 |
30 |
0,140976 |
4 |
52 |
1637,932 |
X |
Xkr |
|
1,000083 |
9,49 |
Гипотеза, что данные распределены по закону Пуассона не отвергается (Хкр>X).
Размещено на Allbest.ru
...Подобные документы
Составная часть обработки данных статистического наблюдения-построение рядов распределения. Характеристики, графические изображения вариационного ряда. Оценка тесноты связи между количественными признаками, ранговые коэффициенты К.Спирмэна и М.Кендэла.
контрольная работа [72,9 K], добавлен 24.09.2008Предварительная подготовка к исследованию и последовательность действий обследователя: выбор проблемы, постановка общего вопроса, подвопросы и формулировка цели. Сбор и классификация информации, полевой и заключительный этапы работы исследователя.
курсовая работа [123,2 K], добавлен 29.03.2011Методика получения исходных данных для статистического исследования. Статистическая сводка и группировка первичных данных. Гистограмма и кумулята, корреляционный анализ. Связь между факторным и результативным признаками. Построение корреляционной таблицы.
курсовая работа [166,2 K], добавлен 20.10.2010Единое социологическое знание науки об обществе. Поиск, сбор, обобщение, анализ эмпирических данных. Анализ информации и подготовка итоговых документов социологического исследования. Комплексный характер методов сбора социологической информации.
презентация [2,7 M], добавлен 19.10.2015Задачи статистики населения, источники статистических данных. Система показателей статистики населения. Статистический анализ демографической ситуации за 2005-2007 гг. Факторный анализ и статистическое прогнозирование показателей статистики населения.
курсовая работа [8,4 M], добавлен 24.06.2010Географические особенности Республики Саха, характеристика используемых статистических показателей исследования численности населения и описание методологических особенностей. Расчет относительных статистических показателей, анализ динамического ряда.
курсовая работа [187,4 K], добавлен 26.03.2011Социальная статистика как количественная характеристика структуры общества, жизни и деятельности людей, их взаимоотношения с правом. Роль и сферы применения статистических данных. Объекты исследования, общие и специфические задачи социальной статистики.
презентация [3,2 M], добавлен 27.02.2014Подготовка эмпирических данных к обработке и анализу. Сущность и виды группировок, понятие рядов распределения. Графическое представление информации в анализе социологических данных. Структура и требования к отчету о социологическом исследовании.
контрольная работа [320,8 K], добавлен 05.04.2011Проведение корреляционного анализа с целью установления зависимости результативного признака у от факторного признака х. Определение показателей вариации. Анализ динамических рядов. Выявление среднего абсолютного прироста, темпа роста и прироста.
курсовая работа [411,2 K], добавлен 26.10.2014Специфика статистического изучения действительности. Представление обощающих показателях в абсолютных, относительных и средних величинах. Становление зарубежной и российской статистики. Виды статистических показателей. Экономико-статистический анализ.
курсовая работа [37,8 K], добавлен 25.01.2009Формирование исходной выборки. Статистические распределения рядов признаков-факторов и результирующего признака. Проверка однородности и нормальности. Вывод зависимостей результирующего-признака от факторов-признаков. Определение доверительного интервала.
курсовая работа [987,0 K], добавлен 13.05.2009Изучение сущности санитарной статистики, которая изучает здоровье населения, безопасность среды обитания для здоровья населения. Характеристика системы показателей производственного травматизма. Анализ статистических данных по Новосибирской области.
контрольная работа [40,6 K], добавлен 11.09.2010Сущность социологического исследования. Этапы его проведения: разработка программы, сбор первичных данных путем опроса, наблюдения или эксперимента, проведение линейного и структурно-типологического анализа результатов исследования, их оформление.
реферат [37,1 K], добавлен 28.11.2010Информационная база статистического исследования. Цели и способы проведения статистического наблюдения - планомерного сбора данных, сведений о массовых явлениях и процессах, заключающегося в регистрации отобранных признаков у каждой единицы совокупности.
лекция [27,0 K], добавлен 14.01.2011Количественные стороны массовых социально-экономических явлений как предмет статистики. Общие правила и приемы статистических исследований. Виды и способы статистического наблюдения. Программно-методологические вопросы статистического наблюдения.
реферат [22,5 K], добавлен 19.02.2010Основные виды социологических исследований: теоретические (разведывательные, описательные, аналитические) и эмпирические (международные, общенациональные, региональные, локальные, отраслевые). Обработка результатов и анализ эмпирических данных социологии.
контрольная работа [32,3 K], добавлен 02.08.2011Понятие социологического исследования. Подготовка эмпирических данных к обработке и анализу. Сущность и виды группировок. Таблицы и графики: их роль в анализе социологических данных. Структура отчета об исследовании. Основные требования к его составлению.
контрольная работа [542,4 K], добавлен 10.11.2010Определение понятия среднего класса в Российской Федерации, история и общая характеристика признаков. Критерии отнесения к среднему классу: уровень образования, уровень доходов и потребления. Структура и функции среднего класса в современном обществе.
курсовая работа [155,3 K], добавлен 10.01.2011Статистическое исследование, получение первичной статистической информации. Систематизация данных, сводная характеристика всей совокупности фактов при помощи обобщающих статистических показателей. Определение статистической закономерности. Ошибки выборки.
реферат [37,7 K], добавлен 06.03.2009Показатели статистики образования - отрасли статистики, изучающей деятельность учреждений: дошкольных; общеобразовательных; начального, среднего, высшего профессионального и дополнительного образования. Исследование развития рынка услуг образования.
курсовая работа [380,0 K], добавлен 07.05.2012