Обработка и анализ информации в программе "IBM SPSS Statistics 20"
Сбор, систематизация и интерпретация сложных данных. Понятия описательной статистики. Метод наследования мощных измерений стандартных ошибок и доверительных интервалов для измерений. Математическое представление структурных зависимостей между выборками.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 15.05.2017 |
Размер файла | 525,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
28
Размещено на http://www.allbest.ru/
Министерство образования и науки России
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
«Череповецкий государственный университет»
Институт информационных технологий
Кафедра Информационной безопасности
Дисциплина: Технологии обработки информации
Курсовая работа
Обработка и анализ информации в программе "IBM SPSS Statistics 20"
Череповец, 2014 г.
Содержание
Введение
1. Виды и методы анализа данных
2. Теоретические сведения
3. Формулы и понятия описательной статистики
4. Практическая часть
Заключение
Список использованной литературы
Введение
описательный статистика выборка
IBM® SPSS® Statistics - это универсальная система для анализа данных.
SPSS Statistics может считывать данные практически любого типа и использовать их для создания табличных отчетов, диаграмм, графиков распределений и трендов, вычисления показателей, проведения статистического анализа и построения моделей.
Для расширения функциональных возможностей базовой системы IBM® SPSS® Statistics доступны следующие дополнительные модули:
Статистическая база предоставляет широкий диапазон статистических процедур для базового анализа и создания отчетов, включая частоты, сопряженности и описательные таблицы, кубы OLAP и отчеты шифровальных книг. Также этот модуль предоставляет широкий диапазон уменьшения размера, методы классификации и сегментации, например факторный анализ, кластерный анализ, анализ методом ближайшего соседа и анализ дискриминантной функции. Кроме этого, SPSS Statistics База предлагает широкий диапазон алгоритмов сравнения средних величин и методы прогноза, например t-статистику, дисперсионный анализ, линейную и порядковую регрессию.
В Advanced Statistics содержатся методы, часто используемые в сложных экспериментальных и биомедицинских исследованиях. Он включает процедуры общей линейной модели (ОЛМ), смешанных линейных моделей, анализа компонент дисперсии, логлинейного анализа, порядковой регрессии, страховых таблиц, анализа выживаемости Каплана-Мейера, а также базовую и расширенную регрессию Кокса.
Бутстреппинг является методом наследования мощных измерений стандартных ошибок и доверительных интервалов для измерений, таких как среднее, медиана, пропорция, кумулятивное отношение, коэффициенты корреляции и регрессии.
Categories - процедуры оптимального шкалирования, включая анализ соответствий.
Complex Samples позволяет тем, кто проводит выборочные опросы и обследования, создавать выборки со сложными планами и учитывать сложные планы выборок при анализе.
Conjoint позволяет измерять влияние отдельных атрибутов товаров на предпочтения потребителей.
С помощью Conjoint можно легко измерять эффект попеременного использования каждого атрибута продукта в контексте набора атрибутов продукта -- как это делают потребители, когда принимают решение о покупке.
Custom Tables позволяет создавать разнообразные табличные отчеты, готовые для презентаций, включая сложные отчеты и таблицы для переменных с множественными ответами.
Data Preparation позволяет практически мгновенно получить первое представление о данных. Этот дополнительный модуль также позволяет применять к данным правила проверки для обнаружения недопустимых значений. Вы можете создавать правила, которые выявляют значения, выходящие за пределы диапазона, и пропущенные значения. Имеется возможность сохранять переменные, содержащие информацию о нарушении правил контроля и общее количество нарушений по каждому наблюдению. Предоставляется ограниченный набор предопределенных правил, который можно скопировать или изменить.
Decision Trees позволяет строить модели деревьев классификации. Такие модели классифицируют наблюдения на группы или предсказывают значения зависимой (целевой) переменной по значениям независимой переменной (предиктора). Для таких моделей также доступны инструменты проверки для разведочного и подтверждающего классификационного анализа. Прямой маркетинг позволяет сделать маркетинговые программы эффективными в такой степени, насколько это возможно с помощью методов, специально разработанных для прямого маркетинга.
Exact Tests позволяет вычислять точные уровни p для статистических критериев в том случае, когда маленький размер или неравномерность выборки может сделать обычные критерии неточными. Этот модулю доступен только в версиях для систем Windows.
Forecasting дает возможность анализировать и предсказывать временные ряды, предоставляя множество моделей аппроксимации кривых, сглаживания, а также методов оценивания авторегрессионных функций.
Missing Values дает возможность описывать закономерности в пропущенных данных, оценивать средние значения и другие статистики и производить импутацию пропущенных значений.
Neural Networks может использоваться при выборе решений в сфере бизнеса при предсказании спроса на продукцию как функции от цены и от других переменных, или при группировке клиентов на основе покупательских привычек и демографических характеристик. Нейронные сети являются средством нелинейного моделирования данных. Они могут быть полезны при моделировании сложных отношений между входом и выходом или при поиске шаблонов в данных.
В Regression реализованы методы анализа данных, не удовлетворяющих предположениям традиционных линейных статистических моделей. Он содержит процедуры для пробит-анализа, логистической регрессии, взвешенного оценивания, двухэтапной регрессии методом наименьших квадратов, общей нелинейной регрессии.
Amos™ (analysis of moment structures) использует моделирование при помощи структурных уравнений для подтверждения и объяснения концептуальных моделей для атрибутов, восприятия и других поведенческих факторов.
1. Виды и методы анализа данных
описательный статистика выборка
Метод статистического анализа информации - это раздел математической статистики, который посвящен методам сбора, систематизации и интерпритации сложных данных.
Этапы статистического анализа данных:
- Получение исходных данных
- Сводка и группировка данных
- Анализ данных.
Выборка данных -- множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.
Корреляционный анализ - это группа статистических методов, направленная на выявление и математическое представление структурных зависимостей между выборками.
Корреляционно-регрессионный анализ и его возможности
Корреляционный анализ является одним из методов статистического анализа взаимосвязи нескольких признаков.
Он определяется как метод, применяемый тогда, когда данные наблюдения можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону. Основная задача корреляционного анализа (являющаяся основной и в регрессионном анализе) состоит в оценке уравнения регрессии.
Корреляция - это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.
Парная корреляция - связь между двумя признаками (результативным и факторным или двумя факторными).
Частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.
Множественная корреляция - зависимость результативного и двух или более факторных признаков, включенных в исследование.
Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным признаком и множеством факторных признаков (при многофакторной связи).
Теснота связи количественно выражается величиной коэффициентов корреляции. Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками, дают возможность определить «полезность» факторных признаков при построении уравнений множественной регрессии. Величина коэффициентов корреляции служит также оценкой соответствия уравнению регрессии выявленным причинно-следственным связям.
Первоначально исследования корреляции проводились в биологии, а позднее распространились и на другие области, в том числе на социально-экономическую. Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму. И корреляция, и регрессия служат для установления соотношений между явлениями и для определения наличия или отсутствия связи между ними. Перед рассмотрением предпосылок корреляционного и регрессионного анализа, следует сказать, что общим условием, позволяющим получить более стабильные результаты при построении корреляционных и регрессионных моделей биржевых ставок, является требование однородности исходной информации. Эта информация должна быть обработана на предмет аномальных, т.е. резко выделяющихся из массива данных, наблюдений. Эта процедура выполняется за счет количественной оценки однородности совокупности по какому-либо одномерному или многомерному критерию (в зависимости от исходной информации) и имеет цель тех объектов наблюдения, у которых наилучшее (или наихудшее) условия функционирования по не зависящим или слабо зависящим причинам.
После обработки данных на предмет «аномальности» следует провести проверку, насколько оставшаяся информация удовлетворяет предпосылкам для использования статического аппарата при построении моделей, так как даже незначительные отступления от этих предпосылок часто сводят к нулю получаемый эффект. Следует иметь ввиду, что вероятностное или статистическое решение любой экономической задачи должно основываться на подробном осмыслении исходных математических понятий и предпосылок, корректности и объективности сбора исходной информации, в постоянном сочетании с теснотой связи экономического и математико-статистического анализа.
Для применения корреляционного анализа необходимо, чтобы все рассматриваемые переменные были случайными и имели нормальный закон распределения. Причем выполнение этих условий необходимо только при вероятностной оценке выявленной тесноты связи.
Рассмотрим простейшие случай выявления тесноты связи - двумерную модель корреляционного анализа.
Для характеристики тесноты связи между двумя переменными обычно пользуются парным коэффициентом корреляции , если рассматривать генеральную совокупность, или его оценкой - выборочным парным коэффициентом , если изучается выборочная совокупность. Парный коэффициент корреляции в случае линейной формы связи вычисляют по формуле
,
а его выборочное значение - по формуле
При малом числе наблюдений выборочный коэффициент корреляции удобно вычислять по следующей формуле:
Величина коэффициента корреляции изменяется в интервале .
При между двумя переменными существует функциональная связь, при - прямая функциональная связь. Если , то значение Х и У в выборке некоррелированы; в случае, если система случайных величин имеет двумерное нормальное распределение, то величины Х и У будут и независимыми.
Если коэффициент корреляции находится в интервале , то между величинами Х и У существует обратная корреляционная связь. Это находит подтверждение и при визуальном анализе исходной информации. В этом случае отклонение величины У от среднего значения взяты с обратным знаком.
Если каждая пара значений величин Х и У чаще всего одновременно оказывается выше (ниже) соответствующих средних значений, то между величинами существует прямая корреляционная связь и коэффициент корреляции находится в интервале .
Если же отклонение величины Х от среднего значения одинаково часто вызывают отклонения величины У вниз от среднего значения и при этом отклонения оказываются все время различными, то можно предполагать, что значение коэффициента корреляции стремится к нулю.
Следует отметить, что значение коэффициента корреляции не зависит от единиц измерения и выбора начала отсчета. Это означает, что если переменные Х и У уменьшить (увеличить) в К раз либо на одно и то же число С, то коэффициент корреляции не изменится.
Регрессионный анализ раздел математич. статистики, объединяющий практич. методы исследовании регрессионной зависимости между величинами по статистич. Данным основано на использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска: что искать. Если делать все правильно, то формирование списка ключевых слов требует предварительной работы по составлению тезауруса. Регрессионные процедуры позволяют рассчитать модель, описываемую некоторым уравнением и отражающую функциональную зависимость между экспериментальными количественными переменными, а также проверяют гипотезу об адекватности модели экспериментальным данным. По полученным результатам можно оценить природу и степень зависимости переменных и предсказать новые значения зависимой переменной.
Регрессионный анализ позволяет рассчитать модель, описываемую некоторым уравнением и отражающую функциональную зависимость между экспериментальными количественными переменными, а также проверяют гипотезу об адекватности модели экспериментальным данным. По полученным результатам можно оценить природу и степень зависимости переменных и предсказать новые значения зависимой переменной.
Дисперсионный анализ применяется для исследования влияния одной или нескольких качественных переменных (факторов) на одну зависимую количественную переменную (отклик). Дисперсионный анализ -- это статистический метод оценки связи между факторными и результативным признаками в различных группах, отобранный случайным образом, основанный на определении различий (разнообразия) значений признаков. В основе дисперсионного анализа лежит анализ отклонений всех единиц исследуемой совокупности от среднего арифметического. В качестве меры отклонений берется дисперсия (В) -- средний квадрат отклонений.
Отклонения, вызываемые воздействием факторного признака (фактора) сравниваются с величиной отклонений, вызываемых случайными обстоятельствами. Если отклонения, вызываемые факторным признаком, более существенны, чем случайные отклонения, то считается, что фактор оказывает существенное влияние на результативный признак.
Описательная статистика
Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распределения их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.
Методы описательной статистики
Методами описательной статистики называются методы описания выборок х1, х2, ..., хn с помощью различных показателей и графиков. Достоинство методов описательной статистики в том, что ее простые и довольно информативные статистические показатели избавляют от необходимости просмотра большого количества значений выборки. Показатели описательной статистики
Показатели, описывающие выборку можно разбить на несколько групп:
1. Показатели положения описывают положение данных (или середины совокупности) на числовой оси:
- Минимальный и максимальный элементы выборки
- Выборочные верхний и нижний квартили
- Среднее
- Выборочная медиана
- Выборочная мода
2. Показатели разброса описывают степень разброса данных относительно своего центра (насколько кучно основная масса данных группируется около середины совокупности)
- Дисперсия выборки
- Выборочное среднее квадратическое отклонение (стандартное отклонение)
- Размах
- Коэффициент эксцесса
3. Показатели асимметрии описывают симметричность распределения данных около своего центра
- Коэффициент асимметрии
- Положение выборочной медианы относительно выборочного среднего и относительно выборочных квартилей
- Гистограмма
4. Показатели, описывающие закон распределения, дают представление о законе распределения данных
- Гистограмма
- Выборочная функция распределения
- Таблица частот
Из перечисленных выше характеристик на практике по традиции чаще всего используют выборочные среднее, медиану и дисперсию (или стандартное отклонение). Однако для получения более точных и достоверных выводов необходимо использовать и другие показатели.
Особое внимание следует обратить на наличие в выборке выбросов - грубых, сильно отличающихся от основной массы, наблюдений.
Большинство традиционных статистических методов весьма чувствительны к отклонениям от условий применимости метода.
Поэтому выбросы могут не только исказить значение выборочных показателей, но и привести к ошибочным выводам. Подозрение о присутствии таких наблюдений должно возникнуть, если выборочная медиана сильно отличается от выборочного среднего, хотя в целом совокупность симметрична, или, если положение медианы сильно несимметрично относительно минимального и максимального элементов выборки. Проще всего обнаружить выбросы с помощью перехода от выборки к вариационному ряду или гистограмме с большим числом интервалов группировки.
2. Теоретические сведения
Что же такое информация и данные и в чем же отличие этих двух понятий?!
Чтобы проще было понять, можно привести простую аналогию: Любая информация есть данные, но не все данные - информация. На первый взгляд, достаточно сложное и расплывчатое объяснение, однако, давайте по порядку.
Обратимся к такому источнику как Wikipedia и посмотрим какие определения дает нам данный ресурс:
Дамнные -- представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе.
Изначально -- данные величины, то есть величины, заданные заранее, вместе с условием задачи. Противоположность -- переменные величины.
Данные сами могут выступать в роли сообщений при условии их декодирования. Данные, могут подвергаться обработке, и результаты обработки фиксируются в виде новых данных.
Информация - психический продукт любого психофизического организма, производимый им при использовании какого-либо средства, называемого средством информации. Информация или сообщение, или данные не передаются от организма к организму, но формируются при пользовании средствами информации, которые могут передаваться-получаться от одного организма к другому. Например, книги являются средствами информации. С помощью книг - определенных изделий человек может, действуя на себя данными средствами (книгами) производить информацию в разговорном языке означает передаваемые сведения, знания; нечто осмысленное и как-то полезное получателю. Такое словоупотребление довольно верном: informare с латыни -- «научать». Информацией является и эта книга.
Можно сделать вывод, что Информация - это данные, которые могут быть интерпретированы получателем. Например, если взять любую книгу, на незнакомом языке, то она будет содержать множество данных (букв, слов), но поскольку, из-за незнания языка, вы не способны интерпретировать эти наборы данных, то они, соответственно не несут никакой информации для вас. Человек, обладающий знаниями языка, сможет обработать данные и получить из них информацию.
В связи с этим, наш курсовой проект и называется “Технология обработки информации”, поскольку основной идеей и задачей является работа именно с информацией.
Из этого вывода вытекает необходимость ознакомления со Свойствами Информации, которые необходимо знать, прежде чем приступать к обработке информации.
Новизна
Главной характеристикой информации является ее новизна. Все, что не привносит новизны в наше понимание сущности объекта или явления - информацией не является.
Объективность
Объективность информации характеризует её независимость от чьего-либо мнения или сознания, а также от методов получения. Более объективна та информация, в которую методы получения и обработки вносят меньший элемент субъективности.
Полнота
Информацию можно считать полной, когда она содержит минимальный, но достаточный для принятия правильного решения набор показателей. Как неполная, так и избыточная информация снижает эффективность принимаемых на основании информации решений.
Достоверность
Достоверность - верность информации, не вызывающая сомнений. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Причинами недостоверности могут быть: преднамеренное искажение (дезинформация); непреднамеренное искажение субъективного свойства; искажение в результате воздействия помех; ошибки фиксации информации.
В общем случае достоверность информации основывается на фактах, достигается: указанием времени свершения событий, сведения о которых передаются; сопоставлением данных, полученных из различных источников; своевременным вскрытием дезинформации; исключением искажённой информации и др.
Адекватность
Адекватность -- степень соответствия смысла реально полученной информации его ожидаемому содержимому. Например, задан вопрос - "Сколько у человека пальцев на руке?" "На руке у человека пять пальцев" - ответ достоверный и адекватный, "У человека две руки" - ответ достоверный, но неадекватный.
Актуальность
Актуальность информации -- это степень соответствия информации текущему моменту времени.
Эмоциональность
Эмоциональность -- свойство информации вызывать различные эмоции у людей. Это свойство информации используют производители медиаинформации. Чем сильнее вызываемые эмоции, тем больше вероятности обращения внимания и запоминания информации.
Как мы видим, в рассмотренных нами понятиях нет ничего страшного и сложно. Информация и данные плотно вошли в нашу жизнь, и следуют за человеком с момента его рождения. А развивающиеся технологии упрощают процесс структурирования и автоматизации работ над информацией. Однако, никогда не следует забывать про критическое мышление в процессах связанных с рассмотренными выше понятиями. Также следует помнить про семь основных свойств информации для достижения максимального успеха.
3. Формулы и понятия описательной статистики
1. Среднее (оценка среднего, выборочное среднее) -- сумма значений переменной, деленная на n (число значений переменной). Если вы имеете значения Х(1), ..., X(N), то формула для выборочного среднего имеет вид:
х =
2. Дисперсия (D)
Дисперсия выборки или выборочная дисперсия (от английского variance) - это мера изменчивости переменной. Термин впервые введен Фишером в 1918 году. Выборочная дисперсия вычисляется по формуле:
s2 =
где `х -- выборочное среднее, N -- число наблюдений в выборке
3. Стандартное отклонение (у)
Стандартное отклонение, среднее квадратичное отклонение (от английского standard deviation) вычисляется как корень квадратный из дисперсии. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего.
4. Медиана (Ме)
Медианой (англ. median) называется значение исследуемого признака, справа и слева от которого находится одинаковое число упорядоченных элементов выборки. Если объем выборки - четное число, то медианой является среднее арифметическое двух центральных членов. Другими словами медиана разбивает выборку на две равные части. Также, как и среднее арифметическое, медиана дает общее представление о том, где находится центр выборки. В некоторых случаях медиана более удобна, чем среднее.
5. Мода (англ. mode) представляет собой наиболее часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной). Сложность состоит в том, что редкая выборка имеет единственную моду. Если в выборке несколько мод, то говорят, что она мультимодальна или многомодальна (имеет два или более «пика»). Таким образом можно сказать, что мода характеризует не только положение выборки, но отчасти и форму ее распределения.
Мода представляет собой максимально часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной), например, популярная передача на телевидении, модный цвет платья или марка автомобиля и т. д, Сложность в том, что редкая совокупность имеет единственную моду. (Например: 2, 6, 6, 8, 9, 9, 9, 10 - мода = 9).
4. Практическая часть
Исходные данные
№ |
Регион |
Кредиты, предоставленные предприятиям, организациям, банкам и физическим лицам, млн. руб. |
Среднегодовая численность, занятых в экономике, тыс. чел. |
Среднедушевые денежные доходы в месяц, руб. |
Среднемесячная заработная плата, работающих в экономике, руб. |
Основные фонды в экономик, млн. руб. |
Удельный вес убыточных предприятий, % |
Число малых предприятий, тыс. |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|||
1 |
Белгородская область |
342,5 |
671,3 |
1382,4 |
1717 |
145787 |
39,1 |
4,6 |
|
2 |
Брянская область |
275,4 |
593,7 |
1150 |
1213,1 |
113415 |
52,6 |
3,8 |
|
3 |
Владимирская область |
112,1 |
726,4 |
1127,2 |
1573,4 |
129272 |
41,1 |
6,9 |
|
4 |
Воронежская область |
274,5 |
1090,9 |
1239 |
1376 |
211898 |
39,4 |
11 |
|
5 |
Ивановская область |
141,5 |
491,2 |
912,3 |
1184,3 |
84550 |
45,7 |
5,1 |
|
6 |
Калужская область |
129 |
488,7 |
1212,1 |
1664,3 |
105783 |
36,9 |
5,9 |
|
7 |
Костромская область |
50,7 |
337,6 |
1240,8 |
1508,3 |
83716 |
55 |
3,2 |
|
8 |
Курская область |
401,3 |
616,6 |
1258,7 |
1453,6 |
124453 |
49,3 |
2,8 |
|
9 |
Липецкая область |
125,3 |
572,8 |
1692,9 |
1880,8 |
129114 |
33,8 |
4,3 |
|
10 |
Московская область |
5814,2 |
2441,9 |
1908,3 |
2269,3 |
659675 |
28,6 |
46 |
|
11 |
Орловская область |
58 |
420 |
1324,9 |
1535 |
64366 |
35,6 |
2,5 |
|
12 |
Рязанская область |
456,5 |
539,5 |
1200,4 |
1482,4 |
110379 |
41,5 |
6,4 |
|
13 |
Смоленская область |
192,2 |
473,9 |
1626,3 |
1656,4 |
125247 |
49,6 |
2,6 |
|
14 |
Тамбовская область |
82,3 |
532,8 |
1432,7 |
1234,5 |
111642 |
53,9 |
3,6 |
|
15 |
Тверская область |
319,1 |
669,6 |
1197,7 |
1574,5 |
175833 |
49,8 |
5,7 |
|
16 |
Тульская область |
638,3 |
786,9 |
1428,1 |
1654,9 |
156543 |
41,5 |
6,3 |
|
17 |
Ярославская область |
727,9 |
666,5 |
1683 |
1905,8 |
185442 |
36,2 |
7,3 |
|
18 |
Республика Карелия |
41 |
343,1 |
2168,1 |
2559 |
90800 |
41,9 |
4 |
|
19 |
Республика Коми |
654,1 |
499,2 |
2788,1 |
3558,6 |
201201 |
46,5 |
4 |
|
20 |
Архангельская область |
103,3 |
599,1 |
1870,2 |
2621 |
198340 |
47,7 |
4,8 |
|
21 |
Вологодская область |
2411,2 |
622,6 |
1825,7 |
2561,9 |
136362 |
30 |
6 |
|
22 |
Калининградская область |
784,4 |
410 |
1655,1 |
1750,4 |
75707 |
43,3 |
7,6 |
|
23 |
Ленинградская область |
244,7 |
701,6 |
1357,1 |
2178,8 |
223013 |
36,9 |
12 |
|
24 |
Мурманская область |
490,7 |
432,9 |
3333,8 |
3746,9 |
144824 |
37 |
2,9 |
|
25 |
Новгородская область |
221,8 |
318,1 |
1689,1 |
1742,5 |
65864 |
44 |
3 |
|
26 |
Псковская область |
163,5 |
340,7 |
1293,1 |
1470,7 |
74695 |
40,3 |
2,8 |
|
27 |
Республика Адыгея |
60,3 |
156,8 |
1112,6 |
1302,5 |
47056 |
30,6 |
2,2 |
|
28 |
Республика Дагестан |
469,5 |
737,8 |
850,6 |
878,7 |
134133 |
45,9 |
2 |
|
29 |
Республика Ингушетия |
10,5 |
59,4 |
488,6 |
1243,6 |
5139 |
53,9 |
0,3 |
|
30 |
Кабардино-Балкарская Республика |
81,7 |
303,7 |
1135,6 |
1180,6 |
48059 |
30 |
2,2 |
|
31 |
Республика Калмыкия |
46,4 |
117,4 |
956,3 |
1220 |
21677 |
44,1 |
0,9 |
|
32 |
Карачаево-черкесская Республика |
96,4 |
139,4 |
1021 |
1130,9 |
32493 |
47,4 |
1,8 |
|
33 |
Республика Северная Осетия - Алания |
356,5 |
227,2 |
1612,7 |
1166,7 |
43296 |
43,8 |
3,7 |
|
34 |
Краснодарский край |
2463,5 |
2038,3 |
1575,6 |
1697,6 |
479549 |
28,7 |
20,5 |
|
35 |
Ставропольский край |
278,6 |
1020,5 |
1363,2 |
1438,4 |
205580 |
32,5 |
7,1 |
|
36 |
Астраханская область |
321,9 |
428,4 |
1602,7 |
1898,7 |
106980 |
32,4 |
3,6 |
|
37 |
Волгоградская область |
782,9 |
1103,9 |
1204,1 |
1690,4 |
206817 |
41,3 |
13 |
|
38 |
Ростовская область |
19140 |
18367 |
1616,5 |
13605 |
299151 |
30,6 |
25 |
|
39 |
Республика Башкортостан |
14330,5 |
1746,2 |
1731,8 |
19329 |
407013 |
37,1 |
14,3 |
|
40 |
Республика Марий Эл |
52,2 |
333,4 |
863,5 |
1164,8 |
95617 |
51,4 |
4,1 |
|
41 |
Республика Мордовия |
304,8 |
404,9 |
1009,8 |
1107,6 |
70373 |
48,9 |
2,3 |
|
42 |
Республика Татарстан |
9739,4 |
1694 |
1779,1 |
2010,2 |
477390 |
34,6 |
16,1 |
|
43 |
Удмуртская Республика |
934,9 |
767,8 |
1404,9 |
1741,5 |
180173 |
37,2 |
8 |
|
44 |
Чувашская Республика |
137,9 |
610,4 |
1016,2 |
1196,2 |
113170 |
42,2 |
4 |
|
45 |
Кировская область |
311 |
734,3 |
1155,4 |
1521,7 |
148026 |
46,6 |
3,9 |
|
46 |
Нижегородская область |
4833,2 |
1658,5 |
1561,6 |
1697,6 |
294133 |
41,9 |
13,6 |
|
47 |
Оренбургская область |
502,8 |
1018,6 |
1404,4 |
1848,8 |
234022 |
40,6 |
7,6 |
|
48 |
Пензенская область |
383,5 |
676 |
1136,9 |
1258 |
123940 |
49,4 |
6,1 |
|
49 |
Пермская область |
1300,9 |
1334,3 |
2165,8 |
2433,7 |
302898 |
41,1 |
8,2 |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|||
50 |
Самарская область |
7051,4 |
1470,5 |
2561 |
2214 |
482883 |
37,5 |
27,6 |
|
51 |
Саратовская область |
1832,9 |
1184,2 |
1377,9 |
1391,5 |
268971 |
44,9 |
10,8 |
|
52 |
Ульяновская область |
1448 |
619,3 |
1212,3 |
1429 |
125943 |
53 |
5 |
|
53 |
Курганская область |
75,5 |
455,3 |
1196,2 |
1461,9 |
93139 |
59,9 |
2,9 |
|
54 |
Свердловская область |
10187,3 |
2016,3 |
1770,6 |
2273,8 |
580302 |
39,9 |
21,6 |
|
55 |
Тюменская область |
9666,7 |
1704,3 |
4905,3 |
6706,8 |
1083475 |
39,4 |
12,5 |
|
56 |
Челябинская область |
4805,5 |
1582,4 |
1883 |
2086,2 |
404407 |
38,5 |
19,1 |
|
57 |
Республика Алтай |
29,8 |
84,3 |
1147,4 |
1248,2 |
15278 |
52,9 |
1,4 |
|
58 |
Республика Бурятия |
817,4 |
395,5 |
1381,4 |
1923,7 |
91700 |
60,3 |
4,1 |
|
59 |
Республика Тыва |
14,8 |
99,2 |
1095,2 |
1582 |
14652 |
69,2 |
0,7 |
|
60 |
Республика Хакасия |
158,8 |
241 |
1551,8 |
2193,5 |
61889 |
45,9 |
1,5 |
|
61 |
Алтайский край |
405,2 |
1110,2 |
1160,1 |
1364,8 |
191413 |
42,3 |
12,1 |
|
62 |
Красноярский край |
1320,6 |
1429,4 |
2583,3 |
3503,4 |
383673 |
43,9 |
14 |
|
63 |
Иркутская область |
1053,6 |
1145,4 |
2199,5 |
2694,7 |
339505 |
47,1 |
13,8 |
|
64 |
Кемеровская область |
1435,1 |
1235,9 |
2202,9 |
2425,4 |
313617 |
44,4 |
11,7 |
|
65 |
Новосибирская область |
1682,8 |
1130 |
1477,8 |
1819,1 |
302292 |
33 |
23,7 |
|
66 |
Омская область |
1774,7 |
974,5 |
1306,9 |
1466,1 |
190292 |
50,2 |
10,9 |
|
67 |
Томская область |
338 |
482,5 |
2002,3 |
2544,9 |
149647 |
47,2 |
6,9 |
|
68 |
Читинская область |
57 |
449,7 |
1018 |
2106,3 |
105245 |
65,1 |
3,1 |
|
69 |
Республика Саха (Якутия) |
408 |
471,7 |
3559,4 |
4539,1 |
220865 |
52,2 |
2,7 |
|
70 |
Приморский край |
1439 |
945,1 |
1694 |
2383,2 |
166236 |
42,7 |
16,1 |
|
71 |
Хабаровский край |
1933,3 |
692,5 |
2240,4 |
2800 |
248304 |
38 |
8,3 |
|
72 |
Камчатская область |
661,6 |
185,7 |
3040,5 |
4448,5 |
62198 |
44,5 |
2 |
|
73 |
Магаданская область |
236,8 |
111,2 |
2979,3 |
4247,9 |
45747 |
47 |
2,9 |
|
74 |
Сахалинская область |
247,9 |
280 |
2563,5 |
3680,8 |
97652 |
50,7 |
4,8 |
|
75 |
Амурская область |
108,5 |
435,8 |
1465,8 |
2232,2 |
141651 |
53,1 |
3,8 |
Работа в IBM SPSS 20
Для удобного, наглядного отображения данных, применяется гистограмма. Благодаря ей, происходит визуальное структурирование, упрощающее дальнейшую обработку.
Также, на гистограмме отображается среднее значение, стандартное отклонение.
Отдельная гистограмма для каждой переменной в SPSS 20, дает возможность оценить, адекватность представленной информации, а также, возможность и необходимость отбора наблюдений. Присутствие огибающей на гистограмме, создает непрерывную функцию, что является большим плюсом. При составлении статистических вычислений, немаловажную роль играет оценка наличия связей между двумя и более, величинами, при отсутствии структурированного подхода к анализу выборки данных, можно упустить из виду, возможность сужения диапазона выборок, для получения информации о наличие этих связей.
Пример выборки наблюдений.
С помощью IBMSPSS 20 мы имеем возможность быстро получить основные показатели описательной статистики, такие как: среднее значение, стандартная ошибка среднего, медиана, мода и дисперсия. Исходя из результатов полученных в таблице, можно сказать, что данные неоднородные. Этот вывод можно сделать исходя из величины отклонения среднего значения от медианы.
Статистики |
|||
Число малых предприятий |
|||
N |
Валидные |
75 |
|
Пропущенные |
2 |
||
Среднее |
973,3027 |
||
Стд. ошибка среднего |
242,49708 |
||
Медиана |
610,4000 |
||
Мода |
59,40a |
||
Стд. отклонение |
2100,08634 |
||
Дисперсия |
4410362,620 |
||
Минимум |
59,40 |
||
Максимум |
18367,00 |
||
Процентили |
25 |
404,9000 |
|
50 |
610,4000 |
||
75 |
1090,9000 |
||
a. Имеется несколько мод. Показана наименьшая. |
Корреляции |
||||
Среднегодовая численность занятых в экономике |
Среднемесячная заработная плата работающих в экономик |
|||
Среднегодовая численность занятых в экономике |
Корреляция Пирсона |
1 |
,551** |
|
Знч.(2-сторон) |
,000 |
|||
N |
75 |
75 |
||
Среднемесячная заработная плата работающих в экономик |
Корреляция Пирсона |
,551** |
1 |
|
Знч.(2-сторон) |
,000 |
|||
N |
75 |
75 |
||
**. Корреляция значима на уровне 0.01 (2-сторон.). |
Коррелямция (от лат. correlatio «соотношение, взаимосвязь») или корреляционная зависимость -- это статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин.
Среднегодовая численность занятых в экономике |
Среднемесячная заработная плата работающих в экономик |
Удельный вес убыточных предприятий |
Число малых предприятий |
||
Среднегодовая численность занятых в экономике |
1 |
,551** |
-,285* |
,462** |
|
,000 |
,013 |
,000 |
|||
75 |
75 |
75 |
75 |
||
Среднемесячная заработная плата работающих в экономик |
,551** |
1 |
-,190 |
,260* |
|
,000 |
,103 |
,024 |
|||
75 |
75 |
75 |
75 |
||
Удельный вес убыточных предприятий |
-,285* |
-,190 |
1 |
-,480** |
|
,013 |
,103 |
,000 |
|||
75 |
75 |
75 |
75 |
||
Число малых предприятий |
,462** |
,260* |
-,480** |
1 |
|
,000 |
,024 |
,000 |
|||
75 |
75 |
75 |
75 |
||
**. Корреляция значима на уровне 0.01 (2-сторон.). |
|||||
*. Корреляция значима на уровне 0.05 (2-сторон.). |
По полученным значениям отчетливо видна достаточная слабая корреляция между переменными, лишь о одном случае она превышает 50%.
Важную роль в обработке информации играет регрессионный анализ. Регремссия (. regressio -- обратное движение, отход), в теории вероятностей и математической статистике, зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. В отличие от чисто функциональной зависимости y=f(x), когда каждому значению независимой переменной x соответствует одно определённое значение величины y, при регрессионной связи одному и тому же значению x могут соответствовать в зависимости от случая различные значения величины y. Если при каждом значении x=xi наблюдается ni значений yi1…yin1 величины y, то зависимость средних арифметических =(yi1+…+yin1)/ni от x=xi и является регрессией в статистическом понимании этого термина. В данном примере достаточно четко прослеживается линейная зависимость, что говорит о прямой взаимосвязи между двумя величинами: среднегодовой численности занятых в экономике и числе малых предприятий в областях.
В данных примерах, мы попытались изменить выборку, для более точной оценки регрессии, однако, как показал опыт, регрессия отсутствует.
Заключение
Нами была произведена обработка информации с помощью программы IBMSPSS 20, которая позволила получить результаты анализа в разы быстрее.
Нами были рассчитаны основные статистические показатели, которые позволили дать оценку нашим данным. Благодаря вариации различных возможностей, которые предоставляла нам программа и нашим знаниям о описательной статистике, мы выяснили: среднее, моду, медиану и так далее.
Получили результаты корреляции и регрессионного анализа, которые показали нам отсутствие линейной связи между переменными. Благодаря полученным навыкам, у нас появилась возможность применять наши знания для повседневного анализа.
Список использованной литературы
1. Гусев А.Н. Дисперсионный анализ в экспериментальной психологии:Учебное пособие для студентов факультетов психологии. М., 2000.
2. Дэйвисон М. Многомерное шкалирование: методы наглядного представления данных. М., 1988.
3. Закс Л. Статистическое оценивание. М., 1976.
4. Иберла К. Факторный анализ. М., 1980.
5. Кендалл М., Стьюарт А. Статистические выводы и связи. М., 1973.
6. Крамер Д. Математическая обработка данных в социальных науках: современные методы: Учеб. пособие. М.: Академия, 2007. 288 с.
7. Митина О.В. Моделирование латентных изменений с помощью структурных уравнений // Экспериментальная психология. 2008. № 1. С. 131-148.
8. Митина О.В. Основные идеи и принципы структурного моделирования // Ученые записки кафедры общей психологии МГУ. 2006. Вып. 2. С. 272-296.
9. Митина О.В., Михайловская И.Б. Факторный анализ для психологов. М., 2001
10. Наследов А. IBM SPSS 20 Statistics и Amos. Профессиональный статистический анализ данных.
Размещено на Allbest.ru
...Подобные документы
Значения показателей и коэффициент вариации. Пределы возможных ошибок, исключение ошибочных результатов. Величина доверительных интервалов для заданных значений доверительных вероятностей. Средние квадратичные отклонения. Значения коэффициента доверия.
лабораторная работа [38,4 K], добавлен 01.03.2011Метод наименьших квадратов; регрессионный анализ для оценки неизвестных величин по результатам измерений. Приближённое представление заданной функции другими; обработка количественных результатов естественнонаучных опытов, технических данных, наблюдений.
контрольная работа [382,4 K], добавлен 16.03.2011Определение среднего арифметического исправленных результатов многократных наблюдений, оценка среднего квадратического отклонения. Расчет доверительных границ случайной составляющей погрешности результата измерения. Методика выполнения прямых измерений.
лабораторная работа [806,9 K], добавлен 26.05.2014Теория измерений является составной частью эконометрики, которая входит в состав статистики объектов нечисловой природы. Краткая история теории измерений. Основные шкалы измерения. Инвариантные алгоритмы и средние величины – в т. ч. в порядковой шкале.
реферат [30,2 K], добавлен 08.01.2009Вид одномерного распределения для номинальной шкалы с совместимыми альтернативами. Меры центральной тенденции. Математическое ожидание, отклонение. Показатели асимметрии, эксцесса. Построение распределений в пакете ОСА и SPSS, визуальное представление.
курс лекций [2,4 M], добавлен 09.10.2013Расчет зависимости курса акций от эффективности рынка ценных бумаг. Построение графика экспериментальных данных и модельной прямой. Нахождение значения стандартных погрешностей для определения доверительных интервалов для значений зависимой переменной.
контрольная работа [441,9 K], добавлен 13.10.2014Общая характеристика и функциональные особенности пакета SPSS для Windows, его назначение и анализ возможностей. Основные понятия и методики эконометрического прогнозирования, порядок использования для данного прогнозирования инструментов пакета SPSS.
курсовая работа [507,1 K], добавлен 28.03.2010Теория измерений. Использование чисел в жизни и хозяйственной деятельности людей. Инвариантные алгоритмы и средние величины. Численность работников различных категорий, их заработная плата и доходы. Величины в порядковой шкале. Средние по Колмогорову.
реферат [34,5 K], добавлен 09.01.2009Оценка уравнений парной и множественной регрессии. Ковариация, корреляция, дисперсия. Определение доверительных интервалов для параметров. Статистические уравнения зависимостей. Расчет нормативных микроэкономических показателей хозяйственной деятельности.
дипломная работа [1,9 M], добавлен 20.10.2014Равенство нулю математического ожидания случайной компоненты. Знакомство со статистическим методом однофакторного дисперсионного анализа, а также с реализацией его на ПК в различных программах. Сравнение IBM SPSS Statistics 20 и Microsoft Office 2013.
курсовая работа [1,3 M], добавлен 29.11.2014Статистический анализ курса Центрального банка валютной пары евро/рубль, построение соответствующих гистограмм. Выполнение описательной статистики выборочных данных, проверка гипотезы о нормальном распределении, равенстве средних и равенстве дисперсий.
курсовая работа [2,5 M], добавлен 08.07.2015Анализ и описание различных подходов к определению вероятности. Примеры стохастических зависимостей в экономике, их особенности и теоретико-вероятностные способы их изучения. Классификация и характеристика основных этапов эконометрического исследования.
реферат [25,1 K], добавлен 16.04.2009Расчет прогноза среднего значения цены и доверительных интервалов для него, используя статистический подход. Методы построения полей рассеяния между ценой и возрастом автомобиля, между ценой и мощностью автомобиля. Обоснование гипотезы о наличии тренда.
контрольная работа [98,5 K], добавлен 11.09.2010Планирование деятельности предприятия по производству продуктов питания. Прогнозирование объема продаж продукции на заданный период времени, построение графика изменения, используя метод трехчленной скользящей средней; расчет доверительных интервалов.
контрольная работа [668,5 K], добавлен 02.01.2012Сбор данных и их первичная обработка. Построение корреляционной матрицы. Связь между факторными и результативными признаками. Оценка статистической значимости параметров регрессии. Определение доверительного интервала параметров доверительной регрессии.
курсовая работа [739,0 K], добавлен 06.04.2016Основные понятия теории графов. Схема построения сетевой модели рынка. Основная идея бутстрэпа. Процедура проверки многих гипотез сравнения распределения вершин двух выборочных MST. Значения доверительных интервалов векторов наблюдений за два года.
курсовая работа [1,0 M], добавлен 19.09.2016Предмет, метод, показатели статистики. Понятия и категории статистического наблюдения. Показатели вариации, абсолютные и относительные величины, графический и индексный методы. Взаимосвязь социально-экономических явлений. Сглаживание рядов динамики.
курс лекций [132,9 K], добавлен 23.02.2009Графический метод обнаружения автокорреляции. Критерии Дарбина-Уотсона. Построение уравнения линейной регрессии, его оценка с использованием матричной алгебры. Поиск стандартных ошибок коэффициентов. Статистическая значимость показателя детерминации.
контрольная работа [70,3 K], добавлен 05.12.2013Проблема достижения максимальной точности измерений при минимальном количестве опытов и статистической достоверности результатов. Построение адекватной нормированной модели в реальных величинах используя метод ортогонального композиционного планирования.
курсовая работа [212,3 K], добавлен 15.12.2014Изучение экономических показателей и особенностей повышения эффективности химического производства, которое достигается различными методами, одним из которых является метод математического моделирования. Анализ путей снижения затрат на производство.
курсовая работа [41,2 K], добавлен 07.09.2010