Статистический анализ взаимосвязей в массовых явлениях

Виды и формы связей между явлениями. Моделирование и прогнозирование массовых процессов с использованием метода наименьших квадратов. Определение коэффициентов ассоциации и контингенции. Непараметрические методы изучения взаимосвязей в массовых явлениях.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 23.03.2015
Размер файла 233,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки рф

Волжский политехнический институт (филиал)

Федерального государственного бюджетного образовательного

Учреждения высшего профессионального образования

«Волгоградский государственный технический университет»

СЕМЕСТРОВАЯ РАБОТА

по учебной дисциплине СТАТИСТИКА

на тему «Статистический анализ взаимосвязей в массовых явлениях»

Введение

Статистика - одна из важных общепрофессиональных учебных дисциплин при подготовке специалистов с высшим образованием.

В работе я постараюсь раскрыть вопрос о статистическом анализе, видах и формах связей между явлениями рассматриваемыми статистикой.

Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных.

Среди способов анализа статистических данных выделяют методы прикладной статистики, которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приёмочный контроль, статистическое регулирование технологических процессов, надёжность и испытания, планирование экспериментов.

Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.

1. Виды и формы связей между явлениями

Все явления объективного мира, в том числе и общественные, находятся в постоянной взаимосвязи и взаимодействии между собой, в непрерывном изменении и развитии. Важнейшей задачей статистики, наряду с оценкой состояния массовых явлений и выявлением закономерностей их развития, является изучение связей между ними. Связи массовых общественных явлений устанавливают на основе теоретического анализа их сущности, изучения закономерностей и движущих сил развития, оценки условий их функционирования. При этом используются категории, понятия и накопленные ранее знания других наук. Задача статистики состоит в том, чтобы выявить само наличие связи в конкретных условиях, а также получить показатели, характеризующие ее силу, степень и характер. Основой изучения связей является качественный анализ.

Теоретический и практический интерес представляют в первую очередь причинно-следственные связи, когда одни явления (факторы) выступают причиной изменения других (результаты). Их анализ позволяет, во-первых, объяснить фактическое положение дел, а во вторых, воздействуя на факторы, добиться изменения результатов в желаемом направлении.

Связи между явлениями и их признаками бывают разные. Они отличаются по характеру, направлению, плотностью, аналитическим выражением, числом взаимодействующих факторов и др. В философской литературе отмечается, что существует около 32 видов различных взаимосвязей.

По характеру различают связи функциональные и статистические (корреляционные), однофакторные и многофакторные; по форме выражения - прямые и обратные, прямолинейные и криволинейные.

По аналитическим выражением различают: прямолинейные (линейные) и криволинейные (нелинейные) связи. При прямолинейном связи с ростом факторного признака происходит равномерный рост (или уменьшение) результативного признака. Математически такая связь сказывается уравнением прямой а графически - прямой линией.

ух = а0 + а1х

где ух - теоретические значения результативного признака полученные по уравнению регрессии;

а0, а1 - параметры прямой;

х - значение факторного признака.

Параметры уравнения прямой (а0, а1) определяются путем решения системы нормальных уравнений на основе метода наименьших квадратов. Сущность данного метода заключается в нахождении параметров модели, при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических.

Поэтому такая связь и называют линейным. При криволинейном связи с ростом факторной признаки роста (или снижения) результативного признака происходит неравномерно, или направление связи меняется с прямого на обратный. Геометрически такая связь сказывается кривыми линиями (гиперболой, параболой и т.д.).

Различают два вида признаков:

1. Факторные - те, которые влияют на изменение других процессов.

2. Результативные - те, которые изменяются под воздействием других признаков.

По направлению связи между явлениями различают связи прямые и обратные. Если с увеличением факторного признака есть тенденция к росту индивидуальных и средних значений результативного признака, то это будет прямая связь.

Если с увеличением факторного признака результативный признак уменьшается или, наоборот, с уменьшением факторного признака результативный признак возрастает, то это обратная связь. Например, между пьянством и преступностью есть прямая зависимость, а между образованием и преступностью - обратная.

По количеству взаимодействующих факторов связи могут быть однофакторные и многофакторные. Однофакторные связи - это такие, при которых одна результативная признак связан с одной факторной признаку. Такая связь называют парным.

Многофакторные связи - это такие, при которых одна результативная признак связан с двумя или факторных признаков. В общественных явлениях чаще встречаются многофакторные связи. Так, на решение расторгнуть брак влияют многие факторы, на осуществление автотранспортного преступления влияют разные факторы: природные условия, состояние дороги, состояние транспортных средств, квалификация водителя, соблюдение правил дорожного движения водителями и другими участниками движения и т.п..

Связь между явлениями называется функциональной, если изменению факторного показателя (x) на единицу соответствует строго определенное изменение результативного признака (y). Такие связи выражают формулами, действительными во всех случаях.

При функциональной связи полное соответствие между причиной (факторный признак) и следствием (результативный признак), т.е. величина результативного признака, полностью определяется одним или несколькими факторными признаками. Каждому значению величины факторного признака соответствует только одно значение результативного признака.

Функциональные связи обычно выражаются формулами и исследуются в математике и физике, астрономии и т.д.. Они выражаются по точной математической формуле, которая может быть использована в любом случае для явления, которое рассматривается.

Например, площадь круга (результативный признак) прямо пропорциональна радиусу (факторной признаку) и выражается формулой

S = рR2

а связь между длиной окружности и радиусом - формулой

L = 2рR

Примерами функциональной зависимости результативного признака от нескольких факторных признаков могут быть: зависимость тока от напряжения и сопротивления, зависимость площади треугольника от величины его сторон.

Функциональная зависимость проявляется с одинаковой силой во всех единицах совокупности независимо от изменения других признаков данного явления.

Так, установлена зависимость площади круга от квадрата радиуса будет проявляться везде: и при вычислении площади круга диска для метания в спортивных соревнованиях, и при характеристике площади круга площади города или села и проч. Итак, если установлена функциональная зависимость на базе единичного исследования, то ею можно пользоваться во всех аналогичных случаях.

Функциональная зависимость имеет место и в общественных явлениях, но очень редко, и эти связи единичные, отражающие взаимосвязь только отдельных сторон явлений. Функциональные связи имеют место и в экономике. Пример, заработная плата рабочего повременной оплате равна произведению часовой тарифной ставки на число отработанных часов и т.п.. В правовых явлениях функциональная зависимость, как правило, не встречается.

Для исследования функциональных связей применяется индексный и балансовый метод. Функциональные связи называют также полными, «жесткими».

Функциональная связь является точной и полной, т.к. обычно известны все факторы, оказывающие влияние на результативный признак. При функциональных связях величина результативного признака полностью показывается факторными признаками. Однако, в массовых явлениях общественной жизни в виду крайнего разнообразия факторов и их взаимосвязи и противоречивого действия этих факторов, не поддающихся строгому учету и контролю, возникает широкое варьирование результативного признака. Это свидетельствует о том, что связь между признаками неполная, а проявляется лишь, в общем, и среднем. Такие связи называются корреляционными.

Корреляционными называют связи, при которых строго определенному изменению факторного признака (x) соответствует целый ряд (статистическое распределение) изменений результата (y), не вполне определенных, подверженных случайным колебаниям. Эти связи проявляются лишь в среднем, в массовых явлениях. Кроме изучаемого фактора на результат воздействуют и другие причины, в том числе носящие случайный характер.

При корреляционной связи между причиной и следствием не имеется полного соответствия, а наблюдается лишь определенное соотношение. При корреляционной связи под влиянием изменения многих факторных признаков (ряд из которых может быть неизвестен), меняется средняя величина результативного признака.

Пример, корреляционная связь между влиянием удобрения и урожайностью культур, между производительностью и энергооснощенностью предприятия. Наибольшее распространение корреляционные связи имеют среди общественных явлений. Так, между уровнем производительности труда и энергооснащения труда на предприятиях одинаковой специализации есть определенное соответствие, если иметь в виду значительное количество случаев. Но на уровень производительности труда влияют и такие факторы, как режим работы на предприятии, организация снабжения, личные качества производственного персонала и др. Поэтому может быть так, что на предприятии, где выше энерговооруженность, производительность труда может быть ниже, и наоборот. Это означает, что на уровень производительности труда существенно влияли другие факторы. Но если взять достаточно большое количество предприятий, то зависимость между производительностью и энерговооруженностью труда станет четкой. Корреляционная зависимость существует между производительностью труда и себестоимостью продукции - с ростом производительности труда снижается себестоимость продукции.

Или возьмем обратную зависимость между преступностью и образованием лиц, совершивших преступления. Такая зависимость есть, но на уровень преступности в разных направлениях действует много других факторов (употребление алкоголя, моральные качества личности, материально-бытовые условия и т.д.). Поэтому в каждом конкретном случае зависимость между образованием и преступностью может не проявиться и для выявления такой неполной зависимости надо взять большое количество явлений, которые следует рассматривать в совокупности. Подобным образом можно изучать и зависимость между преступностью и рецидивом, между преступностью и удельным весом лиц, совершивших преступления в составе группы по отдельным видам преступлений.

В гражданско-правовой статистике можно изучать: зависимость между ростом жилищного строительства и снижением количества судебных дел соответствующей категории (дел, которые возникали на почве семейно-бытовых конфликтов) зависимость между количеством разводов на 10 тысяч населения и условиями жизни населения, между количеством заключенных браков на 10 тысяч населения и социально-демографическим показателям всего населения и т.п.

Важная особенность корреляционных связей состоит в том, что они обнаруживаются не в отдельных случаях, а в массовых общественных явлениях. Проявление корреляционных зависимостей подвержено действию закона больших чисел: лишь в достаточно большом числе фактов индивидуальные особенности и второстепенные факты сгладятся, и зависимость проявится достаточно отчетливо.

На формирование уровня любого массового явления оказывает влияние множество факторов. Некоторые из них являются первостепенно важными, доминирующими, другие - второстепенными, их воздействие незначительно. При этом влияние того или иного фактора может быть незаметным, если оно заслоняется действием других, чтобы его обнаружить, необходимо исследовать связь результативного признака не только с каждым фактором в отдельности, но и с несколькими факторами одновременно. По этой причине в статистике различают однофакторные и многофакторные связи.

Итак, наличие многих факторных признаков, степень влияния которых на результативный признак неизвестен, выступает как одна из характерных особенностей корреляционных связей. Корреляционная связь между результативным признаком и единицей из определенного количества факторных признаков может проявиться лишь в общем, в среднем, при прочих равных условиях. Влияние факторов, которые не являются объектом исследования, устраняется путем замены их средними показателями. Согласно закону больших чисел это достигается на основании взаимопогашение отклонений признаков определенных единиц в той или другую сторону от средней при достаточно большом количестве единиц, которые изучаются. Чем больше статистическая совокупность, тем точнее устанавливаемое соотношение выражает закономерность корреляционных связей.

Следует обращать внимание и на то, что в сложных взаимоотношениях может находиться и результативный фактор - в более общем виде он может выступать как фактор изменения других признаков. Это требует того, что результаты корреляционного анализа имеют значение для данного вида связи, а интерпретация этих результатов требует построения системы корреляционных связей в более общем виде.

Но и на массовом статистическом материале выявлены зависимости не будут носить полного, функционального характера. Они в определенной мере приближаться к функциональной связи, но действие других факторов, которые не учтены исследованиям, приводит к тому, что корреляционная связь будет неполный. Из этого следует, что корреляционная связь не выражается определенной математической формулой, он может быть выражен примерно с помощью аналитических формул.

Важная особенность корреляционных связей состоит в том, что эти связи неполные. Даже на массовых данных обнаруженные зависимости не будут носить полного, т.е. функционального характера. В зависимости от действия функциональных и корреляционных связей их делят на: прямые и обратные.

Прямая связь - направление изменения результативного признака совпадает с направлением изменения признака фактора, т.е. с увеличением факторного признака увеличивается и результативный и наоборот. Обратная связь - направление изменения результативного признака не совпадает с изменением факторного признака, т.е. при увеличении факторного признака результативный уменьшается и наоборот.

По форме связи бывают:

1. Прямолинейные - с возрастанием величины факторного признака происходит непрерывное возрастание результативного признака и наоборот. Математически такая зависимость представляется уравнением прямой. График представлен в виде прямой. Эту зависимость называют линейной.

2. Криволинейные - с возрастанием величины факторного признака изменение результативного признака происходит неравномерно, направление его может даже меняться. Графически этот процесс представлен гиперболой, параболой и ломаной.

При этом следует иметь в виду, что только функциональная связь аналитическим уравнением выражается точно, а корреляционная связь - лишь приблизительно, при абстрагирование от влияния всех других признаков. Поэтому на графике будет иметь место разброс точек вокруг линии.

Если с возрастанием одного признака при любом его исходном значении другой изменяется в среднем на одну и ту же величину, между ними имеется прямолинейная связь. Если же эти изменения сами изменяются (увеличиваются, уменьшаются или даже меняют свой знак), зависимость между признаками криволинейная.

Для корреляционных связей есть различия в том случае, если: исследуется связь между одним признаком - фактором и результативным признаком; исследуется связь между несколькими признаками - факторами и результативным признаком. В первом случае имеет место парная связь и парная корреляция, во втором случае многофакторная связь и множественная корреляция.

Замечу, что многие массовые общественные явления изменяются в одном и том же направлении, но как бы параллельно, независимо друг от друга. Например, в стране увеличивается число компьютеров и число банков, растут доходы населения и уменьшается детская смертность. Здесь отсутствует причинно-следственная связь, хотя и обнаруживается тесная корреляционная зависимость. Иногда это происходит под влиянием какой-то общей причины (например, экономического роста), но чаще всего это мнимые, кажущиеся связи, не подтверждаемые содержательным анализом изучаемых явлений.

Приемы изучения статистических связей зависят от характера явлений, формы показателей и вида связи между ними, задач анализа и имеющейся информации.

Статистика рассматривает всё как существенную и устойчивую связь между определенными явлениями и процессами. Познавая связи, статистика познает законы. А их знание позволяет управлять общественным развитием.

Теория статистических методов нацелена на решение реальных задач. Поэтому в ней постоянно возникают новые постановки математических задач анализа статистических данных, развиваются и обосновываются новые методы. Обоснование часто проводится математическими средствами, то есть путем доказательства теорем. Большую роль играет методологическая составляющая - как именно ставить задачи, какие предположения принять с целью дальнейшего математического изучения. Велика роль современных информационных технологий, в частности, компьютерного эксперимента.

Актуальной является задача анализа истории статистических методов с целью выявления тенденций развития и применения их для прогнозирования.

Всё это имеет высокую значимость во всех формах хозяйствования, как для получения данных о рентабельности и эффективности, так и давать объективную оценку становления экономики по прошествии временного интервала.

Статистика как наука, всегда будет оставаться востребованной, иметь различные направления развития и применения, как на уровне международной статистике - макроуровне, так и в самой малой форме - микроуровне, в связи с постоянно возникающими в ней новыми постановками математических задач и необходимости анализа статистических данных.

2. Задача

массовый ассоциация контингенция непараметрический

ЗАДАЧА 1.16. Моделирование и прогнозирование экономических массовых процессов с использованием метода наименьших квадратов (МНК).

Дано: Имеются данные статистического наблюдения о средних затратах ряда предприятий города на капитальный ремонт оборудования (уiф - тыс. руб.) в зависимости от срока службы (периода эксплуатации) этого оборудования (хiф - лет). Данные наблюдения приведены в Приложении в таблице 1. (графы 2 и 3).

Необходимо: 1) Разработать (синтезировать) и построить с обоснованием практической значимости адекватную математическую модель массового экономического процесса в хозяйственной деятельности предприятий - зависимость затрат предприятия на ремонт производственного оборудования (уi) и его срока службы (хi).

2) Для построения и обоснования математической модели использовать корреляционно-регрессионный анализ исследуемой зависимости и метод наименьших квадратов (МНК).

3) Построить линейный график корреляционной зависимости типа y=f(x) в виде ломаной линии (по фактическим данным хiф и уiф) и ее теоретического аналога (модели) - прямой линии (Рис. 1).

4) Аналитически и графически определить время начала необходимости капитального ремонта оборудования (значение хнач. рем. при ух=0).

5) Методами интерполяции (и) и экстраполяции (э), с целью нормирования и планирования затрат предприятия на ремонт оборудования (хит и уэт), дать прогноз затрат по заданному времени эксплуатации оборудования в области фактической (известной) статистики (данные наблюдения), например, при хи=6,5 лет и вне этой области - при хэ=12 лет.

6) Построить макет сложной аналитической таблицы 1 и внести в нее фактические данные статистического наблюдения - хiф и уiф (графы 2 и 3).

7) Построить линейный график (Рис. 1) корреляционной зависимости (связи) хiф и уiф вида

y=f(x)+ о (1),

где о - величина влияния на ух суммы случайных факторов. Нанести на график (используя шкалы осей координат у и х и «сетку графика») соответствующие координатам хiф и уiф и соединить их прямыми линиями в непересекающуюся ломаную линию (ухф).

8) По характеру построенной ломаной линии определить предполагаемую теоретическую линию аппроксимации (выравнивания ломаной); в данной задаче - принимаем прямую линию и ее аналитическое выражение

ух = а0 + а1х (2)

Преобразовать (синтезировать) уравнение прямой (2) в теоретическую зависимость затрат на ремонт оборудования от его срока службы подставив в (2) фактические значения хiф :

уiт = а0 + а1хiф (3).

Решение: Уравнение (3) есть уравнение регрессии, т.е. синтезированная математическая модель исследуемого экономического массового процесса - зависимости затрат предприятия на ремонт оборудования от его срока эксплуатации, параметры которого определяются по формулам (4) (см лекцию …):

; (4).

Параметры a0 и а1 можно определить также и путем подстановки соответствующих сумм в уравнение (4) по данным таблицы 1. 2) Рассчитаем a0 и а1 по уравнениям (4). По уравнению регрессии (3) определим теоретические значения затрат на ремонт оборудования (ут) и другие показатели таблицы 1 и внесем результаты расчетов в соответствующие графы таблицы 1. По данным таблицы 1: xср = Ухi / n = 70 / 10 = 7 лет;

; ; ; ;

;; У (уiт - уiф)2 = 100.

3) Подставим рассчитанные суммы из таблицы 1 в уравнения системы (4):

Принимаем: а0=25.3; а1=2,5: у1,2т= а0 + а1х1ф= 25.3+2.5*4= 35.3 тыс. руб., т.д.

у10т= а0 + а1х10ф= 25.3+2,5*11=52.8 тыс. руб.

4) В поле графика (рис.1) построим теоретическую прямую линию исследуемой зависимости уiт (3) по координатам уiт хiф.

5) По tкр - критерию Стьюдента необходимо обосновать практическую значимость синтезированной по уравнению прямой (2) регрессионной модели (3) и ее параметров а0=25.3 (без учета знака); а1=2,63 с учетом условия ta0 > tкр < ta (5). По вероятностной таблице для коэффициента значимости б =0,05 и количества степеней свободы ксв = n - 2 = 10 - 2 = 8 tкр=28 (с вероятностью Pt=0,95). Фактические значения t-критерия определить по формулам:

(6);

;.

Вывод: условие типичности выполняется: ta0=22.62>tкр=28<ta1=5.19

Следовательно, уравнение регрессии (3) и его параметры a0 и a1 являются (признаются) типичными, т. к. с достаточной степенью вероятности (P=0.95) определяют корреляционную зависимость затрат предприятия на ремонт оборудования уiT от его срока службы хiф.

6) Для определения показателя тесноты и характеристики силы корреляционной связи между уiТ и хiф определить коэффициент корреляции (r) и коэффициент детерминации (r2) для прямолинейной зависимости:

(8)

Соответственно: (9)

7) Оценить значимость вычисленного коэффициента корреляции r=0.856 по t-критерию Стьюдента при условии tr>tкр=2.3 и по шкале Чеддока (табл.2). Фактическое значение t-критерия r:

(10)

Следовательно, условие значимости r выполняется: tr=5,24>tкр=2.3

8) По шкале Чеддока коэффициент корреляции r=0.856 определяет корреляционную связь между уiТ и хiф как «высокую».

Вывод: величина r=0.856 является существенной, а связь между уiТ и хiф - «высокой». На основании коэффициент детерминации r2=0,734 с высоким уровнем доверительной вероятности (Р = 0.95) можно утверждать, что 73,4% общей вариации результативного признака уi (затрат на ремонт оборудования) объясняется (детерминировано) изменением факторного признака хi (срока службы оборудования). При этом 22,6% общей вариации (100% - 74,4%) уi вызвано влиянием суммы случайных факторов, т.е. о = 26,6%

9) Следовательно, синтезированная по уравнению прямой линии математическая модель(3) - утi = 25.3+2,5хф является типичной и может быть использована для практических целей прогнозирования и планирования затрат предприятия на ремонт оборудований (уi) в зависимости от его срока службы (хi).

10) Теоретически и графически определим время начала необходимости капитального ремонта оборудования (хнач. рем.) по уравнению (3) при уx=0:

, откуда года.

Нанесем на график (рис 1) пунктирными линиями вычисленные координаты уит хи и уэт хэ..

Таблица 1 Данные для расчета показателей уравнения регрессии

№ п/п

хiф

уiФ

xiМ*yi

xi2

yi2

xi-

(xi -)2

уiт

уiт-уiФ

(уiт-уiФ)2

1

2

3

4

5

6

7

8

9

10

11

1

4

37

141

16

1369

(-)3

9

34.1

2.99

8.94

2

4

34

136

16

1156

3

9

34.01

0.01

0.0001

3

5

40

200

25

1600

2

4

36.64

3.34

11.15

4

6

39

234

36

1521

1

1

39.27

0.27

0.073

5

6

41

246

36

1681

1

1

39.27

1.73

2.99

6

7

42

294

49

1764

0

0

41.90

0.10

0.001

7

8

44

352

64

1936

1

1

45.53

0.47

0.22

8

9

42

378

81

1764

2

4

47.16

5.16

26.6

9

10

49

490

100

2401

3

9

46.79

3,79

14.36

10

11

60

660

121

3600

4

16

56.42

3,58

12.81

У :

70

428

3131

544

17051

-

54

-

-

77.14

Примечание: xi-годы (лет); yi-тыс. руб. Принимаем: У (уiт-уiФ)2?100.

Кв = (Nсп + 10)/ 100;

прибавить Кв ко всем уiФ

Рис 1 График зависимости y = F(x) + о (масштаб шкал OX : OY = 1:2)

По шкале Чеддока (Таблица 2) коэффициент корреляции r=0.856 определяет корреляционную связь между уiТ и хiф как «высокую».

Таблица 2 Шкала Чеддока

Теснота связи

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Сила связи

слабая

умеренная

заметная

высокая

Весьма высокая

Общие выводы:

График - теоретическая прямая линия

уiт = а0 + а1хiф (3),

выражает форму корреляционно-регрессионной зависимости экономического массового процесса - зависимости затрат предприятия на ремонт оборудования (уiТ) от срока службы (периода эксплуатации) этого оборудования (хiф ). Уравнение (3) является также математической моделью указанного экономического массового процесса и уравнением регрессии корреляционной зависимости между уiТ и хiф, построенного (синтезированного) на основе использования метода наименьших квадратов (МНК) для определения параметров регрессии а0 и а1.

Синтезированное уравнение регрессии (3) может быть использовано для моделирования и прогнозирования (планирования) затрат предприятия (уiТ) на ремонт эксплуатируемого основного оборудования в зависимости от срока его эксплуатации (хiф ) как в пределах известных статистических данных (хiф от 4-х до 11-ти лет, собранных и зарегистрированных в результате научно организованного статистического наблюдения) методом интерполяции и так и за пределами известных данных статистики (хiф более 11 лет, в предположении сохранения прямолинейной зависимости уiТ) методом экстраполяции.

3. Нормальный закон распределения. Критерии согласия

Большинство социально-экономических массовых явлений и процессов, изучаемых с помощью ранжированных рядов распределения, подчиняются нормальному закону распределения. При нормальном распределении, с увеличением величины изучаемого признака единиц статистической

Рис. 2 График нормального закона распределения (уt). Для симметричного распределения Мо = хср = Ме.

совокупности, соответствующие им частоты вначале возрастают до некоторой максимальной величины и затем убывают, асимптотически приближаясь к минимальным значения относительно их симметричного начального значения.

Примечание: уt - ордината (частота) кривой нормального распределения; t - нормальное отклонение.

Для теоретической симметричной кривой нормального распределения всегда величины средней хср, моды (Мо) и медианы (Ме) равны между собой

Мо = хср = Ме

т.е. принадлежат одной и той же варианте, которая расположена в середине ряда - в центре распределения с общей вершиной одновершинной симметричной колоколообразной кривой (рис.5.4).

Замена ломаной эмпирической линии фактического распределения его теоретическим аналогом - функциональной кривой распределения, имеющей аналитическое выражение (формулу), представляет собой процесс сглаживания или функционального выравнивания (аппроксимации, замены), связанного с возникновением отклонений и ошибок аппроксимации, для учета которых используются различные критерии согласия (К. Пирсона, А.Н.Колмогорова, В.И. Романовского и др.) и методы оценки характера, величины, направления отличий и асимметричности аналоговой кривой.

Асимметричность вершины (отклонение фактического распределения и его аналоговой модели относительно симметричного в теоретическом распределении) оценивается сравнением величины средней с величиной моды или медианы в аналоговой кривой путем расчета коэффициента асимметрии

As (мо ) = (хср - Мо ) / у или As (ме ) = (хср - Ме ) / у

Для асимметричного нормального распределения Мо, хср и Ме не равны между собой. При Мо < хср смещение положительно (As>0) и вершина распределения (мода) смещена влево (на графике средняя справа от моды), при этом правая часть распределения больше левой. Такая асимметрия является (и называется) правосторонней. При хср < Мо смещение имеет отрицательное значение (As<0) и вершина распределения (мода) смещена влево (на графике средняя слева от моды). При этом левая часть распределения больше правой. Такая асимметрия является левосторонней. При As / у >3 асимметрия признается существенной с несимметричным распределениям изучаемого признака в генеральной совокупности.

Согласно теории нормального распределения теоретическая типовая кривая распределения имеет характеристические точки перегиба, которым соответствуют значения стандартного отклонения и среднего квадратического (стандартного) отклонения у (t = 1 или tу = ; t = 2 или tу = ; t = 3или tу = ) и вероятности этих отклонений (Рt = 1 = 0,683; Рt = 2 = 0,954; Рt = 3 = 0,997).

В условиях нормального распределения имеет место взаимосвязь между значениями t, у, Рt и количеством единиц совокупности в пределах кратных значений tу. При t = 1 и Pt = 0,683 в пределах хср располагается 0,683 или 68,3% общего количества единиц статистической совокупности исследуемого массового явления.

Соответственно, при t = 2 и Pt = 0,954 в пределах хср располагается 0,954 или 95,4%,а при t = 3 и Pt = 0,997 в пределах хср располагается 0,997 или 99,7% общего числа единиц совокупности.

Использование теоретических кривых нормального распределения позволяет осуществлять моделирование, сравнение, анализ, прогнозирование и планирование социально-экономических показателей хозяйственной деятельности.

Размещено на http://www.allbest.ru/

Рис. 2 Ассиметричное распределение: а) при As>0 - правосторонняя асимметрия, б) при As<0 - левосторонняя асимметрия

4. Расчет параметров нормального распределения и показателей критериев согласия

Дано: Имеются данные статистического наблюдения о распределении численности рабочих (fi ) предприятия (n = 220 чел) по величине фонда средней заработной платы Фот: хi = 3-17 тыс руб. (хi мин = 3, хi мин = 17).

Необходимо: Построить интервальный ряд и групповую таблицу распреления. Определить теоретическое выражение (аналитическую формулу), характеризующее закономерность распределения численности рабочих по уровню заработной платы. Проверить гипотезу о том, что данное распределение подчиняется нормальному закону распределения:

уt = 1/2р * ? -t2i /2

функция нормального распределения.

На основе критериев согласия для вывода о сходимости эмпирической и теоретической линий кривой распределения, подтвердить или отвергнуть принятую гипотезу о характере данного распределения. В качестве критериев использовать критерии согласия К.Пирсона (хи-квадрат при ч2 расч < ч2 табл), В.И. Романовского (при Кр ч < 3), А.Н. Колмогорова (при лрасч < лтабл), сравнивая их с уровнем, определяющим область достоверности и значимости (типичности) полученных путем расчета параметров распределения.

Критерии согласия это специфические показатели для характеристики рядов распределения, позволяющие определить случайность (несущественность при допустимом значении принятого критерия согласия) или неслучайность (существенность при превышении допустимого значения критерия) расхождения эмпирической и теоретической кривых в рядах распределения изучаемых массовых явлений и процессов.

Для наглядности подтверждения о сходимости эмпирической и теоретической линий кривой распределения, нужно построить по фактическим данным график эмпирической зависимости (координаты хi и fi в таблице 15.3) в виде ломаной линии, по характеру которой высказывается гипотеза о законе данного распределения. Для сравнения и анализа построить график нормального распределения по дискретным значениям расчетных теоретических частот в виде ломаной линии (fi от), по которой можно построить плавную линию теоретического нормального распределения (уt).

Теоретической кривой распределения называется линия, которой заменяют ломаную линию на графике фактического распределения, и аналитическое выражение (формула) которой и форма ее на графике отражают закономерность изучаемого (реально существующего) процесса распределения по частотной характеристике в «чистом виде» без учета влияния совокупности случайных факторов.

Расчет параметров нормального распределения.

Размах вариации признака (уровень оплаты труда рабочих по группам оплаты )

Rв = хmax - хmin = 17 - 3 = 14 млн. руб.

Оптимальное количество групп (формула Стерджесса):

кгр.опт = 1 + 3.32 * lg n; lg 74 = 1,9; кгр = 1 + 3.32 * 1.9 = 7.31;

принимаем кгр = 7. Величина группового интервала:

игр = Rв /кгр = 14/7 =2 тыс. руб.

Величины нижней и верхней границ первого интервала интервального ряда распределения составляют хmin1 = 3, хmax1 = хmin1 + игр = 3 + 2 =5 и т.д. по всем интервальным группа. Данные расчета сведены в таблицу 3.

Таблица 3 Группы рабочих (fi ) по уровню заработной платы (Фот)

Фот, хi

3-5

5-7

7-9

9-11

11-13

13-15

15-17

Итого

fi

26

29

31

44

37

28

25

220

№ п\п

1

2

3

4

5

6

7

8

для вариантного решения задачи

Кв = (Nсп +10) /10; fвi = fi +Кв

в гр.3; значение частот округлить до целого

Критерий согласия К.Пирсона:

ч2 расч = У (fi -fi от )2 / fi от ;

ч2 расч < ч2 табл (при n > 50).

Критерий согласия В.И. Романовского на основе критерия Пирсона

Кр ч = [ч2 - (m - 3)] / 2 * (m - 3)] < 3

(m - 3 - по характеру и условиям решаемой задачи; m =7 - число групп рабочих).

Критерий согласия А.Н.Колмогорова:

к = Dmax / n

Dmax - максимальное различие накопленных эмпирических и теоретических частот; n = У fi - сумма эмпирических частот; для уровня значимости б = 0,05 и n = 200 (220); к табл = 1,015 [5, c. 386]

Для расчета ч2 расч необходимо построить таблицу 12.2.

Теоретическое значение частот для критерия согласия Пирсона определяется по формуле

fi т = [(n* игр ) / у ] * {1/2р * ? --- t2i /2 ];

ti = (хi - хi ср ) / у

величина нормированного (стандартного) отклонения (доверительного интервала) кривой нормального распределения;

основание натуральных логарифмов (экспонента) ? и число р - постоянные математические величины.

хi ср определяется как средняя арифметическая взвешенная

хi ср = У (хi fi ) / У fi =2210/ 220 =10.04 тыс руб.

Среднее квадратической отклонение

у = [(хi ц - хi ср )2 *fi ] / У fi = 3232 / 220 = 8,95 =2,99,

принимаем у=3.

Постоянный множитель Кf :

Кf = (n* игр ) / у = (220 * 2) / 3 =146,6;

игр = 2 величина группового интервала (см. гр. 2).

Таблица 4 Расчет теоретических частот нормального распределения (ты сруб.)

№ п\п

хi

fi

хi ц

хi ц *fi

ti

yt

fi т

fi от

fi - fi от

(fi - fi от )2 / fi от

1

2

3

4

5

6

7

8

9

10

11

1

3-5

26

4

104

- 2,0

0,0540

22,66

23

2

1,33

2

5-7

29

6

174

-1,33

0,1647

28,12

28

0

0

3

9-7

32

8

256

-0,66

0.3209

35,82

32

5

1,56

4

9-11

44

10

440

0

0,3989

39,67

45

4

0,84

5

11-13

37

12

444

0,66

0,3209

35,82

36

0

0

6

13-15

28

14

392

1,33

0.1647

28,12

29

1

0,13

7

15-17

25

16

400

2

0,0540

22,66

23

1

0,33

-

Итого

220

-

2210

-

-

-

216

-

4,19

Примечание: Значения в графах 3 и 9 имеют расхождение (220 и 216) в связи с округлениями fi т.

Фt (yt ) = 1/2р * ? ---ti /2

кривая нормального распределения Лапласа-Гауса.

Значения функции Фt в зависимости от расчетных величин ti выбираются по таблице [3, с. 320].

ксв = m -3 = 4

(m = 7 - число интервалов) и вероятности Р = 0,95 (коэффициенте значимости б = 0,05) ч2табл = 9,5.

По таблице 5.4. (гр. 11)

ч2 расч = У (fi -fi от)2 / fi от = 4,19,

Следовательно, условие по критерию согласия К. Пирсона выполняется ч2 расч = 4,19 < ч2 табл = 9,5. Принятая гипотеза о нормальном распределении исследуемой зависимости не отвергается (признается).

По критерию согласия В.И. Романовского:

Кр ч = [ч2 расч - (m - 3)] / 2 * (m - 3)] = [4,19 - (7 - 3)] / 2 * (7- 3)] = 0,19 / 8 = 0,19 / 2,83 = 0,067; Кр ч = 0,067 < 3.

Условие по критерию согласия В.И. Романовского выполняется, что подтверждает гипотезу о нормальном законе распределения изучаемой зависимости.

Для определения критерия согласия Колмогорова расчет разностей накопленных частот (кумулят) приведен в таблице 5.5.

Таблица 5 Расчет накопленных частот (кумулят) распределения

эмпирич. S fi

5

13

24

47

63

70

74

тоеретич.S fi т

3

11

27

46

62

70

73

D= S fi - S fi т

2

2

3

1

1

0

1

Dmax = 3; = Dmax / n = 3 / 220 = 3 / 14,6 = 0,205;

расч = 0,205 < табл = 1,015.

Гипотеза о нормальном характере распределения фонда оплаты труда рабочих (Фот) и их численности (fi ) по критерию согласия А.Н. Колмогорова выполняется.

Размещено на http://www.allbest.ru/

Рис. 3 Эмпирическое (пунктирная линия по fi ) и теоретическое (сплошная линия по fi от) нормальное распределение (разрыв оси 0-х условный)

Линии эмпирического и теоретического распределения на графике (рис.3.) по условиям задачи подтверждают гипотезу о нормальном законе распределения уровня оплаты труда рабочих и численности рабочих в группах на данном предприятии.

Общие выводы:

Подтверждение принятой гипотезы о характере распределении позволяет с заданной (высокой) вероятностью (Р = 0,95) сделать два важных вывода.

1) По принятым критериям согласия К. Пирсона (ч2 расч > ч2 табл. ), В.И. Романовского (Кр ч < 3 ) и А.Н. Колмогорова ( расч< табл ) исследуемое распределение действительно подчиняется выявленному нормальному закону распределения.

2) Все расчетные параметры (хi ср, у и др.) достоверны и типичны для данного вида зависимостей и закономерностей и могут быть использованы для моделирования, прогнозирования, анализа и планирования фондов оплаты труда рабочих на данном предприятии.

5. Непараметрические методы изучения взаимосвязей в массовых явлениях. Таблицы сопряженности

При исследовании характера взаимосвязей социально-экономических массовых явлений и процессов возникают проблемы выявления закономерностей социальных и политических явлений на основе взаимосвязей качественных (атрибутивных) признаков и показателей, не имеющих количественных оценок. Для исследования таких явлений используются коэффициенты ассоциации (КА) и контингенции (Кк), для расчета которых строятся таблицы сопряженности. Связь между качественными признаками считается существенной и подтверждается при условии Ка > 0,5 и Кк > 0,3, при этом Кк всегда меньше Ка (Кк,< Ка )/

При статистическом анализе взаимосвязей в массовых явлениях и процессах, в которых изучаемые признаки взаимодействующих факторов (уi-n и xi-n) подчиняются разным законам распределения, используются методы расчета показателей «условных оценок» - коэффициенты Фихнера (Кф), ранговые коэффициенты Спирмена (с) и Кенделла (Я) и др. Основой расчета Кф при оценке тесноты связи между факторами является принцип сопоставления не абсолютных (эмпирических) значений признаков (у) и (x), а их отклонений xi и уi от средних уровней (xi - xср) и (уi -уср), в предположении, что эти отклонения при их сочетании носят случайный характер. Соотношение пар совпадений (С) или несовпадений (Н) знаков отклонений (xi - xср и уi -уср) позволяет судить о наличии и степени тесноты связи между (у) и (х). Коэффициент Фихнера определяется по формуле:

Кф = (С - Н) / (С + Н).

Кф может принимать значения в пределах: (-1 ? Кф ? + 1); при Кф = ± 1 связь между (у) и (х) функциональная; при Кф = 0 - связь отсутствует; при изменении Кф в пределах -1 ? Кф < 0 - связь обратная, а в пределах 0 < Кф ? + 1 - связь прямая. Если по 10-ти значениям эмпирических данных (xi и уi; i = 1,n; n = 10) коэффициент Фихнера будет иметь значение Кф = (9 - 1) / (8 + 2) = 0,8, то связь между (у) и (x) оценивается как «сильная» (по шкале Чеддока, таблица 6). При расчете ранговых коэффициентов связи осуществляется процедура ранжирования - упорядочение эмпирических количественных значений признаков факторов взаимосвязанных рядов распределения (xi и уi ) по принятым предпочтениям. Под рангом понимается порядковый номер значений признаков, располагаемых в порядке возрастания или убывания их величин. Ранговые коэффициенты корреляции могут использоваться для определения тесноты связи и между количественными признаками, и между качественными признаками ранжированных рядов распределения. Коэффициент Спирмена - коэффициент корреляции рангов сх/у, определяется по формуле

сх/у = 1 - 6?d 2i / (n2 - 1),

где: d 2i - квадрат разности рангов; n - число пар рангов, равное количеству наблюдений; коэффициент сх/у изменяется в пределах -1 ? сх/у ? + 1. Значимость коэффициента корреляции оценивается сравнением его расчетного значения

tс = сх/у v (n-2) / (1 - с2х/у )

с табличным значением t-критерия Стьюдента. Значение коэффициента корреляции сх/у признается статистически существенным (значимым), если выполняется условие tс > tкр (количество степеней свободы k= n -2 для б = 0,05; Р = 0,95).

6. Определение коэффициентов ассоциации и контингенции

Дано: Имеются данные о посещаемости молодежи (мужчины и женщины в возрасте 20 - 25 лет; количество респондентов по 100 человек каждой группы) театров города в течение года. Данные приведены в таблице 8.1 и 8.2..

Необходимо сделать заключение о культурных предпочтениях молодежи разного пола.

Для подтверждения гипотезы (предположения) о культурных предпочтениях молодёжи необходимо рассчитать коэффициенты ассоциации (Ка ) и контингенции (Кк ) с пороговыми значениями: Ка > 0,5; Кк > 0,3.

Таблица 6 Таблица сопряженности для расчета Ка и Кк

Показатель

Женщины

Мужчины

Всего

Посещает

А

Б

А + Б

Не посещает

В

Г

В + Г

Всего

А + В

Б + Г

А +Б +В +Г

Коэффициенты ассоциации и контенгенции определяются по формулам

Ка = (АГ-БВ) / (АГ + БВ) = [(60*70)]- (30*40)] / [(60*70)]+ (30*40)] = (4200-1200) / (4200 + 1200) = 3000 / 5400 = 0,55;

Таблица 7 Таблица сопряженности для расчета Ка и Кк

Показатель

Женщины

Мужчины

Всего

Посещает

60

30

90

Не посещает

40

70

110

Всего

100

100

200

Кк = (АГ - БВ) / v (А + В) * (Б + Г) * (А + Б) * (В +Г) = (4200-1200) / v (60 + 40) * (30 + 70) * (60 + 30) * (40 +70) = = 3000 / v (100) * (100) * (90) * (110) = 3000 / 9949,8 = 0,3015

Ответ: Ка = 0,55, Кк = 0,3015.

Вывод: С учетом значимости коэффициентов Ка > 0,5 и Кк > 0,3, можно утверждать: 1) Различия в предпочтениях к культурному развитию между женщинами и мужчинами весьма слабые; 2) Практически пороговые уровни коэффициентов ассоциации и контингенции (весьма не значительные различия) свидетельствуют об устойчивом проявлении интереса молодежи обоего пола к культурным ценностям.

Список использованной литературы

1. Зинченко А.П. Статистика. Учебник для вузов. ООО «Издательство «КолосС», Москва 2007.

2. Зинченко А.П., Шибалкин А.Е., Тарасова О.Б. и др. Практикум по статистике /Под ред. Зинченко А.П. - М.: КолосС, 2004.

3. Ильенкова С.Д., Гохберг Л.М., Суринов А.Е. и др. Макроэкономическая статистика /Под ред. Ильенковой С.Д. - М.: Финансы и статистика, 2004.

4. Вопросы статистики. - Журнал Госкомстата РФ. 1994-2006.

5. Статистический словарь. - М.: Финстатинформ, 1996.

6. Методологические положения по статистике. Москва.: Госкомстат РФ, 1996-2003.

7. Орлов А. И. Эконометрика. Учебник для вузов. Изд. 3-е, исправленное и дополненное. - М.: Изд-во «Экзамен», 2004.

Размещено на Allbest.ru

...

Подобные документы

  • Виды и формы связей между явлениями. Методы изучения взаимосвязи экономических явлений. Статистические методы изучения взаимосвязи. Метод аналитических группировок. Дисперсионный и корреляционно-регрессионный анализ. Непараметрические методы оценки связи.

    курсовая работа [235,9 K], добавлен 10.12.2008

  • Статистические показатели производительности труда и заработной платы, характеристика ее динамики. Виды взаимосвязей между явлениями. Статистический анализ использования трудовых ресурсов, производительности и оплаты труда и факторов, на них влияющих.

    курсовая работа [181,7 K], добавлен 18.03.2015

  • Задачи корреляционного анализа. Статистическое изучение взаимосвязей. Коэффициенты ассоциации и контингенции, коэффициенты Пирсона и Чупрова. Связи между дихотомическими переменными. Применение статистического анализа для хозяйственных субъектов.

    контрольная работа [246,2 K], добавлен 14.01.2015

  • Теоретические аспекты исследования эффективности массовых маркетинговых коммуникаций. Медиапланирование как процесс выбора эффективных массовых маркетинговых коммуникаций. Исследование эффективности массовых коммуникаций при разработке медиаплана.

    курсовая работа [65,1 K], добавлен 11.09.2010

  • Основные понятия рыночного процесса, виды и методы их взаимосвязей. Влияние статистических методов на решение маркетинговых задач. Расчет индексов постоянного и переменного состава и структурных сдвигов на примере товарооборота и численности населения.

    курсовая работа [763,8 K], добавлен 08.01.2012

  • Сущность и назначение корреляционного метода изучения взаимосвязей между явлениями. Зависимость чистых процентных доходов от выданных кредитов, активов банка от величины вкладов частных лиц, стоимости акции на ММВБ от величины операционных доходов.

    курсовая работа [2,1 M], добавлен 07.03.2011

  • Методика моделирования взаимосвязей показателей производства услуг и социально-экономического развития на основе метода корреляции и регрессии. Выявление тенденций производства услуг на основе метода аналитического выравнивания и прогнозирования.

    курсовая работа [310,9 K], добавлен 26.10.2014

  • Проведение статистических наблюдений в биологии. Методы изучения массовых явлений. Графическое изображение рядов распределения. Показатели вариации признаков. Ошибки и надежность статистических показателей. Основные характеристики интервальных рядов.

    отчет по практике [199,4 K], добавлен 23.12.2010

  • Виды, типы и методы исследования экономических и политических процессов. Анализ состояния и тенденций развития социальных процессов. Сущность метода структуризации. Изучение социальной системы, освоение взаимосвязей и взаимозависимостей ее элементов.

    курсовая работа [158,0 K], добавлен 24.10.2014

  • Математические методы систематизации и использования статистических данных для научных и практических выводов. Формирование закономерностей массовых социально-экономических процессов. Толкование экономических явлений посредством закона больших чисел.

    контрольная работа [19,5 K], добавлен 28.10.2010

  • Экономические показатели условий и результатов деятельности предприятий. Обоснование объема и оценка параметров статистической совокупности. Экономико-статистический анализ взаимосвязей между признаками изучаемого явления. Метод аналитической группировки.

    курсовая работа [189,2 K], добавлен 28.05.2013

  • Решение с помощью метода скользящей средней, метода наименьших квадратов и экспоненциального сглаживания. Линейная зависимость валового выпуска продукции в стране от численности занятых. Определение величины интервала скольжения и временного ряда.

    контрольная работа [79,2 K], добавлен 01.02.2011

  • Статистическое наблюдение как научно организованный сбор количественных данных о явлениях и процессах. Срочная, текущая, годовая отчетность. Документальный способ наблюдения. Задача на определение средней стоимости товарных запасов, показателей вариации.

    контрольная работа [173,4 K], добавлен 27.12.2013

  • Экономические показатели условий и результатов деятельности сельскохозяйственных предприятий. Оценка параметров и характера распределения статистической совокупности. Экономико-статистический анализ взаимосвязей между признаками изучаемого явления.

    курсовая работа [61,3 K], добавлен 03.03.2015

  • Виды и формы связей социально-экономических явлений. Корреляционно-регрессионный анализ. Уравнение парной регрессии: экономическая интерпретация и оценка значимости. Качество однофакторных линейных моделей. Прогнозирование экономических показателей.

    реферат [154,7 K], добавлен 19.12.2010

  • Корреляционно-регрессионный анализ как объект статистического изучения, система статистических показателей, его характеризующих. Особенности и принципы применения метода корреляционно-регрессионного анализа. Построение статистического ряда распределения.

    курсовая работа [453,1 K], добавлен 28.01.2014

  • Виды и методы взаимосвязи. Виды взаимосвязи. Методы взаимосвязи. Аналитические группировки. Метод параллельных рядов. Балансовый метод. Корреляционно-регрессионный анализ. Графики, характеризующие связь социальных явлений.

    курсовая работа [141,7 K], добавлен 26.03.2007

  • Рассмотрение современных приемов сбора, обработки, обобщения и анализа массовой, однородной статистической информации о социально-экономических явлениях и процессах, методов их моделирования и прогнозирования с целью принятия управленческих решений.

    методичка [130,6 K], добавлен 14.04.2010

  • Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.

    контрольная работа [47,3 K], добавлен 15.06.2009

  • Понятие и сущность, методы работы информационно-консультационных служб, основные направления и результаты. Проект с использованием массовых методов ИКС. Деятельность службы и ее значение в сохранении экологического и культурного своеобразия региона.

    курсовая работа [46,6 K], добавлен 18.11.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.