Дисперсионный анализ

Роль науки в агропромышленном комплексе. Датчики телематики сельхозоборудования на тракторах, комбайнах. Сущность и классификация научных исследований. Комплексные и дифференцированные исследования. Понятия дисперсионного анализа, однофакторный анализ.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 30.09.2021
Размер файла 107,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. РОЛЬ НАУКИ В РАЗВИТИИ АПК

«Малая наука» (исследователи-одиночки или небольшие группы) уже не способна увеличить мировое производство пищевых продуктов, улучшить качество питания населения, повысить безопасность пищевых продуктов и решать другие глобальные задачи. Сегодня для решения накопившихся сложных проблем нужны команды специалистов различных дисциплин, совместно работающих с большими базами надежной и широкодоступной информации.

Необходимо создавать централизованные «баз знаний», связывающие хранилища данных сельскохозяйственных исследований. На этой основе, как полагают американские эксперты, и формируется современная «большая сельскохозяйственная наука». Конечно, на ее пути есть немало препятствий. Например, отсутствие доступа к данным, которые уже накоплены к настоящему времени. Ценная информация продолжает накапливаться и сейчас, но она почти закрыта для широкого доступа. Отсутствие полного и точного информирования снижает ценность государственных инвестиций в науку, поскольку в условиях ограниченной информации невозможно принимать эффективных решений в сельском хозяйстве. Без осмысления принимаемых решений на основе фактических данных, инвестиционная политика сегодня вынужденно опирается на оценочные мнения экспертов. [2]

1.1 Продукты питания

Создание новых штаммов животных и растений для лучшего удовлетворения биологических и физиологических потребностей. Отказ от генетически модифицированных продуктов питания. Научное обоснование технология получила в 2016 году, активное инвестирование запланировано на 2021 год, финансовая жизнеспособность технологии будет достигнута в 2022 году.

Производство мясо «в пробирке» - продукта, который никогда не был частью полноценного, живого животного. Запущено несколько исследовательских проектов, в рамках которых экспериментально выращивают мясо в лабораторных условиях. Научное обоснование технология получила в 2017 году, активное инвестирование запланировано на 2024 год, финансовая жизнеспособность технологии будет достигнута в 2027 году.

1.2 Автоматизация

Возможность регулирования переменной скорости для отдельных технологических операций на сельхозмашинах. Предварительное вычисление формы поля с учетом производительности различных узлов сельхозтехники обеспечит точность и дифференцированность выполнения отдельных операций. Научная жизнеспособность направления была обоснована в 2013 году, активное инвестирование началось в 2014 году, в 2016 году технология стала финансово жизнеспособной.

Быстрое итеративное селекционное разведение сельхозживотных. Анализ продуктивности потомства на генном уровне позволяет точно определить характеристики будущего потомства, а также предложить алгоритм улучшения характеристик потомства. Научная жизнеспособность технологии доказана в 2014 году, основные инвестиции начались в 2017 году, к 2018 году технология стала финансово жизнеспособный.

Сельскохозяйственные роботы или агботы. Автоматизация сбора фруктов, вспашка полей, уход за почвой, прополка, посадка, орошение и другие необходимые технологические операции. Научная жизнеспособность доказана в 2018 году, основное инвестирование предполагается в 2020 году, достижение финансовой жизнеспособности - в 2021 году.

Точное земледелие, основанное на наблюдении и реагировании возникающих полевых изменений. Благодаря спутниковым снимкам и датчикам фермеры могут оптимизировать издержки при большей сохранности ресурсов. Понимание изменчивости культур, анализ данных о геолокации и с различных датчиков максимально автоматизирует процесс принятия решений для сельхозпроизводителя. Научное подтверждение технология получила в 2019 году, активное инвестирование ожидается в 2023 году, финансовая жизнеспособность - в 2024 году.

Роботизированные фермерские рои - комбинация десятков или сотен сельскохозяйственных роботов с тысячами микроскопических датчиков, которые вместе могли бы отслеживать, предсказывать, выращивать и собирать урожай практически без вмешательства человека. Научная жизнеспособность направления, как ожидается, будет доказана в 2023 году, основное инвестирование и финансовая жизнеспособность запланированы на 2026 год.

1.3 Инженерия

Создание закрытых экологических систем, которые не зависят от обмена веществ вне системы. Такие замкнутые экосистемы способны превращать отходы в кислород, пищу и воду, чтобы поддерживать формы жизни, населяющие систему. Такие системы уже существуют в небольших масштабах, но технологические ограничения не позволяют им масштабироваться. Научная жизнеспособность технологии получила подтверждение в 2015 году, основные инвестиции в это направление ожидаются в 2020 году, финансовая жизнеспособность - в 2021 году.

Синтетическая биология - программирование живых систем с использованием стандартизированных частей по аналогии с тем, как сегодня программируются компьютеры с использованием стандартизированных библиотек. Конечная цель - способность проектировать, создавать и восстанавливать инженерные биологические системы, которые обрабатывают информацию, манипулируют химическими веществами, производят материалы и структуры, производят энергию, обеспечивают пищу, поддерживают и улучшают здоровье человека и его окружения. Научная жизнеспособность доказана в 2013 году, основные инвестиции ожидаются в 2023 году, возможная финансовая жизнеспособность технологии будет достигнута в 2024 году.

Вертикальное земледелие как естественное продолжение городского сельского хозяйства. Вертикальные фермы будут культивировать растения или животных в специализированных или смешанных небоскребах в городских условиях. Используя методы, подобные стеклянным домам, вертикальные фермы увеличивают естественное освещение. Обеспечение круглогодичного растениеводства, защиту от непогоды, поддержку городской продовольственной автономии и снижение транспортных расходов. Научная жизнеспособность будет окончательно достигнута в 2023 году, инвестирование и проект, и достижение его финансовой жизнеспособности ожидаются к 2027 году.

1.4 Датчики

В растениеводстве это прежде всего датчики воздуха и почвы, в животноводстве - температурные датчики, датчики движения, которые позволят в реальном времени увидеть, понять и оценить ситуацию на поле или внутри фермы. Такие датчики были научно обоснованы уже в 2013 году, активно получали инвестиции с 2015, а к 2016 году эта технология стала финансово жизнеспособной.

Датчики телематики сельхозоборудования на тракторах, комбайнах, других машинах и устройствах, позволяющие предупреждать механизаторов и механиков о том, что вскоре может произойти поломка. Научное обоснование технология получила в 2013 году, инвестиции - в 2016 году, а финансовую жизнеспособность в 2017 году.

Биометрия сельхозживотных с помощью ошейников с GPS, которые могут автоматически определять и передавать жизненно важную информацию в режиме реального времени. Технология получила научное обоснование в 2017 году, инвестиции с 2018, финансово жизнеспособной технология станет к 2020 году.

Датчики урожайности позволяют применять дифференцированное внесение удобрений, а также определять состояние посевов по всему полю, например, с помощью инфракрасного света. Научная идея получила подтверждение в 2015 году, стала мейнстримом в 2018 году, а в 2019 году станет и финансово жизнеспособной технологией.

Датчики работоспособности для мониторинга вибраций и общего состояния материалов в зданиях, фермах и другой инфраструктуре. Возможность напрямую передавать важную информацию прямо в бригады технического обслуживания. Научное обоснование технология получает сейчас, ожидается, что работы будут завершены к 2021 году. С 2025 года ожидается активное инвестирование, а к 2027 году - полная финансовая жизнеспособность этого направления.[1]

Датчики изменяют сельское хозяйство, позволяя в режиме реального времени отслеживать и диагностировать состояние выращиваемых культур, скота и сельскохозяйственных машин. Нужные продукты питания можно получить, используя генетические данные, или вообще начать производство мяса непосредственно в лаборатории. Автоматизация с помощью крупных и мелких роботов дает возможность контролировать зреющий урожай и ухаживать за ним. Инжиниринг обеспечит сельскому хозяйству новые средства, новые места и даже новые области экономики.

2. ОСОБЕННОСТИ ТЕОРЕТИЧЕСКИХ ИССЛЕДОВАНИЙ

Научное исследование - процесс изучения, эксперимента, концептуализации и проверки теории, связанный с получением научных знаний. Не всякое знание можно рассматривать как научное. Нельзя признать научными те знания, которые получает человек лишь на основе простого наблюдения. Эти знания играют в жизни людей важную роль, но они не раскрывают сущности явлений, взаимосвязи между ними, которая позволила бы объяснить, почему данное явление протекает так или иначе, и предсказать дальнейшее его развитие. Правильность научного знания определяется не только логикой, но, прежде всего обязательной проверкой его на практике. Научные знания принципиально отличаются от слепой веры, от беспрекословного признания истинным того или иного положения, без какого-либо логического его обоснования и практической проверки. Раскрывая закономерные связи действительности, наука выражает их в абстрактных понятиях и схемах, строго соответствующих этой действительности.

Объектом научного исследования являются материальная или идеальная система. Структура системы, взаимодействие ее элементов, различные свойства, закономерности развития.

Цель научного исследования - определение конкретного объекта и всестороннее, достоверное изучение его структуры, характеристик, связей на основе разработанных в науке принципов и методов познания, а также получение полезных для деятельности человека результатов, внедрение в производство с дальнейшим эффектом.

Результаты научных исследований оцениваются тем выше, чем выше научность сделанных выводов и обобщений, чем достовернее они и эффективнее. Они должны создавать основу для новых научных разработок.

Одним из важнейших требований, предъявляемых к научному исследованию, является научное обобщение, которое позволит установить зависимость и связь между изучаемыми явлениями и процессами и сделать научные выводы. Чем глубже выводы, тем выше научный уровень исследования.

2.1 Сущность и классификация научных исследований

Познание - это сложный процесс движения человеческого сознания, человеческой мысли от незнания к знанию, от неполных или неточных знаний к более полным и точным знаниям, которое осуществляется с помощью исследований.

Научное исследование, как процесс, включает в себя три основных компонента (составляющих):1.целесообразную деятельность человека, т.е. собственно сам научный труд;2.предмет научного труда;3.средства научного труда.

В результате целесообразная научная деятельность человека, опирающая на совокупность конкретных методов познания, необходимая для достижения новых или уточнённых знаний об объекте исследования (предмет труда), использует соответствующее научное оборудование (измерительное, вычислительное и др.), т.е. средства труда.

Научные исследования в зависимости от своего целевого назначения, степени связи с природой или промышленным производством, глубины и характера научной работы подразделяются на несколько основных типов:

1.фундаментальные

2.прикладные

3.разработки

Фундаментальные исследования - получение принципиально новых знаний и дальнейшее развитие системы уже накопленных знаний. Цель фундаментальных исследований, открытие новых законов природы, вскрытие связей между явлениями и создание новых теорий. На их основе решаются многие прикладные задачи применительно к потребностям конкретных отраслей науки, техники и производства. Фундаментальные исследования связаны со значительным риском и неопределённостью с точки зрения получения конкретного положительного результата, вероятность которого не превышает 10%.Несмотря на это, именно фундаментальные исследования составляют основу развития как самой науки, так и общественного производства.

Прикладные исследования представляют собой поиск и решение практических задач развития отдельных отраслей производства на основе результатов фундаментальных исследований. Они связаны с созданием новых, либо совершенствованием существующих технологий, средств производства, предметов потребления и т.п. Например, прикладные исследования в области техники не имеют, как правило, непосредственного дела с природой. Объектом исследования в них обычно являются машины, технология или организационная структура, т.е. «искусственная» природа. Практическая ориентация (направленность) и отчетливое целевое назначение прикладных исследований делает вероятность получения ожидаемых от них результатов весьма значительной, не менее 80-90%.

Использование результатов прикладных исследований для создания и отработки опытных моделей техники (машин, продуктов), технологии производства, а также усовершенствование существующей техники. На этапе разработки результаты, продукты научных исследований принимают такую форму, которая позволяет использовать их в других отраслях общественного производства.

Научные исследования классифицируются по различным основаниям: по методам решения поставленных задач, сфере применения результатов исследования, видам исследуемого объекта и другим факторам исследования могут быть теоретическими, теоретико-экспериментальными и экспериментальными. Отнесение исследования к одному из этих видов зависит от применяемых методов и средств научного исследования.

Теоретические исследования базируются на применении математических и логических методов познания объекта. Результатом теоретического исследования является установление новых зависимостей, свойств и закономерностей происходящих явлений. Результаты теоретических исследований должны быть подтверждены практикой.

Теоретико-экспериментальные исследования предусматривают последнюю экспериментальную проверку результатов теоретических исследований на натурных образцах или моделях.

Экспериментальные исследования осуществляются на натурных образцах или моделях в лабораторных условиях, при которых устанавливаются новые свойства, зависимости и закономерности, а также служат для подтверждения выдвинутых теоретических предположений.

По составу исследуемых свойств объекта исследования подразделяются на комплексные и дифференцированные.

Комплексные исследования представляют собой изучение разнородных свойств одного объекта, каждое из которых может предусматривать применение различных методов и средств исследования. Выполняются они в различное время и в различных местах. Примером комплексного исследования может служить оценка надежности нового автомобиля. Надежность автомобиля является интегральным свойством и обусловливается такими его отдельными свойствами, как безотказность, ремонтопригодность, сохраняемость и долговечность деталей и т.д.

Дифференцированным исследованием называется такое исследование, в котором познается одно из свойств или группа однородных свойств. В рассмотренном примере исследование каждого в отдельности свойства надежности автомобиля является дифференцированным.

По признаку места их проведения исследования; именуются лабораторными или производственными. Исследуемый объект может быть натурным или представлять его модель. В каждом случае выбор вида исследуемого объекта подлежит обоснованию.

По стадиям выполнения исследования подразделяются; поисковые, научно-исследовательские и опытно-промышленные разработки.

При разработке крупной научно-технической проблемы. Первой стадией является поисковое исследование, в результате которого устанавливаются принципиальные основы, пути и методы решения поставленной задачи. Вторая стадия представляет собой научно-исследовательские разработки, целью которых является установление необходимых зависимостей, свойств и закономерностей, создающих предпосылки для дальнейших инженерных решений. Третья стадия опытно-промышленная разработка, главная задача которой состоит в доведении исследования до практической реализации, т.е. его апробации в условиях производства. На основе результатов опытно-производственной проверки вносятся коррективы в техническую документацию для широкого внедрения разработки в производство.

Каждое научное исследование можно отнести к определенному научному направлению.

Под научным направлением понимается наука или комплекс наук, в области которых ведутся исследования. В связи с этим различают техническое, биологическое, физико-техническое, историческое и другие направления с возможной их последующей детализацией.

Структурными единицами научного направления являются комплексные проблемы, проблемы, темы и научные вопросы.

Выбор направления, проблемы, темы научного исследования и постановка научных вопросов являются весьма ответственной задачей. Так, в частности актуальные направления и комплексные проблемы исследований стратегического масштаба формулируются в директивных документах правительства страны.

В научном учреждении направление исследования часто предопределяется спецификой этого научного учреждения или отраслью науки, в которых работает тот или иной исследователь.

Выбранное направление исследований часто становится стратегией научного работника или научного коллектива на длительный период. Однако необходимо иметь в виду, что в процессе научных разработок возможны и некоторые изменения в тематике по предложению заказчика.[3]

3. ДИСПЕРСИОННЫЙ АНАЛИЗ

Дисперсионный анализ (от латинского Dispersio - рассеивание) - статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Метод был разработан биологом Р. Фишером в 1925 году и применялся первоначально для оценки экспериментов в растениеводстве. [6]

Целью дисперсионного анализа является проверка значимости различия между средними с помощью сравнения дисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации.

При истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии.

При проведении исследования рынка часто встает вопрос о сопоставимости результатов. Например, проводя опросы по поводу потребления какого-либо товара в различных регионах страны, необходимо сделать выводы, на сколько данные опроса отличаются или не отличаются друг от друга. Сопоставлять отдельные показатели не имеет смысла и поэтому процедура сравнения и последующей оценки производится по некоторым усредненным значениям и отклонениям от этой усредненной оценки. Изучается вариация признака. За меру вариации может быть принята дисперсия. Дисперсия у2 - мера вариации, определяемая как средняя из отклонений признака, возведенных в квадрат.

На практике часто возникают задачи более общего характера - задачи проверки существенности различий средних выборочных нескольких совокупностей. Например, требуется оценить влияние различного сырья на качество производимой продукции, решить задачу о влиянии количества удобрений на урожайность с/х продукции.

Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей (дисперсии этих совокупностей одинаковы по предположению; если дисперсионный анализ покажет, что и математические ожидания одинаковы, то в этом смысле совокупности однородны). Однородные же совокупности можно объединить в одну и тем самым получить о ней более полную информацию, следовательно, и более надежные выводы [2].

3.1 Основные понятия дисперсионного анализа

В процессе наблюдения за исследуемым объектом качественные факторы произвольно или заданным образом изменяются. Конкретная реализация фактора (например, определенный температурный режим, выбранное оборудование или материал) называется уровнем фактора или способом обработки. Модель дисперсионного анализа с фиксированными уровнями факторов называют моделью I, модель со случайными факторами - моделью II. Благодаря варьированию фактора можно исследовать его влияние на величину отклика. В настоящее время общая теория дисперсионного анализа разработана для моделей I.

В зависимости от количества факторов, определяющих вариацию результативного признака, дисперсионный анализ подразделяют на однофакторный и многофакторный.

Основными схемами организации исходных данных с двумя и более факторами являются:

- перекрестная классификация, характерная для моделей I, в которых каждый уровень одного фактора сочетается при планировании эксперимента с каждой градацией другого фактора;

- иерархическая (гнездовая) классификация, характерная для модели II, в которой каждому случайному, наудачу выбранному значению одного фактора соответствует свое подмножество значений второго фактора.

Если одновременно исследуется зависимость отклика от качественных и количественных факторов, т.е. факторов смешанной природы, то используется ковариационный анализ.

При обработке данных эксперимента наиболее разработанными и поэтому распространенными считаются две модели. Их различие обусловлено спецификой планирования самого эксперимента. В модели дисперсионного анализа с фиксированными эффектами исследователь намеренно устанавливает строго определенные уровни изучаемого фактора. Термин «фиксированный эффект» в данном контексте имеет тот смысл, что самим исследователем фиксируется количество уровней фактора и различия между ними. При повторении эксперимента он или другой исследователь выберет те же самые уровни фактора. В модели со случайными эффектами уровни значения фактора выбираются исследователем случайно из широкого диапазона значений фактора, и при повторных экспериментах, естественно, этот диапазон будет другим.

Таким образом, данные модели отличаются между собой способом выбора уровней фактора, что, очевидно, в первую очередь влияет на возможность обобщения полученных экспериментальных результатов. Для дисперсионного анализа однофакторных экспериментов различие этих двух моделей не столь существенно, однако в многофакторном дисперсионном анализе оно может оказаться весьма важным.

При проведении дисперсионного анализа должны выполняться следующие статистические допущения: независимо от уровня фактора величины отклика имеют нормальный (Гауссовский) закон распределения и одинаковую дисперсию. Такое равенство дисперсий называется гомогенностью. Таким образом, изменение способа обработки сказывается лишь на положении случайной величины отклика, которое характеризуется средним значением или медианой. Поэтому все наблюдения отклика принадлежат сдвиговому семейству нормальных распределений.

Говорят, что техника дисперсионного анализа является "робастной". Этот термин, используемый статистиками, означает, что данные допущения могут быть в некоторой степени нарушены, но несмотря на это, технику можно использовать.

При неизвестном законе распределения величин отклика используют непараметрические (чаще всего ранговые) методы анализа.

В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты. Вариацию, обусловленную влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия у2. Она является мерой вариации частных средних по группам вокруг общей средней и определяется по формуле:

,

где k - число групп;

nj - число единиц в j-ой группе;

- частная средняя по j-ой группе;

- общая средняя по совокупности единиц.

Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группе внутригрупповая дисперсия уj2.

.

Между общей дисперсией у02, внутригрупповой дисперсией у2 и межгрупповой дисперсией существует соотношение:

у02 = + у2.

Внутригрупповая дисперсия объясняет влияние неучтенных при группировке факторов, а межгрупповая дисперсия объясняет влияние факторов группировки на среднее значение по группе [2].

3.2 Однофакторный дисперсионный анализ

дисперсионный датчик исследование

Однофакторная дисперсионная модель имеет вид:

xij = м + Fj+ еij, (1)

где хij - значение исследуемой переменой, полученной на i-м уровне фактора (i=1,2,...,m) cj-м порядковым номером (j=1,2,...,n);

Fi - эффект, обусловленный влиянием i-го уровня фактора;

еij - случайная компонента, или возмущение, вызванное влиянием неконтролируемых факторов, т.е. вариацией переменой внутри отдельного уровня.

Основные предпосылки дисперсионного анализа:

- математическое ожидание возмущения еij равно нулю для любых i, т.е.

M(еij) = 0; (2)

- возмущения еij взаимно независимы;

- дисперсия переменной xij (или возмущения еij) постоянна для любых i, j, т.е.

D(еij) = у2; (3)

- переменная xij (или возмущение еij) имеет нормальный закон
распределения N(0;у2).

Влияние уровней фактора может быть как фиксированным или систематическим (модель I), так и случайным (модель II).

Пусть, например, необходимо выяснить, имеются ли существенные различия между партиями изделий по некоторому показателю качества, т.е. проверить влияние на качество одного фактора - партии изделий. Если включить в исследование все партии сырья, то влияние уровня такого фактора систематическое (модель I), а полученные выводы применимы только к тем отдельным партиям, которые привлекались при исследовании. Если же включить только отобранную случайно часть партий, то влияние фактора случайное (модель II). В многофакторных комплексах возможна смешанная модель III, в которой одни факторы имеют случайные уровни, а другие - фиксированные.

Пусть имеется m партий изделий. Из каждой партии отобрано соответственно n1,n2, …, nm изделий (для простоты полагается, что n1=n2=...=nm=n). Значения показателя качества этих изделий представлены в матрице наблюдений:

x11 x12 … x1n

x21 x22 … x2n

………………… = (xij), (i = 1,2, …, m; j = 1,2, …, n).

xm1xm2… xmn

Необходимо проверить существенность влияния партий изделий на их качество.

Если полагать, что элементы строк матрицы наблюдений - это численные значения случайных величин Х1,Х2,...,Хm, выражающих качество изделий и имеющих нормальный закон распределения с математическими ожиданиями соответственно a1,а2,...,аm и одинаковыми дисперсиями у2, то данная задача сводится к проверке нулевой гипотезы Н0: a1=a2 =...= аm, осуществляемой в дисперсионном анализе.

Усреднение по какому-либо индексу обозначено звездочкой (или точкой) вместо индекса, тогда средний показатель качества изделий i-й партии, или групповая средняя для i-го уровня фактора, примет вид:

, (4)

где i* - среднее значение по столбцам;

ij - элемент матрицы наблюдений;

n - объем выборки.

А общая средняя:

(5)

Сумма квадратов отклонений наблюдений хij от общей средней выглядит так:

2=2+2++22. (6)

Q = Q1 + Q2 + Q3.

Последнее слагаемое равно нулю

=0. (7)

так как сумма отклонений значений переменной отее средней равна нулю, т.е.

2=0.

Первое слагаемое можно записать в виде:

В результате получается тождество:

Q = Q1 +Q2, (8)

где - общая, или полная, сумма квадратов отклонений;

- сумма квадратов отклонений групповых средних от общей средней, или межгрупповая (факторная) сумма квадратов отклонений;

- сумма квадратов отклонений наблюдений от групповых средних, или внутригрупповая (остаточная) сумма квадратов отклонений.

В разложении (8) заключена основная идея дисперсионного анализа. Применительно к рассматриваемой задаче равенство (8) показывает, что общая вариация показателя качества, измеренная суммой Q, складывается из двух компонент - Q1 и Q2, характеризующих изменчивость этого показателя между партиями (Q1) и изменчивость внутри партий (Q2), характеризующих одинаковую для всех партий вариацию под воздействием неучтенных факторов.

В дисперсионном анализе анализируются не сами суммы квадратов отклонений, а так называемые средние квадраты, являющиеся несмещенными оценками соответствующих дисперсий, которые получаются делением сумм квадратов отклонений на соответствующее число степеней свободы.

Число степеней свободы определяется как общее число наблюдений минус число связывающих их уравнений. Поэтому для среднего квадрата s12, являющегося несмещенной оценкой межгрупповой дисперсии, число степеней свободы k1=m-1, так как при его расчете используются m групповых средних, связанных между собой одним уравнением (5). А для среднего квадрата s22, являющегося несмещенной оценкой внутригрупповой дисперсии, число степеней свободы k2=mn-m, т.к. при ее расчете используются все mn наблюдений, связанных между собой m уравнениями (4).

Таким образом:

= Q1/(m-1),

= Q2/(mn-m).

Если найти математические ожидания средних квадратов и , подставить в их формулы выражение xij (1) через параметры модели, то получится:

(9)

т.к. с учетом свойств математического ожидания

а

(10)

Для модели I с фиксированными уровнями фактора Fi(i=1,2,...,m) - величины неслучайные, поэтому

M(S) =2 /(m-1) +у2.

Гипотеза H0 примет вид Fi = F*(i = 1,2,...,m), т.е. влияние всех уровней фактора одно и то же. В случае справедливости этой гипотезы

M(S)=M(S)= у2.

Для случайной модели II слагаемое Fi в выражении (1) - величина случайная. Обозначая ее дисперсией

получим из (9)

(11)

и, как и в модели I

M(S)= у2.

В таблице 1.1 представлен общий вид вычисления значений, с помощью дисперсионного анализа.

Таблица 3.1 - Базовая таблица дисперсионного анализа

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Средний квадрат

Математическое ожидание среднего квадрата

Межгрупповая

m-1

= Q1/(m-1)

Внутригрупповая

mn-m

= Q2/(mn-m)

M(S)= у2

Общая

mn-1

Гипотеза H0 примет вид уF2 =0. В случае справедливости этой гипотезы

M(S)=M(S)= у2.

В случае однофакторного комплекса как для модели I, так и модели II средние квадраты S2 и S2, являются несмещенными и независимыми оценками одной и той же дисперсии у2.

Следовательно, проверка нулевой гипотезы H0 свелась к проверке существенности различия несмещенных выборочных оценок S и S дисперсии у2.

Гипотеза H0 отвергается, если фактически вычисленное значение статистики F =S/Sбольше критического Fб:K1:K2, определенного на уровне значимости б при числе степеней свободы k1=m-1 и k2=mn-m, и принимается, если F<Fб:K1:K2 .

F- распределение Фишера (для x > 0) имеет следующую функцию плотности (для = 1, 2, ...; = 1, 2, ...):

где - степени свободы;

Г - гамма-функция.

Применительно к данной задаче опровержение гипотезы H0 означает наличие существенных различий в качестве изделий различных партий на рассматриваемом уровне значимости.

Для вычисления сумм квадратов Q1, Q2, Qчасто бывает удобно использовать следующие формулы:

(12)

(13)

(14)

т.е. сами средние, вообще говоря, находить не обязательно.

Таким образом, процедура однофакторного дисперсионного анализа состоит в проверке гипотезы H0 о том, что имеется одна группа однородных экспериментальных данных против альтернативы о том, что таких групп больше, чем одна. Под однородностью понимается одинаковость средних значений и дисперсий в любом подмножестве данных. При этом дисперсии могут быть как известны, так и неизвестны заранее. Если имеются основания полагать, что известная или неизвестная дисперсия измерений одинакова по всей совокупности данных, то задача однофакторного дисперсионного анализа сводится к исследованию значимости различия средних в группах данных [1].

3.3 Многофакторный дисперсионный анализ

Следует сразу же отметить, что принципиальной разницы между многофакторным и однофакторным дисперсионным анализом нет. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных многофакторный дисперсионный анализ, касается в основном возможности оценить межфакторное взаимодействие. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного дисперсионного анализа (в варианте ее компьютерного использования) несомненно более экономична, поскольку всего за один запуск решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие [3].

Общая схема двухфакторного эксперимента, данные которого обрабатываются дисперсионным анализом имеет вид:

Рисунок 3.1 - Схема двухфакторного эксперимента

Данные, подвергаемые многофакторному дисперсионному анализу, часто обозначают в соответствии с количеством факторов и их уровней.

Предположив, что в рассматриваемой задаче о качестве различных m партий изделия изготавливались на разных t станках и требуется выяснить, имеются ли существенные различия в качестве изделий по каждому фактору:

А - партия изделий;

B - станок.

В результате получается переход к задаче двухфакторного дисперсионного анализа.

Все данные представлены в таблице 1.2, в которой по строкам - уровни Ai фактора А, по столбцам -- уровни Bj фактора В, а в соответствующих ячейках, таблицы находятся значения показателя качества изделий xijk(i=1,2,...,m; j=1,2,...,l; k=1,2,...,n).

Таблица 3.2 - Показатели качества изделий

B1

B2

Bj

Bl

A1

x11l,…,x11k

x12l,…,x12k

x1jl,…,x1jk

x1ll,…,x1lk

A2

x21l,…,x21k

x22l,…,x22k

x2jl,…,x2jk

x2ll,…,x2lk

Ai

xi1l,…,xi1k

xi2l,…,xi2k

xijl,…,xijk

xjll,…,xjlk

Am

xm1l,…,xm1k

xm2l,…,xm2k

xmjl,…,xmjk

xmll,…,xmlk

Двухфакторная дисперсионная модель имеет вид:

xijk=м+Fi+Gj+Iij+еijk, (15)

где xijk - значение наблюдения в ячейке ij с номером k;

м - общая средняя;

Fi- эффект, обусловленный влиянием i-го уровня фактора А;

Gj - эффект, обусловленный влиянием j-го уровня фактора В;

Iij - эффект, обусловленный взаимодействием двух факторов, т.е. отклонение от средней по наблюдениям в ячейке ij от суммы первых трех слагаемых в модели (15);

еijk - возмущение, обусловленное вариацией переменной внутри отдельной ячейки.

Предполагается, что еijk имеет нормальный закон распределения N(0; с2), а все математические ожидания F*, G*, Ii*, I*j равны нулю.

Групповые средние находятся по формулам:

- в ячейке:

,

по строке:

по столбцу:

общая средняя:

В таблице 3.3 представлен общий вид вычисления значений, с помощью дисперсионного анализа.

Таблица 3.3 - Базовая таблица дисперсионного анализа

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Средние квадраты

Межгрупповая (фактор А)

m-1

Межгрупповая (фактор B)

l-1

Взаимодействие

(m-1)(l-1)

Остаточная

mln - ml

Общая

mln - 1

Проверка нулевых гипотез HA, HB, HAB об отсутствии влияния на рассматриваемую переменную факторов А, B и их взаимодействия AB осуществляется сравнением отношений , , (для модели I с фиксированными уровнями факторов) или отношений , , (для случайной модели II) с соответствующими табличными значениями F - критерия Фишера - Снедекора. Для смешанной модели III проверка гипотез относительно факторов с фиксированными уровнями производится также как и в модели II, а факторов со случайными уровнями - как в модели I.

Если n=1, т.е. при одном наблюдении в ячейке, то не все нулевые гипотезы могут быть проверены так как выпадает компонента Q3 из общей суммы квадратов отклонений, а с ней и средний квадрат , так как в этом случае не может быть речи о взаимодействии факторов.

С точки зрения техники вычислений для нахождения сумм квадратов Q1, Q2, Q3, Q4, Q целесообразнее использовать формулы:

Q3 = Q - Q1 - Q2 - Q4.

Отклонение от основных предпосылок дисперсионного анализа -- нормальности распределения исследуемой переменной и равенства дисперсий в ячейках (если оно не чрезмерное) -- не сказывается существенно на результатах дисперсионного анализа при равном числе наблюдений в ячейках, но может быть очень чувствительно при неравном их числе. Кроме того, при неравном числе наблюдений в ячейках резко возрастает сложность аппарата дисперсионного анализа. Поэтому рекомендуется планировать схему с равным числом наблюдений в ячейках, а если встречаются недостающие данные, то возмещать их средними значениями других наблюдений в ячейках. При этом, однако, искусственно введенные недостающие данные не следует учитывать при подсчете числа степеней свободы [1].

Заключение

Современные приложения дисперсионного анализа охватывают широкий круг задач экономики, биологии и техники и трактуются обычно в терминах статистической теории выявления систематических различий между результатами непосредственных измерений, выполненных при тех или иных меняющихся условиях.

Благодаря автоматизации дисперсионного анализа исследователь может проводить различные статистические исследования с применение ЭВМ, затрачивая при этом меньше времени и усилий на расчеты данных. В настоящее время существует множество пакетов прикладных программ, в которых реализован аппарат дисперсионного анализа. Наиболее распространенными являются такие программные продукты как:

- MSExcel;

- Statistica;

- Stadia;

- SPSS.

В современных статистических программных продуктах реализованы большинство статистических методов. С развитием алгоритмических языков программирования стало возможным создавать дополнительные блоки по обработке статистических данных.

Дисперсионный анализ является мощным современным статистическим методом обработки и анализа экспериментальных данных в психологии, биологии, медицине и других науках. Он очень тесно связан с конкретной методологией планирования и проведения экспериментальных исследований.

Дисперсионный анализ применяется во всех областях научных исследований, где необходимо проанализировать влияние различных факторов на исследуемую переменную.

Список используемых источников

1. Кремер Н.Ш. Теория вероятности и математическая статистика. М.: Юнити - Дана, 2002.-343с.

2. Гмурман В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 2003.-523с.

3. Гусев А.Н. Дисперсионный анализ в экспериментальной психологии. - М.: Учебно-методический коллектор «Психология», 2000.-136с.

4. http://www.statsoft.ru/home/textbook/modules/stanman.html

5. Шеффе Г. Дисперсионный.анализ М., Наука: 1980, 512 стр.

6. http://www.ucheba.ru/referats/8214.html

Размещено на Allbest.ru

...

Подобные документы

  • Построение статистических таблиц. Оценка достоверности влияния организованных и неучтенных факторов на величину результативного признака. Определение числа степеней свободы в однофакторном комплексе. Обработка двухфакторного дисперсионного комплекса.

    презентация [134,4 K], добавлен 14.04.2013

  • Общее понятие о дисперсионном анализе, его сущность и значение. Использование INTERNET и компьютера для проведения дисперсионного анализа, особенности работы в среде MS Excel. Примеры применения однофакторного и двухфакторного дисперсионного анализа.

    курсовая работа [820,4 K], добавлен 17.02.2013

  • Дисперсионный анализ. Применение дисперсионного анализа в различных задачах и исследованиях. Дисперсионный анализ в контексте статистических методов. Векторные авторегрессии. Факторный анализ.

    курсовая работа [139,8 K], добавлен 29.05.2006

  • Изучение раздела математической статистики, посвященного методам выявления влияния отдельных факторов на результат эксперимента. Эффекты взаимодействия. Использование однофакторного дисперсионного анализа для сравнения средних значений нескольких выборок.

    презентация [110,0 K], добавлен 09.11.2014

  • Дисперсионный анализ по одному признаку для проверки равенства нескольких средних. Множественная линейная регрессия. Зависимость ВАШБП и ВАШСП от показателей активности в динамике. Дисперсионный анализ и линейная регрессия, артрит реактивный.

    курсовая работа [2,2 M], добавлен 08.08.2010

  • Проведение аналитической группировки и дисперсионного анализа данных, с целью количественно определить тесноту связи. Определение степени корреляции между группировочными признаками и вариационной зависимости переменной, обусловленной регрессией.

    контрольная работа [140,5 K], добавлен 17.08.2014

  • Оценка надежности аналитической методики. Дисперсионный анализ результатов опытов и аппроксимация результатов эксперимента. Расчет линейного уравнения связи. Определение полного квадратного уравнения. Вычисление типа и объема химического реактора.

    курсовая работа [229,2 K], добавлен 06.01.2015

  • Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа [215,1 K], добавлен 13.12.2014

  • Анализ исследований в области лечения диабета. Использование классификаторов машинного обучения для анализа данных, определение зависимостей и корреляции между переменными, значимых параметров, а также подготовка данных для анализа. Разработка модели.

    дипломная работа [256,0 K], добавлен 29.06.2017

  • Комплексные числа и комплексные равенства, их алгебраическая и тригонометрическая формы. Арифметические действия над комплексными числами. Целые функции (многочлены) и их свойства. Решение алгебраических уравнений на множестве комплексных чисел.

    лекция [464,6 K], добавлен 12.06.2011

  • Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.

    контрольная работа [328,2 K], добавлен 07.12.2013

  • Комплексные числа в алгебраической форме. Степень мнимой единицы. Геометрическая интерпретация комплексных чисел. Тригонометрическая форма. Приложение теории комплексных чисел к решению уравнений 3-й и 4-й степени. Комплексные числа и параметры.

    дипломная работа [1,1 M], добавлен 10.12.2008

  • Исторический обзор формирования тригонометрии как науки от древности до наших дней. Введение понятия тригонометрических функций на уроках алгебры и начал анализа по учебникам А.Г. Мордковича, М.И. Башмакова. Решения линейных дифференциальных уравнений.

    дипломная работа [2,6 M], добавлен 02.07.2011

  • Главная задача спектрального анализа временных рядов. Параметрические и непараметрические методы спектрального анализа. Сущность понятия "временный ряд". График оценки спектральной плотности для окна Дирихле, при центрированном случайном процессе.

    курсовая работа [332,8 K], добавлен 17.09.2009

  • Роль и место учебных исследований в обучении математике. Содержание и методические особенности проектирования учебных исследований по теме "Четырехугольники" на основе использования динамических моделей. Структура учебного исследования по математике.

    курсовая работа [720,9 K], добавлен 28.05.2013

  • Математические понятия. Сущность процесса математизации. Эволюция учения о методе в истории философии. Метод и методология науки. "Методологический негативизим" и "методологическая эйфория". Классификация методов научного познания.

    реферат [93,9 K], добавлен 05.06.2007

  • Алгоритм проведения регрессионного анализа для создания адекватной модели, прогнозирующей цены на бензин на будущий период. Основы разработки программного обеспечения, позволяющего автоматизировать исследования операций в заданной предметной области.

    контрольная работа [182,0 K], добавлен 06.02.2013

  • Вычисление среднего одномерных случайных величин. Определение доверительного интервала для математического ожидания и для дисперсии. Построение эмпирической и приближенной линий регрессии Y по X. Дисперсионный анализ греко-латынского куба второго порядка.

    курсовая работа [698,0 K], добавлен 08.05.2012

  • История нестандартного анализа. Линейные операторы. Обратный оператор. Обратимость. Резольвента линейного оператора. Резольвентное множество. Спектр. Введение в нестандартный анализ. Пример неархимедовой числовой системы.

    дипломная работа [256,2 K], добавлен 08.08.2007

  • Введение в математический анализ. Индивидуальные домашние задания по теме "Предел функции и непрерывность» и по теме "Производная". Комбинаторика, бином Ньютона, математическая индукция и комплексные числа. Применение производной при исследовании функции.

    учебное пособие [950,8 K], добавлен 25.08.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.