Технология применения современных компьютерных методов для анализа агрохимических данных

Применение дисперсионного анализа для обработки индивидуальных агрохимических показателей. Нелинейный характер зависимости между агрохимическими показателями и урожайностью. Технология проведения компьютерной обработки для анализа агрохимических данных.

Рубрика Сельское, лесное хозяйство и землепользование
Вид дипломная работа
Язык русский
Дата добавления 21.02.2013
Размер файла 777,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

2

Размещено на http://www.allbest.ru/

Содержание

Введение

1. Обзор литературы

1.1 Значенье агрохимических показателей

1.2 Современные математические методы

1.2.1 Классические математические методы

1.2.2 Многомерные математические методы

2. Объекты и методы

2.1 Агрохимические данные

2.2 Компьютерное и программное обеспечение

2.3 Безопасность жизнедеятельности

3. Результаты исследования

Заключение

Литература

Введение

Рациональное использование земельных ресурсов невозможно без детального изучения агрохимических свойств почв. Сложный комплекс почвообразующих пород, наряду с другими причинами, обуславливают большое варьирование почв по содержанию гумуса и подвижных форм питательных веществ. Оптимальные показатели плодородия обеспечивают формирование высокого планируемого урожая. К основным показателям можно отнести плотность почвы (объемный вес, г/см?), влажность почвы, гумусированность, содержание нитратного и аммонийного азота, содержание подвижного фосфора.

Как видно из вышесказанного, в агрохимии часто приходится иметь дело не с одним, а с группой показателей. Поэтому анализ результатов агрохимических данных требует применения современных математических методов.

Цель работы: отработать технологию применения современных компьютерных методов для анализа агрохимических данных.

Задачи работы:

1) Отработать применение методов классической статистики для анализа агрохимических данных

2) Проверить применимость методов многомерной статистики для анализа агрохимических данных

3) Провести компьютерную обработку раннее необработанных агрохимических данных

дисперсионный агрохимический урожайность компьютерный

1. Обзор литературы

1.1 Значение агрохимических показателей для изучения плодородия почвы

Рациональное использование земельных ресурсов невозможно без детального изучения агрохимических свойств почв. Сложный комплекс почвообразующих пород, наряду с другими причинами, обуславливают большое варьирование почв по содержанию гумуса и подвижных форм питательных веществ (Танделов, 1998).

Показатели плодородия почвы являются оптимальными в том случае, если они обеспечивают формирование высокого планируемого урожая. Их содержание экономически выгодно и улучшает экологическую ситуацию в конкретном агроценозе. Оптимальные параметры плодородия почвы должны соответствовать биологическим требованиям всех культур севооборота и способность реализации их потенциальной продуктивности.

Оптимальные параметры основных показателей плодородия почвы создаются путем применения комплекса агротехнических и агрохимических приемов (Минеев, 1990).

Роль физических свойств почвы в решении задач по регулированию плодородия значительно возросла. Благоприятные физические свойства - одно из важнейших условий проявления почвенного плодородия. Они определяют выбор технологий обработки, мелиорации, химизации и др.

Один из важных показателей физических свойств почвы - плотность сложения почв (по прежней терминологии объемный вес). Он зависит от минералогического и гранулометрического состава, содержания гумуса, агрегатного состояния и от факторов, определяющих разрыхление или уплотнение почвы (механическая обработка, работа роющей фауны, динамика увлажнения и иссушения, промерзания и оттаивания). Это важный экологический показатель и характеристика плодородия почвы.

Переуплотнение - важнейший фактор ухудшения агрофизического состояния и плодородия почв. Почва уплотняется действием движителей сельскохозяйственной техники. Переуплотнение усиливает эрозию, обуславливает образование переувлажненных участков и разрушение структуры, уменьшает водо- и воздухопроницаемость, снижает нитрификационную способность, вследствие этого возрастают затраты на последующие обработки и, в конечном счете, снижаются урожаи. Последствие уплотнения сохраняется в течение 2-3-х лет (Бугаков, 1995).

Не менее важный показатель плодородия почв - это влажность почвы. Почвенная вода имеет огромное значение для жизнедеятельности организмов (прежде всего растений, микробов) и почвообразования.

Вода в почве представляет собой жидкую фазу. Или почвенный раствор. Попадая в почву различными путями (с осадками из грунтовых вод по капиллярам, при конденсации водяных паров и т. д.), вода претерпевает определенные изменения: с одной стороны, впитывает находящиеся в почве различные водорастворимые соединения, а с другой - теряет поглощаемые с почвой вещества. Одна часть поступающей в почву воды теряется (просачивается вглубь, теряется, испаряется), другая - удерживается почвой; она и представляет собой почвенный раствор, характеризующиеся рядом показателей (рН, наличие водорастворимых органических соединений и питательных веществ, солей и др.).

Вода обуславливает развитие всех жизненно важных процессов в почве и на ее поверхности, определяет интенсивность и направленность процессов выветривания и почвообразования (гидролиз, гидратация, новообразование минералов, гумусообразование), динамику почвенных процессов. С почвенной водой связаны процессы выноса, перемещения и аккумуляции веществ и энергетического материала, формирование генетических горизонтов и профиля почвы в целом.

Почвенная влага выступает и в качестве терморегулятора, влияя на тепловой баланс и режим почвы.

Влажность почвы влияет на агрофизические свойства: плотность, липкость, способность к крошению и образованию агрегатов - спелость почвы.

Вода в почве во многом определяет уровень эффективного плодородия, поскольку именно почвенная влага - основной, а нередко и единственный источник воды для произрастающих на этой почве растений. Почвенный раствор, имея определенную реакцию (кислую, нейтральную, щелочную), содержит питательные вещества и различные соединения (благоприятные или токсичные для растений), оказывает непосредственное воздействие на продуктивность выращиваемых сельскохозяйственных культур, их урожайность (Муха, 2003).

Влажность и температура почвы оказывают сильное влияние на продуцирование и концентрацию углекислоты. Уменьшение влажности при оптимальной температуры сопровождается уменьшением СО2 в почвенном воздухе. Особенно отчетливо связь между этими показателями наблюдается в летний период, когда температура не является лимитирующим фактором (Бугаков, 1995).

Для характеристики азотного режима почв и уровня обеспеченности культур азотом определяют содержание гумуса (Муравин, 2003).

Гумусное состояние почв - совокупность морфологических признаков, общих запасов, свойств органического вещества и процессов его создания, трансформации и миграции в почвенном профиле. Это фундаментальное свойство почвы, поскольку обуславливает все многообразие факторов плодородия и в итоге - само плодородие (Бугаков, 1995).

Содержание гумуса служит основным критерием оценки не только почвенного плодородия, но и поглотительной способности, буферности и биологической активности почвы. Одновременно этот параметр определяет в значительной степени устойчивость агроценозов к неблагоприятным факторам внешней среды и почв антропогенному воздействию. Особенно ярко стабилизирующая роль органического вещества почвы проявляется в экстремальных ситуациях - в условия засухи, благодаря присущей ему водоудерживающей способности, а при химическом загрязнении - благодаря сильной сорбирующей способности, образованию органно-минеральных комплексных соединений с тяжелыми металлами, биологической деградации и детоксикации различных органических полютантов (пестицидов, нефтепродуктов, поверхностно - активных веществ и др.) (Муравин, 2003).

В почве азот находится в виде органических и неорганических веществ. Преобладающая часть (95-98%) почвенного азота входит в состав гумуса. Органический азот в почве, обладая достаточной устойчивостью, поддерживает ее плодородие. Его величина определяет степень мобилизации азота почвы. Минеральных соединений азота в почвах крайне мало (1-5%).

Непрерывные циклы созидания и разрушения азотных веществ приводят к накоплению в почве доступных растениям соединений азота. Основу превращения азота составляют процессы минерализации и иммобилизации. Минерализация означает превращение органического азота в минеральный посредством аммонификации нитрификации. Иммобилизация азота представляет собой трансформацию микроорганизмами его минеральных форм в органические соединения микробных клеток и их метаболитов. Оба эти процесса взаимосвязаны и играют важную роль в азотном режиме почв.

Азот нитратов и обменного аммония в физиологическом отношении являются равноценными источниками азотного питания для растений. Их накопление в почве определяет продуктивность сельскохозяйственных растений. Известны исследования (Шмук, 1950; Александрова, 1966 ), которых показано более энергичное поглощение растениями аммонийного азота, чем нитратного азота. Другие публикации (Возбудская, 1960 ) свидетельствуют о преимуществе поглощения растениями нитратного азота.

Установлено также, что растения усваивают лучше нитратный азот при кислой реакции почвенного раствора, а при щелочной - аммонийный. Азот аммония интенсивнее поступает в растения, богатые органическими кислотами, и сразу же используется на синтез аминокислот, в то время как нитратный должен предварительно восстанавливаться до аммиака. В растениях, богатых углеводами, процесс восстановления нитратов до аммиака протекает быстро.

Многолетние исследования азотного режима пахотных почв края позволяют сделать следующие обобщение.

Количество нитратного и аммонийного азота в почве не постоянно, а подвержено значительным колебаниям в зависимости от ряда факторов: гидротермического режима, генетических свойств почв, характера растительности и агротехнических приемов. Наряду с накоплением нитратного азота за счет текущей нитрификации одновременно происходит обеднение его запасов в результате потребления растениями и микроорганизмами, денитрификации и вымывания в более глубокие горизонты при обильных осадках.

Благоприятные условия для нитратообразования складываются в паровом поле выщелоченного чернозема. Темпы мобилизации нитратов нарастают от весны к лету и осени. В посевах сельскохозяйственных культур, в отличии от пара, содержание нитратов к осени уменьшается в связи с потреблением их растениями. Чем выше урожай полевых культур, тем интенсивнее идет потребление нитратного азота и меньше остается его в почве (Бугаков, 1995).

Одной из главных характеристик оккультуренности почв служит содержание подвижного фосфора, при котором достигается наибольший урожай возделываемой культуры и отсутствие эффекта от дополнительно вносимых фосфорных удобрений. При этом следует ориентироваться на ведущие и наиболее требовательные к уровню фосфорного питания культуры севооборота в конкретно почвенно-климатических условий (Минеев, 1990).

Общее запасы фосфора в почве, относительно велики. Валовое содержание фосфора в почвах различного типа изменяется менее существенно, чем азота. Аналогично изменяется и содержание подвижного фосфора в почве.

В почве фосфор находиться в форме органических и минеральных соединений. Органические соединения представлены нуклеиновыми кислотами, нуклеопротеидами, фосфотидами, сахорофосфатами и др. минеральные соединения фосфора содержаться в почвах главным образом в виде солей кальция, магия, железа и алюминия ортофосфорной кислоты. Фосфор может находиться в почве в составе минералов апатита, фосфорита и вивианита, а также в поглощенном состоянии фосфат-аниона.

Минеральные фосфаты - основной источник фосфора для растений. Фосфор органических соединений усваивается главным образом после их минерализации (Муха, 2003).

Роль фосфора в жизни растений многогранна. Его оптимум обеспечивает максимальную продуктивность репродуктивных органов, способствуя закладке дополнительных стеблей, наибольшего числа зерен в колосе, увеличивая массу 1000 зерен, ускоряет созревание растений, резко снижает отрицательное влияние засухи на развитие растений. Кроме того, он способствует ассимиляции азота из атмосферы бобовыми за счет увеличения количества клубеньков на корнях.

На содержание подвижных фосфатов в почве большое влияние оказывает уровень применения минеральных и органических удобрений, тип почвы, почвообразующие породы, гранулометрический состав и другие факторы, которые необходимо учитывать оценке уровня эффективного плодородия почв, а также его изменения при сельскохозяйственном использовании земель.

В заключении следует отметить, что влияние агрохимических показателей имеет не только познавательное значение, но и дает возможность правильно распределить и поставить в тот или иной район нужный ассортимент минеральных удобрений с учетом почвенной характеристики, что имеет большое производственное значение (Танделов, 1998).

1.2 Современные методы математической обработки результатов сельскохозяйственных исследований

1.2.1 Методы классической статистики

Оценка параметров выборки: среднее, дисперсия, ошибка, доверительные интервалы. Очень часто биологу приходится решать задачи, связанные с измерением каких-либо показателей у некоторой группы объектов (урожайность сельскохозяйственных культур и т. д.). Как правило, невозможно измерить интересующий исследователя показатель у всех изучаемых объектов. Обычно приходится выбирать некоторую часть объектов (несколько образцов сельскохозяйственной продукции, несколько делянок и т. д.), проводить на них измерения, а полученные результаты распространять на все изучаемые объекты. Выбранная для исследования группа называется "выборка", а все объекты - "генеральная совокупность".

Одна из основных задач статистической обработки - оценить параметры генеральной совокупности по ограниченному числу измерений, проведенных в выборке.

Все выводы, которые сделаны на основании анализа выборки, неизбежно содержат ошибки. Эти ошибки зависят от разброса исходных данных и от выборки. Чем меньше разброс данных и чем больше выборка - тем меньше ошибка. Совсем избежать ошибки можно только в том случае, если анализировать не выборку, а всю генеральную совокупность, но это, как правило, невозможно.

Отсюда вытекает вторая, не менее важная задача статистической обработки - выяснить надежность сделанных в результате анализа выборки выводов. Эта надежность характеризуется как вероятность ошибки.

Для того чтобы принять правильное решение, исследователю необходимо знать вероятность ошибки статистических выводов.

Если при анализе экспериментальных данных вероятность ошибки превысила 5% (в сельскохозяйственных исследованиях - 10%) - результаты считаются недостоверными (на основании их нельзя делать какие-либо выводы).

Основные задачи первичной статистической обработки результатов исследования:

1. На основе выборки ограниченного объема сделать выводы о всей генеральной совокупности.

2. Определить надежность (достоверность) этих выводов.

Как правило, при анализе выборки исследователю необходимо определить два основных показателя: среднее значение и разнообразие.

Вычисление среднего. Среднее значение, определяемое по выборке, называется "выборочное среднее" (Хижняк, 2001). Этот показатель является центром распределения, вокруг которого группируются все варианты статистической совокупности (Лакин, 1990).

Вычисление показателей разнообразия. Показатели разнообразия в первую очередь необходимы для определения надежности статистических выводов. Важнейший показатель разнообразия - это дисперсия (средние квадратическое отклонение). Обычно дисперсию обозначают Sх. Дисперсия характеризует разброс данных относительно среднего. Чем больше разброс данных - тем больше дисперсия.

Другим важным показателем разнообразия является коэффициент вариации (КВ или СV).

Коэффициент вариации равен выраженному в процентах отношению дисперсии к среднему. Коэффициент вариации особенно полезен, если необходимо сравнить изменчивость разных признаков.

Еще один полезный показатель разнообразия - разброс данных (максимальное и минимальное значение: Хmax и Хmin).

Вычисление ошибки и доверительных интервалов. Вслед за вычислением среднего значения выборки следует определить среднее всей генеральной совокупности. Однако можно установить, что среднее лежит в некоторых пределах. Эти пределы называются "доверительным интервалом", или "доверительными границами".

Анализ формы распределения. Кроме вычисления среднего, дисперсии и доверительных границ может оказаться полезным анализ формы распределения объектов исследования по изучаемому признаку. Для этого необходимо составить вариационный ряд и вариационную кривую.

В большинстве биологических исследований вариационная кривая имеет симметричную форму и соответствует кривой нормального распределения.

Однако в ряде случаев форма распределения может заметно отличаться от "нормальной" (ассимметричное, двувершинное, с положительным эксцессом) (Хижняк, 2001).

Дисперсионный анализ. Наряду с относительно простыми способами сравнения одной выборки с другой в исследовательской работе встречаются и более сложные задачи, когда приходится сравнивать одновременно несколько выборок, объединяемых в единый статистический комплекс. В таких случаях метод попарных сравнений выборочных характеристик оказывается обременительным, требующий большой вычислительной работы. Учитывая это обстоятельство, Р. Фишер (1925) предложил метод комплексной оценки сравниваемых средних, получивший название дисперсионного анализа (Лакин, 1990).

В простейшем случае дисперсионный анализ используется для сравнения двух или нескольких выборочных средних. Такой анализ носит название однофакторного дисперсионного анализа. В его основе лежит очень простой принцип, основанный на сравнении дисперсий ("разбросов").

Принцип, положенный в основу однофакторного дисперсионного анализа, используется и в многофакторном дисперсионном анализе. Многофакторный дисперсионный анализ позволяет одновременно изучать действие нескольких независимых факторов. При этом можно определить как эффект каждого фактора в отдельности, так и их взаимодействие. Под взаимодействием факторов понимается явление, при котором действие одного фактора зависит от других факторов. Например, эффект от применения органического удобрения зависит от влажности и температуры почвы.

В зависимости от числа одновременно исследуемых факторов различают двухфакторный дисперсионный анализ, трехфакторный дисперсионный анализ, четырехфакторный дисперсионный анализ и т.д. В реальных биологических исследованиях, как правило, изучают одновременное действие двух - трех факторов.

Дисперсионный анализ может использоваться для изучения действия самых разнообразных факторов, как на количественные, так и на качественные признаки. Однако область применения дисперсионного анализа имеет два важных ограничения:

Исследуемые группы (популяции, сорта растений и т.д.) должны иметь нормальное распределение.

Исследуемые группы должны иметь равные дисперсии.

При планировании и проведении многофакторного дисперсионного анализа настоятельно рекомендуется использовать выборки равного или пропорционального объема (в каждом варианте должно быть одинаковое или пропорциональное число повторностей). Однофакторный дисперсионный анализ не требует использования выборок равного или пропорционального объема.

Изучение взаимозависимостей: общие подходы. Во многих биологических исследованиях возникает необходимость определить, связаны ли между собой изучаемые показатели (рост и вес, содержание азота в почве и содержание нитратов в продукции, уровень органического загрязнения водоема и численность сине-зеленых водорослей и т. д.), а также определить характер и возможные причины этой связи.

Математические методы, применяемые для анализа наличия и тесноты связи между различными показателями, используют следующий подход.

Исходя из теоретических соображений либо по внешнему виду графика определяют тип линии (прямая, экспонента и т.д.), которая лучше всего описывает исследуемую зависимость.

С помощью особой вычислительной процедуры на основе экспериментальных данных подбирают математическое уравнение, которое соответствует выбранному типу зависимости. В результате получают уравнение регрессии. На основе полученного уравнения строят теоретический график зависимости У от Х (линию регрессии).

Проводят математический анализ полученного уравнения регрессии. Цель анализа - определить, насколько точно экспериментальные данные соответствуют выбранному уравнению регрессии (насколько "плотно" экспериментальные точки группируются вокруг линии регрессии).

Математические методы, основанные на данном подходе, известны под названиями корреляционного и регрессионного анализов.

Корреляционный анализ предназначен для изучения линейных зависимостей

Регрессионный анализ предназначен для изучения любых зависимостей. В определенном смысле корреляционный анализ является частным случаем регрессионного анализа.

Корреляционный анализ. Корреляционный анализ предназначен для определения тесноты и направленности связи между изучаемыми признаками в случае, если предполагаемая связь носит линейный характер.

Основным показателем, характеризующим тесноту и направленность связи, является коэффициент корреляции (r). Он может варьировать от -1 до +1:

r = +1 - между признаками существует прямая связь;

r = -1 - между признаками существует обратная связь;

r = 0 - связь между признаками отсутствует.

Перед тем, как вычислять коэффициент корреляции, полезно нанести экспериментальные точки на график (это можно сделать, например, с помощью программы Exel либо любой другой аналогичной программы, либо вручную, с помощью авторучки и листа бумаги), и посмотреть:

наблюдается ли вообще какая-либо связь между изучаемыми показателями (если такая связь "на глаз" не просматривается, дальнейший анализ проводить, как правило, не имеет смысла);

если связь между изучаемыми показателями просматривается - определить, носит ли она линейный или нелинейный характер.

Регрессионный анализ. В ряде случаев исследователю важно не только установить наличие связи между изучаемыми показателями (Х и У), но и выразить эту связь в виде математического уравнения. Это требуется в случаях, когда необходимо вычислять неизвестную величину У по известным Х. Например, зная запас минеральных элементов в почве (Х), вычислить ожидаемый урожай (У). Уравнение, связывающее величины Х и У, носит название уравнения регрессии.

Х называется "независимая переменная", У - "зависимая переменная".

Регрессионный анализ проводят в несколько этапов.

1. Получение исходных (экспериментальных) данных.

2. Определение характера зависимости (линейная, нелинейная) для выбора уравнения регрессии.

3. Выбор уравнения регрессии.

Известно, что линейная зависимость описывается уравнением вида У = aX + b, где a и b - коэффициенты (пока неизвестные)

Для построения уравнения регрессии необходимо подобрать неизвестные коэффициенты a и b таким образом, чтобы полученное уравнение наиболее точно соответствовало экспериментальным данным.

4. Вычисление коэффициентов в уравнении регрессии.

Неизвестные коэффициенты в уравнении регрессии вычисляют на основе экспериментальных данных с помощью особой вычислительной процедуры - Метода Наименьших Квадратов. Суть метода заключается в подборе таких коэффициентов в уравнении регрессии, при которых сумма квадратов расстояний между экспериментальными и расчетными значениями Y была бы минимальной.

5. Последний этап регрессионного анализа - дисперсионный анализ полученного уравнения регрессии.

Этот анализ преследует две цели:

1) Оценить тесноту связи между Х и Y.

2) Проверить адекватность выбранного уравнения регрессии. Для этого вычисляют коэффициент Фишера, а также некоторые другие показатели.

Результат регрессионного анализа в значительной степени зависит от правильного выбора типа зависимости (модели). Чтобы выбрать "наилучшее" уравнение регрессии необходимо учитывать следующие моменты:

1. Могут быть основательные теоретические причины для выбора вида уравнения регрессии.

2. Регрессионное уравнение должно обеспечивать минимальное расхождение между реальными и вычисленными значениями Y. Для оценки этого расхождения можно использовать критерий R2: чем он больше, тем лучше регрессионная модель соответствует реальным данным.

3. Регрессионное уравнение должно быть максимально простым.

Таким образом, при выборе типа уравнения регрессии необходимо, кроме всего прочего, руководствоваться здравым смыслом.

1.2.2 Многомерные статистические методы

Остановимся на четырех генеральных идеях и методологических принципах многомерного статистического анализа, на которых базируются, по существу, все основные разделы и подходы математического аппарата классификации и снижения размерности.

I. Эффект существенной многомерности. Сущность этого принципа в том, что выводы, получаемые в результате анализа и классификации множества статистически обследованных (по ряду свойств) объектов, должны опираться одновременно на совокупность этих взаимосвязанных свойств с обязательным учетом структуры и характера их связей. Статистический анализ множества объектов, даже если по каждому из них зарегистрированы значения набора признаков, будет неполным, ущербным, если ограничиваться при этом только средними значениями признаков и не использовать разнообразные характеристики тесноты и структуры связей между ними.

2. Возможность лаконичного объяснения природы анализируемых многомерных структур. Определим вначале, что понимается (здесь и в дальнейшем изложении) под многомерной структурой. Речь идет о множестве статистически обследованных объектов {О1, О2, .... Оn}. Результаты статистического обследования представляются, как правило (но не всегда), в одной из двух форм:

таблицы (матрицы) "объект- свойство" вида

X (Х1, Х2, ..., Xn},

в которой Xi = (Xi?, Xi?, .... хi(р))' -- вектор значений анализируемых признаков (свойств) X?, X?, ...., х (р), зарегистрированных на i-м обследованном объекте; или матрицы (таблицы) попарных сравнений, где элемент аij определяет результат сопоставления объектов Оi и Оj; в смысле некоторого заданного отношения:аij, может выражать меру сходства или различия объектов Оi и Oj, меру их связи или взаимодействия в каком-либо процессе (например, поток продукции отрасли i в отрасль j), геометрическое расстояние между объектами, отношение предпочтения (аij = 1, если объект Оi не хуже объекта 0j и аij = О в противном случае) и т. д. Под возможностью лаконичного объяснения природы анализируемой многомерной структуры подразумевается априорное допущение, в соответствии с которым существует небольшое (в сравнении с р) число определяющих (типообразующих) факторов, с помощью которых могут быть достаточно точно описаны как наблюдаемые характеристики анализируемых объектов (т. е. все элементы хi? и аij соответственно матриц X и А) и характерсвязей между ними, так и искомая классификация самихобъектов. При этом упомянутые определяющие факторы могут находиться среди статистически обследованных характеристик, а могут быть латентными, т.е. непосредственно статистически не наблюдаемыми, но восстанавливаемыми поисходным данным.

На данном принципе многомерного статистического анализа достроены такие важнейшие разделы математического аппарата классификации и снижения размерности, как метод главных компонент и факторный анализ, многомерное шкалирование, целенаправленное проецирование в разведочном статистическом анализе данных и др.

3. Максимальное использование "обучения" в настройке математических моделей классификации и снижения размерности. Для пояснения этого принципа представим задачи классификации и снижения размерности по схеме "на входе задачи - на выходе задачи".

Если исследователь располагает и "входами" и "выходами" задачи, то исходную информацию называют обучающей и целью исследования является описание процедур, с помощью которых при поступлении только входных данных нового объекта его можно было бы с наибольшей (в определенном смысле) точностью отнести к одному из классов (в задаче классификации) или снабдить значениями определяющих факторов (в задаче снижения размерности). Именно к таким ситуациям относятся типичные задачи медицинской диагностики, когда в клинических условиях в качестве исходных данных исследователь располагает как "входами"-- результатами инструментальных обследований пациентов, так и "выходами" -- уже установленным диагнозом ("болен"-- "здоров") по каждому из них. Цель исследований такого типа-- использование имеющегося "обучения" для отбора из множества результатов обследований небольшого числа наиболее информативных (с точки зрения диагностической силы) показателей и для построения на их основе формального диагностирующего правила.

4. Оптимизационная формулировка задач классификации и снижения размерности. Среди множества возможных методов, реализующих поставленную цель статистической обработки данных (разбиение совокупности статистически обследованных объектов на однородные классы, переход от заданного широкого набора признаков х?,..., х{р) к небольшому числу определяющих факторов), нужно уметь найти наилучший метод с помощью оптимизации некоторого экзогенно заданного критерия (функционала) качества метода. Выбор конкретного вида этого критерия основан либо на априорном знании вероятностной и геометрической природы обрабатываемых данных, либо на соображениях содержательного (экономического, медицинского, технического и т. п.) плана. В сочетании с некоторыми другими (более специфицированными) базовыми идеями этот подход дает возможность построить достаточно общую математическую конструкцию, в рамках которой удается "навести порядок" в огромном множестве существующих алгоритмов классификации и снижения размерности, подчас стихийно (и эвристически) возникающих из нужд разнообразных приложений.

Разделение рассматриваемой совокупности объектов или явлений на однородные (в определенном смысле) группы называется классификацией. При этом термин "классификация" используют, в зависимости от контекста, для обозначения как самого процесса разделения, так и его результата. Это понятие тесно связано с такими терминами, как группировка, типологизацня, систематизация, дискриминация, кластеризация, и является одним из основополагающих в практической и научной деятельности человека. Переход от характеризующего состояние или функционирование некоторой совокупности объектов исходного массива данных к существенно более лаконичному набору показателей, отобранных из числа исходных или построенных с помощью некоторого их преобразования таким образом, чтобы минимизировать связанные с этим потери в информации (содержавшейся в исходном массиве данных относительно рассматриваемой совокупности объектов), составляет сущность процесса снижения размерности. Этот процесс использует, в частности, логику и приемы классификации, и сам н свою очередь используется в классификационных процедурах.

3. В ситуациях, когда каждый из исследуемых объектов или явлений характеризуется большим числом разнотипных и стохастически взаимосвязанных параметров, и исследователь имеет возможность получить, или уже получил, результаты статистического обследования но этим параметрам целой совокупности таких объектов или явлений, для решения задач классификации и снижения размерности следует привлекать специальный математический инструментарий многомерного статистического анализ: дискриминантный и кластер-анализ, методы расщепления смесей распределений, методы иерархической классификации, многомерное шкалирование, главные компоненты, факторный анализ, целенаправленное проецирование многомерных данных и т. п. Практическая реализация этих методов требует весьма сложных н трудоемких расчетов и стала возможной приблизительно лишь к середине нашего столетия, когда была создана необходимая вычислительная база.

4. К числу основных методологических принципов, которые лежат в основе большинства конструкций многомерного статистического анализа, следует отнести: а) необходимость учета эффекта существенной многомернжти анализируемых данных (используемые в конструкциях характеристики должны учитывать структуру и характер статистических взаимосвязей исследуемых признаков); б) возможность лаконичного объяснения природы анализируемых многомерных структур (допущение, в соответствии с которым существует сравнительно небольшое число определяющих, подчас латентных, т. е. непосредственно не наблюдаемых, факторов, с помощью которых могут быть достаточно точно описаны вес наблюдаемые исходные данные, структура и характер связей между ними); в) максимальное использование "обучения" в настройке математических моделей классификации и снижения размерности (под "обучением" понимается та часть исходных данных, в которой представлены "статистические фотографии" соотношений "входов" и "выходов" анализируемой системы); г) возможность оптимизационной формулировки задач многомерного статистического анализа (в том числе задач классификации и снижения размерности), т. е. нахождение наилучшей процедуры статистической обработки данных с помощью оптимизации некоторого экзогенно заданного критерия качества метода.

Первые два принципа относятся к природе обрабатываемых данных, а следующие два -- к логике построения соответствующих аппаратных средств. Среди типов прикладных задач (конечных прикладных целей) классификации следует выделить: 1) комбинационные группировки и их непрерывные обобщения -- разбиение совокупности на интервалы (области) группирования; 2) простая типологизация: выявление естественного расслоения анализируемых данных (объектов) на четко выраженные "сгустки" (кластеры), лежащие друг от друга на некотором расстоянии, но не разбивающиеся на столь же удаленные друг от друга части; 3) связная неупорядоченная типологизация: использование реализованной в пространстве результирующих показателей простой типологизаини в качестве обучающих выборок при классификации той же совокупности объектов в пространстве описательных признаков; 4) связная упорядоченная пшпологизация, которая отличается от связной неупорядоченной возможностью экспертного упорядочения классов, полученных в пространстве результирующих показателей, и использованием этого упорядочения для построения сводного латентного результирующего показателя как функции от описательных переменных; 5) структурная типолагизация дает на "выходе" задачи дополнительно к описанию классов еще и описание существующих между ними и их элементами структурных (в том числе иерархических) связей; 6) типологизация динамических траекторий системы: в качестве классифицируемых объектов выступают характеристики динамики исследуемых систем, например дискретные или непрерывные временные ряды или траектории систем, которые в каждый момент времени могут находиться в одном из заданных состояний.

Основные типы прикладных задач снижения размерности: 1) отбор наиболее информативной системы показателей (в задачах регрессии, классификации и т.п.); 2) сжатие больших массивов информации; 3) визуализация (наглядное представление многомерных данных); 4) построение условного координатного пространства, в терминах переменных которого в некотором смысле наилучшим образом описываются и интерпретируются анализируемые свойства объектов рассматриваемой совокупности.

При выборе подходящего математического инструментария для решения конкретной задачи классификации следует исходить из согласованного с "заказчиком" типа конечных прикладных целей исследования и характера априорной и выборочной информации при определении математической модели, лежащей в основе выбора метода решении задачи снижения размерности, следует идти от типа прикладной задачи к характеристике состава и формы исходных данных, а затем -- к смысловой нацеленности и конкретному виду подходящего критерия информативности. Вся процедура статистического исследования, нацеленного на решение задачи классификации или снижения размерности, может быть условно разбита на восемь этапов: 1) установочный {предметно-содержательное определение целей исследования); 2) постановочный (определение тина прикладной задачи в терминах теории классификации и снижения размерности); 3) информационный {составление плана сбора исходной информации и его реализация, если ее не было уже на этапе I, затем предварительный анализ исходной информации, ее ввод в ЭВМ, сверка, редактирование); 4) априорный математико-постановочный {осуществляемый до каких бы то ни было расчетов выбор базовой математической модели механизма генерации исходных данных); 5) разведочный (специальные методы статистической обработки исходных данных, например целенаправленное проецирование, нацеленные на выявление их вероятностной и геометрической природы); 6) апостериорный математико-постановочный (уточнение выбора базовой математической модели с учетом результатов предыдущего этапа); 7) вычислительный (реализация на ЭВМ уточненного на предыдущем этапе плана математико-статистического анализа данных); 8) итоговый ( подведение итогов исследования, формулировка научных или практических выводов).

2. Объекты и методы

2.1 Исходные данные для исследования

Исходные данные для математической обработки были предоставлены к. с.-х. н. Сорокиной О. А. с кафедры агрохимии. Раннее эти данные не обрабатывались из-за большого объема и отсутствия современной компьютерной техники. Данные были получены в 1979 году сотрудниками кафедры на экспериментальных полях учебного хозяйства Миндерлинское. Участок находится на водораздельной платообразной вершине междуречья (р. Мендерла, р. Шила). Мезорельеф равнинно-увалистый, микрорельеф не выражен. Почва данного участка серая лесная оподзоленная тяжело-суглинистая среднемощная на коричнево-бурой карбонатной глине.

Опыт был заложен по методике Ц. Н. ИА. О. Сущность метода состоит в сравнение величины агрохимических показателей и урожайности основных культур ( в данном случае на примере овса ) и их возможной взаимосвязи . Весной в сорокакратной повторности были взяты почвенные образцы с делянок 1м?1м. В центре делянки были помечены колышками, с которых осенью сняли урожай и сопоставили с агрохимическими показателями.

2.2 Компьютерное и программное обеспечение

Для нашего анализа мы использовали персональный компьютер c процессором Intel Pentium III c тактовой частотой 733 Мгц и оперативной памятью 128 Мб. В качестве программного обеспечения использовали пакет математического анализа, входящий в комплект поставки MS Excell, а также русифицированную версию интегрированного пакета анализа статистических данных StatSoft Statistica 6.0.

2.3 Безопасность жизнедеятельности

Безопасность жизнедеятельности - это наука о комфортном и безопасном взаимодействии человека и техносферы. Основной целью БЖД является защита человека в техносфере от негативных воздействий и достижения комфортных условий жизнедеятельности.

Одним из разделов БЖД является охрана труда. Охрана труда - это система обеспечения безопасности жизни и здоровья работников в процессе трудовой деятельности, включая правовые, социально-экономические, организационно-технические, санитарно-гигиенические, лечебно-профилактические, реабилитационные и другие мероприятия.

Для обеспечения безопасных условий труда используются общие меры безопасности.

Введение

Настоящая инструкция предназначена для предотвращения неблагоприятного воздействия на человека вредных факторов, сопровождающих работы со средствами вычислительной техники и периферийным оборудованием.

Настоящая инструкция подлежит обязательному и безусловному выполнению.

За нарушение инструкции виновные несут ответственность в административном и судебном порядке в зависимости от характера последствий нарушения.

Соблюдение правил безопасной работы является необходимым условием предупреждения производственного травматизма.

I. Общие положения

Область распространения и порядок применения инструкции:

Настоящая инструкция распространяется на персонал, эксплуатирующая средства вычислительной техники и периферийное оборудование.

Инструкция содержит общие указания по безопасному применению электрооборудования в учреждении. Требования настоящей инструкции являются обязательными, отступления от нее не допускаются.

Требования к персоналу, эксплуатирующему средства вычислительной техники и периферийное оборудование:

К самостоятельной эксплуатации электроаппаратуры допускается только специально обученный персонал не моложе 18 лет, пригодный по состоянию здоровья и квалификации к выполнению указанных работ.

Перед допуском к работе персонал должен пройти вводный и первичный инструктаж по технике безопасности с показом безопасных и рациональных приемов работы. Затем не реже одного раза в 6 мес. проводится повторный инструктаж, возможно, с группой сотрудников одинаковой профессии в составе не более 20 человек. Внеплановый инструктаж проводится при изменении правил по охране труда, при обнаружении нарушений персоналом инструкции по технике безопасности, изменении характера работы персонала.

В помещениях, в которых постоянно эксплуатируется электрооборудование должны быть вывешены в доступном для персонала месте Инструкции по технике безопасности, в которых также должны быть определены действия персонала в случае возникновения аварий, пожаров, электротравм.

Руководители структурных подразделений несут ответственность за организацию правильной и безопасной эксплуатации средств вычислительной техники и периферийного оборудования, эффективность их использования; осуществляют контроль за выполнением персоналом требований настоящей инструкции по технике безопасности.

2. Виды опасных и вредных факторов

Эксплуатирующий средства вычислительной техники и периферийное оборудование персонал может подвергаться опасным и вредным воздействия, которые по природе действия подразделяются на следующие группы: поражение электрическим током, механические повреждения, электромагнитные излучения, инфракрасное излучение, опасность пожара, повышенный уровень шума и вибрации. Для снижения или предотвращения влияния опасных и вредных факторов необходимо соблюдать санитарные правила и нормы. Гигиенические требования к видеодисплейным терминалам, персональным электронно-вычислительным машинам и организации работы. (Утверждено Постановлением Госкомсанэпнднадзора России от 14 июля 1996 г. N 14 СанПиН 2.2.2.542-96), и Приложение 1,2.

3. Требования электробезопасности

При пользовании средствами вычислительной техники и периферийным оборудованием каждый работник должен внимательно и осторожно обращаться с электропроводкой, приборами и аппаратами и всегда помнить, что пренебрежение правилами безопасности угрожает и здоровью, и жизни человека

Во избежание поражения электрическим током необходимо твердо знать и выполнять следующие правила безопасного пользования электроэнергией:

Необходимо постоянно следить на своем рабочем месте за исправным

состоянием электропроводки, выключателей, штепсельных розеток,

при помощи которых оборудование включается в сеть, и заземления.

При обнаружении неисправности немедленно обесточить

электрооборудование, оповестить администрацию. Продолжение

работы возможно только после устранения неисправности.

Во избежание повреждения изоляции проводов и возникновения коротких замыканий не разрешается:

а) вешать что-либо на провода;

б) закрашивать и белить шнуры и провода;

в) закладывать провода и шнуры за тазовые и водопроводные трубы, за батареи отопительной системы,

г) выдергивать штепсельную вилку из розетки за шнур, усилие должно быть приложено к корпусу вилки) часто включать и выключать компьютер без необходимости;

3. Для исключения поражения электрическим током запрещается:

б) прикасаться к экрану и к тыльной стороне блоков компьютера,

в) работать на средствах вычислительной техники и периферийном оборудовании мокрыми руками;

г) работать на средствах вычислительной техники и периферийном оборудовании, имеющих нарушения целостности корпуса, нарушения изоляции проводов, неисправную индикацию включения питания, с признаками электрического напряжения на корпусе;

д) класть на средства вычислительной техники н периферийном оборудовании посторонние предметы.

3. Запрещается под напряжением очищать от пыли и загрязнения электроооборудованне.

4. Запрещается проверять работоспособность электрооборудования в неприспособленных для эксплуатации помещениях с токопроводящим полами, сырых, не позволяющих заземлить доступные металлические части.

5. Ремонт электроаппаратуры производится только специалистами-техниками с соблюдением необходимых технических требований.

Недопустимо под напряжением проводить ремонт средств вычислительной техники и перифейного оборудования.

Во избежание поражения электрическим током, при пользовании электроприборами нельзя касаться одновременно каких-либо трубопроводов, батарей отопления, металлических конструкций , соединенных с землей.

При пользовании элетроэнергией в сырых помещениях соблюдать особую осторожность.

При обнаружении оборвавшегося провода необходимо немедленно сообщить об этом администрации, принять меры по исключению контакта с ним людей. Прикосновение к проводу опасно для жизни.

Спасение пострадавшего при поражении электрическим током

главным образом зависит от быстроты освобождения его от действия током.

Во всех случаях поражения человека электрическим током немедленно вызывают врача. До прибытия врача нужно, не теряя времени, приступить к оказанию первой помощи пострадавшему. Необходимо немедленно начать производить искусственное дыхание, наиболее эффективным из которых является метод 'рот в рот' или 'рот в нос', а также наружный массаж сердца. Искусственное дыхание пораженному электрическим током производится вплоть до прибытия врача.

4. Требования по обеспечению пожарной безопасности

На рабочем месте запрещается иметь огнеопасные вещества.

В помещениях запрещается:

а) зажигать огонь;

б) включать электрооборудование, если в помещении пахнет газом;

в) курить;

д) закрывать вентиляционные отверстия в электроаппаратуре

Источниками воспламенения являются:

а) искра при разряде статического электричества

б) искры от электроборудования

в) искры от удара и трения

г) открытое пламя

При возникновении пожароопасной ситуации или пожара персонал должен немедленно принять необходимые меры для его ликвидации, одновременно оповестить о пожаре администрацию.

Помещения с электроборудованием должны быть оснащены огнетушителями типа ОУ-2 или ОУБ-3.

Примечание. Время перерывов дано при соблюдении требований настоящих Санитарных правил и норм. При несоответствии фактических условий труда требованиям настоящих Санитарных правил и норм время регламентированных перерывов следует увеличить на 30

3. Результаты исследования

Для того чтобы отработать применение методов классической статистики, многомерной статистики мы провели компьютерную обработку раннее необработанных данных предоставленные к. с.-х. н., доцентом Сорокиной О. А. с кафедры агрохимии.

На первом этапе отрабатывали применение классической статистической обработки. В качестве модельного объекта были использованы данные по содержанию влаги на разных почвах в течение вегетационного периода. Цель эксперимента, проводившегося агрономами, состояла в том, чтобы выяснить влияние горизонта и типа почвы на содержание влаги.

Для анализа экспериментальных данных мы применили двухфакторный дисперсионный анализ с повторениями, встроенный в стандартный пакет анализа программы Excel. Проанализировав данные, мы выяснили, что до появления всходов влияние типа почвы на содержание влаги не наблюдается, горизонт почвы не оказывает влияния на содержание влаги, эффекта взаимодействия не наблюдается у изучаемых факторов. Это означает, что тип почвы не зависит от горизонта почвы по содержанию влаги (табл. 1).

Таблица 1 Двухфакторный дисперсионный анализ влияния типа почвы и горизонта на содержание влаги до появления всходов

Во время всходов тип почвы не влияет на содержание влаги, горизонт почвы также не оказывает влияния на содержание влаги, взаимодействия между изучаемыми признаками не наблюдается (табл. 2).

Таблица 2 Двухфакторный дисперсионный анализ влияния типа почвы и горизонта на содержание влаги в фазу всходов

Во время кущения на содержание влаги тип почвы оказывает влияние, влияние горизонта почвы не доказано, эффекта взаимодействия не наблюдается (табл.3).

Таблица 3 Двухфакторный дисперсионный анализ влияния типа почвы и горизонта на содержание влаги в фазу кущения

Во время колошения тип почвы на содержание влаги влияет. Влияние горизонта на содержание влаги в почве не доказано. Эффект взаимодействия не наблюдается. Это означает, что влияние типа почвы на содержание влаги не зависит от почвенного горизонта (табл.4).

Таблица 4 Двухфакторный дисперсионный анализ влияния типа почвы и горизонта на содержание влаги в фазу колошения

Во время уборки на содержание влаги тип почвы влияет, горизонт в значительной степени влияет, эффект взаимодействия между типом и горизонтом почвы не наблюдается (табл. 5).

Таблица 5 Двухфакторный дисперсионный анализ влияния типа почвы и горизонта на содержание влаги во время уборки

На содержание влаги после уборки тип почвы влияет, горизонт почвы также не влияет, эффект взаимодействия между изучаемыми факторами не доказан (табл. 6).

Таблица 6 Двухфакторный дисперсионный анализ влияния типа почвы и горизонта на содержание влаги после уборки

Таким образом, можно сказать, что дисперсионный анализ может с успехом применяться для анализа агрохимических данных.

Для изучения динамики изменения содержания влаги в почвах разного типа был проведен регрессионный анализ. Средствами Excel были построены графики изменения влажности почвы и построены уравнения регрессии. Результаты представлены на графиках.

На основании первого графика можно вынести суждение, что в березовом лесу больше всего влаги в почве оказалось до появления всходов растения. Наименьшее количество влаги в почве было во время колошения растения (рис. 1).

Рис. 1. Содержание влаги в зависимости от периода роста растения в березовом лесу

На основании второго графика можно сказать, что на пашне 2-3 года, наибольшее количество влаги в почве оказалось, как и на первом графике, до появления всходов, наименьшее в период кущения (рис. 2).

Рис. 2. Содержание влаги в зависимости от периода роста растения на пашне 2-3 года пользования

Третий график показывает, что в сосновом лесу наибольшее количество влаги в почве наблюдается во время всходов растения, наименьшее - во время колошения растения (рис. 3).

Рис. 3. Содержание влаги в зависимости от периода роста растения в сосновом лесу

На основании четвертого графика, можно вынести суждение, что на пашне 5-7 года наибольшее количество влаги наблюдается до появления всходов, наименьшее - во время колошения (рис. 4).

Рис. 4. Содержание влаги в зависимости от периода роста растения на пашне 5-7 года

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.