Выбор уравнений регрессии, их верификация и практическое применение в лесном хозяйстве
Знакомство с принципами и критериями выбора регрессионной модели. Рассмотрение видов закономерностей в лесоводстве и лесной таксации. Особенности математической формы эмпирических моделей связи. Анализ линейных и нелинейных регрессионных уравнений.
Рубрика | Математика |
Вид | автореферат |
Язык | русский |
Дата добавления | 29.03.2018 |
Размер файла | 7,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Выбор уравнений регрессии, их верификация и практическое применение в лесном хозяйстве
1. Принципы и основные критерии выбора регрессионной модели
регрессионный уравнение лесоводство
В предыдущих главах описано как вычислить коэффициенты регрессионного уравнения и как оценить это уравнение. Но для проведения анализа биологических и лесоводственных явлений этого недостаточно. Нам надо выбрать вид связи, определиться с конкретной ее моделью с тем, чтобы она отражала суть изучаемого явления, описывала закономерности его изменения.
Наилучшим образом модель будет выбрана тогда, когда она не просто сгладит экспериментальные данные, но и будет отражать суть изучаемого явления. В этом случае с определенными оговорками эту модель можно использовать для экстраполяции опытных данных. Последнее представляет собой наиболее сложную и неоднозначную часть по выбору и использованию моделей.
Если модель выбрана не совсем верно и не отражает всей сути изучаемого явления, то, хотя на некотором отрезке кривой сглаживание может быть удовлетворительным, но для экстраполяции такая модель не годится.
Например, если мы описываем рост дерева или древостоя в высоту, то модель, исходя из основных законов роста древостоя, должна отвечать следующим условиям:
· кривая роста должна начинаться в начале координатных осей, т.к. рост начинается от семени, т.е. от нулевого значения высоты;
· в начальный период жизни (у разных древесных пород этот период неодинаков) рост идет медленно;
· постепенно происходит ускорение роста, достигая некоторого максимума прироста по высоте. Последний наблюдается в разном возрасте в зависимости от древесной породы и условий произрастания;
· постепенное замедление прироста по высоте продолжается до старшего возраста, который тоже бывает разным, аналогично предыдущему условию;
· в самом старшем возрасте рост в высоту практически прекращается (по диаметру дерево еще растет) и крона деревьев приобретает своеобразную уплотненную форму;
· в конце жизни дерева (древостоя) оно погибает и начинается новый цикл.
Исходя из описанных условий, кривая роста должна отвечать следующим условиям:
§ начинаться в начале координат;
§ иметь не менее 2 (иногда 3) точки перегиба: начало большого роста, переход к замедленным темпам прироста, прекращение роста. В практике обычно не используют последнее условие, т.к. при интенсивном хозяйстве до естественной спелости и распада древостои могут дожить только в зоне полной заповедности в заповедниках и национальных парках;
§ абсолютное максимальное значение высоты, которое дает модель, не должно превышать максимально достижимую высоту, до которой вырастают деревья определенной породы в заданных условиях произрастания.
Поскольку для моделирования роста деревьев (древостоев) в высоту часто используют экспериментальный материал (пробные площади), где возраст древостоя колеблется от 20-30 до 60-80 лет, то этот отрезок может быть описан различными кривыми, даже параболой 2 порядка - y=a0+a1x+a2x2. Но эта кривая из-за ее «жесткости» совершенно непригодна для экстраполяции.
Поэтому, применив кривую, не отвечающую сути изучаемого явления, мы не можем сделать суждения о действительной траектории изменения некоторого признака под воздействием разных факторов. Так, в приведенном примере нельзя сказать, какова будет высота за пределами изученных возрастов - в 10 или 100 лет. Кривая может здесь уйти далеко в сторону, даже вниз в 100 лет, просто исказив суть явления. Поэтому в лесной таксации для этих целей еще с XIX века применяют достаточно гибкие модели. Наиболее известны и хорошо «работают» следующие.
Функция Вебера:
Уравнение гомельских ученых В.Н. Дракина, работавшего в Гомельском пединституте (ныне ГГУ им. Ф. Скорины) и Д.И. Вуевского научного сотрудника БелНИИЛХа: ; (16.2)
Формула Я.А. Юдицкого (УСХА, г. Киев): . (16.3)
В формулах (16.1-16.3) применены следующие обозначения:
На- высота в возрасте «а»;
Нmax - максимальная высота данной породы в определенных условиях произрастания;
Ф - функция Маркова.
Другие обозначения характеризуют параметры уравнений.
Несколько иная тенденция наблюдается в модели роста деревьев по диаметру. Объясняется это тем, что в толщину деревья растут до момента их отмирания, хотя темп прироста в старости замедляется. Здесь зависимый признак - диаметр (независимый - возраст) - имеет положительное приращение практически в течение всей жизни, тогда как рост в высоту в старовозрастном лесу прекращается. На основе знаний биологии можно предсказать, что кривые, отражающие рост в высоту в связи с возрастом и диаметром H=f(A,D), будут отличаться друг от друга. Это обусловлено тем, что изменение возраста характеризуется равными приращениями в течение всей жизни. Приращение же диаметра неодинаково. В первые годы жизни оно небольшое, затем достигает максимума в молодые годы, после чего прогрессивно убывает до периода отмирания дерева. Здесь мы характеризуем среднее поведение роста, не обращая внимания на годовые или краткопериодические колебания прироста высоты или диаметра, которые возможны в связи с влиянием различных факторов среды, например, засуху, но не биологических законов.
Из этого далеко не полного перечня моделей видно, что они постепенно совершенствуются, сохраняя основные требования к моделям роста. Существуют определенные правила, приемы и критерии, которые в совокупности определяют выбор моделей. В большинстве случаев выбор уравнения регрессии производят на основе анализа, используя профессиональные знания, как это делали выше при рассмотрении роста деревьев по высоте и диаметру. К настоящему времени накоплены знания о конкретных уравнениях регрессии для описания важнейших биологических процессов, подобных рассмотренным. Однако следует заметить, что при изучении многих явлений возникают большие затруднения в выборе подходящего уравнения регрессии. Даже установление общей ее формы (прямолинейна она или криволинейна) на основе профессиональных знаний часто не может быть сделано. Статистические методы в таких случаях дают основание для принятия решений о форме регрессии и выборе уравнения.
Для примера возьмем ранее рассмотренную зависимость длины корней сеянцев сосны и высоты ее всходов. Размещение точек на графике часто указывает на форму кривой. Если точки расположились, как на рисунке 16.1, есть основания принять связь за линейную. Теоретический анализ существа явления не доставляет аргументации, противоречащей этому выводу.
Действительно, для всходов сосны нет ограничивающих факторов к развитию обоих изучаемых признаков - длины стволиков и длины корней. В отношении регрессии длины стволиков и корней всходов или молодых растений можно сказать, что она линейна. Если точки на графике расположились так, что указывают на изгиб обобщающей их кривой, есть основания проверить гипотезу о линейности регрессии, т.е. рассчитать и оценить достоверность меры криволинейности.
Рисунок 16.1 Регрессия длины корней на длину стволиков всходов сосны
Часто при исследованиях связи между признаками регрессионный анализ следует за корреляционным или осуществляется вместе с ним. Тогда определенные статистические заключения о линейности регрессии делают на основе t-критерия Стьюдента, но лучше на основе F-критерия Фишера.
Отметим, однако, что сами по себе критерии не дают исчерпывающего ответа о выборе уравнения, а лишь о форме регрессии: прямолинейна она или криволинейна. Если получены данные, свидетельствующие, что связь прямолинейна, этого достаточно, чтобы перейти к следующему шагу регрессионного анализа. Указание на криволинейный характер регрессии обязывает вести дальнейший поиск функции среди многих функций этого вида. В таком случае следует испытать наиболее простые и доступные исследователю функции. Останавливают выбор на функции, дающей лучшее приближение к опытным данным, или имеющую наименьшее среднее квадратическое отклонение вычисленных данных (уух) или (уґух). Здесь часто помогают уже упомянутые альбомы, где помещены графики различных функций.
В лесном хозяйстве во многих случаях удовлетворительную аппроксимацию опытных данных получают на основе парабол 2, 3-й и более высоких степеней, оценивая точность каждой из регрессий. При малом числе групп (классов) зависимой переменной у можно получить параболу с числом коэффициентов, равным числу групп, и проходящую через все точки, характеризующие групповые средние. Однако ценность регрессии в этом случае снижается. Кривая не выражает в таком случае закономерности связи, а отражает случайности выборочных наблюдений. Применять такую кривую можно только для аппроксимации и нахождения промежуточных значений в конкретном случае, не выходя за пределы измерений. Например, если мы измерили на срубленном дереве диаметры в 6 точках, то для получения промежуточных диаметров, лежащих между измерениями, правомерно использовать уравнения вида целых полиномов 5-6 степени. Но они будут описывать образующую только этого дерева.
Криволинейный характер зависимости между переменными иногда удается заменить на прямолинейный путем преобразования х или у. Логарифмирование часто дает существенное уточнение выражения связи. Логарифмические параболы вследствие растянутости осей, вообще, более гибки.
2. Основные виды закономерностей в лесоводстве, лесной таксации и других лесных дисциплинах, выражаемые с помощью регрессионных моделей
В лесном хозяйстве, как видно из изложенного, применяются разные модели. Они выбираются, исходя из условий проведенного эксперимента и из сущности изучаемого явления. Если мы изучаем рост чего-либо (дерева, насаждения, ветви, животного и т.д.), то должны определиться каким условиям будет соответствовать наша модель. Для описания роста в высоту и по диаметру такие подходы изложены выше. Если же мы изучаем другие показатели роста дерева или древостоя, то должны учитывать уже их особенности. Например, изучая изменение запасов (М) древостоя, мы должны помнить следующие условия:
· кривая начинается в начале координат;
· она должна отражать медленный рост в самом молодом возрасте;
· необходимо, чтобы нашло отражение замедление увеличения запаса древостоя после определенного возраста (у сосны после 60-70 лет, у березы после 40-50 лет и т.д.), которое будет видно из наличия точки перегиба;
· в самом старшем возрасте идет процесс распада древостоя, появляется много сухостоя, и величина запаса уменьшается. При этом он не может быть отрицательным - предельный случай при полном распаде М=0.
Таким образом, модель изменения запаса насаждения будет иметь примерно такой вид, как кривая на рисунке 16.2.
Если же мы будем исследовать прирост запаса древостоя (), то он должен соответствовать следующим условиям:
§ начало кривой приходится на точку 0;
§ медленный рост в начале жизненного цикла;
§ резкое увеличение в период «большого роста» - сосна в 20-50 лет - и т.д.;
§ достижение максимума прироста и постепенное его снижение;
§ в перестойных древостоях, когда преобладают процессы распада, текущий прирост может быть отрицательным за счет отмирания деревьев;
§ для отдельного дерева прирост может быть равен 0, но отрицательные величины исключаются.
Графически изменение прироста запаса древостоя (М) и наличного древостоя (Z)показано на рисунке 16.2.
Рисунок 16.2. Ход роста по наличному запасу древостоя осины I класса бонитета и его текущее изменение запаса с увеличением возраста
Рисунок 16.3. Изменение прироста наличного древостоя
Исследование других закономерностей в лесном хозяйстве приводит к использованию других кривых. Выбор формы зависимости во всех случаях идет от простого к сложному.
Модели, отражающие причинно-следственные взаимосвязи и взаимодействия в системах (или модели связи), - основной тип моделей, применяемых в практике и исследованиях по лесному хозяйству. Ниже мы рассмотрим модели связи двух классов: эмпирические и структурные или функциональные.
В качестве математической формы эмпирических моделей связи в основном используют регрессионные уравнения и реже - интерполяционные многочлены. В первом случае для нахождения коэффициентов уравнений применяют различные модификации метода наименьших квадратов, позволяющие просто и достаточно надежно оценить статистическим путем разрабатываемую модель. Методом регрессионного анализа получены, пожалуй, практически все наиболее содержательные биометрические закономерности в лесном хозяйстве.
В то же время метод наименьших квадратов имеет существенные недостатки чисто познавательного плана: во-первых, он не учитывает природной сущности изучаемого явления и допускает известный произвол в выборе конкретных типов уравнений. Во-вторых, этот метод предполагает детерминированный характер изучаемого процесса. Поэтому в последнее время все больше внимание привлекают вероятностные модели (особенно для отражения процессов, протекающих во времени), использующие методы теории случайных функций.
Основное средство объективной разработки моделей эмпирических связей - использование методов биометрии, основанных на законах математической статистики. Это позволяет принять обоснованные решения, оценить структуру, рабочий диапазон и надежность моделей. Однако в полной мере методы статистики можно применять только к материалу, полученному с соблюдением статистических предпосылок. Во всех остальных случаях применение относительно трудоемких методов статистического анализа взаимосвязей неоправданно. То же относится и к материалу, из которого произвольно исключена значительная часть только на том основании, что она “не укладывается” в некоторые представления экспериментатора, ибо простые графические методы позволяют в таких случаях получить те же результаты.
Если для разработки модели связи информация еще не собрана, то планирование эксперимента позволяет значительно улучшить результаты, так как лучше потратить часть времени и средств для предварительной оценки ситуации, выбора независимых переменных и их анализа. Главное здесь, как и во многих других случаях применения математических методов, - это точная формулировка задачи и преследуемых целей, исходя из сути изучаемого явления.
В данном разделе будем применять следующие термины: адекватность модели - соответствие исходным данным, подтвержденное статистическими критериями; корректность - ее приемлемость (с точки зрения пользователя), соответствие моделируемому процессу или системе. Эти термины являются обычными в математике.
Статистические методы могут подтвердить высокую вероятность адекватности модели, но особенности информации могут привести к результатам, неприемлемым с точки зрения существа явления; иначе говоря, корректная модель есть в известном смысле и лучшая. Особенно возрастает опасность ошибок при малых выборках.
Модели, связывающие более двух переменных, называют многомерными. К ним относятся множественные регрессионные уравнения, многомерные случайные процессы. По форме модели связи могут быть в табличном, графическом или аналитическом виде, т.е. в виде уравнений.
Регрессионные уравнения бывают линейные и нелинейные, причем этот термин может относиться как к коэффициентам уравнения, так и к независимой переменной. Например, уравнение у=а+bх+сх2+dх3 является линейным по коэффициентам а, b, c, d и нелинейным по х, а множественное уравнение нелинейно как по коэффициентам, так и по переменным х1, х2, х3. Мы рассмотрим линейные уравнения относительно коэффициентов, т.к. модели такого рода вполне достаточны для моделирования связей в лесных исследованиях, а теория нелинейного (по коэффициентам) оценивания очень сложна. Многие нелинейные модели можно привести к линейному виду, например, логарифмированием. Такие модели называют внутренне линейными.
Модели могут быть представлены не только уравнениями, но и в графической и табличной форме. Табличное и графическое представления закономерностей связи традиционно свойственны лесному хозяйству и широко распространено, особенно для данных, полученных без надлежащего статистического обоснования. Так, лесотаксационные таблицы (объемные, сортиментные, хода роста и др.), разработанные до 60-х годов ХХ века, представлены преимущественно в виде числовых массивов, полученных графическим выравниванием опытных материалов. Недостатки такого рода моделей известны: субъективизм конечных результатов, невозможность статистической оценки соответствия модели изучаемому явлению, неудовлетворительность формы для целей механизации обработки информации.
В то же время модели, выраженные в табличном виде, где величины получены путем графического выравнивания, разработанные весьма квалифицированными и ответственными специалистами на основе большого (даже огромного) экспериментального материала, часто оказывались адекватными и корректными и находили (находят и сегодня) широкое применение в практике. К таким моделям можно отнести таблицы объемов стволов А. Крюденера и объемные таблицы Союзлеспрома (М.М. Орлов (1867-1932), Д.И. Товстолес, В.К. Захаров, Б.А. Шустов, А.В. Тюрин), сортиментные таблицы Ф.П. Моисеенко, таблицы хода роста А.В. Тюрина и другие. Эти табличные данные обычно точнее результатов, полученных в 60-80 годы прошлого века путем использования математических моделей, имеющих недостаточное лесоводственное обоснование.
В принципе любой численный или графический материал можно выразить в виде формул. В 60-70 годы прошлого века машинный счет больших массивов информации из-за несовершенства ЭВМ того времени был затруднен. Поэтому таблицы выражали в виде математических моделей. Для этого был выполнен ряд работ по моделированию существующих таблиц. Однако опыт моделирования численных массивов, выровненных графически, свидетельствует, что достаточно точное их отражение требует использования громоздких и разнородных математических выражений, что также создает определенные неудобства в их использовании в системах автоматизированной обработки данных. В настоящее время возможности компьютеров позволяют пользоваться огромными массивами информации, выраженной в табличной форме, не прибегая к ее упрощению в виде уравнений.
При обработке лесоводственной информации нередки случаи, когда графические методы выравнивания наиболее целесообразны. Это бывает тогда, когда методы сбора исходных данных неизвестны либо статистически несостоятельны,а сбор информации (метод сбора, объем) не согласован с конечной целью работы.В силу этого применение статистических методов может дать здесь результаты, противоречащие сути изучаемого явления. Проиллюстрируем второе положение примером.
Пусть у нас есть некоторый массив данных, который характеризует изменение запаса древостоя с возрастом. Известно, что запас древостоя зависит от породы, условий произрастания, возраста и полноты. При сборе экспериментального материала наиболее сложно строго выдержать единообразие по полноте. Если мы хотим определить ход роста по запасу нормальных древостоев (с полнотой 1,0), но в опытном материале есть пробные площади с полнотой от 0,6 до 1,0, то математическое выравнивание с использованием всего имеющегося материала даст искаженную картину, что видно на рисунке 16.4.
Из рисунка 16.4 видно, что использование всего массива пробных площадей, которые представляют разнородный материал (по полноте) ведет к ошибкам. В этом случае правильно предварительно построить график, определить главную закономерность (ход роста при полноте 1,0), даже сделать графическое выравнивание, а потом разрабатывать математическую (регрессионную) модель.
Запас (М)
Возраст (А)
Рисунок 16.4 Модель изменения запаса (М) древостоя от возраста (А) при неверно организованных исходных данных для березовых древостоев
II класса бонитета
1 - линия, построенная по данным из разнополнотных древостоев;
2 - графическое выравнивание по данным древостоев с полнотой 1,0
Подобный пример приводят К.Е. Никитин и А.З. Швиденко (рисунок 16.5). На нем показано 15 случайным образом замеренных высот деревьев в разновозрастном насаждении бука. Допустим, что требуется установить зависимость высоты от возраста. Применение стандартных статистических методов дает зависимость, показанную штриховой линией: начиная с некоторого возраста, высота деревьев постепенно уменьшается, т.е. модель адекватна, но не корректна.
Такой результат получен, конечно, из-за недостаточности исходных данных. В разновозрастном древостое деревья, имеющие одинаковый возраст, но отличающиеся расположением в пологе, имеют разные высоты. Если нет возможности собрать дополнительный материал, то графическое выравнивание - единственная возможность решения задачи. Надежность такого выравнивания нельзя оценить, поскольку в основе его лежит единственная предпосылка: высота деревьев с возрастом должна, как правило, увеличиваться, но не может уменьшаться.
Рисунок 16.5 Выравнивание плохо организованных данных: 1 - графическое; 2 - аналитическое
Иногда возникает необходимость графические модели представить в аналитическом виде. Для этого применяют два практических приема: снимают с графика значения зависимой переменной и применяют один из статистических методов вычисления уравнения регрессии или, если конкретный вид уравнения известен, то коэффициенты уравнений целесообразно вычислять решением систем уравнений. Статистическая оценка моделей в обоих случаях может дать только соответствие графика полученному уравнению.
В качестве примера возьмем данные из рисунка 16.4. Здесь необходимо подобрать коэффициенты уравнения, отражающего зависимость высоты от возраста. Исходя из графика, форма связи здесь (сплошная линия) может быть в виде параболы второй степени
у=b0+b1x+b2x2
где х - возраст; у - высота.
Для нахождения коэффициентов b, b1, b2 возьмем три точки, например, со значениями х, равными 20, 80 и 140 годам. По графику находим у1=12,3; у2=21,1; у3=25,2. Поскольку уравнение (16.4) справедливо для любой точки, лежащей на кривой, то подставив значения х и у, в уравнение (16.4) и решаем систему из трех уравнений для нахождения коэффициентов. Переменную х для упрощения расчетов можно маштабировать в 20 раз и записать:
хґ1 =х1/20=1, хґ2 =х2/20=4, хґ3 =х3/20=7, т.е.
12,3=b0+b1+b2;
21,1 =b0+4b1+16b2; (16.5)
25,2 = b0+ 7b1+ 49b2.
Решая систему (16.5), находим b0=8,32, b1=4,239, b2=-0,2611; вернувшись к исходной переменной, окончательно получим
у = 8,32 + 4,239х /20 - 0,2611(х/20)2 = 8,32 + 0,212х - 0,000652х2.
Легко убедиться, что сплошная линия на рисунке 16.4 есть графическое изображение полученного уравнения. Для этого вычислим для некоторого значения х, например 80 лет, получим у=8,32+0,212*80+0,000652*802=8,32+16,96-4,17=21,11, т.е. искомый результат (21,1 м) в 80 лет. Аналогично рассчитываем значения для любого возраста на имеющемся интервале наблюдений.
Приведенный пример есть частный случай так называемых интерполяционных многочленов. При многочисленных приближениях интерполяционный многочлен степени n однозначно определяется n+1 его значением. В нашем примере для нахождения коэффициентов многочлена второй степени мы взяли 3 точки. Применение интерполяционных многочленов такого типа удобно, если используемая модель должна предсказывать поведение функции только в точках (хi, yi) - узлах интерполяции, поскольку оценка поведения многочлена между узлами затруднена.
Если статистический анализ (или другие соображения) позволяет ограничиться линейным (относительно независимой переменной) уравнением, то выбор модели связи однозначен. Но если связь нелинейна, то процедуры однозначного выбора конкретного аналитического выражения в качестве уравнения регрессии не существует: одна и та же зависимость у от х может быть отражена многими формулами. Здесь требуется, с одной стороны, знание общих свойств моделируемой зависимости, с другой - математических свойств используемых выражений. В качестве примера рассмотрим материал, приводимый К.Е. Никитиным и А.З. Швиденко. Пусть нам требуется найти зависимость коэффициента вариации (хМ) запаса древостоя, определенного по материалам измерений на круговых пробных площадях, от величины этих круговых проб (b). Результаты показаны на рисунке 16.6.
Рисунок 16.6
а) Модель хМ=f(l): 1 - исходные данные; 2 - выравнивающая кривая гиперболического вида: (16.8);
б) Зависимость коэффициента изменчивости запаса от величины круговых проб и преобразование ее к линейному виду. Здесь кривые 3-7 - показывают преобразование данных соответственно по формулам (16.7), (16.8), (16.9),(16.10),(16.11).
Можно подобрать такое уравнение регрессии, которое пройдет через все точки (так, интерполяционный многочлен n-1 степени пройдет точно через n точек), но бессмысленность подобного подхода очевидна. Например, нам требуется получить закономерность изменения показателей формы ствола (q2) в зависимости от высоты дерева в среднем, т.е. учесть изменение условных средних (а не каждого конкретного значения), которые являются случайными величинами, подвержены изменчивости и содержат ошибки измерений. Анализ ситуации позволяет предположить, что уменьшение q2 с увеличением высоты должно быть представлено монотонно убывающей кривой. Следовательно, выбираемая модель не должна содержать внутри своего “рабочего” интервала (диапазона значений независимой переменной) особых точек минимума, максимума, точек перегиба.
Важное значение имеет простота модели и количество коэффициентов, подлежащих определению. Поэтому круг выражений, из которых выбирают уравнение регрессии, должен быть ограничен по возможности простыми функциями. Из них особое место занимают те, которые путем алгебраических преобразований могут быть приведены к линейному виду. Это позволяет применить относительно простые, но глубоко разработанные методы статистической оценки. К ним в первую очередь принадлежат показательные, степенные, логарифмические и гиперболические функции. В таблице 16.1 и на рисунках 16.7 и 16.8 приведены типы уравнений, которые, по совершенно справедливому мнению К.Е. Никитина и А.З. Швиденко наиболее часто используют в лесных исследованиях. Эти модели с одной независимой переменной и с двумя коэффициентами, приводимые к линейному виду. В таблице показан вид преобразования и критерии, позволяющие оценить приемлемость данного выражения. Их графическое изображение приведено на рисунке 16.6.
Таблица 16.1 - Некоторые элементарные функции, наиболее часто используемые в лесном деле, одной переменной и преобразование их к линейному виду
Задачу также можно решить путем предварительного преобразования исходных данных и нанесения их на график в новой системе координат (точки должны располагаться вдоль прямой линии). Первый путь предпочтительнее, поскольку легко реализуется в программах автоматического выбора модели на компьютере, второй - более нагляден.
В лесном хозяйстве помимо уравнений, приведенных в таблице 16.1 очень широко используются уравнения вида целых полиномов, в основном 2-4 степени: у=а0+а1х+а2х2+а3х3+…К линейному виду они могут быть приведены путем логарифмирования. Их употребление для описания динамики древостоев рекомендуют К.Е. Никитин, В.Ф. Багинский и другие. Этими уравнениями хорошо выражаются зависимости Н=f(D). При этом здесь нежелательно использование параболы 2 порядка, которая занижает начальные и завышает конечные данные. А.Г. Мошкалев (1926-1992) использовал для связи Н=f(D) полиномы 3 степени. В.Ф. Багинский иногда употреблял параболу 4 порядка. Для вычисления коэффициентов в уравнениях вида целых полиномов для ПК имеется хорошее матобеспечение, где дается и оценка уравнения.
Из уравнений, рекомендованных К.Е. Никитиным и А.З. Швиденко, при проведении исследований в лесном хозяйстве наиболее употребительными являются (16.6), (16.9), (16.10) и (16.11). Формы кривых, часто применяемых для моделирования зависимостей в исследованиях по лесному хозяйству, показаны на рисунках 16.7-16.8.
Рисунок 16.7 Графики кривых с двумя параметрами:
1 - 1/y=a+bx; 2 - у=а+b/x; 3 - у/х=а+b/x; 4 - у=аеbx; 5 - у=ахb
Рисунок 16.8 Графики кривых с тремя параметрами:
1 - у=аеbx+с; 2 - у=ахb+с; 3 - у=ахbесч
Анализ основных моделей и выделение наиболее адекватных, применяемых для описания динамики древостоев, строения, связей между запасами насаждений и классами бонитетов, типов леса и описание взаимосвязей между другими таксационными показателями выполнил О.А. Атрощенко в монографии «Моделирование роста леса и лесохозяйственных процессов», которая приведена в списке литературы.
3. Верификация регрессионных моделей
Верификация модели - это ее проверка, т.е. подтверждение того, что модель верна (или не верна) и соответствует законам и закономерностям, действующим в генеральной совокупности. Верификация проводится в несколько этапов.
· Проверяется степень сглаживания (выравнивания) опытных данных, т.е. степень совпадения теоретических и экспериментальных значений функции при заданных аргументах. Для этого используют методы, рассмотренные ранее: основную ошибку уравнения регрессии, остаточную дисперсию, отношение общей и остаточной дисперсий, анализ остатков.
· Проверяют значимость коэффициентов уравнения регрессии по t-критерию, где t - должен быть 2 или 3 в зависимости от принятого уровня достоверности.
· Устанавливают степень коррелированности аргументов и принимают решение об их исключении или оставлении.
После выполнения перечисленных процедур приходят к заключению, что уравнение подобрано верно и хорошо описывает закономерность по результатам опыта. Если это не так, то подбирают другую модель.
Но при постановке опыта могут быть ошибки. Количество первичного материала может оказаться недостаточным для отражения всех особенностей изучаемого явления в генеральной совокупности и т.д. Поэтому требуется дополнительная проверка модели, описывающей ту или иную закономерность, но на новом материале, собранном независимо от нашего опыта. Его количество должно быть не меньше, чем использовано для построения модели. При этом сбор материала для проверки должен осуществляться в соответствии с правилами планирования эксперимента, т.е. правилами организации выборочных наблюдений. Иначе выборка будет нерепрезентативной. Здесь нельзя использовать “типичные” места замеров, “типичные” делянки и т.д., т.к. могут возникнуть смещенные оценки, т.е. имеющие систематическую ошибку.
Например, если мы, определяя выход сеянцев в питомнике, взяли более урожайную грядку в качестве “типичной”, то показатели будут завышены и наоборот. Когда нет систематической ошибки, то точность можно рассчитать (и планировать), но систематическую ошибку исправить практически невозможно, т.к. она не поддается статистической интерпретации. Поэтому при планировании эксперимента надо строго выдерживать статистический метод.
В лесном хозяйстве исследуют обычно достаточно неоднородные совокупности. Например, изучая приживаемость лесных культур, мы можем обнаружить на участке места, где культуры прижились хорошо или где они погибли, скажем, в случае вымочек на понижениях.
Оценивая участки древостоев, пройденные рубками ухода, встречаемся с неравномерностью выборки деревьев на всей площади. Изучая смешанный древостой, видим, что деревья, скажем, сосны и ели, могут располагаться относительно равномерно или биогруппами, но встречаются и относительно большие куртины (до 0,05 га до 0,10 га и больше), состоящие из одной породы.
При проведении исследований (обследований), причем не только в научных, но и практических целях, требуется собирать различную информацию. Поэтому планирование эксперимента при изучении подобных объектов должно строиться на применении выборочных методов, отвергая закладку опытных участков в «типичных» местах.
Сказанное подтвердим примером, когда нам требуется провести исследование в совокупностях различных объектов (таблица 16.2).
Таблица 16.2. Информация, требуемая для проведения исследования разных объектов
№ п/п |
Наименование совокупностей (объектов) |
Требуемая информация |
Метод сбора |
|
1 |
Средний состав дубовых древ. в лесхозе (обл., республике) |
Состав на выделе в дубовой хозсекции |
Марш. выбор. учет или анализ таксац. опер. |
|
2 |
Возобн. под пологом леса в ельниках |
Средняя численность и возраст возобнов. на 1 га |
Закладки учетных площадок |
|
3 |
Сос. 1-2 летних культур сосны |
Процент приживаемости |
Закл. учетных площадок |
|
4 |
Сред. запас спелых сосн. древ. |
Запас м3/га |
Зак. пробных площадей |
Чтобы получить статистически значимую информацию, например, для второй из названных совокупностей, т.е. при учете естественного возобновления, надо провести наблюдение на большом числе учетных площадок или проанализировать много выделов. Численность возобновления от выдела к выделу и от площадки к площадке внутри выдела будет сильно варьировать. Коэффициент вариации х может достигать 100% и выше. Понятно, что в этих условиях ни одна, ни десятки площадок, заложенных по принципу типичной выборки, не дадут надежной информации. Так, для учета с точностью 10% надо заложить 100 площадок: . При 5% точности (с достоверностью 0,68) уже требуется огромный исходный материал: шт. Поэтому в практике обычно ограничиваются точностью в 10-15% при достоверности 0,68.
Аналогичная картина будет для первого примера. Состав дубовых насаждений от выдела к выделу и от лесхоза к лесхозу, даже от лесничества к лесничеству будет меняться. Понятно, что «типическая» выборка здесь ничего не дает, т.к. «типичность», т.е. средний состав, еще предстоит определить.
Для обследования лесных культур с целью установления их приживаемости в лесном хозяйстве существуют специальные правила, которые требуют подсчитать количество сеянцев на определенной площади. При этом предполагается выборочным путем, чаще всего методом систематической выборки, закладывать учетные площадки или ленты (ряды).
Для нахождения среднего запаса в древостоях, которые намечаются в главное пользование, необходимо заложить пробные площади, естественно, в спелых сосняках. Но вариация здесь высока из-за различия в условиях произрастания и полноте. Поэтому и в подобных ситуациях планирование эксперимента базируется на методах, разработанных в математической статистике.
Непригодность типического способа отбора выборки в описанных случаях состоит не в том, что способ недостаточно точен, а в том, что он не свободен от субъективизма. Несмотря на этот недостаток, способ типической выборки приходится нередко применять при оценке (таксации) насаждений. Например, при глазомерной таксации средний диаметр деревьев древостоя определяют как среднюю величину из 3-4, взятых “на глаз” средних по толщине деревьев. При детальном обследовании участка леса на зараженность вредителем приходится закладывать пробную площадь в средних (типичных) условиях. Иногда таким же образом решают и задачу оценки возобновления.
По неизбежности, как способ, требующий наименьшего объема наблюдений, метод типической выборки находит широкое применение при решении многих задач в лесном хозяйстве. Следует отметить, что информацию, пригодную для статистической оценки опыта с определенной точностью, этим способом получить невозможно. Можно вычислить среднюю величину признака на основе такого материала. Но ошибку этой средней определять не следует, так как она неправомерна, ибо случайная изменчивость признака (среднее квадратическое отклонение) в опыте не измерялась. В этом случае придется для оценки опыта ограничиться типической выборкой, т.е. только полученной средней величиной признака.
Для статистического истолкования результатов опыта рассмотренных совокупностей (возобновление на вырубке, сосняки лесничества, культуры сосны) с определенной точностью требуется закладка проб по одному из способов случайного отбора, рассматриваемых ниже. При этом исследователю придется решить два главных вопроса: 1) определить достаточное число наблюдений, 2) правильно отобрать единицы для наблюдений.
При решении первого вопроса можно воспользоваться формулой
где V - коэффициент вариации; Р - показатель заданной точности.
Выше показано, что для получения результата с точностью 5% для оценки возобновления, где коэффициент вариации (х) нами установлен в 100 %, потребовалось бы заложить 400 площадок. При этом наше заключение о том, что полученная выборочная средняя будет отличаться не более чем на 5% от генеральной средней, дается с вероятностью 0,68. Это значит, что в 32 случаях из 100 эта закономерность может и не подтвердиться. Если принять уровень безошибочного суждения 0,05, т.е. делать заключение с вероятностью 0,95, которую следует считать достаточной, то в формулу для определения числа наблюдений нужно ввести множитель t (t - критерий). При вероятности 0,95 t-критерий примерно равен 2 (1,96).
Тогда формула для числа наблюдений будет
Для нашего объекта число наблюдений составило бы
N= (22(1002) / 52 = 1600.
В других случаях, когда х по пробной выборке характеризовалось бы меньшим числом, можно было бы планировать меньшее число наблюдений.
Из приведенного примера видно, что, если варьирование значений признака в совокупности велико и полученное N по формуле (16.13) практически недостижимо, исследователь должен пойти на сужение объекта исследований или иногда довольствоваться точностью опыта в 10 и даже 15%.
Правильнее первое решение. Можно взять, например, в опыте не все ельники лесхоза, лесничества, а только какого-то типа леса или типа условий местопроизрастания, желательно наиболее распространенные. В пределах таких объектов варьирование будет значительно меньшим. Вообще, следует придерживаться принципа брать более ограниченные совокупности.
4. Применение регрессионных моделей в лесном хозяйстве
В лесоводственных исследованиях регрессионные модели - необходимый инструмент для решения возникающих задач. При этом важнейшим этапом, который надо строго выдерживать и в практической работе, является планирование эксперимента в строгом соответствии с законами биометрии.
Решения вопроса по планированию эксперимента состоит в правильном отборе или размещении единиц наблюдения. Современная статистическая теория рекомендует для этого ряд способов.
Обычно применяют следующие способы: простой случайный отбор, или случайное бесповторное выборочное наблюдение, случайное послойное выборочное наблюдение, систематическое выборочное наблюдение и субвыборочное наблюдение, или двухстадийное наблюдение.
Простой случайный отбор является наиболее распространенным и статистически разработанным методом. Его организуют с помощью какого-либо механизма, обеспечивающего равную возможность для любой единицы попасть в выборку. Обычно для выбора единиц используют таблицу случайных чисел.
Но применить этот способ в чистом виде при исследованиях в лесном хозяйстве часто очень трудно, а иногда и невозможно. Например, закладка учетных площадок в пределах лесхоза потребует большого количества времени на переезды и поиск нужного объекта.
Более приемлема и наиболее часто применяется систематическая выборка. По точности и обоснованности она практически не уступает случайной, являясь своеобразным вариантом последней.
Систематическая выборка полностью определяется выбором первого ее члена. Выбирают для обмера или наблюдения, допустим, каждый десятый член, например 10, 20, 30-е и т.д. дерево по перечету или 10, 20, 30-й и т.д. ряд культур. Закладка учетных площадок через определенное расстояние друг от друга представляет также систематическую или механическую выборку. Преимущество такой выборки - легкость ее получения и равномерность распределения по всему объекту. Ее недостатком могут быть случаи, когда совокупность обладает периодической изменчивостью и если интервал между отбираемыми единицами совпадает с длиной волны этого изменения (или кратный ей), то получим выборку со смещением, т.е. с систематической ошибкой.
Допустим, что многорядный агрегат, который применяли при посеве некоторой культуры, имел один из шести или другого числа неисправный захват. Если в последующем учете №№ учетных рядов культур совпадают с рядами, произведенными неисправным захватом, то выборка будет содержать систематическую ошибку. Это всегда следует учитывать при планировании опыта. В условиях равномерной изменчивости признака, можно применять систематическую выборку и без существенной погрешности обрабатывать как случайную. После получения дополнительного материала, собранного с использованием статистического метода, можно рекомендовать ее использование в широкой практике.
Окончательное суждение о верности модели и ее широком применении может быть сделано только после проверки на практике, т.е. модель должна быть опробована в производственных условиях. Только тогда можно учесть все возможные особенности закономерностей, действующих в генеральной совокупности. Если модель подобрана правильно и хорошо проверена, то при ее использовании в практике не обнаруживается существенных недостатков. Но небольшая коррекция все равно может иметь место.
Например, сортиментные таблицы Ф.П. Моисеенко с 1958 по 1968 годы были неоднократно проверены в практике. Но их новый усовершенствованный вариант до издания в 1972 году прошел дополнительную проверку в течении 1970-71 гг. и лишь после внесения небольших уточнений был принят и издан. Зато с 1972 года, т.е. уже более 37 лет эти таблицы применяются в практике без замечаний.
Это положительный пример, хотя есть и такие, когда модель приходилось менять. Например, первоначальную модель для упрощенного отвода лесосек, разработанную в 1986 году В.Ф. Багинским, через год после опытной проверки автор заменил на более совершенную.
Регрессионные модели - основа для составления почти всех нормативов в лесном хозяйстве, и они должны тщательно отбираться и проверяться, чтобы хозяйство в лесу велось на должном научном уровне.
Все нормативы для лесного хозяйства, где встречаются количественные зависимости, разработаны с помощью описанных методов. Так, «Правила рубок в лесах Республики Беларусь» базируются на закономерностях изменения прироста древостоя (z) в зависимости от полноты (П). Это регрессионная связь z=f (А, П, Б), где А и Б - возраст и класс бонитета. Выход сортиментов (С) в товарных таблицах определяется по его связи со средними диаметром (D), высотой (Н) и классом товарности (К), т.е. С=f (D, Н, К). Стоимость древесины (Ст) зависит от породы (Р), крупности сортимента (Кр) и его сорта (S), т.е. Ст=f (Р, Кр, S). Этот показатель учитывают при расчетах эффективности проводимых лесохозяйственных мероприятий. Спелость леса и возраст рубки находят, используя связи выхода сортиментов, их стоимости и др. от возраста. Эти примеры можно продолжить.
Все сказанное свидетельствует о том, что в лесном хозяйстве регрессионные методы применяются повсеместно.
Размещено на Allbest.ru
...Подобные документы
Особенности решения линейных и нелинейных уравнений. Характеристика и практическое применение и различных методов при решении уравнений. Сущность многочлена Лагранжа и обратного интерполирования. Сравнение численного дифференцирования и интегрирования.
курсовая работа [799,6 K], добавлен 20.01.2010Изучение способов решения нелинейных уравнений: метод деления отрезка пополам, комбинированный метод хорд и касательных. Примеры решения систем линейных алгебраических уравнений. Особенности математической обработки результатов опыта, полином Лагранжа.
курсовая работа [181,1 K], добавлен 13.04.2010Общий вид системы линейных уравнений и ее основные понятия. Правило Крамера и особенности его применения в системе уравнений. Метод Гаусса решения общей системы линейных уравнений. Использование критерия совместности общей системы линейных уравнений.
контрольная работа [35,1 K], добавлен 24.06.2009Рассмотрение систем линейных алгебраических уравнений общего вида. Сущность теорем и их доказательство. Особенность трапецеидальной матрицы. Решение однородных и неоднородных линейных алгебраических уравнений, их отличия и применение метода Гаусса.
реферат [66,4 K], добавлен 14.08.2009Обзор применения аппарата разностных уравнений в экономической сфере. Построение моделей динамики выпуска продукции фирмы на основе линейных разностных уравнений второго порядка. Анализ модели рынка с запаздыванием сбыта, динамической модели Леонтьева.
практическая работа [129,1 K], добавлен 11.01.2012Решение дифференциальных уравнений с разделяющимися переменными, однородных, линейных уравнений первого порядка и уравнений допускающего понижение порядка. Введение функций в решение уравнений. Интегрирование заданных линейных неоднородных уравнений.
контрольная работа [92,7 K], добавлен 09.02.2012Классификация гиперболических уравнений в общей классификации уравнений математической физики. Классификация уравнений: волновое, интегро-дифференциальные, уравнение теплопроводности. Методы решения в зависимости от видов гиперболических уравнений.
контрольная работа [249,3 K], добавлен 19.01.2009Методы решения нелинейных уравнений: касательных и хорд, результаты их вычислений. Алгоритм и блок схема метода секущих. Исследование характерных примеров для практического сравнения эффективности рассмотренных методов разрешения нелинейных уравнений.
дипломная работа [793,2 K], добавлен 09.04.2015Выполнение действий над матрицами. Определение обратной матрицы. Решение матричных уравнений и системы уравнений матричным способом, используя алгебраические дополнения. Исследование и решение системы линейных уравнений методом Крамера и Гаусса.
контрольная работа [63,2 K], добавлен 24.10.2010Основные понятия теории систем уравнений. Метод Гаусса — метод последовательного исключения переменных. Формулы Крамера. Решение систем линейных уравнений методом обратной матрицы. Теорема Кронекер–Капелли. Совместность систем однородных уравнений.
лекция [24,2 K], добавлен 14.12.2010Знакомство с уравнениями и их параметрами. Решение уравнений первой степени с одним неизвестным, определение множества допустимых значений неизвестного. Понятие модуля числа, решение линейных уравнений с модулем и квадратных уравнений с параметром.
контрольная работа [122,1 K], добавлен 09.03.2011Ознакомление с основами метода Гаусса при решении систем линейных уравнений. Определение понятия ранга матрицы. Исследование систем линейных уравнений; особенности однородных систем. Рассмотрение примера решения данной задачи в матрической форме.
презентация [294,9 K], добавлен 14.11.2014Понятия и решения простейших дифференциальных уравнений и дифференциальных уравнений произвольного порядка, в том числе с постоянными аналитическими коэффициентами. Системы линейных уравнений. Асимптотическое поведение решений некоторых линейных систем.
дипломная работа [395,4 K], добавлен 10.06.2010Система линейных уравнений. Общее и частные решения системы линейных уравнений. Нахождение векторного произведения. Приведение уравнения кривой второго порядка к каноническому виду. Исследование функции на непрерывность. Тригонометрическая форма числа.
контрольная работа [128,9 K], добавлен 26.02.2012Сущность и графическое представление методов решения нелинейных уравнений вида F(x)=0. Особенности метода хорд, бисекции, простой итерации, касательных и секущих. Проверка результатов с помощью встроенных функций и оценка точности полученных значений.
контрольная работа [316,1 K], добавлен 09.11.2010Виды дифференциальных уравнений: обыкновенные, с частными производными, стохастические. Классификация линейных уравнений второго порядка. Нахождение функции Грина, ее применение для решения неоднородных дифференциальных уравнений с граничными условиями.
курсовая работа [4,8 M], добавлен 29.04.2013Понятие и сущность определителей второго порядка. Рассмотрение основ системы из двух линейных уравнений с двумя неизвестными. Изучение определителей n–ого порядка и методы их вычисления. Особенности системы из n линейных уравнений с n неизвестными.
презентация [316,5 K], добавлен 14.11.2014Решение биквадратных, симметричных и кубических уравнений, содержащих радикалы. Решение уравнений четвертой степени методом понижения степени и разложения на множители. Применение бинома Ньютона. Графический метод решения уравнений повышенной степени.
презентация [754,7 K], добавлен 29.05.2010Способы решения системы уравнений с двумя переменными. Прямая как график линейного уравнения. Использование способов подстановки и сложения при решении систем линейных уравнений с двумя переменными. Решение системы линейных уравнений методом Гаусса.
реферат [532,7 K], добавлен 10.11.2009Параллельные методы решения систем линейных уравнений с ленточными матрицами. Метод "встречной прогонки". Реализация метода циклической редукции. Применение метода Гаусса к системам с пятидиагональной матрицей. Результаты численного эксперимента.
курсовая работа [661,7 K], добавлен 21.10.2013