Работа с программой "Statistica"

Исследование функций ввода. Установка программы статистических вычислений. Изучение основных процедур. Анализ параметров распределения. Расчет линейной регрессии. Построение кластерной графической формы. Факторная методика принципиальных компонент.

Рубрика Программирование, компьютеры и кибернетика
Вид лабораторная работа
Язык русский
Дата добавления 19.09.2015
Размер файла 50,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Графическое изображение корреляционной матрицы можно получать также, используя другие пути. Например, с помощью пункта “GRAPH” в основном меню на верхней панели экрана, либо применяя кнопки на панели инструментов. Для примера попробуем кнопку на стандартной панели инструментов с изображением S. Нажав на нее с помощью клавиши мыши, появится падающее меню, из которого подвести стрелку и высветить Matrix Scatterplot. Автоматически появится подменю этой процедуры, из него стрелкой высветить Pair wise MD и щелкнуть левой клавишей мыши. Появится диалоговое окно с предложением выбрать переменные для графиков. Нажмите на кнопку “Переменные”, в появившемся новом окне на кнопку “Select all” для поля “first list” и то же для поля “second list”, затем кнопку “ОК”. В вернувшемся диалоговом окне нажмите “ОК” для выполнения анализа. Появится окно с многочисленными графиками, показывающими гистограммы распределения как отдельных переменных по краю матрицы, так и графики корреляционной зависимости между двумя переменными.

Другой путь выполнения корреляционного анализа можно проделать, вернувшись к начальному меню с основными процедурами (STATISTICA Module Switcher). Здесь выбрать Basic statistics/tables, а в появившемся его меню - Correlation matrices. Появится диалоговое окно “Person Product - Moment Correlation“. Так же, как и в процедурах, описанных выше, выберете переменные для анализа. Затем в поле “Display” отметьте стрелкой и щелчком мыши Corr matrix. Для выполнения анализа нажимаем кнопку Correlations и “ОК”. Появится результирующая таблица с корреляционной матрицей. Значимые значения коэффициентов корреляции будут отмечены красным цветом.

3.5 Регрессионный анализ (Linear Regression - линейная регрессия)

Система предоставляет статистические процедуры, соотносящие зависимую переменную одной или нескольким независимым переменным.

Для примера исследуем модель y = a + х (где y- зависимая переменная, х - независимая переменная, - коэффициент к независимой переменной, а - свободный член уравнения). Результатом анализа должно быть получение значений а и . В начальном меню “Statistica Module Switcher” выбираем (стрелкой и щелчком мыши) строку Linear Regression и нажимаем кнопку “Switch To”. Раскрывается диалоговое окно процедуры Multiple Regression. Данная процедура позволяет исследовать связь между одной зависимой переменной и одной или более независимыми переменными. Для выбора переменных нажимаем кнопку “Variables”. В появившемся новом окне заполняем поля: 1) Dependent var (зависимая переменная) - сюда вводится одна переменная из представленного выше списка; 2) Independent variable (независимая переменная) - сюда можно также из списка выбрать стрелкой мыши одну переменную; если же необходимо ввести несколько независимых переменных, то курсор устанавливается в это окошко и с клавиатуры набираются номера переменных, представленных в списке, используя между ними пробел. После заполнения полей нажимаем кнопку “ОК”. При этом возвращается прежнее диалоговое окно, но в нем уже заполнены имена переменных. Для выполнения анализа нажимаем кнопку “ОК”. Появится окно с результатом регрессионного анализа.

Для составления уравнения регрессии используйте значения beta к независимым переменным и свободного члена уравнения - Entercept. Уравнение множественной регрессии при этом принимает вид y = a + x1+ x2 +...xn. Далее вы можете подставлять в это уравнение любые значения х для получения величины y.

3.6 Кластерный анализ (Cluster Analysis)

Процедура позволяет сгруппировать измерения в блоки “одинаковых точек”. Её можно использовать для группирования различных переменных или объектов. Результаты группирования могут быть представлены в графической и таблитчатой форме.

3.6.1 Графическая форма кластерного анализа

В начальном меню “Statistica Module Switcher” выбираем (стрелкой и щелчком мыши) строку “Clustering Method и нажимаем кнопку “Switch To”. Появится меню Clustering Method, из которого стрелкой и щелчком мыши выбираем Joining (tree Clustering) - классификационное дерево, затем нажимаем “ОК”. Появится диалоговое окно этой процедуры. Для выбора переменных нажмем кнопку “Variables”. При необходимости классификационного анализа всех переменных нажимаем кнопку “Select all. Если нужно только несколько переменных, то в поле Select variablesустанавливаем курсор и с клавиатуры набираем цифры, соответствующие номерам этих переменных в представленном в данном окне списке; между цифрами вводятся пробелы. Для возврата в предыдущее окно нажимаем кнопку “ОК”.

Для проведения кластерного анализа необходимо дать команду - что классифицировать. Для этого в окошке Cluster с помощью полоски-прокрутки выбираем либо переменные - Variables (колонки), либо объекты - Cases (ряды). Попробуйте сначала разбить на классы переменные. Для выполнения анализа нажмите “ОК”. Появится новое окно с кнопками-командами разных процедур кластерного анализа. Например, если нажать кнопку Horizontal hierarchical tree plot (горизонтальное иерархическое дерево), то появится результирующая древовидная диаграмма (Tree Diagram). Можно вернуться к этому окну, нажав кнопку “Continue”, и выбрать такую же древовидную диаграмму, но расположенную вертикально (кнопка Vertical icicle plot").

Вид древовидной диаграммы можно поменять также в окне с результирующими командами кластерного анализа. Для этого надо пометить одно из окошек: Restangular branchers или Scale tree to dlink/dmaxx 100”. Посмотрите результат сначала одной, потом другой команды.

Для кластерного анализа объектов (рядов) повторите все процедуры с начала диалога Joining (tree Clustering) . Только теперь в окошке “Cluster” с помощью полоски-прокрутки выбираем Cases. Далее выполняйте уже описанные команды.

3.6.2 Кластерный анализ с заданным количество классов (таблитчатая форма)

В начальном меню “Statistica Module Switcher” выбираем (стрелкой и щелчком мыши) строку “Clustering Method и нажимаем кнопку “Switch To”. Появится меню Clustering Method, из которого стрелкой и щелчком мыши выбираем K-Means Clusteringи нажимаем “ОК”. Появится диалоговое окно этой процедуры, в котором необходимо ввести различные условия для анализа. Как и в предыдущих процедурах, нажав кнопку “Variables”, выбираете переменные, которые необходимо классифицировать (или с помощью которых будут классифицироваться объекты). В качестве примера выберете все, нажав кнопку “Select all”. Команда “ОК” вернет вас к предыдущему диалоговому окну. Следующее окошко для заполнения - “Cluster. Здесь с помощью прокрутки можно автоматически поместить предлагаемые варианты: либо cases (rows) - классификация объектов, либо Variables (columns) - классификация переменных. В окошке Number of clusters установить мышью курсор и с клавиатуры ввести цифру - количество классов, на которые вы хотите разбить данные (предположим - 3). В окошке Missing data (задача) оставим “Casewise deleted”. После заполнения окошек нажмите “ОК”.

Появится результирующее диалоговое окно “K-Means Clustering . В верхней его части высветятся условия, которые вы вводили для классификации, а в нижней будут расположены кнопки-команды различных процедур. Для получения таблиц с членами каждого класса нажмите кнопку “Members of each. . .”. Появятся несколько наложенных друг на друга окон с результирующими таблицами, отдельными для каждого класса. В них будут заголовки с номером класса, перечислены члены класса и даны расстояния, их объединяющие. Если данные таблицы не вмещаются в окне, то на полях будут присутствовать полоски-прокрутки для просмотра. Как просмотреть следующие наложенные друг на друга таблицы или переместить их в другое место экрана для одновременного просмотра описывалось в разделах Инструкции 2.3.5, 2.3.6.

3.7.Факторный анализ (Factor Analysis) с использованием метода принципиальных компонент

Процедура классифицирует данные с выделением принципиальных компонент исследуемых переменных, полученных с использованием самих переменных и матриц корреляции и ковариации.

В начальном меню “Statistica Module Switcher” выбираем (стрелкой и щелчком мыши) строку “Factor Analysis и нажимаем кнопку “Switch To”. Появится диалоговое окно этого анализа. Нажмите кнопку “Variables” для выбора переменных. Для примера выберете все, нажав кнопку “Select all”(если вам нужно только несколько переменных, выберете их так же, как описывалось в предыдущем разделе). Для перехода к предыдущему диалоговому окну нажмите “ОК”. Здесь теперь уже будут введены переменные для анализа. Нажмите в этом окне “ОК” и появится окно выбора метода факторного анализа “Define Method of Factor Extraction”. В поле “Extraction Method” отмечаем стрелкой и щелчком мыши “Principal component”. В окошке “Maximum no of factors” вводим цифру, соответствующую количеству факторов, которые вы хотите задать для анализа (для этого мышью или “таб.” помещаем курсор в окошко, стираем ненужное и набираем цифру с клавиатуры). В окошке “Minimum eigenvalue” также вводим 0 - тогда количество факторов будет определяться по цифре, заданной в предыдущем окошке. Для выполнения процедуры нажимаем “ОК”. Появится результирующее диалоговое окно “Factor Analysis Results”, в верхней части которого будут показаны заданные нами условия проведения анализа, а в нижней - кнопки команды различных процедур. В поле “Explained variance” нажмите кнопку “eigenvalues”. Появится таблица, в которой в графе “ % total variance” можно посмотреть вес (в %) каждого заданного фактора. Вернемся к результирующему диалоговому окну и в поле “Factor loadings” (факторные нагрузки) нажмите кнопку “Factor loadings”. Появится таблица с факторными нагрузками каждого признака, в которой столбцы будут заканчиваться значениями Expl. Var (сумма факторных нагрузок всех признаков) и Prp Totl (вес каждого фактора, который уже указывался в предыдущей таблице, но в %). Вернемся к результирующему диалоговому окну и нажмем кнопку-команду “Factor scores”. Появится таблица со значениями каждого фактора для исследуемых объектов.

Для графического изображения и классификации признаков можно выполнять команды результирующего диалогового окна “Plot of loadings, 2D” или “Plot of loadings, 3D”. В первом случае получается результирующая таблица с группированием признаков в пространстве двух факторов, во втором в трехмерном пространстве факторов. Если вы при выполнении начальной процедуры факторного анализа задали количество факторов, большее, чем нужно для графика, то автоматически появится диалоговое окно, в котором нужно ввести номер фактора по осям x, y и, если нужно z.

ЗАКЛЮЧЕНИЕ

Описанные процедуры статистического анализа далеко не исчерпывают возможности «Statistica». Выбранные анализы соответствуют программе лабораторных занятий по курсу «Математические методы моделирования в геологии». Простота изложения материала дает возможность самостоятельной работы студентов. При необходимости можно использовать все процедуры программы «Statistica», руководствуясь более полными стандартными инструкциями.

Настоящее методическое пособие может быть применено при написании курсовых, дипломных работ и проектов, а также в научно-исследовательской работе студентов и аспирантов.

Размещено на Allbest.ru

...

Подобные документы

  • Проверка наличия линейной связи между соответствующими показателями деятельности коммерческих банков Украины в модуле Multiple Regression ППП Statistica. Расчет теоретических значений зависимой переменной и ошибки модели, вид графика линейной функции.

    лабораторная работа [1,5 M], добавлен 19.05.2011

  • Создание приложения для вычисления значений функций и определение суммы этих функций: эскиз формы, таблица свойств объекта, список идентификаторов и непосредственные коды процедур. Результаты вычислений и выводы, проверка работы данной программы.

    лабораторная работа [19,9 K], добавлен 20.10.2009

  • Основные элементы окна программы MathCAD. Выполнение операций с файлами, редактирование, настройка программы. Способы ввода и редактирования в рабочем поле окна программы. Задание на рабочей области необходимых функций и матриц, выполнение вычислений.

    контрольная работа [18,0 K], добавлен 11.09.2019

  • Ознакомление с интерфейсом программы схемотехнического проектирования и моделирования MC8DEMO. Структура окна программы Micro-cap. Приобретение навыков графического ввода и редактирования электрических принципиальных схем в формате схем Micro-cap.

    лабораторная работа [1,8 M], добавлен 06.12.2012

  • Назначение, классификация и экономическая целесообразность использования устройств ввода текстовой и графической информации. Обзор и сравнительный анализ программ распознавания образов Acrobat Reader и ASDee. Охрана труда при работе на компьютере.

    дипломная работа [4,3 M], добавлен 23.07.2010

  • Ознакомление с основами программного пакета Statistica. Описание статистики и графики. Группировка данных, корреляции, методы множественной регрессии. Рассмотрение набора непараметрических статистик. Реализация дисперсионного и ковариационного анализа.

    контрольная работа [544,5 K], добавлен 09.06.2015

  • Создание макроса на языке Statistica Visual Basic (SVB) для проверки гипотезы о нормальности остатков множественной регрессии. Возможности программирования на языке SVB в пакете STATISTICA. Проверка гипотезы в модели вторичного рынка жилья в г. Минске.

    курсовая работа [573,1 K], добавлен 02.10.2009

  • Разработка программы построения графика экспериментальных точек и полинома регрессии второй степени в среде Turbo Pascal. Блок-схемы алгоритмов используемых процедур. Листинг программы. Составление вектора свободных членов и матрицы коэффициентов.

    курсовая работа [46,6 K], добавлен 24.11.2013

  • Построение перспективной проекции, алгоритм удаления невидимых линий и поверхностей, получения изменений формы и движения объекта. Обобщенная структурная диаграмма программы, предназначение данных и основных переменных. Блок-схема процедур и функций.

    курсовая работа [2,0 M], добавлен 08.02.2011

  • Классификация задач DataMining. Создание отчетов и итогов. Возможности Data Miner в Statistica. Задача классификации, кластеризации и регрессии. Средства анализа Statistica Data Miner. Суть задачи поиск ассоциативных правил. Анализ предикторов выживания.

    курсовая работа [3,2 M], добавлен 19.05.2011

  • Общее описание программы Statistica. Архитектура и интерфейс системы. Регрессионный анализ в Statistica. Решение задачи регрессионного анализа с помощью пакета анализа данных табличного процессора MS Excel. Многомерный дисперсионный анализ в SPSS.

    курсовая работа [2,4 M], добавлен 22.01.2013

  • История развития программы Паскаль. Типы переменных. Значение переменной для прекращения вычислений. Использование операторов цикла, процедур и функций. Ввод значений М-конца цикла и произведение вычислений по расчётной формуле. Форматированный вывод.

    контрольная работа [45,9 K], добавлен 13.07.2013

  • Функции ввода-вывода строк и символов языка Си. Вычисление среднего значения, дисперсии, среднеквадратических отклонений х и у, коэффициента парной корреляции, регрессии двух функций, остаточных дисперсий. Расчет параметров регрессионных зависимостей.

    курсовая работа [421,7 K], добавлен 12.03.2016

  • Анализ и описание алгоритма. Основные характеристики выбранного компьютера, программных сред (операционная система и среда программирования). Описание компонентов и интерфейса программы, а также модулей, процедур и функций. Вызов и загрузка программы.

    курсовая работа [1,3 M], добавлен 26.04.2015

  • Исследование процедуры ввода графического изображения основных компонентов аналоговых электронных схем, с присвоением им определенных параметров и с созданием чертежей принципиальных схем. Принципиальные схемы пассивного фильтра и усилительного каскада.

    лабораторная работа [220,4 K], добавлен 22.10.2015

  • Особенности графики системы MATLAB и ее основные отличительные черты. Построение графика функций одной переменной. Графики в логарифмическом масштабе, построение диаграмм, гистограмм, сфер, поверхностей. Создание массивов данных для трехмерной графики.

    реферат [1,4 M], добавлен 31.05.2010

  • Методика разработки, практической апробации программы в среде Turbo Pascal по построению графика прямой линии регрессии. Формирование блок-схемы данной программы, ее листинг. Построение графика с помощью математических формул и графического модуля Graph.

    контрольная работа [46,2 K], добавлен 22.07.2011

  • Использование программой функции ввода-вывода данных для реализации дружественного интерфейса с пользователем. Функции консоли и особенности их применения для обеспечения аккуратного ввода информации и упорядоченного вывода. Обзор стандартных функций.

    лабораторная работа [40,4 K], добавлен 06.07.2009

  • Вычисление выражений, использование стандартных функций; работа с графикой. Порядок действий при вычислении, способы ввода данных с клавиатуры. Построение таблиц функций. Организация циклов в программе, итерационные процессы. Работа с массивами чисел.

    контрольная работа [614,7 K], добавлен 16.09.2012

  • Использование нестандартных функций и подпрограмм (процедур) для составления алгоритмов вычислений. Программы для вычисления значение корней нелинейного уравнения по методу половинного деления. Составление алгоритма операций над матрицами и интегралами.

    курсовая работа [580,0 K], добавлен 23.08.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.