Кластерный анализ разработки современных алгоритмов обработки данных

Особенность использования кластерного анализа в аппаратном обеспечении. Изучение основных видов кластеров. Формирование результатов поиска на основе группировки при поиске файлов и веб-сайтов. Проведение исследования интерфейса программы Statistica.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 31.03.2019
Размер файла 148,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ФГБОУ ВО «Владивостокский государственный университет

Кластерный анализразработки современных алгоритмов обработки данных

Сенкальский Р.А.

Когда информационные технологии и огромный поток информации увеличивается в обществе постоянно, тогда для обработки данных требуются новые методы, одним из которых является кластерный анализ. Кластерный анализ - это многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, а также упорядочивания объектов в сравнительно однородные группы [1]. Кластерный анализ применяется во многих сферах, таких как медицина, биология, маркетинг, социология и т.д. Задачами кластерного анализа является классификация и типология объектов, исследование объектов на предмет полезности концептуальных схем, исследование данных на присутствие типовых данных, выделенных каким-либо способом. Целью кластерного анализа является разбиение на группы схожих объектов для исследования данных из кластерной структуры.

Рассмотрим примеры применения кластерного анализа. Одним из способов применения кластерного анализа является его использование в аппаратном обеспечении. Кластер - это группа компьютеров, объединенных высокоскоростными каналами связи, представляющая с точки зрения пользователя в единый аппаратный ресурс [2]. Другими словами, это группа нескольких вычислительных систем выполняющие общие действия, которые представляются единой системой. Данная группа обычно состоит из нескольких компьютеров, связанных между собой, при этом используется как единый ресурс. кластерный аппаратный файл интерфейс

Существуют следующие виды кластеров:

? Отказоустойчивые кластеры (High-availabilityclusters, HA, кластеры высокого уровня)

? Кластеры с балансировкой нагрузки (Loadbalancingclusters)

? Вычислительныекластеры (High performance computing clusters, HPC) ? Системы распределенных вычислений[2].

Если анализировать действия кластеров серверов, то чаще всего она функционируют на раздельных компьютерах, что позволяетповышает производительность за счет распределения нагрузки на аппаратные ресурсы и обеспечивает отказоустойчивость на аппаратном уровне. Основной принцип, используемый при организации кластера сервера, на уровне программного протокола, это исполнение на одном аппаратном обеспечении по нескольку программных серверов. Такое использование может быть востребовано:

? при разработке и тестировании кластерных решений;

? при необходимости обеспечить доступность кластера только с учётом частых изменений конфигурации серверов - членов кластера, требующих их перезагрузки (перезагрузка производится поочерёдно) в условиях ограниченных аппаратных ресурсов [2]. В качестве примеров применения кластера можно привести использование такого программного обеспечения как: Google, Yandex, Youtube, 1C, ORACLE, CISCO, MS SQL.

Рассмотрим второй пример использование кластеризации на решении задач на поиск информации по заданным параметрам. Результаты поиска формируются на основе группировки при поиске файлов, веб-сайтов, тем самым показывая один из приемов кластерного анализа обработки данных. Данный метод представляет пользователю использование быстрого поиска из набора заведомо известных подмножеств и исключения заведомо менее релевантного, что повышает использование интерфейса по сравнению с использование простого сортированного списка. Для кластеризации поиска можно использовать следующее программное обеспечение:

? поисковая машина компании Vivнsimo - Clusty;

? российская поисковая система - Nigma;

? облачная - Quintura.

Кластерный анализ обработки данных может быть использован в области цифрового изображения, когда цифровое изображение разбивается на отдельные области с целью распознавания объектов или с целью обнаружения границ. Также одна из областей изучения информатики является интеллектуальный анализ данных. В ходе решения задач анализа данных, которые в основном применяются в решении экономических, математических, статистических задач, также применяется кластерный анализ обработки данных. В решении таких задач наилучшим вариантом является выделение группы объектов, которые схожи для аналитического решения, изучить особенности выделенной группы, построить отдельную модель, чем решать задачу для всех данных. Примером такой задачи может быть анализ в области маркетинга, когда необходимо разработать единую стратегию для товаров, клиентов, покупателей.

Рассмотрим третий пример кластерного анализа на примере нейронных сетей.

STATISTICA - современная, мощная и чрезвычайно быстрая среда по созданию нейросетевых моделей, а также является нейросетевым программным продуктом, который был переведен на русский язык и появилась эта программа в 1984 году и разрабатывается до сих пор. Данный программный продукт STATISTICA Automated Neural Network (SANN) это один из самых передовых и эффективных нейросетевых продуктов на рынке. В этом программном продукте используются уникальные инструменты автоматического нейросетевого поиска, автоматизированной нейронной сети (АНС), легкая в использовании как для новичков, так и для экспертов в области нейросетевых вычислений [3]. В данной программе можно выбирать данные, выполнять кодирование номинальных значений, а также решать задачи временных рядов и выполнять регрессию. Используя инструмент автоматического нейросетевого поиска Автоматизированные нейронные сети (АНС) пользователь пройдет все этапы создания нейронных сетей и выберет наилучший вариант, тем самым подтверждая простоту и аналитическую мощность данного программного продукта. Достоинством программы является поддержка ассамблеи нейросетей и нейросетевых архитектур практически неограниченного размера. Еще одно достоинство это огромное количество графических и статических возможностей, которые облегчают интерактивный исследовательский анализ. Программа поддерживает загрузки и анализ нескольких моделей, а также имеет опциональную возможность генерации исходного кода на языках С, С++, С#, Java, PMML (Predictive Model Markup Language), которая может быть легко интегрирована во внешнюю среду для создания собственных приложений, интерфейс представлен на Рисунке 1 [3].

Рисунок 1. Интерфейс программы STATISTICA.

Современный человек уже не можем представить себе жизнь без Интернета (т.е. без работы кластера в аппаратном обеспечении). Кроме планирования, моделирования и расчетов, кластерный анализ применяется при создании нейронных сетей, например в экономической деятельности, когда необходимо проанализировать количество данных в конкретных ситуациях, как анализ рынка ценных бумаг, анализ и прогноз курса валют, оценить оптимальное распределение ресурсов и т.п. Кластерный анализ в области искусственного интеллекта проникает в нашу повседневную жизнь, в виде интеллектуальных помощников, которые решают различные задачи в быту («умные» домашние приборы), на производстве («умные» машины). В эпоху информатизации кластерный анализ получил широкое применение не только в научной среде, но и в обычной жизни.

Размещено на Allbest.ru

...

Подобные документы

  • Исследование производительности труда методом компонентного и кластерного анализов. Выбор значащих главных компонент. Формирование кластеров. Построение дендрограммы и диаграммы рассеивания. Правила кластеризации в пространстве исходных признаков.

    лабораторная работа [998,9 K], добавлен 25.11.2014

  • Методы анализа данных, применяемые в диагностике. Кластерный анализ, иерархическая группировка. Система статистического анализа, язык программирования, интерфейс для связи. Установка для контроля сварных соединений. Векторы классификации для измерений.

    дипломная работа [769,3 K], добавлен 03.01.2014

  • Общее описание программы Statistica. Архитектура и интерфейс системы. Регрессионный анализ в Statistica. Решение задачи регрессионного анализа с помощью пакета анализа данных табличного процессора MS Excel. Многомерный дисперсионный анализ в SPSS.

    курсовая работа [2,4 M], добавлен 22.01.2013

  • Проведение исследования опыта взаимодействия в сети. Методы улучшения согласования с пользователем web-сервиса. Особенность проектирования онлайн-приложения. Изучение разработки контроллеров и моделей. Характеристика создания интерфейса программы.

    дипломная работа [1,3 M], добавлен 11.08.2017

  • Характеристика алгоритмов и программных реализаций поведения агентов в двумерной среде. Исследование разработки структур данных и знаний. Особенность создания интерфейса и карты лабиринта. Экспериментальное тестирование и отладка модулей программы.

    дипломная работа [2,4 M], добавлен 12.08.2017

  • Разработка блок-схемы и программы обработки одномерного массива с доступом к элементам с помощью индексов и с помощью указателей. Словесное описание алгоритма и пользовательского интерфейса, листинг программы обработки матрицы и результат её выполнения.

    курсовая работа [391,1 K], добавлен 30.09.2013

  • Изучение применяемых в программировании и информатике структур данных, их спецификации и реализации, алгоритмов обработки данных и анализ этих алгоритмов. Программа определения среднего значения для увеличивающегося количества чисел заданного типа.

    контрольная работа [16,0 K], добавлен 19.03.2015

  • Характеристика форматов файлов wav и mp3. Построение диаграмм прецедентов, разработка графического интерфейса и архитектуры приложения. Разработка алгоритмов работы программы: метод TrimWavFile, TrimMp3, ChangeVolume, speedUpX1_2, speedDownX1_2.

    курсовая работа [2,7 M], добавлен 20.12.2013

  • Общая характеристика организации массива в виде двоичного дерева. Особенности линейного и двоичного поиска заданного элемента массива. Методика упорядочения массива методом сортировки деревом. Инструкции и текст программы для нечисленной обработки данных.

    курсовая работа [242,3 K], добавлен 12.11.2010

  • Проектирование структуры и архитектуры программного продукта. Реализация программы конвертера файлов баз данных. Описание пользовательского интерфейса. Выбор порядка конвертации dbf файлов. Создание и исполнение шаблонов. Расчет себестоимости продукта.

    дипломная работа [2,2 M], добавлен 21.06.2013

  • Исследование проблемы сравнения звуковых файлов и определение степени их схожести. Сравнение файлов с использованием метода нечеткого поиска, основанного на метрике (расстоянии) Левенштейна. Сравнение MIDI-файлов и реализация алгоритмов считывания.

    курсовая работа [2,0 M], добавлен 14.07.2012

  • Создание программы, которая позволяет пользователю задавать произвольную директорию, содержащую музыкальные файлы. Осуществление поиска или рекурсивного поиска файлов в этой директории и формирование csv-файла. Исправление тегов в музыкальных файлах.

    курсовая работа [241,3 K], добавлен 13.02.2015

  • Общие сведения в области формирования контрольной суммы и проверки кластеров. Основные элементы в файловой системе Windows и их взаимодействие. Разработка программы для подсчета и проверки контрольной суммы кластеров, тестирование и обработка результатов.

    курсовая работа [1,3 M], добавлен 25.04.2011

  • Ознакомление с основами программного пакета Statistica. Описание статистики и графики. Группировка данных, корреляции, методы множественной регрессии. Рассмотрение набора непараметрических статистик. Реализация дисперсионного и ковариационного анализа.

    контрольная работа [544,5 K], добавлен 09.06.2015

  • Описание документов, на основании которых ведется разработка. Назначение разработки и анализ функций проектируемого программного средства. Этапы разработки программы для поиска и открытия файлов. Руководство для пользователя на разработанную программу.

    курсовая работа [3,3 M], добавлен 10.11.2010

  • Особенность разработки алгоритмов для базы данных "Поэты". Анализ реализации анимации с помощью многофункциональной кроссплатформенной библиотеки SFML. Характеристика схемы алгоритма работы меню. Осуществление запуска программы через VisualStudio.

    курсовая работа [4,4 M], добавлен 10.05.2019

  • Классификация систем управления базами данных. Выбор операционной системы, языка программирования, среды разработки (IDE) и дополнительных компонент. Разработка интерфейса и функций программы по управлению складом, её тестирование и исходный код файлов.

    курсовая работа [487,3 K], добавлен 25.12.2015

  • Методы реализации алгоритмов сортировки и алгоритмов поиска на языках программирования высокого уровня. Программирование алгоритмов сортировки и поиска в рамках создаваемого программного средства на языке Delphi. Создание руководства пользователя.

    курсовая работа [1,7 M], добавлен 16.04.2012

  • Суть выбора редактора для создания коммерческого сайта. Формирование интерфейса взаимодействия пользователя с системой. Изучение основных языков проектирования. Особенность тестирования программных средств. Анализ разработки сопроводительных документов.

    отчет по практике [2,4 M], добавлен 20.05.2017

  • Изучение информационной базы клиента "Управление торговлей". Выбор и изучение платформы для построения сайта. Выбор технологии и среды разработки. Разработка основных алгоритмов решения задач и хранения данных. Проектирование интерфейса пользователя.

    дипломная работа [1,1 M], добавлен 20.05.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.