Исследование ценностных моделей организации методами анализа корпоративных коммуникаций

Внешние коммуникации — информация, которую компания распространяет среди общественности о самой организации, ее продуктах и услугах. Схема работы методов машинного обучения в сентимент-анализе. Нейронная сеть - определенная совокупность алгоритмов.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 18.07.2020
Размер файла 1,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

Введение

Благодаря быстро развивающимся технологиям, организации изменяют свои структуры, увеличивается роль управлением знаниями. В таких условиях становится актуальным вопрос взаимодействия этих людей в организации, как они взаимодействуют, общаются, какие ценности несут в себе. Помимо этого, встаёт вопрос о том, разделяет ли компания, в которой они работают, ценности большинства сотрудников. Как соотносятся коммуникации внутри компании с тем, что компания декларирует на весь остальной рынок?

Потребность бизнеса в лице организаций в изучении этого вопроса понятна - только так можно обеспечить преданность сотрудников, хороший деловой климат, стабильные бизнес-процессы и правильно растущий бизнес, который в долгой перспективе принесёт успех, а не убытки, конфликты и сплошные разочарования.

Потребность работников тоже очевидна - в современном мире большинство людей хочет жить в комфорте, чувствовать уважение к себе и не быть обманутыми. Большую часть времени в 2020 году человек проводит на работе, соответственно для него рамки внутренних коммуникаций имеют чрезвычайно важную роль. Работнику необходимо понимать, как реагировать в том или ином случае, когда организация провозглашает те или иные ценности как основу происходящих бизнес-процессов. В своём исследовании я бы хотел выяснить, как ценности, которые проявляются во внутренних коммуникациях, соотносятся с теми ценностями, которые компания выносит во внешнее информационное поле.

Определим объект исследования как тексты, составляющие внутренние и внешние коммуникации компании. Электронные письма сотрудников отражают внутренние корпоративные коммуникации. Помимо, объектом являются статьи, заметки, интервью руководителей бизнеса как элемент внешней коммуникации. Объектом исследования внешних коммуникаций также являются пресс релизы, информация, которая преподносится от лидеров мнения со стороны компании до всех заинтересованных лиц, таких как клиенты, партнёры, общественность.

Предмет - внутренние и внешние коммуникации сотрудников компании Merck за последние 12 месяцев.

Гипотеза - одни и те же ценности организации во внутренних и внешних коммуникациях проявляются в одинаковой силе.

Цель - исследование семантики контента внутренних и внешних корпоративных коммуникаций для выявления взаимосвязи между ними в разрезе определённого набора ценностей.

Задачи исследования:

1. Анализ важности внутренних и внешних коммуникаций

2. Изучение алгоритмов классификации и обработки естественного языка

3. Выявление ценностей организации

4. Разметка обучающей выборки на предмет соответствия каждой из ценностей

5. Анализ данных и выявление релевантной модели классификации

6. Сопоставление результатов относительных ценностных моделей, выявленных при анализе внутренних и внешних коммуникаций.

1. Теоретические предпосылки исследования

1.1 Ценность внутренних и внешних коммуникаций

Внутренние коммуникации

Под термином «внутренние коммуникации» в данной работе мы будем понимать поддерживающую бизнес-функцию в компаниях, призванную решить стратегические задачи построения эффективной системы взаимодействия между подразделениями и сотрудниками, хотя в общем смысле внутренние коммуникации могут не ограничиваться формальной функцией, нацеленной на решение конкретных бизнес-задач. В первую очередь необходимо понять, в чём заключается ценность внутренних коммуникаций в компании. По мнению [21] Вол Лоусон, бывшего генерального директора Vale Volunteers, которая занималась поддержкой стратегических программ развития Relationship Management в Великобритании, ценность внутренних коммуникаций может заключаться в следующем:

1. Помощь сотрудникам в организации бизнес-процессов

2. Информирование людей, что на самом деле происходит в бизнесе

3. Возбуждение интереса и вовлечённости персонала

4. Повышение эффективности и мотивации персонала

5. Вовлечение людей в то, что делает бизнес

6. Предотвращение различных слухов

7. Вдохновлять людей на «go the extramile»

Помогая людям понять бизнес-концепцию и то, что происходит, правильные коммуникации вовлекают их, вдохновляя их «делать лишнюю работу». Когда происходят организационные перемены, важно дать людям четкую информацию во избежание возникновения слухов. В совокупности эти элементы коммуникации способствуют «вовлечению сотрудников»в рабочий процесс.

Внутренние коммуникации жизненно важны для каждой организации. В настоящее время есть неопровержимые доказательства [21] того, что хорошие связи внутри организаций повышают производительность. Хорошо информированные сотрудники более счастливы и работают более продуктивно, но управлять этим правильно нелегко. Люди на самом верху должны обеспечивать ощутимое руководство в плане их видения, а также формулировать цели своей организации. В это должны быть вовлечены также и линейные руководители, чтобы они могли интерпретировать задачи и цели для своих команд. А специалисты в ходе регулярной рабочей переписки должны взаимодействовать так, что все заинтересованные лица без труда смогли воспользоваться необходимой информацией. Необходима системная работа, позволяющая процессу этому происходить регулярно и последовательно.

Также должны быть выстроены процессы для распространения точной информации и наличие обратной связи. Все эти элементы должны быть объединены для достижения эффективных коммуникаций, которые соотносятся с целями организации. Кроме того, работники становится все более изощренными и проницательными. HR вынужден постоянно вводить новшества, чтобы оказывать максимальное влияние на внутренние коммуникации людей.

В одной из своих статей [14] Лиз Йоманс рассматривала растущую специализацию внутренних коммуникаций в организациях. В ней обсуждались ключевые соображения и навыки внутренних коммуникаторов, помогающие организациям улучшить отношения со своими сотрудниками. Утверждалось, что правильное понимание разнообразия внутреннего климата, а также мотивов коммуникаций и проблем, которые поднимают сотрудники, - является отправной точкой для тщательно спланированного общения. Помимо прочего Лиз писала, что хорошие коммуникационные программы включают в себя выслушивание сотрудников, а также их информирование вместе с обсуждением их роли в оказании помощи менеджерам и руководителям в создании корпоративной культуры, которая позволяет сотрудникам высказывать своё мнение и иметь возможность принимать непосредственное участие в жизни организации.

В другой научно-исследовательской работе [16] Туулюки Пелтонен постарался изучить «феномен организационных ценностей и их внутренней коммуникации» с критической точки зрения. Он описал подход к ценностям в контексте организации, который позволил по-новому взглянуть на тему корпоративного общения. В своей работе он провёл эмпирическое исследование компании, проводящую деятельность в сфере ИТ-консалтинга, в которой работают 750 человек. Данные были собраны из онлайн-опроса и интервью. Главным выводом, который сделал исследователь, стало то, что для современной организации полезно прислушиваться к собственным ценностям людей и позволять людям обсуждать и «создавать новые знания», основанные на их интересах. Укрепление таких качеств, как лояльность и выполнение своих обещаний, рассматривалось как более важное и актуальное, чем продвижение корпоративных ценностей.

Внешние коммуникации

Внешние коммуникации -- это любая информация, которую компания распространяет среди общественности, либо о самой организации, либо о ее продуктах и услугах. Тщательно продуманный коммуникационный план, как правило, не только информирует целевую аудиторию организации, но и направлен на то, как эффективно достичь поставленных целей. Поскольку одними из целей внешних коммуникаций является как продвижение компании и увеличение доходов, так и создание позитивного имиджа компании, этот тип коммуникаций являются важной частью общего маркетингового плана. Рассмотрим каждую задачу по-отдельности.

1. Распространение новостей

В то время как внутренние коммуникации предназначены специально для сотрудников и руководства, внешние направлены на распространение новостей и информации об организации среди населения, клиентов, подрядчиков и всех заинтересованных сторон компании. Типичными примерами внешних деловых коммуникаций являются пресс-релизы, почтовые рассылки, финансовые отчеты и прочее.

2. Определение восприятия общественности

Хотя многие компании ориентируются исключительно на продажи как на показатель успеха в бизнесе, общественное восприятие так же важно для прибыли организации. Коммуникации являются одним из способов формирования и определения имиджа корпорации для партнёров, клиентов и, например, потенциальных инвесторов. Внешние коммуникации, такие как информационные бюллетени, сообщения в прессе и пресс-релизы, позволяют широкой общественности узнать о внутренней жизни компании, благотворительной деятельности, успехах в разработках, достижениях целей и других видах деятельности, связанных с имиджем, и все это способствует укреплению связей организации с общественностью.

3. Привлечение новых клиентов

В то время как традиционные методы печати все еще широко распространены, современные технологии изменили облик внешних коммуникаций, и Интернет стал ценным ресурсом для привлечения новых клиентов. Компании создают веб-сайты, чтобы люди знали о новых продуктах и услугах. Социальные сети, такие как Facebook, Vkontakte, блоги, -- это простой способ достичь целевой аудитории и экономически более эффективно продвигать свои товары и услуги. Тем не менее, с интерактивными технологиями также существует возможность негативной реакции общественности, например, публикации негативных комментариев. Но в долгосрочной перспективе преимущества сильно перевешивают риски, так как технологии являются прогрессивными и позволяют компании сконцентрироваться на качестве предоставляемых товаров и услуг, чтобы заслужить доверие потребителей.

В то время как внешние коммуникации являются единственным способом связи с общественностью, процесс построения подобных коммуникаций не обходится без проблем. Общественное мнение об организации в долгосрочной перспективе может определить факторы успеха, или наоборот, неудачи компании. Единственная неуместная цитата или плохо сформулированный пресс-релиз не только испортят всю долгосрочную стратегию внешних коммуникаций, но также может повлиять на валовый доход. Поэтому ответственный за внешние коммуникации (как правило, это PRmanager) для компании должен знать свою аудиторию, имидж компании и отдавать отчёт, каким ценностям соответствует организация.

В одной из статей [17] Рашида Амера проводилось исследование влияния ценностей компании на внешние коммуникации. В область исследования попали некоторые Новозеландские компании. В статье, помимо прочего, использовались методы «корпусной лингвистики» для изучения влияния ценностей на коммуникации. Результаты показывают, что корпоративные ценности, связанные с социальной тематикой, оказывают положительное влияние на силу коммуникационных стратегий. Новозеландские компании, под влиянием соответствующей общественно-политической системы, формирующей ценности сотрудников, прибегают к соответствующим коммуникациям для того, чтобы «узаконить» некоторые операции с точки зрения одобрения общества и всех заинтересованных лиц.

Сочетание внешних и внутренних коммуникаций

В одной из своих статей [13] Ансгар Зефра спроводил сравнительный анализ внешних и внутренних коммуникаций для выявления того, как их эффективное использование может помочь извлечь дополнительную ценность для бизнеса. Он исследовал создание структуры, которая определяет и систематизирует назначение коммуникаций, связанных с принятыми корпоративными целями. В результате, он определил четыре основных ценностных измерения коммуникации - обеспечение операционной деятельности работникам, создание «нематериальных активов», корректировка корпоративной стратегии и обеспечение гибкости управления.

В статье [15] Рогала Анна провела углубленный анализ взаимозависимостей между коммуникациями внутри и снаружи организации. По её мнению, особое внимание следует уделить: влиянию внутренней коммуникации на различные аспекты функционирования организации; согласованность внутренней и внешней коммуникации, а также взаимозависимости между эффективностью внутренней коммуникации и согласованностью внутренней и внешней коммуникации. В основу статьи были положены главным образом статистический анализ результатов опроса, проведенного по выборке из 1354 респондентов, и качественный анализ данных, полученных в ходе опросов 23 фокус-групп.Анализ корреляций показал, что существуют статистически значимые положительные корреляции между достижением целей внутренней коммуникации в ее конкретных аспектах, а также общей оценкой эффективности внутренней коммуникации и оценкой согласованности комплексных коммуникационных мероприятий. Более того, есть области, в которых низкая оценка согласованности доказывает необходимость принятия соответствующих корректирующих мер. Для действий, предпринимаемых в рамках внутренней маркетинговой коммуникации, основной целью должно быть надлежащее информирование сотрудников о предложении компании. Чтобы завоевать расположение сотрудников, необходимо создать соответствующую рабочую атмосферу и создать положительный имидж среди работников при условии, что это соответствует внешнему имиджу компании. И внутренняя коммуникация, по её словам, играет важную роль в этом процессе.

В одной из своих статей [19] Лесли де Чернатони изучал проявление ценностей через соответствующие бренды. Поскольку бренды услуг представляют собой набор ценностей, он изучал, каким образом ценности передаются как клиентам, так и персоналу (то есть использовались и внешние и внутренние коммуникации). Эта работа была основана на темах, выделенных в ходе глубинных интервью с ведущими консультантами по брендингу услуг. Ценности, как правило, доводятся до потребителей через их опыт взаимодействия с брендом в целом, включая их общение с сотрудниками компании, продвигающей данный бренд, внешние коммуникации бренда и некоторые материальные элементы. Для сотрудников ценности передаются через методы и политики управления персоналом, внутренние и внешние коммуникации бренда и через характер поведения их менеджеров. В ходе исследования выяснилось, что доминирующее влияние на восприятие брендов из сферы услуг оказывает взаимодействие с работниками на рабочем месте. Учитывая это, приоритетом для таких организаций является интерактивная передача ценностей сотрудникам и, следовательно, потребителям, если они хотят оставаться конкурентоспособными на рынке.

Проведенный мной анализ научных публикаций по теме исследования показал, что как внутренние, так и внешние корпоративные коммуникации очень важны для построения эффективных бизнес-процессов, построения и поддержания позитивного имиджа компании. Хотя в изученных научных статьях рассматривалось влияние разных видов коммуникаций на ценностные модели организации, в них не исследовалась разница между внутренними и внешними коммуникациями, исследования носили скорее качественный, эмпирический характер, а математические модели для обоснования результатов не использовались. Вопрос о том, одинаковые ли ценности несут в себе разные типы коммуникаций, остаётся пока открытым. Для получения более точных результатов, с учетом огромного потока информации во внешних и внутренних коммуникациях реальных компаний, необходимо применение автоматизированных методов анализа естественного языка, в том числе, с помощью технологий машинного обучения.

1.2 Алгоритмы сентимент- анализа

В рамках данной работы под понятием корпоративной культуры мы понимаем совокупность моделей поведения сотрудников и организации, которые были приобретены первыми в процессе внутренней интеграции в коллективе, а вторым -- в результате взаимодействия с внешней средой и рынком, которые дают определённый результат с точки зрения эффективности бизнеса. Иными словами, корпоративная культура с точки зрения анализа - набор ценностей. Ценность - некоторая общность, проявляющаяся в текстах через используемые лексические обороты.

Для того, чтобы автоматически выявлять проявления той или иной ценности в потоке коммуникаций, необходимо применять алгоритмы анализа естественного языка (Natural Language Processing - NLP) [2].

Основные типы используемых алгоритмов NLPвключают в себя:

· Системы на основе правил (Rule-based), которые выполняют сентиментальный анализ на основе набора правил, созданных вручную.

· Автоматические системы (Automatic), основанные на методах машинного обучения, для изучения данных.

· Гибридные системы (Hybrid), объединяющие как основанные на правилах, так и автоматические подходы.

Системы на основе правил (Rule-based):

Обычно такие системы использует набор созданных человеком правил, чтобы помочь определить субъективность, полярность или выражение мнения. Эти правила могут включать различные методы, разработанные в компьютерной лингвистике, такие как:

· Стемминг, токенизация, разбор и разметка по части речи (Stemming, tokenization, part-of-speechtagging and parsing).

· Лексиконы (списки слов и выражений) - Lexicons.

Пример того, как работает система на основе правил:

1. Определяет два списка поляризованных слов (например, негативные - плохой, наихудший, неприятный, некрасивыйи пр.; позитивные слова - хороший, наилучший, красивый и пр.)

2. Подсчитывает количество положительных и отрицательных слов, которые появляются в данном тексте.

3. Если количество положительных появлений слова больше, чем количество отрицательных появлений слова, система возвращает положительное значение, и наоборот. Если их сумма в абсолютном выражении равна, алгоритм вернет нейтральное отношение.

Такие системы могут быть не совсем точными, поскольку не учитывают, как слова объединяются в последовательности. Разумеется, можно использовать более продвинутые методы обработки и добавлять новые правила для поддержки новых выражений и словарного запаса. Однако добавление новых правил может повлиять на предыдущие результаты, и вся система может стать очень объёмной. Поскольку системы, основанные на правилах, часто требуют точной настройки и время, на регулярной основе их использование может быть затруднительным или дорогим.

Автоматические системы (Automatic):

Автоматические методы, в отличие от систем, основанных на правилах, опираются не на правила, которые были созданы вручную, а на предопределённые методы машинного обучения. Задача сентиментального анализа обычно моделируется как классификатор, при которой он получает текст и возвращает категорию, например, как и в предыдущем пункте, положительный, отрицательный или нейтральный.

Как схематически это может работать (Рис1):

Рис 1. Схема работы методов машинного обучения в сентимент-анализе

Процесс обучения и прогнозирования:

В процессе обучения - training (а) наша модель учится связывать конкретный ввод (текст) с соответствующим выводом (тегом) на основе тестовых данных, используемых для обучения. Экстрактор объектов преобразует текст в вектор объектов. Пары таких векторов и тегов (например, положительный, отрицательный или нейтральный) вводятся в алгоритм машинного обучения для создания модели.

В процессе прогнозирования - prediction (b) механизм создания признаков используется для преобразования невидимых текстов в векторы признаков. Затем эти векторы признаков подставляются в модель, которая генерирует теги, предсказанные на модели (такие же, как и были в обучении - положительные, отрицательные или нейтральные).

Первым шагом в классификаторе текста машинного обучения является преобразование текста в вектор, где происходит«bag-of-words» или «bag-of-ngrams» с их частотой.

Совсем недавно были применены новые методы извлечения признаков, основанные на встраивании слов (также известные как векторы слов) [22]. Этот вид представлений позволяет словам с одинаковым значением иметь одинаковое представление, что может улучшить качество классификаторов.

Гибридные системы (Hybrid):

Гибридные системы объединяют элементы первого и второго методов в одну систему. Одним из огромных преимуществ этих систем является то, что результаты часто являются более точными, но реализация бывает более сложная.

Вывод:

В этом разделе были описаны типы используемых алгоритмов анализа естественного языка и кратко рассмотрены наиболее популярные алгоритмы классификации, о которых пойдёт речь в следующих разделах.

1.3 Алгоритмы классификации

Для того, чтобы оценить, насколько та или иная коммуникация несёт в себе ту или иную ценность, необходимо использовать модель, которая бы на вход подавала текст, а на выходе выдавала принадлежность к этой ценности. Для задач подобного класса используют классификаторы.

Классификация -- это процесс прогнозирования класса заданных объектов данных. Классы иногда называют таргетами, лэйблами или категориями. Классификация (прогностическое моделирование с использованием разделения на классы) -- это задача приближения функции отображения (f) от входных переменных (X) к дискретным выходным переменным (y).

Например, задача обнаружения какой-либо ценности в переписке по электронной почте может рассматриваться как проблема классификации. Этот тип можно назвать бинарной классификацией, в случае, когда мы считаем, что существует только 2 класса: ценность представлена в тексте письма или ценность отсутствует в тексте письма. Классификатор использует некоторые обучающие данные, чтобы понять, как заданные входные переменные относятся к классу. Когда классификатор обучен с высокой точностью, его можно использовать для обнаружения какой-либо ценности в коммуникации. Также мы можем использовать классификаторы, где на выходе не только «да» и «нет», но и названия (метки) самого класса.

Классификация относится к категории обучения с учителем, где объясняемые переменные также обеспечиваются входными данными.

Алгоритмы классификации:

Классификация обычно включает в себя статистическую модель, такую как наивный Байесовский классификатор, логистическая регрессия, SVM или нейронные сети:

1. Naпve Bayes: семейство вероятностных алгоритмов, использующее теорему Байеса для прогнозирования категории текста.

2. Line arregression - Линейная регрессия: один из самых распространённых алгоритмов в статистике, используемый для прогнозирования некоторого значения (Y) с учетом набора признаков (X). Хоть в общем виде это регрессионный алгоритм, в частности он часто используется как классификатор.

3. SVM (Support vector machines - Машины опорных векторов): модель, которая использует представление текстовых примеров в виде точек в многомерном пространстве. Примеры разных категорий сопоставляются с различными подпространствами в этом пространстве. Затем новым текстовым векторам присваивается класс на основе сходства с существующими текстами и подпространствами, в которые они входят.

4. Deep machine learning - Глубокое обучение (нейронная сеть): разнообразный набор алгоритмов - имитация работы человеческих нейронов. Использует искусственные нейронные сети для обработки данных.

5. LDA (Latent Dirichlet allocation - Латентное размещение Дирихле)

В следующие подразделах данные алгоритмы будут описаны поподробнее.

Наивный байесовский классификатор -- это вероятностная модель машинного обучения, которая используется для задачи классификации. Суть классификатора основана на теореме Байеса.

(1)

Используя теорему Байеса, мы можем найти вероятность того, что событие A произошло, учитывая, что событие B также произошло. В таком случае, B является признаком, а A является гипотезой. Предположение, которое сделано здесь, состоит в том, что предикторы независимы. То есть наличие одной конкретной функции не влияет на другую. Следовательно это называется наивным.

Следует рассмотреть пример. Мы классифицируем, подходит ли конкретная рассматриваемая коммуникация для отнесения её в определённой ценности, учитывая некоторые особенности предложения. Если представить данные в виде таблицы, столбцы представляют собой эти функции, а строки -отдельные записи. Если мы возьмем, например предложение, в котором сказано, что «оставайтесь на том же уровне развития» мы увидим, что оно не относится к ценности «стремление к успеху» по некотором семантическим характеристикам. Здесь мы делаем два предположения: одно, как указано выше, что эти предикторы независимы. То есть, есть слово «оставайтесь», то оно не связано со словом «развитие». Другое предположение, сделанное здесь, заключается в том, что все предикторы оказывают одинаковое влияние на результат. То есть, слово «развитие» влияет также, как и слово «уровень».

Соответственно, в данном случае мы можем представить Байесовскую теорему, как функцию:

(2)

где y - класс классификатора (является ли ценностью или нет), а

- набор слов.

Соответственно для нас X - слова, в частном случае могут быть лексемы (наборы слов), которые вместе могут образовать какую-то ценность.

Преобразовав выражение, получаем

(3)

Получив значение для каждого объекта, можно их подставить в уравнение. Знаменатель для каждой из записей не изменится, значит он может быть удалён при введение следующей пропорциональности

(4)

В нашем случае переменная класса (y) имеет только два результата: да или нет. Хотя, как уже писалось ранее, могут быть случаи, когда классификация может быть многомерной. Поэтому нам нужно найти класс y с максимальной вероятностью.

(5)

Соответственно, используя эту функцию, мы можем определить принадлежность к классу.

Наивные байесовские алгоритмы в основном используются в анализе настроений, фильтрации чего бы то ни было, рекомендательных системах и т. д. Они быстры и просты в реализации, но их основным недостатком является требование независимости предикторов. В большинстве реальных случаев предикторы являются зависимыми, что снижает производительность классификатора. Хотя в данном случае, если мы будем рассматривать простые предложения, в которых будет мало связанных слов, этот метод может быть релевантным.

Следующим из рассматриваемых алгоритмов - решающее дерево. Дерево принятия решений (Decisiontree) - метод построения модели, в листьях которого стоят значения целевой функции, а в узлах условия перехода для определения по какому из рёбер идти далее [26]. Как правило, при истинном значении некоторого условия переход происходит в левую сторону, при отрицательном - в правую. Максимальная длинна пути одного алгоритма называется глубиной дерева. Деревом решений у данного метода является строго ориентированный граф без петель.

В качестве использования одного дерева или нескольких деревьев применяются следующие методы:

· CART (используется всего одно дерево)

· Random Forest (используется ансамбль деревьев)

· Stochastic Gradient Boosting (используется также несколько деревьев)

Далее рассмотрим каждый метод отдельно:

CART (Classification and regression trees - Классификационные и регрессионные деревья):

Алгоритм состоит в базовом построении дерева. В узле для каждого признака проводится гиперплоскость, которая логически делит признаки на два множества, вплоть до достижения максимальной глубины дерева. Подобный метод более применим к задачам классификации, но может использоваться в частном случае и для регрессии. В задачах классификации данный алгоритм использует индекс Gini для оценки расстояния между классами.

(6)

где - вероятность класса j в узле c.

Преимуществами такого метода можно считать быстрое построение модели и относительно лёгкую интерпретацию исходя из узлов и рёбер дерева. Недостатками же низкая точность и возможная сходимость к локальным решениям.

Random Forest (Случайный лес):

В основе алгоритма случайного леса лежит использование ансамбля деревьев принятия решения. Как правило, выборка делится на части: две третьих и одна третья. Первая отвечает за обучение, вторая - за тест. Эта операция происходит много раз, и итоговая модель получается, исходя из «голосования» набора деревьев, полученных при обучении.

Преимуществом является высокий результат и, соответственно, низкая ошибка. Особенно это актуально для случаев, где большое количество признаков, но малое количество объектов. Также для применения случайного леса не требуется выделение тестовой и обучающей выборки. В качестве недостатков следует выделить высокое время построение модели и сложность интерпретации каждого из деревьев ввиду их большого количества.

Stochastic Gradient Boosting (Стохастическое градиентное добавление):

Стохастическое градиентное добавление является методом построения «слабых» предсказывающих деревьев принятия решений. На первом этапе строится фактически случайное дерево, на втором - вычисляется разность между предсказанием дерева, умноженные на коэффициент слабости и самой целевой переменной на конкретном шаге. Иными словами, выполняется равенство . Таким образом, каждый следующий шаг пытается исправить ошибки, которые были получены при построении предыдущего дерева. Как и для всех градиентных методов, операция будет производиться до тех пор, пока улучшение (разность) не будет стремиться к нулю.

Преимуществом так же, как и в предыдущем методе, можно считать высокое качество обучения, но уже при меньших размерах модели (ввиду заданного ограничения глубины дерева). Соответственно, ввиду меньшего размера, происходит более быстрое обучение модели. К недостаткам следует отнести сложную интерпретацию и необходимость задания тестовой и обучающей выборки. Кроме того, данный метод не слишком устойчив к шумовым данным и переобучению [23].

Алгоритмы классификации. K-ближайших соседей

Алгоритм k-ближайших соседей (KNN) представляет собой простой, легко реализуемый алгоритм машинного обучения с учителем, который можно использовать для решения как задач классификации, так и регрессии [24].

Алгоритмы машинного обучения с учителем (в отличие от алгоритмов машинного обучения без учителя) -- это те, которые опираются на соответствующие входные данные для изучения функции, которая имеет соответствующую объясняемую переменную (y) при получении новых данных, которых нет в тренировочной выборке.

Алгоритм KNN предполагает, что схожие вещи существуют в непосредственной близости. Другими словами, похожие вещи находятся рядом друг с другом в каком-либо из пространств.

Рис. 2. Графическая интерпретация KNN

коммуникация машинный нейронный алгоритм

Необходимо обратить внимание (Рис. 2), что в большинстве случаев схожие точки данных находятся близко друг к другу. Целесообразность алгоритма KNN основана на том, что предположение о близости в пространстве достаточно верно. KNN отражает идею сходства (иногда называемую расстоянием или близостью) в геометрическим смысле. Хотя, существуют и другие способы расчета расстояния, и какой-то из них может быть более предпочтительным в зависимости от решаемой задачи. Однако геометрическое расстояние (также называемое евклидовым расстоянием) является одним из самых популярных выборов в данном методе.

В общем виде алгоритм выбора ближайших k соседей выглядит следующим образом [26]:

1. Загружаются данные

2. Определяется число K для выбранного числа соседей

3. Далее, для каждого объекта

3.1 Рассчитывается расстояние между одним из выбранных объектов и рассматриваемым в выборке объекта

3.2 Добавляется расстояние и индекс объекта в упорядоченный список.

4. Сортируется упорядоченный набор расстояний и индексов от наименьшего к наибольшему (в порядке возрастания)

5. Выбираются первые K записей из отсортированного списка

6. Выбираются метки этих записей

7. Возвращается класс этих K записей

Из преимуществ следует отметить, что алгоритм прост и легко реализуем. А также нет необходимости строить модель, настраивать несколько параметров или делать дополнительные предположения. Кроме того, алгоритм довольно универсален. Его можно использовать как для классификации, так и для регрессии. В качестве большого недостатка - Алгоритм становится значительно медленнее по мере увеличения числа примеров. Иными словами, он сложно масштабируем.

Алгоритмы классификации. LDA

В этом параграфе будет описываться модель латентное распределение Дирихле (LDA) - генеративная вероятностная модель для набора дискретных данных, предназначенная для анализа текста [25]. LDA -- это трехуровневая иерархическая байесовская модель, в которой каждый элемент списка моделируется как конечное сочетание по основному набору тем. Каждая тема в свою очередь моделируется как бесконечное сочетание по основному набору вероятностей темы. В контексте анализа предложений, вероятности выбора темы обеспечивают явное представление самого текста. Иными словами, классификатор показывает, к какой теме он относится, и с какой вероятностью, используя термы, биграммы и триграммы (n - граммы).

Латентное распределение Дирихле (LDA) является генеративно-вероятностной моделью корпуса (набора текстов). Основная идея состоит в том, что документы представлены в виде случайных выборок по скрытым темам, где каждая тема характеризуется распределением по словам. LDA предполагает следующий процесс генерации для каждого документа w в корпусе D:

1. Выбирается N Пуассона (о)

2. Выбирается и Dir (б).

3. Для каждого из N слов :

(a) Выбирается тема Многочлен (и).

(б) Выбирается слово из p( | :, в), где полиномиальная вероятность обусловлена темой .

В этой базовой модели сделано несколько упрощающих допущений. Во-первых, размерность k распределения Дирихле (и, следовательно, размерность

переменной темы z) предполагается известной и фиксированной. Во-вторых, вероятности слова параметризуются матрицей k Ч V, где = p (= 1 | = 1), которую мы рассматриваем как фиксированную величину. Помимо этого, предположение Пуассона не является необходимым для всего, что следует и

при необходимости можно использовать более реалистичное распределение, которое будет зависеть от длины документа. Кроме того, следует обратить внимание, что N является независимой от всех других переменных(и и z). Таким образом, это вспомогательная переменная имы можем игнорировать её случайность в последующих шагах.K-мерная случайная величина Дирихле и может принимать значения в (k ?1) -симплекс (k-вектори лежит в (k ? 1) -симплексе, если ? 0, =1и имеет следующую плотность вероятности:

(7)

где параметр б является k-вектором с компонентами > 0, и где Г(x) является гамма-функцией.

Дирихле -- это достаточно удобное распределение на симплексе - оно в экспоненциальном семействе, имеет достаточную конечномерную статистику и сопряжено с многочленным распределением. Учитывая параметры б и в, совместное распределение тематической выборки и, набора из N тем z и набора из N слов w задается как:

(8)

где p ( просто для единственного i, такого что . Проинтегрировав по и и просуммировав по z, мы получаем предельное распределение текста:

(9)

Наконец, взяв произведение предельных вероятностей отдельных текстов, мы получаем вероятность совокупности:

(10)

Модель LDA представлена в виде вероятностной графической модели на рисунке 3:

Рис. 3. Графическая модель LDA

Как видно из рисунка, существует три уровня представления LDA. Параметры б и в являются параметрами корпусного уровня, которые, как предполагается, отбираются единственный раз в процессе создания такого корпуса. Переменные являются переменными уровня текста, которые выбираются один раз для каждого такого текста. Наконец, переменные и являются переменными уровня конкретного слова и отбираются один раз для каждого слова в каждом тексте.

Важно отличать LDA от простой модели многочленовой кластеризации Дирихле. Классическая модель кластеризации будет включать двухуровневую модель, в которой Дирихле выбирается один раз для корпуса, полиномиальная кластерная переменная выбирается один раз для каждого документа в корпусе, а набор слов выбирается для документа, условного для кластерной переменной. Как и во многих моделях кластеризации, такая модель ограничивает привязку документа к одной теме. LDA, с другой стороны, включает в себя три уровня, и, в частности, тема (а в конкретно нашем случае - ценность) повторно выбирается в документе. Согласно этой модели,тексты могут быть связаны с несколькими темами (что особенно важно в корпоративных ценностях, ведь одно предложение может в себе нести более одной ценности).

2. Методы и средства решения задач

2.1 Формальное описание задачи

Опираясь на теоретические аспекты, которые были представлены в предыдущих главах, мы можем выделить несколько подзадач, необходимых для достижения поставленной цели:

1. Выбор языка программирования для проведения анализа данных. Для качественного выполнения необходимо выбрать язык, в котором имеется относительно большое количество библиотек для работы с данными. Исходя из выбора языка, соответственно должен произвестись выбор среды (сред) программирования, в которой(-ых) будет производиться анализ данных и написание интерфейса программы.

2. Предобработка данных. Необходимо представить данные в таком виде, которые подойдут под соответствующие методы тех библиотек, которые могут находиться в выбранной среде программирования.

3. Предоставление списка ключевых ценностей, которые соответствуют политикам компании, наличие которые необходимо будет проверять в исследуемых документах.

4. Экспертная оценка каждого предложения на предмет соответствия каждой из ценностей. Необходимо проанализировать каждое предложение из внутренних и внешних коммуникаций, присваивая каждому соответствующий класс.

5. Выбор релевантной модели классификации. Исходя из теоретических аспектов, необходимо выбрать модель, которая будет иметь наименьшую ошибку, наибольшую точность полученных результатов и относительно высокую скорость обучения.

6. Выделить для каждого текста (письма, пресс-релиза) шкалу соответствия каждой категории ценности в диапазоне от 0 до 100%. В случае, когда текст полностью соответствует выбранной ценности - 100%, когда совершенно никак не относится к какой-либо ценности - 0%

7. На основе полученных данных и релевантного классификатора, проверить исходную гипотезу - одни и те же ценности организации во внутренних и внешних коммуникациях проявляются в одинаковой силе.

2.2 Описание предметной области

В рамках исследования было решено взять фармацевтическую компанию «Мерк» для исследования её внутренних и внешних коммуникаций. Главным критерием выбора объекта исследования стала та отрасль, на которой работает данная организация и возможность получения данных. В рамках законодательных ограничений маркетинговых активностей на территории РФ, единственным валидным источником внешних коммуникаций остаются официальные интернет ресурсы (веб-сайт, аккаунты в инстаграме, фэйсбуке и прочее), заявление в прессе представителей руководства компании и статьи, верифицированные отделом внешних коммуникаций. Источником внутренних коммуникаций было решено взять электронные сообщения от сотрудников отдела кадров, руководителей бизнес подразделений, предназначенных для внутреннего пользования. Источником внешних коммуникаций было решено взять пресс-релизы компании, опубликованные на официальном сайте, за последний год. Следует заметить, что поле выбранных внутренних и внешних коммуникаций не покрывает все информационное пространство в сфере коммуникаций, а отображает лишь определённый срез.

В ходе работы мной были собраны два источника данных: первый - набор из 177 писем, которые были написаны представителями отдела управления человеческими ресурсами, руководителями бизнес подразделений, генерального директора и финансового директора. Письма включали в себя различные рассылки, внутренние и внешние новости компании, обновление внутренних распорядков, в том числе в связи с пандемией COVID-19, и прочее. Второй - 303 пресс-релиза, выпущенных за последний год, в котором упоминались различные достижения, нововведения и иная информация, которая могла бы быть интересна клиентам, работникам, партнёрам, пациентам и иным заинтересованным лицам. Все исследуемые коммуникации были выполнены на английском языке.

Выбранные ценности

Для проверки гипотезы исследования было необходимо выделить те ценности, которые будут проверяться на соответствие во внутренних и внешних коммуникациях. Главным критерием было их соответствие внутренним политикам компании, наличие ценностей в брендбуке компании, а также эмпирическое наблюдение проявляемых ценностей. В результате были выделены 6 таких ценностей (7 вместе с нейтральной):

1. Innovativeness - инновационность. Ценность, которая в текстах показывала бы стремление к инновациям у исследуемой компании. Например, «Merck discovered new drug for multiple sclerosis treatment»

2. Mutualrespect - взаимное уважение. Ценность, которая показывает уважительное отношение людей к друг другу, к имуществу организации, к методам ведения бизнеса и так далее. Например, «Our company respects your free time»

3. Successdesire - пожелание успеха. Ценность, которая выражается в стремлении к успеху сотрудников или организации. Например, «We wish you to broaden new horizons on your new role»

4. Responsibility - ответственность. Ценность, которая демонстрирует ответственность сотрудников перед своими обязанностями и организации перед своими клиентами, государством и всем обществом. Например, «Please take care of yourselfand your relatives»

5. Loyalty - преданность. Ценность, которая демонстрирует преданность сотрудников к компании и организации своим принципам. Например, «We want to congratulate you for 10 years old duration working in our company»

6. Targeting - нацеленность. Ценность, которая выражает нацеленность на результат как сотрудников внутри компании, так и самой компании на достижение своих целей и задач. Например, «We do our best to achieve our operational plan»

7. Neutral - нейтральное предложение. Чаще всего может использоваться для выражения какой-то общей мысли, не связанной с проявлением какой-либо ценности. Например, «The room is already booked».

После определения списка ценностей в следующей главе можно приступать к анализу соответствия выбранных коммуникаций с данным списком.

2.3 Обоснование выбора среды программирования

Задаваясь вопросом, какой язык программирования лучше всего использовать для сентиментального анализа, я использовал несколько объективных критериев:

· Наличие библиотек анализа данных

· Простота использования

· Наличие доступных документаций

· Возможности некоторой визуализации

В связи с первым пунктом, выбор языка, а, соответственно, и среды программирования свёлся к двум: Python и R. Остальные языки не имели достаточного количества библиотек, чтобы за относительно небольшое время построить необходимую модель. Разумеется, была возможность реализовать необходимые алгоритмы на языках группы C, но двойная работа не является оптимальным путём решения проблемы. Изучив реализацию алгоритмов, сопоставляя с теоретическими аспектами, было принято решение использовать язык программирования Python-3 и его дистрибутив Anaconda (Jupyternotebook).

В рамках выполнения данной исследовательской работы были выбраны следующие библиотеки анализа данных:

· nltk.corpus

· sklearn

· pandas

· numpy

· textblob

· nltk.stem

· gensim

Часть этих библиотек использовались для первичной обработки данных, другая часть для обучения и тестирования моделей классификации, необходимых для определения ценностей в каждом конкретном корпусе. Документации к каждой из используемых библиотек можно найти в источниках этой работы.

Помимо базовых библиотек выбранного языка программирования, необходимо также указать программу, которая помогла провести обучение модели LDA с выбранными данными - Class.SDK [12]. Это программное обеспечение, которое было разработано в НИУ ВШЭ, предназначенное для решения задач NLP и обеспечивающее, в том числе, построение классификаторов с помощью алгоритмов машинного обучения.

3. Практическая реализация исследования ценностных моделей организации

3.1 Первичная предобработка данных

В первую очередь, когда мы говорим об исследовании с данными, необходимо помнить об их предобработке. Важно соблюсти тот формат, который подойдёт и под форму методов машинного обучения, и под тренировочные-тестовые данные.

Данные о внутренних коммуникациях были получены путём сбора писем из электронной почты, которые были написаны сотрудниками отдела по работе с персоналом, руководителями бизнес подразделений и генеральным директором, и адресовались сотрудникам компании Merck. Всего использовалось 177 писем в формате «.msg». Все письма были отравлены за последний календарный год, и скачаны из клиента Microsoft Outlook. Данные о внешних коммуникациях являются новостями из пресс-релизов, были собраны с официального сайта группы компаний и хранились в формате «.csv». Аналогично данным внутренних коммуникаций, все новости датированы периодом с июня 2019 года.

Для проверки гипотез в нашем распоряжении есть данные о внутренних корпоративных коммуникациях. Формат этих данных: электронные письма от представителей отдела кадров (как о гаранте администрировании внутренней корпоративной культуры) и руководителей бизнес подразделений (как о лидерах мнения внутри компании). Так как электронные письма имеют вид, не пригодный для его массового анализа ввиду формата данных, некоторой сопутствующей информации, например, такой как «теги», их необходимо обработать. Для этого используем встроенную в дистрибутив библиотеку email, создаём функцию pars (Приложение 1 рис.3):

После получения данных нам необходимо его привести в нужный формат. Для текущих задач нам необходимо лишь тело письма (сама коммуникация).

В нашем распоряжении оказалось 177 писем разной длины. Для того, чтобы их нормализовать, необходимо сделать разбивку по предложениям. Также необходимо помнить, что предложение может заканчиваться не только на точку, но и на восклицательный и вопросительный знак, а также точка с запятой (что реже для английского языка) (Приложение 1. рис.4)

Результатом предобработки стал массив данных, который содержал в себе предложения из внутренних коммуникаций.

3.2 Байесовский наивный классификатор принадлежности к ценности

После предобработки данных, их следует классифицировать для того, чтобы понять, относятся они к ценности или нет. Исходя из того, что как мы уже выяснили, большинство классификаторов бинарные, необходимо разметить тренировочную выборку по тем признакам, которые соотносятся с выбранными ценностями.

Первая ценность, которую хотелось бы проверить - стремление к успеху. В открытом доступе в Интернете есть несколько источников с текстами, которые помогут выразить такую ценность, как «стремление к успеху». В рамках позитивной коннотации в тексте относительно этой ценности встречаются такие слова, как:

Reliability

Integrity

Quality

Support

Best

Educating

Inspiring

Optimistic

Open-minded

Satisfaction

Value

В рамках негатива этой ценности встречаются:

Insecurity

disespectful

privity

worst

monotony

Mess

uneducating

Для реализации искомого алгоритма, воспользуемся Байесовским Наивным классификатором. Для этого установим библиотеку TextBlob. Textblob - библиотека для обработки текстовых данных. Она предоставляет API для решения общих задач обработки естественного языка (NLP), такие как тегирование части речи, извлечение имен существительных, анализ настроений и многое другое.

Реализуем программу следующим способом: обучим классификатор на данных из открытого источника, которые позитивно и негативно относятся к ценности «стремление к успеху». После этого наложим на получившуюся модель тексты из электронный почты, которые мы преобразовали. Сложим все позитивные результаты и разделим на количество строк всего, в результате чего получим некоторое значение принадлежности всего массива внутренних коммуникаций к этой ценности (Приложение 1. Рис 6).

В результате мы получили, что в среднем около 95% содержащихся предложений относятся ближе к ценности «стремление к успеху», чем к его противоположности.

Результат может показаться очень высоким из-за некоторых обстоятельств:

1. Как уже писалось в теоретической части, байесовский Наивный классификатор может быть не очень точным в местах, где есть связки слов

2. Маленькая выборка словосочетаний, где показывается негативная интерпретация выбранной ценности.

3. Отсутствие в модели нейтрального отношения к ценности. У классификатора не было выбора, кроме как «полностью соответствует ценности» или «полностью не соответствует ценности»

3.3 Экспертная оценка соответствия ценностей

Ограничения классификатора, рассмотренного в предыдущем параграфе, заставляют задуматься о необходимости смены классификатора:

1. Сама по себе высокая точность Байесовского классификатора не даёт никаких существенных преимуществ - ввиду отсутствия релевантного обучающего датасета.

2. Отображение классов принадлежностей к ценностям - как «относится» и «не относится» существенно ограничивает решение - на деле большинство слов в предложении могут относиться к нейтральной ценности (например, просто нести в себе какой-то обыкновенный факт, суждение)

3. Байесовский наивный классификатор (наравне с решающими деревьями и k-ближайших соседей) имеют также одно большое ограничение - они возвращают значения класса, а не вероятность его принадлежности к классу. Исходя из этого, нам необходимо будет модифицировать классификатор, что может исказить полученные результаты.

В связи с этим необходимо обеспечить каждое из предложений соответствующим классом - 1 если принадлежит к ценности, 0 - если нет.

Для этого нам необходимо выделить все те ценности, которые будут проверяться на соответствие во внутренних и внешних коммуникациях, о которых было упомянуто в Главе 2:

Innovativeness

Mutual respect

Success desire

Responsibility

Loyalty

Targeting

Neutral

Для реализации данного подхода необходимо смешать оба источника данных, чтобы обеспечить объективную оценку принадлежности к ценности (Приложение 1. Рис 9).

После этого нам, как и в случае с предыдущим классификатором, необходимо очистить данные для корректного сопоставления предложений соответствующими ценностями. Необходимо удалить все лишние символы, пробелы и «избавиться» от кириллицы. После этого можно выгружать всё в Эксель файл для заполнения, сохраняя тот источник, откуда коммуникация пришла (Приложение 1. Рисунок 10).

Теперь всё готово для того, чтобы проставить ценности каждому из предложений в смешанных источниках коммуникаций.

3.4 Обработка полученных предложений

После того, как был получен массив данных с предложениями, каждому из них соответственно были проставлены те или иные соответствия ценностей. Каждому предложению могло соответствовать от 1 до 6 ценностей. В случае, если проставлялась ценность Neutral, то никаких других ценностей в наборе для этого предложения быть не могло. В результате мы получили массив из «грязных» данных предложений, которые не слишком хорошо подходят для обучения. Для начала подключим все те библиотеки, которые ранее были упомянуты (Приложение 1. Рис 11).

...

Подобные документы

  • Механизм работы нервной системы и мозга человека. Схема биологического нейрона и его математическая модель. Принцип работы искусственной нейронной сети, этапы ее построения и обучения. Применение нейронных сетей в интеллектуальных системах управления.

    презентация [98,6 K], добавлен 16.10.2013

  • Анализ проблем, возникающих при применении методов и алгоритмов кластеризации. Основные алгоритмы разбиения на кластеры. Программа RapidMiner как среда для машинного обучения и анализа данных. Оценка качества кластеризации с помощью методов Data Mining.

    курсовая работа [3,9 M], добавлен 22.10.2012

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • Изучение пространственных характеристик АГК и структур НС при обработке ими стохастических сред, подбор алгоритмов. Рекомендаций по использованию разработанных адаптивных алгоритмов с корреляционными методами получения оценок для регрессионных моделей.

    дипломная работа [5,1 M], добавлен 06.05.2011

  • Выбор публичных показателей для построения, обучения и тестирования модели нейронной сети, которая будет использована в основе информационной системы прогнозирования банкротства банков. Обзор моделей прогнозирования банкротства кредитных организаций.

    дипломная работа [1,2 M], добавлен 30.06.2017

  • Популярность алгоритмов машинного обучения для компьютерных игр. Основные техники обучения с подкреплением в динамической среде (компьютерная игра "Snake") с экспериментальным сравнением алгоритмов. Обучение с подкреплением как тип обучения без учителя.

    курсовая работа [1020,6 K], добавлен 30.11.2016

  • Искусственные нейронные сети как вид математических моделей, построенных по принципу организации и функционирования сетей нервных клеток мозга. Виды сетей: полносвязные, многослойные. Классификация и аппроксимация. Алгоритм обратного распространения.

    реферат [270,4 K], добавлен 07.03.2009

  • Эффективность применения объектного подхода для программных систем. Детальное проектирование и реализация системы, реализующей процессы создания и взаимодействия объектов. Распознавание компьютером печатных букв с помощью многослойной нейронной сети.

    курсовая работа [38,0 K], добавлен 09.03.2009

  • Характеристика моделей обучения. Общие сведения о нейроне. Искусственные нейронные сети, персептрон. Проблема XOR и пути ее решения. Нейронные сети обратного распространения. Подготовка входных и выходных данных. Нейронные сети Хопфилда и Хэмминга.

    контрольная работа [1,4 M], добавлен 28.01.2011

  • Обзор существующий решений в области электронного обучения. Исследование архитектурных и технологических аспектов построения виртуальных корпоративных университетов. Анализ возможностей системы дистанционного обучения Sakai, отличительные особенности.

    дипломная работа [2,7 M], добавлен 09.04.2011

  • Применение теории графов и алгоритмов на графах среди дисциплин и методов дискретной математики. Граф как совокупность двух множеств. Основные способы численного представления графа. Элементы и изоморфизмы графов. Требования к представлению графов в ЭВМ.

    курсовая работа [162,2 K], добавлен 04.02.2011

  • Изучение основных аспектов моделирования операционной системы. Исследование принципов организации псевдопараллельной работы процессов. Анализ алгоритмов диспетчеризации процессов. Проектирование подсистемы управления памятью и запоминающими устройствами.

    курсовая работа [1,7 M], добавлен 12.01.2014

  • Функция приема и передачи сообщений, которую выполняют маршрутизаторы в сетях коммутации пакетов. Доменная служба имен. Информация, которую содержат строки таблицы маршрутизаторов. Категории протоколов по обслуживанию среды, используемые алгоритмы.

    лекция [131,1 K], добавлен 15.04.2014

  • Компьютерная сеть предприятия, ее схема и конфигурация, возможные угрозы сети и степень ее защищенности. Анализ методов и средств обеспечения безопасности сети. Организация защиты информации криптографическими методами, разработка программного модуля.

    курсовая работа [780,7 K], добавлен 06.06.2011

  • Обзор программных продуктов для анализа изображений: ABBYY FineReader и OCR CuneiForm. Понятие и виды нейронных сетей. Алгоритм обучения персептрона. Результаты исследований и описание интерфейса программы. Расчет себестоимости программного обеспечения.

    дипломная работа [590,7 K], добавлен 17.08.2011

  • Программная реализация статической нейронной сети Хемминга, распознающей символы текста. Описание реализации алгоритма. Реализация и обучение сети, входные символы. Локализация и масштабирование изображения, его искажение. Алгоритм распознавания текста.

    контрольная работа [102,3 K], добавлен 29.06.2010

  • Использование понятий из теории графов при разработке сетей и алгоритмов маршрутизации. Построение матрицы смежности и взвешенного ориентировочного графа. Результаты работы алгоритмов Дейкстры и Беллмана-Форда. Протоколы обмена маршрутной информацией.

    курсовая работа [334,1 K], добавлен 20.01.2013

  • Создание схем алгоритмов и составление программы на языке Pascal для вычисления значений заданных функций. Сущность и порядок нахождения значения определенного интеграла. Анализ работы подпрограмм. Разработка тестов для проверки правильности алгоритмов.

    контрольная работа [831,0 K], добавлен 24.11.2013

  • Структура локальной компьютерной сети организации. Расчет стоимости построения локальной сети. Локальная сеть организации, спроектированная по технологии. Построение локальной сети Ethernet организации. Схема локальной сети 10Base-T.

    курсовая работа [126,7 K], добавлен 30.06.2007

  • Алгоритм - определенная последовательность действий для получения решения задачи, его сущность и свойства. Основные характеристики разветвляющегося, циклического и линейного алгоритмов. Применение базовых алгоритмов при написании программных продуктов.

    презентация [221,5 K], добавлен 01.03.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.