Инжиниринг новых знаний при анализе текстовых сообщений в социальных сетях
Разработка метода мониторинга внутренних процессов университета, основанного на анализе текстовых сообщений в Интернете. Основные этапы обработки неструктурированной информации в социальных сетях. Инжиниринг новых знаний при анализе текстовых сообщений.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 03.05.2019 |
Размер файла | 104,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский технологический университет»119454, Москва, Россия
Инжиниринг новых знаний при анализе текстовых сообщений в социальных сетях
К.С. Самолетова
Ценность знаний в связи с интенсивным ростом объема информации, генерируемой людьми в современном мире, повышается с течением времени. Очевидно, что подавляющая часть этих данных не имеет четкой структуры: аудио- и видеофайлы, изображения, тексты. При этом большинство средств, используемых аналитиками для анализа, оперируют только структурированной информацией, такой как время, даты, показатели в виде цифр и названия организаций. Так, количество неструктурированных сведений может достигать на предприятии 70%, а в социальных медиа это число равняется практически 100% [1]. Таким образом, неструктурированная информация - исключительный источник для инжиниринга знаний и составляет четыре пятых существующих данных в мире.
Особый интерес существует к онлайновым сервисам социальных сетей. В них люди в открытом доступе публикуют различные пользовательские сведения: факты биографии, дневники и заметки, переписки. Всё это открывает безграничные возможности для различных исследовательских задач, моделирования социальных, экономических, политических и других процессов от персонального до государственного уровня с целью разработки механизмов воздействия на эти процессы, а также создания инновационных аналитических и бизнес-приложений и сервисов [2]. Вместе с этим, работая с социальными данными необходимо учитывать, что качество пользовательского контента может быть крайне нестабильным, и принимать во внимание такие факторы как спам и фейковые аккаунты.
В общем виде обработка неструктурированной информации проводится в пять этапов, которые представлены на рисунке 1.
Рисунок 1 Этапы обработки неструктурированной информации
Первым этапом является выбор объекта анализа, в данной работе - это «Московский технологический университет». Для конкретизации рассматриваемой предметной области в качестве терминов и определений выступили названия структурных подразделений Университета, форм обучения, номера курсов, адреса организации, коды направлений подготовки и специальностей, набор на которые производиться в ВУЗе. Основываясь на этом третий шаг состоит в составлении словарей и правил.
В качестве инструмента для моделирования предмета исследования, осуществления аналитических срезов и перехода от них к анализу и интерпретации результатов был выбран IBM Watson Content Analytics. Данное решение позволяет представлять слова в нормализованной форме, создавать списки часто употребляемых словесных конструкций, а так же с высокой степенью корреляции [3]. Кроме того, среди функционала данного средства предусмотрена возможность добавления пользовательских коллекций словарей.
Проведенное исследование позволило выявить следующие характерные черты заданного Университета: популярные направления подготовки и специальности среди поступающих, актуальные тематики для учащихся различных годов обучения, наиболее важные вопросы абитуриентов и прочее.
Итак, результат работы позволяет сделать вывод, что одна из доминирующих тенденций развития социальных сетей состоит в понимании особенностей поведения людей на основе выявления новых знаний при анализе информации, которую они выкладывают в открытый доступ. Интерес представляет дальнейшая разработка метода мониторинга внутренних процессов Университета, основанного на анализе текстовых сообщений в сети Интернет.
инжиниринг социальный сеть текстовый
Список использованных источников
1. Китова О. В., Дьяконова Л. П. Информационно-аналитические технологии и сервисы в экономике и образовании // Инжиниринг предприятий и управление знаниями. - 2016. - С. 30.
2. Коршунов А. и др. Анализ социальных сетей: методы и приложения // Труды Института системного программирования РАН. - 2014. - Т. 26. - №. 1.
3. Zhu W. D. J. et al. IBM Watson Content Analytics: Discovering Actionable Insight from Your Content. - IBM Redbooks, 2014.
Размещено на Allbest.ru
...Подобные документы
Текстовый редактор - приложение для обработки текстовой информации. Описание текстовых процессоров как более совершенных текстовых редакторов. Типы текстовых файлов: форматированные, неформатированные. Основные правила редактирования и набора текста.
презентация [747,3 K], добавлен 26.11.2010Разработка программы, проверяющей уровень знаний по разделу стереометрии и позволяющей выбор один из нескольких вариантов и ввод ответа. Характеристика библиотеки MFC, тела, классов и файлов приложения, цикла сообщений и текстовых запусков программы.
курсовая работа [1,5 M], добавлен 28.06.2011Основы теории передачи информации. Экспериментальное изучение количественных аспектов информации. Количество информации по Хартли и К. Шеннону. Частотные характеристики текстовых сообщений. Количество информации как мера снятой неопределенности.
лабораторная работа [42,3 K], добавлен 15.02.2011Предотвращение несанкционированного распространения информации в текстовых файлах. Разработка подсистемы обнаружения утечки информации с фильтром идентификации текстовых областей в передаваемом потоке данных и их сходства с конфиденциальными данными.
дипломная работа [1,8 M], добавлен 14.03.2013Количество информации и ее мера. Определение количества информации, содержащегося в сообщении из ансамбля сообщений источника. Свойства количества информации и энтропии сообщений. Избыточность, информационная характеристика источника дискретных сообщений.
реферат [41,4 K], добавлен 08.08.2009Особенности посылки сообщений в Windows и в Win32 API. Обработка состояний простоя. Маршрутизация сообщений в Windows 3.x. Основные циклы обработки сообщений. Применение многопотоковых приложений. Основные возможности редакторов WinWord 97 и Notepad.
лекция [35,9 K], добавлен 24.06.2009Виды социальных медиа. Критерии эффективности продвижения аккаунта в социальных сетях. Программная реализация алгоритма моделирования распространения информации в социальной сети "Twitter". Разработка клиентского приложения. Апробация интерфейса системы.
дипломная работа [5,4 M], добавлен 08.02.2016История появления и развития шифрования текста. Проблема шифрования и дешифрования текстовых сообщений в современности. Создание программы для зашифровки и расшифровки вводимого текста пятью методами: Атбаш, Цезаря, Полибия, Гронсфельда и Винжера.
курсовая работа [923,6 K], добавлен 26.12.2011Анализ проблемы обеспечения информационной безопасности при работе в сетях; обоснование необходимости разработки алгоритмов безопасной маршрутизации пакетов сообщений в глобальной информационной сети. Алгоритмизация задач безопасной маршрутизации пакетов.
дипломная работа [1,0 M], добавлен 21.12.2012Разработка программного комплекса для автоматизации получения и передачи сообщений между центром обработки звонков и клиентами. Пути сокращения среднего времени, затрачиваемого на телефонное соединение, повышение производительности работы менеджеров.
дипломная работа [6,1 M], добавлен 13.10.2013Классификация программ обработки текстовых документов. Общие принципы оформления издания. Правила набора текста. Системы распознавания текста (OCR). Комплекс программного обеспечения для настольных издательских систем. Примеры текстовых редакторов.
презентация [75,0 K], добавлен 13.08.2013Сущность и классификация программных средств для общения через Интернет. Сравнительная характеристика мессенджеров текстовых сообщений ICQ, QIP, Miranda, Mail.ru. Применение мессенджеров медиа связи: Skype, Movi, Мультифон. Почтовые клиенты и их виды.
реферат [47,9 K], добавлен 14.04.2012Принцип работы и программная реализация однозвучного, одноалфавитного и полиграммного шифра. Шифрование по методу подстановки, замены и кодового слова. Безопасность шифровки простой замены. Частотные характеристики текстовых сообщений и дешифрация.
контрольная работа [1,1 M], добавлен 02.02.2012Входной буфер, процессор и две выходных линий с двумя буферами как основные элементы узла коммутации сообщений. Определение параметров загрузки устройств и вероятности отказа в обслуживании сообщений из-за возможности переполнения буферов выходных линий.
лабораторная работа [91,0 K], добавлен 27.06.2013Методика и основные этапы создания многофункциональной программы получения и отправки сообщений по локальной сети с помощью программного обеспечения Winpopup и Traypopup. Сравнительная характеристика встроенных протоколов и их функциональные особенности.
дипломная работа [371,6 K], добавлен 19.06.2010Функциональные характеристики программы форматирования текстовых файлов, требования к ее интерфейсу и данным. Схема взаимодействия компонентов системы, выбор среды исполнения и программная реализация алгоритмов. Тестирование и оценка качества программы.
курсовая работа [61,1 K], добавлен 25.07.2012Создание и редактирование электронных баз данных. Обработка электронных таблиц. Операции изменения формата документа. Основные функции текстовых процессоров. Деловая графика. Построение рисунков, диаграмм, гистограмм различных типов в программе Excel.
презентация [773,1 K], добавлен 23.12.2013Современные методы защиты информации средствами стеганографии. Анализ канала передачи сообщений, подходы к реализации стеганографического приложения. Алгоритмы методов последнего бита и передачи сообщений через стегоканал; ограничения его использования.
курсовая работа [105,7 K], добавлен 05.11.2011Требования, предъявленные к полноценному локальному чату. Протокол передачи данных TCP. Описание программы сервера. Этапы разработки программного продукта. Функция приема сообщений от сервера. Принятие и отправка сообщений всем пользователям чата.
курсовая работа [447,0 K], добавлен 21.01.2016Обзор существующих решений на основе открытых данных. Выбор социальных сетей для извлечения данных. Ограничение геолокации сообщений из социальных сетей. Разработка формата хранения. Визуализация собранных данных методом теплой карты. Архитектура системы.
дипломная работа [1,0 M], добавлен 18.11.2017