Проектные решения по разработке рекомендательного сервиса для онлайн-кинотеатра

Проектные решения по разработке рекомендательного сервиса для онлайн-кинотеатра. Применение семантического поиска для генерации выдачи фильмов пользователю на основе текстового запроса может обеспечить поддержку принятия решений в выборе фильмов.

Рубрика Производство и технологии
Вид статья
Язык русский
Дата добавления 10.12.2024
Размер файла 2,5 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Проектные решения по разработке рекомендательного сервиса для онлайн-кинотеатра

Новиков Александр Владимирович

ФГБОУ ВО «Орловский государственный университет имени И.С. Тургенева», Орел, Россия

Русских Татьяна Николаевна

ФГБОУ ВО «Орловский государственный университет имени И.С. Тургенева», Орел, Россия Доцент кафедры «Алгебры и математических методов в экономике»Кандидат экономических наук, доцент

Тинякова Виктория Ивановна

ФГБОУ ВО «Государственный университет управления», Москва, РоссияПрофессор кафедры «Управления проектом» Доктор экономических наук, профессор

Аннотация

В настоящее время рекомендательные системы, основанные на методах и технологиях искусственного интеллекта, обеспечивают эффективную поддержку принятия управленческих решений в различных сферах деятельности. Рекомендательные системы являются одним из важнейших конкурентных преимуществ онлайн-платформ. В статье предложены проектные решения по разработке рекомендательного сервиса для онлайн-кинотеатра. Современные рекомендательные системы онлайн-кинотеатров преимущественно ориентированы на предоставление рекомендаций на основе анализа свойств контента по истории просмотров пользователя или коллаборативной фильтрации по определенным схожим параметрам пользователей. Традиционный подход к разработке рекомендаций имеет ряд преимуществ, однако не позволяет учитывать предпочтения и настроения пользователя в конкретный момент времени. Применение семантического поиска для генерации рекомендательной выдачи фильмов пользователю на основе текстового запроса может обеспечить эффективную поддержку принятия решений в выборе фильмов. В качестве математического инструментария обработки естественного языка для решения поставленной задачи предлагается использовать технологии нейронных сетей.

Авторами описывается методология разработки рекомендательной системы, включающая процессы автоматизации сбора информации о фильмах, предобработку текстовых данных, семантическое моделирование отзывов пользователей, ранжирование фильмов по выбранным приоритетам. Приводятся результаты программной реализации модели искусственной нейронной сети и Telegram-бота для отправки запросов пользователей с использованием библиотек языка программирования Python, сформулированы возможные пути улучшения качества рекомендаций, предоставляемых моделью. Разработка персонального контентного предложения для каждого пользователя на основе его запросов посредством реализации рекомендательной системы позволит онлайн-платформе повысить лояльность имеющихся пользователей и привлечь новые группы пользователей, обеспечит поддержку управленческих решений по размещению контента. рекомендательный сервис фильм пользователь

Ключевые слова: рекомендательная система; онлайн-кинотеатр; искусственный интеллект; обработка естественного языка; нейронная сеть; модель семантического поиска; пользовательские рекомендации

Novikov Alexander Vladimirovich

Oryol State University named after I.S. Turgenev, Oryol, Russia

Russkikh Tatyana Nikolayevna

Oryol State University named after I.S. Turgenev, Oryol, Russia

Tinyakova Viktoria Ivanovna

The State University of Management, Moscow, Russia

Design solutions for developing a recommendation service for online cinema

Abstract. Currently, recommender systems based on artificial intelligence methods and technologies provide effective support for management decisions in various fields of activity. Recommender systems are one of the most important competitive advantages of online platforms. The article proposes design solutions for developing a recommendation service for an online cinema. Modern recommendation systems for online cinemas are primarily focused on providing recommendations based on analysis of content properties based on the user's viewing history or collaborative filtering based on certain similar user parameters. The traditional approach to developing recommendations has a number of advantages, but does not allow taking into account the preferences and moods of the user at a particular point in time. Using semantic search to generate movie recommendations for a user based on a text query can provide effective decision support for movie selection. It is proposed to use neural network technologies as mathematical tools for natural language processing to solve the problem. The authors describe the methodology for developing a recommendation system, which includes processes for automating the collection of information about films, preprocessing of text data, semantic modeling of user reviews, ranking films according to selected priorities. The results of a software implementation of an artificial neural network model and a Telegram bot for sending user requests using Python programming language libraries are presented, and possible ways to improve the quality of recommendations provided by the model are formulated. Developing a personal content offer for each user based on his requests through the implementation of a recommendation system will allow the online platform to increase the loyalty of existing users and attract new groups of users, and will provide support for management decisions on content placement.

Keywords: recommendation system; online cinema; artificial intelligence; natural language processing; neural network; semantic search model; user recommendations

Введение

В последние годы методы и технологии искусственного интеллекта широко используются для решения практических задач в различных предметных областях, системы искусственного интеллекта обеспечивают поддержку принятия управленческих решений в различных сферах деятельности.

Одним из направлений разработки систем искусственного интеллекта является создание рекомендательных систем, которые внедряются в сервисы предоставления цифрового контента (музыка, кино, приложения), а также товаров (онлайн-магазины). Рекомендательные системы на различных платформах являются востребованным инструментом, который позволяет улучшить пользовательский опыт, повысить популярность платформы, повысить лояльность пользователей, обеспечить поддержку принятия управленческих решений в условиях высокой конкуренции онлайн-платформ. Особенности применения персонализированных рекомендательных систем, проблемы их создания и перспективы развития рассматривается в работах Афанасьева Г.И., Абулкасимова М.М., Сурикова О.В., Павлова П.С., Чжана Ч. [1-3].

В настоящее время широкую популярность получили рекомендательные системы онлайн-кинотеатров. Основная цель данных рекомендательных систем -- предложить пользователям контент согласно их предпочтениям [4]. Традиционные рекомендательные системы ориентированы на предоставление рекомендаций на основе истории просмотров пользователя или просмотров пользователей, схожих по параметрам. В первом случае система анализирует свойства контента по истории просмотров и предлагает фильмы, как правило, определенного жанра и актерского состава. Второй тип систем -- системы коллаборативной фильтрации, подбирают пользователям фильмы, исходя из предпочтений схожих пользователей по некоторым параметрам (страна, пол, возраст, сфера деятельности и другие). На практике также используются гибридные системы, которые сочетают в себе свойства двух перечисленных рекомендательных систем. Традиционные подход к разработке рекомендаций имеет ряд преимуществ, однако не позволяет учитывать предпочтения пользователя в каждый конкретный момент времени, его настроение. Применение семантического поиска для генерации рекомендательной выдачи фильмов пользователю на основе текстового запроса может дополнить и улучшить пользовательский опыт при использовании подобных сервисов. Для реализации семантического поиска на практике широко используются методы искусственных нейронных сетей.

Методы и технологи

Задача реализуемой модели поиска фильма по описанию состоит в том, чтобы на основе текстового запроса пользователя найти наиболее семантически близкие к параметрам запроса текстовые отзывы на фильмы других пользователей и вернуть идентификаторы фильмов из найденных отзывов.

Разработка рекомендательного сервиса онлайн-кинотеатра включает реализацию следующих этапов:

1. Сбор данных.

2. Предварительная обработка данных.

3. Реализация модели с помощью библиотеки Sentence-Transformers.

4. Моделирование семантических векторов отзывов.

5. Реализация Telegram-бота и его коммуникациис моделью.

Остановимся подробнее на рассмотрении предложенных этапов разработки рекомендательного сервиса.

1. Сбор данных. Важнейшим этапом реализации любой модели машинного обучения является сбор и подготовка данных для обучения. От качества датасета и его соответствия решаемой задаче напрямую зависит итоговое качество и точность модели. Методы и особенности сбора, обработки текстовых данных изложены в работах [5-11].

Для того, чтобы модель поиска обеспечивала наилучший результат, в набор данных необходимо включить такую информацию, которая содержит только необходимые для задачи аспекты. Как правило, для определения состава необходимой информации проводят разведочные исследования.

В проведенном авторами исследовании сбор данных включал:

Сбор списка 2 000 самых популярных фильмов по версии сайта «Кинопоиск» с помощью средств автоматизированного сбора информации. Состав собираемой информации: название, рейтинг, страна и год производства, жанр, актерский состав, краткое описание. Данные сохраняются в формате csv.

Сбор отзывов для каждого фильма из сформированного списка. Набор данных составляет порядка 20 и более самых популярных отзывов (при наличии 20), отмеченных как положительные. Данные сохраняются в формате csv. Каждая запись содержит идентификатор записи о фильме, к которому она относится.

В работе не планируется каким-либо образом использовать оценочную информацию из отзывов пользователей, однако имеет смысл отсечь негативные отзывы, поскольку семантическая информация, содержащаяся в них, с высокой вероятностью будет иметь гораздо меньшую ценность для задачи семантического поиска конечным пользователем. Пользователю вряд ли требуется найти фильм, описывая его негативные аспекты и те эмоции, которые пользователь не хотел бы получить от просмотра. Как правило, негативные отзывы содержат информацию именно подобного характера. Более целесообразным в исследовании представляется ориентироваться именно на положительные отзывы.

Отзывы пользователей зачастую имеют субъективный характер. Однако можно считать, что в общей совокупности отзывов они дадут более объективную информацию о фильме. Для повышения уровня объективности пользовательских оценок можно воспользоваться дополнительной информацией -- описанием и мета-информацией.

Сбор информации производился с помощью следующих библиотек:

1. Selenium -- библиотека Python, предназначенная для автоматизированного тестирования веб-интерфейсов и систем, которая широко и успешно применяется для задач парсинга. Библиотека создает и управляет экземпляром полноценного веб-браузера (например, Google Chrome или Mozilla Firefox). Во-первых, это позволяет эффективно взаимодействовать с элементами управления пользовательского интерфейса, сохраняя высокий уровень абстракции, а во-вторых -- обойти многие системы защиты от парсинга, исключая наиболее продвинутые, которые основываются на анализе поведения или, например, вводе «captcha». В ходе пробного парсинга было установлено, что более низкоуровневые инструменты в большинстве случаев блокируются сервисом «Кинопоиск».

2. Requests -- библиотека Python, позволяющая автоматически формировать, отправлять и обрабатывать веб-запросы (GET, POST, PUT и подобные). Некоторые аспекты сбора информации с сервиса «Кинопоиск» (например, запрос страницы отзывов) позволяют отказаться от Selenium в пользу Requests, что обеспечивает серьезное преимущество в скорости работы -- во втором случае обрабатывается только целевой запрос, исключая сопутствующие (например, рекламные и статистические), которые обязательно обрабатываются при работе в полноценном браузере. Кроме того, часть сервиса работает с использованием API -- на запрос приходит ответ не в виде HTML-страницы или Javascript-кода, а в виде JSON-объекта, с которым гораздо удобнее работать при сборе информации.

3. BeautifulSoup (bs4)-- библиотека Python, позволяющая производить

структурированное чтение HTML-документа и поиск нужных элементов. С помощью данной библиотеки можно извлечь из веб-страницы только необходимую информацию. Присутствует поддержка поиска по всем возможным характеристикам HTML-элементов -- классу, тегу, родителю, атрибуту.

4. lxml -- вспомогательная библиотека Python, представляющая собой версию стандартной библиотеки xml, в которой все основные затратные по скорости работы функции реализованы на языке C++. Ввиду схожести синтаксиса HTML и XML-разметки обе библиотеки активно применяются при автоматизированном сборе информации.

5. json -- стандартная Python-библиотека для чтения и формирования объектов JSON, используемых в веб-системах.

Анализ разделов сервиса «Кинопоиск» показал, что наиболее перспективным для сбора датасета фильмов и отзывов является раздел «Популярные фильмы», состоящий, согласно информации на сайте, из 1 000 фильмов, страницы которых чаще всего посещаются пользователями. Однако API-запрос, отправляемый при загрузке страниц данного раздела, позволяет передавать параметр смещения (moviesOffset), превышающий 1 000, что дает возможность получить информацию о фильмах, следующих после первых 1 000. В целях исключения негативного влияния автоматизированного сбора информации на работу сервиса (повышенная нагрузка, увеличение времени ожидания ответа на запрос другими пользователями, отсутствие информации о веб-агенте пользователя) были предприняты следующие меры: указаны параметры user-agent и cookies, установлены задержки между запросами от 1,5 секунд до 3 секунд.

Итоговый набор данных включает следующую информацию:

*2 034 самых популярных фильмов по информации сервиса «Кинопоиск» (рейтинг

фильма, название, описание фильма, актерский состав, жанр фильма, страна, год производства);

*46 502 отзыва пользователей. Каждый отзыв сопоставляется с фильмом

посредством идентификатора.

Информация о фильмах и отзывах для удобства помещена в разные файлы. Примеры содержимого файла с данными приведен на рисунке 1.

Рисунок 1. Фрагмент данных об отзывах (составлено авторами)

Для тестирования и сравнения эффективности моделей были подготовлены 2 варианта списка отзывов -- список вида «фильм -- отзыв», в котором каждый отзыв является отдельной строкой (токеном), и список вида «фильм -- общий текст всех отзывов». Первый вариант при расчете моделью даст в результате отдельный вектор для каждого отзыва, второй -- общий вектор для фильма, в некотором смысле «усредненный» относительно информации, содержащейся в отдельных отзывах.

2. Предварительная обработка данных. Любая информация, которую вводят пользователи интернет-ресурсов, требует выполнения операций по очистке текстовой информации, поскольку излишняя размерность словаря модели для обработки естественного языка снижает эффективность обучения и замедляет процесс усвоения моделью зависимостей в текстовых данных. Однако если выполнять предобработку данных с использованием агрессивных алгоритмов стемминга, можно потерять смысловую нагрузку отзыва.

Предобработка данных включает следующие процедуры:

дополнение текста каждого отзыва метаинформацией о соответствующем фильме с целью повышения релевантности отзыва;

очистка данных от нетекстовой информации -- эмодзи, знаки табуляции, HTML-верстка, гиперссылки и т. д.;

приведение букв книжнему регистру. При этом используется изменение регистра

только заглавныхбукввначалепредложения,вином случаеможно потерять

возможность усвоения моделью именованных сущностей;

токенизация;

лемматизация.

3. Реализация модели с помощью библиотеки Sentence-Transformers. Используется предобученная модель paraphrase-multilingual-mpnet-base-v2. Применение модели, предварительно обученной на большом наборе данных, позволяет значительно снизить затраты и время для реализации сервиса.

Для выполнения поставленной задачи модель машинного обучения должна соответствовать следующим требованиям:

1. Модель должна быть способна находить похожие отзывы. Наиболее эффективный способ добиться этого на сегодняшний день -- использовать векторную модель, а затем производить операции сравнения векторов между собой с помощью расчёта косинусного расстояния.

2. Модель должна уметь работать с мультиязычными токенами (как минимум, русский и английский языки). В результате просмотра нескольких десятков отзывов пользователей на сервисе «Кинопоиск» выяснилось, что в отзывах встречаются англоязычные названия фильмов, имена актёров, режиссёров. Отбрасывать эту информацию нежелательно, так как это весьма релевантная часть отзыва.

3. Модель должна максимально учитывать семантику отзыва. Идея модели состоит в том, чтобы поиск по описанию возвращал не только отзывы, содержащие слова из запроса пользователя (как происходит при полнотекстовом поиске), но и учитывал близкие по значению слова.

4. Для каждого отзыва моделью должен быть рассчитан единый семантический вектор, характеризующий данный отзыв. В этом векторе должны быть учтены все векторы входящих в отзыв слов или N-грамм. Производить операции напрямую с векторами слов по отдельности извне отзыва нет никакого практического смысла, поэтому можно ограничиться сохранением только итогового вектора смысла отзыва целиком.

Исходя из данных требований и особенностей моделей для обработки текстовой информации, можно сделать вывод о том, что для модели поиска по описанию с учетом семантики («нечёткого» поиска) наиболее предпочтительным вариантом является архитектура, основанная на ячейке (ячейках) LSTM, поскольку именно такой вариант обеспечивает наибольшую эффективность запоминания информации искусственными нейронными сетями.

Для того, чтобы модель получила возможность вычислять векторы слов (предложений, документов) таким образом, чтобы они включали в себя семантическую информацию, ее необходимо соответствующим образом обучить. Однако обучение модели LSTM до приемлемого уровня является задачей, которую сложно переоценить в плане трудозатратности -- подразумевает наличие набора данных большого размера, а также доступ к серьезными вычислительным мощностям. На данный момент такая возможность есть, как правило, у крупных компаний (Google, Amazon, Яндекс). Для небольших команд или организаций гораздо более реальной представляется возможность аренды облачных мощностей для обучения модели. Однако существуют также предварительно обученные на больших датасетах модели. Для задачи поиска по описанию вполне можно воспользоваться одной из таких моделей, если она удовлетворяет сформулированным требованиям.

Один из популярных фреймворков Python, позволяющий использовать предобученные модели -- библиотека Sentence-Transformers. Она предназначена для работы с последовательностями -- текстом и изображениями. Кроме официально предоставляемых, Sentence-Transformers также совместима с моделями, размещаемыми разработчиками на Hugging Face Hub. Основные модули библиотеки используют функции фреймворка глубокого обучения PyTorch. При соответствующей настройке это позволяет задействовать вычислительные мощности графического ускорителя, что значительно ускоряет работу.

4. Моделирование семантических векторов отзывов. Поскольку для расчета вектора каждого отзыва требуются значительные вычислительные мощности, используется графический адаптер, имеющий большее количество вычислительных блоков по сравнению с CPU. Рассчитанные вложения векторов сохраняются в постоянную память, и при последующем запуске вновь не рассчитываются.

5. Реализация Telegram-бота и его коммуникации с моделью. Данный бот принимает запросы от пользователей и направляет их в модель, которая осуществляет кодирование текста запроса в семантический вектор. Затем осуществляется поиск наиболее схожих векторов отзывов с вектором запроса пользователя. Итоговый результат ранжируется в соответствии с метрикой ранжирования и режимом, выбранным пользователем. При ранжировании учитывается метрика схожести, возвращаемая моделью для каждого отзыва и рейтинг соответствующего фильма, к которому относится отзыв.

При выдаче результатов поиска фильмов по описанию необходимо провести ранжирование фильмов по некому критерию. Авторами предлагается реализовать три различных варианта ранжирования фильмов:

ранжирование на основе значений метрики схожести (косинусному расстоянию), выдаваемой моделью;

ранжирование на основе общего рейтинга фильма, представленного на сайте сервиса «Кинопоиск»;

комбинированное ранжирование.

Следует отметить, что выбранный способ ранжирования влияет именно на порядок вывода результатов, сама результирующая выборка при этом остается неизменной.

Приоритет ранжирования будет задан отдельной метрикой, рассчитываемой на основе метрики схожести и рейтинга сервиса «Кинопоиск», а также коэффициентов, определяемых в зависимости от выбранного режима ранжирования.

Метрика, выдаваемая моделью, находится в диапазоне от 0 до 1, где 0 означает, что токены (векторы) абсолютно не похожи, а 1 -- что они абсолютно схожи (одинаковы). Таким образом, она не нуждается в дополнительном нормировании.

Рейтинг сервиса «Кинопоиск», используемый для ранжирования с приоритетом рейтинга, находится в диапазон от 0 до 10, поэтому требуется провести нормировку для переводя значений в шкалу от 0 до 1.

Выбор режима ранжирования осуществляется отправкой соответствующей команды Telegram-боту пользователем.

Результаты

В результате пробных реализаций (с использованием только текста отзывов фильма либо их дополнения различной информацией) было найдено оптимальное решение по использованию метаинформации о фильме посредством дополнения каждого отзыва на соответствующий фильм по параметрам «название -- жанр -- актерский состав -- описание -- отзыв». Подобное дополнение должно увеличить релевантность каждого отдельного отзыва и незначительно компенсировать его субъективность.

Для того, чтобы найти ближайшие к текстовому запросу пользователя отзывы и, соответственно, фильмы, необходимо с помощью модели рассчитать семантический вектор запроса. Запрос пользователя передается модели с помощью того же метода encode, который использовался для расчета вложений отзывов. Преимущество семантических моделей в данном случае состоит в том, что вектор в меньшей степени зависит от длины последовательности, чем

в случае с моделями, основанными на «арифметике слов». В случае, например, Word2Vec, вектор будет тем более разрежен, чем короче входная последовательность. Итоговое количество измерений такой модели напрямую зависит от количества слов в словаре, тогда как семантическая модель на выходе всегда дает вектор фиксированной длины, не зависящей от корпуса и задаваемой в качестве гиперпараметра модели. Таким образом, после кодирования текста запроса возвращаемый вектор состоит из 768 элементов и может быть сравнен с векторами отзывов. Метод cos_sim модуля util библиотеки Sentence-Transformers позволяет рассчитать косинусное расстояние между векторами. После расчета данной метрики необходимо выбрать векторы отзывов, наиболее схожие с вектором текстового запроса пользователя. Далее метки отзывов фильмов сопоставляются с данными о фильмах по индексу.

В рамках реализации модели был разработан сервис для отправки запросов, Telegram-бот. Telegram-бот может включать внутри себя нужные функции, либо отправлять API-запрос к сервису, где будет размещена модель.

Рисунок 2. Приветственное сообщение Telegram-бота (составлено авторами)

Нужный функционал предоставляет библиотека Python-Telegram-Bot. После получения аутентификационных данных для доступа к API Telegram, предназначенного для ботов, можно реализовать метод, проверяющий наличие новых сообщений в чате бота. При поступлении нового сообщения бот совершает следующую последовательность действий:

Если сообщение является командой запуска бота («/start») -- в ответ пользователю отправляется справка о том, как пользоваться ботом и какие команды он поддерживает (рис. 2).

2. Если сообщение является командой «/priority» (с передачей в качестве параметра 1, 2 или 3), то происходит смена режима ранжирования. Таким образом, команда «/priority 1» активирует режим ранжирования «по схожести», и так далее. На рисунке 3 показан пример последовательной смены режимов ранжирования.

3. В остальных случаях бот отправляет текст сообщения в функцию. Полученный результат ранжируется функцией в зависимости от текущего режима, преобразуется в текст и возвращается пользователю.

Рисунок 3. Пример команд смены режимов ранжирования (составлено авторами)

Для того, чтобы каждый пользователь имел возможность установить желаемый приоритет, выбираемые режимы записываются в словарь. Если пользователь еще не производил выбор режима, то будет происходить ранжирование по умолчанию (по схожести). В продуктивной среде целесообразно записывать выбранный режим в базу данных, поскольку в текущей реализации словарь очищается при перезапуске бота.

Рисунок 4. Общая схема работы рекомендательного сервиса (составлено авторами)

Примеры результатов запросов с приоритетом схожести, рейтинга и сбалансированного режима представлены на рисунке 5.

Обсуждение

Для использования сервиса рекомендаций в продуктивной среде можно предложить следующие направления улучшения результатов модели и качества рекомендаций:

1. Поскольку в данной реализации выбранный пользователем режим сохраняется только в памяти программы (Telegram-бота), при перезапуске информация об уже сделанных выборах теряется. Для ее сохранения следует использовать базу данных.

2. Информация, содержащаяся в отзывах, обладает высокой степенью субъективности. Кроме того, нет никаких гарантий, что отзывы будут релевантны содержанию фильма. Наиболее продуктивным представляется использование информации, включающей описание сюжета фильма, основных действующих лиц, событий. На момент проведения исследования не удалось найти подобный русскоязычный ресурс, содержащий достаточное количество описаний и фильмов. Представляется, что наличие подобной информации позволит значительно повысить релевантность поиска.

3. Одним из путей развития идеи различных режимов ранжирования может быть добавление новых признаков в формулу расчета метрики ранжирования или создание новых режимов, например, «по дате выхода». Особенно перспективным представляется дополнение или улучшение «сбалансированного» режима, поскольку, исходя из результатов анкетирования пользователей, существует группа пользователей, использовавшая данный режим чаще других.

4. Способность модели предоставлять релевантные рекомендации также сильно зависит от количества токенов, которые «знает» модель. Для увеличения содержательности рекомендаций необходимо увеличить количество собранных фильмов и отзывов.

Выводы

Применение семантической модели искусственного интеллекта для создания сервиса поиска фильма по описанию позволит улучшить пользовательский опыт при использовании сервиса онлайн-кинотеатра, а также расширить доступный пользователю функционал, что повысит лояльность пользователей и популярность сервиса. Для повышения качества рекомендаций, предоставляемых моделью, необходимо сформировать набор данных, который описывал бы целевые токены (фильмы) более точно, чем отзывы пользователей.

Применение искусственных нейронных сетей для создания модели, используемой в рекомендательном сервисе, может обеспечить предоставление конечному пользователю рекомендаций, учитывающих его предпочтения, в отличие от традиционных рекомендательных систем, которые основываются главным образом на истории предыдущих просмотров пользователя или коллаборативной фильтрации. Модель, позволяющая получить выборку токенов (фильмов), близких к текстовому запросу пользователя, в комплексе с традиционной рекомендательной системой может дополнить пользовательский опыт при использовании сервиса онлайн-кинотеатра.

ЛИТЕРАТУРА

1. Афанасьев, Г.И. Алгоритмы оптимизации, используемые в нейронных сетях, и градиентный спуск / Г.И. Афанасьев, М.М. Абулкасимов, О.В. Сурикова // Аспирант и соискатель. -- 2019. -- № 6(114). -- С. 81-86. -- URL: https://www.elibrarv.ru/item.asp?id=41659522 (дата обращения: 6.05.2023).

2. Павлов, П.С. Методы оценки качества рекомендательных систем / П.С. Павлов // Международный журнал гуманитарных и естественных наук. -- 2018. -- № 6. -- С. 178-182. -- URL: https://cvberleninka.ru/article/n/metodv-otsenki-kachestva- rekomendatelnvh-sistem/viewer (дата обращения: 25.05.2023).

3. Чжан, Ч. Основные технологии и перспективы эволюции персонализированных

рекомендательных систем / Ч. Чжан, Г.И. Афанасьев // E-Scio, 2022. -- № 4(67). -- С. 309-320.-- URL:https://www.elibrarv.ru/item.asp?id=48569729 (дата

обращения: 6.05.2023).

4. Ефимов, И.П. Бизнес-процессы управления цифровыми платформами для просмотра видеоконтента / И.П. Ефимов, П.П. Ефимов, С.В. Рындина // Вестник Пензенского государственного университета. -- 2022. -- № 1(37). -- С. 61-66. -- URL: https://www.elibrarv.ru/item.asp?id=48458950 (дата обращения: 20.05.2023).

Большакова, Е.И. Автоматическая обработка текстов на естественном языке и анализ данных / Е.И. Большакова, К.В. Воронцов, Н.Э. Ефремова, Э.С. Клышинский, Н.В. Лукашевич, А.С. Сапин. -- М.: Изд-во НИУ ВШЭ, 2017. -- 269 с. -- URL: https://www.elibrary.ru/item.asp?id=48734949 (дата обращения:

6.05.2023) .

Витехновский, В.И. Автоматизация определения тональности текста / В.И. Витехновский // Вестник магистратуры. -- 2020. -- № 5(20). -- С. 34-36. -- URL: https://cvberleninka.ru/article/n/avtomatizatsiva-opredeleniva-tonalnosti-teksta-

1 (дата обращения: 20.05.2023).

Котельников, Е.В. Анализ тональности текстов с применением ДСМ-метода / Е.В. Котельников, А.В. Котельникова // Достижения вузовской науки. -- 2021. -- № 2. -- С. 118-122. -- URL: https://cvberleninka.ru/article/n/analiz-tonalnosti- tekstov-s-primeneniem-dsm-metoda (дата обращения: 20.05.2023).

Москаленко, А.А. Разработка приложения веб-скрапинга с возможностями обхода блокировок / А.А. Москаленко, О.Р. Лапонина, В.А. Сухомлин // Исследования и разработки в области новых информационных технологий и их приложений. --2019.--№ 2.-- С. 412-420.-- URL:

https://cvberleninka.ru/article/n/razrabotka-prilozheniva-veb-skrapinga-s-

vozmozhnostvami-obhoda-blokirovok (дата обращения: 6.05.2023).

Поточняк, Я.В. Обработка текстов и сообщений на естественном языке в информационных системах / Я.В. Поточняк // Технологический аудит и резервы производства. --2012.--№ 5/2(7).-- C. 5-6.-- URL:

https://cvberleninka.ru/article/n/obrabotka-tekstov-i-soobscheniv-na-estestvennom-

vazvke-v-informatsionnvh-sistemah (дата обращения: 6.05.2023).

Салып, Б.Ю. Анализ модели BERT как инструмента определения меры смысловой близости предложений естественного языка / Б.Ю. Салып, А.А. Смирнов // Научно-образовательный журнал для студентов и преподавателей «StudNet». -- 2022. -- № 5. -- С. 3509-3517. -- URL: https://cvberleninka.ru/article/n/analiz-modeli-bert-kak-instrumenta-opredeleniva-

merv-smvslovov-blizosti-predlozheniv-estestvennogo-vazvka (дата обращения:

25.05.2023) .

Червяков, Н.И. Представление текстовой информации для анализа тональности текста посредством искусственной нейронной сети, реализация частного словарного метода / Н.И. Червяков, Е.И. Лифанова // Наука, инновации, технологии. --2016.--№ 1.-- С. 63-70.-- URL:

https://cvberleninka.ru/article/n/predstavlenie-tekstovov-informatsii-dlva-analiza-

tonalnosti-teksta-posredstvom-iskusstvennov-nevronnov-seti-realizatsiva-chastnogo (дата обращения: 6.05.2023).

Размещено на Allbest.ru

...

Подобные документы

  • Основные проектные решения по разработке Барсуковского месторождения. Состояние разработки и фонда скважин. Понятия о сборе, транспорте и подготовке нефти и газа на месторождении. Характеристика сырья, вспомогательных материалов и готовой продукции.

    курсовая работа [2,6 M], добавлен 26.08.2010

  • Материальная основа и функции технического сервиса пути его развития. Современное состояние предприятий ТС, направления их реформирования. Виды и применение наноматериалов и нанотехнологий при изготовлении, восстановлении и упрочнении деталей машин.

    реферат [397,6 K], добавлен 23.10.2011

  • Новая технологическая схема утилизации хвостов обогащения на горно-обогатительном комбинате. Обоснование проектируемой схемы хвостового хозяйства. Системы подготовки пульпы и гидротранспорта промышленных отходов. Моделирование фильтрации из накопителя.

    дипломная работа [188,3 K], добавлен 20.11.2012

  • Определение технической сущности изобретения и порядок оформления патентной заявки на него. Конкретная цель данного технического решения: регламент поиска - программа, определяющая область проведения поиска; выбор стран и глубина поиска информации.

    курсовая работа [295,8 K], добавлен 27.05.2009

  • Технологический процесс производства обоев бумажных марка В1. Характеристика существующих систем водоснабжения и водоотведения. Проект производства работ по строительству флотатора-отстойника. Расчет разбавления сточных вод при сбросе их в озеро Шапор.

    дипломная работа [367,5 K], добавлен 21.10.2012

  • Горно-геологическая характеристика предприятия. Проектные решения по модернизации подъемной установки ствола. Расчет емкости подъемного сосуда и уравновешивающих канатов. Выбор основных размеров органа навивки. Определение мощности приводного двигателя.

    дипломная работа [322,7 K], добавлен 24.09.2015

  • Разработка схемы обогащения медно-цинковых руд Абызского месторождения. Технико-экономическое обоснование строительства обогатительной фабрики. Основные технологические и проектные решения. Генеральный план, транспорт и рекультивация нарушенных земель.

    дипломная работа [323,0 K], добавлен 18.03.2015

  • Современный уровень развития организации производства на предприятиях сервиса. Организация цеха по ремонту стиральных машин, расчет основных показателей деятельности цеха. Организации работы вспомогательных и обслуживающих хозяйств и служб предприятия.

    курсовая работа [330,5 K], добавлен 20.04.2009

  • Три вида исходной информации при разработке технологических процессов: базовая, руководящая и справочная. Выполнение рабочего чертежа детали. Тип производства и методы изготовления изделий при разработке технологических процессов с применением ЭВМ.

    реферат [1,1 M], добавлен 07.03.2009

  • Характеристика редукторов, их виды, назначение и применение в промышленности. Цилиндрический, червячный и конически-цилиндрический редукторы, их применение для изменения скорости вращения при передаче вращательного движения от одного вала к другому.

    реферат [36,8 K], добавлен 03.04.2013

  • Войлок: история применения и способы изготовления. Анализ лучших отечественных и зарубежных образцов тканей (изделий подобного типа). Анализ композиционного решения в разработке проекта тканей. Изготовление из войлока женской жилетки и ее декорирование.

    курсовая работа [32,1 K], добавлен 19.12.2013

  • Характеристика технического творчества как важной сферы интеллектуальной деятельности человека. Классификация методов поиска новых технических решений. Анализ списка вопросов по А. Осборну для изобретателя. Сущность идеального технического решения.

    контрольная работа [855,2 K], добавлен 26.03.2015

  • Проектирование кинотехнологической части широкоэкранного кинотеатра. Усилители и акустические системы EuroSound. Расчет освещения помещений киноаппаратного комплекса. Выбор электромонтажных материалов и описание контура заземления. Монтаж оборудования.

    курсовая работа [103,3 K], добавлен 06.01.2017

  • Урбоэкологический и ландшафтный анализ основных факторов, которые влияют на проектирование. Проектные предложения реконструкции территории загородной усадьбы в г. Севастополь, благоустройству территории и насаждений, их экономическое обоснование.

    курсовая работа [61,2 K], добавлен 05.12.2013

  • Анализ современного состояния рынка исследуемого предприятия, определение места организации на нем. Проектирование материального объекта услуги, производственных подразделений предприятия. Планировка рабочих мест и агрегатов процессов швейных цехов.

    дипломная работа [1,1 M], добавлен 17.10.2013

  • Закономерности существования и развития технических систем. Основные принципы использования аналогии. Теория решения изобретательских задач. Нахождение идеального решения технической задачи, правила идеальности систем. Принципы вепольного анализа.

    курсовая работа [3,3 M], добавлен 01.12.2015

  • Описание и анализ надежности шасси самолета Ту-154. Конструктивные усовершенствования тормозного цилиндра и дисков колес, расчет энергоемкости тормоза. Механизмы технического сервиса и разработка передвижной установки обслуживания шасси самолета.

    дипломная работа [1,2 M], добавлен 15.08.2010

  • Традиционный метод решения технических задач и кустарный промысел. Особенности чертежной тактики машиностроения и современного проектирования. Использование способов "мозгового штурма", синектики, морфологического анализа и ликвидации тупиковых ситуаций.

    реферат [42,1 K], добавлен 09.02.2011

  • Основное применение конических зубчатых колес в передачах между валами, оси которых расположены под углом. Геометрические параметры, силы и передаточное число детали. Компоновочные возможности при разработке сложных зубчатых и комбинированных механизмов.

    реферат [3,0 M], добавлен 14.02.2011

  • Нормативные материалы для нормирования труда, их применение. Сущность, разновидность, требования, разработка нормативных материалов. Методические положения по разработке нормативных материалов. Отраслевые нормативы. Классификация нормативов по труду.

    реферат [73,3 K], добавлен 05.10.2008

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.