Методы поиска заимствований в сети интернет
Рассмотрение содержания способов реализации поиска плагиата с использованием сети интернет. Исследование и характеристика способа реализации и внедрения этих способов для нового программного обеспечения, выполняющих поиск и анализ заимствований.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 03.12.2018 |
Размер файла | 14,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ФГБОУ ВО «Московский государственный университет технологий и управления имени К.Г. Разумовского (Первый казачий университет)» Пензенский казачий институт технологий (филиал)
Методы поиска заимствований в сети интернет
Рубрика: 05.00.00 технические науки
Москаленко Екатерина Николаевна, Слесарев Юрий Николаевич
Аннотация
В данной статье рассматриваются способы реализации поиска плагиата с использованием сети Интернет, рассмотрен способ реализации и внедрения этих способов для нового программного обеспечения, выполняющих поиск и анализ заимствований.
Ключевые слова: запросы, онлайн-сервисы, плагиат, поиск google, проверка документов
Abstract
METHODS OF SEARCHING FOR BORROWINGS OF TEXT DOCUMENTS ON THE INTERNET
Moskalenko Ekaterina Nikolaevna1, Slesarev Yuri Nikolaevich1
1Moscow State University of Technology and Management named K.G. Razumovsky (First Cossack University) Penza Cossack Institute of Technology (Branch)
This article explores how to implement search for plagiarism using the Internet, and how to implement and implement these methods for new software that perform search and analysis of borrowing.
Keywords: google web search API
На настоящий момент времени нет ни одного онлайн-сервиса и ни одной программы, которые бы со 100% вероятностью позволяли выявить плагиат в Интернете. Но если использовать несколько сервисов и программ, то высока вероятность, что плагиат будет выявлен.
Один из вариантов реализации поиска плагиата в текстовых и научных работах студентов возможен за счет использования google web search API. Программа или он-лайн сервис отправляет запрос по API в поиск google и получает ответы, иными словами результаты запроса. Если ответ содержит данные и что-то найдено, программа или сервис сравнивает результаты и анализирует совпадения. Если совпадений найдено много, на проверку отправляется следующее предложение. Проверка производится до конца текстового документа. Однако, если совпадений не найдено по нескольким выбранным программой автоматически предложениям, делается вывод об отсутствии заимствований, т.к. в сети Интернет похожий текстовый документ отсутствует.
Поиск плагиата может осуществляться по собственной справочной коллекции работ студентов. Google Web Search API позволяет осуществить поиск плагиата на веб-страницах с помощью JavaScript. Результаты поиска можно интегрировать в собственные веб-страницы или использовать в любом собственном программном обеспечении. Поисковую систему можно настроить как для поиска текста, так и изображений.
С помощью Google Web Search API можно осуществить:
- создание пользовательских поисковых систем, которые осуществлять поиск по указанному набору сайтов или страниц;
- поиск изображений;
- настройку внешнего вида результатов поиска;
- структурировать поиск данных, чтобы персонализировать результаты поиска [1].
Тематическая поисковая система является инструментом, который фокусируется на определенной тематике. Иными словами, осуществлять поиск плагиата имеет смысл не по всей сети Интернет, а по статьям, сборникам журналов, научной литературе и подобным источникам информации. плагиат программный интернет
Можно выполнять точный и надежный расширенный поиск, используя стандартную систему google.com поисковой системы, выбрав правильные ключевые слова, используя операторы поиска и фильтрацию результатов.
К примеру, в поисковую систему для студентов в инженерных специальностей можно добавить ключевое слово «инженерное», для того, чтобы дифференцировать технические результаты поиска общего характера от неоднозначных запросов [2].
Иногда условие поиска может быть неоднозначным или иметь различное значение в зависимости от контекста, поэтому поиск необходимо делать более точным. К примеру, слова, часто используемые в работах студентов, могут носить шаблонный характер, что в свою очередь не позволяет сделать вывод о наличии заимствований в работах.
Однако необходимо учитывать методы скрытия заимствований. В тексте могут применяться синонимы, замена слов местами, русские буквы могут быть заменены на латинские и т.д.
Кроме того, проверку текстов можно улучшить за счет внесения дополнительных фраз-синонимов, которые могут часто использоваться студентами в их научных работах.
Для проверки текста на плагиат надо вставить в строку поиска часть проверяемого текста, заключив его в кавычки.
Кроме рассмотренных выше способов, есть другие не менее результативные API по проверке текста в Интернете, к ним можно отнести Plagspotter.com и CopyScape.com (Premium).
Для поисковой системы Яндекс можно использовать стандартное API поиска, где исходный текст разбивается на шинглы. Либо возможно так же использовать собственные разработанные алгоритмы, которые осуществляют поиск во всей сети Интернет. Такие алгоритмы существуют практически у всех разработанных систем поиска заимствований в текстовых документах.
Однако самый точный результат оценки оригинальности можно получить только за счет использования нескольких систем или средств проверки текстов.
Библиографический список
1. Свободная открытая энциклопедия «Википедия» // Сайт wikipediа.org
2. URL: https://ru.wikipediа.org/wiki (дата обращения: 10.04.2017)
3. Шарапов Р. В. Анализ подходов к обнаружению заимствованных текстов // Журнал «Современные наукоемкие технологии» -- М: Российская академия естествознания,2015 г. No 3, С. 47-49 (дата обращения: 05.04.2017)
Размещено на Allbest.ru
...Подобные документы
Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.
реферат [32,2 K], добавлен 02.11.2010Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.
реферат [17,2 K], добавлен 12.05.2010Теоретические основы Интернет-технологий и основных служб сети Интернет. Ознакомление с возможностями подключения к сети Интернет. Основные службы сети. Принципы поиска информации в WWW. Обзор современных Интернет браузеров. Программы для общения в сети.
курсовая работа [385,2 K], добавлен 18.06.2010Выявление структуры и основных свойств незащищённой сети. Основные компоненты защиты системы. Исследование способов противодействия сетевым атакам. Разработка и формирование структуры защищённой сети с использованием технологии "Открытый Интернет".
курсовая работа [1,2 M], добавлен 01.07.2011Рост количества информации в мире, его увеличение в сети Интернет в геометрической прогрессии. Количество сайтов, зарегистрированных в поисковой системе Яндекс. Особенности эффективного поиска информации в сети Интернет. Схема информационных потоков.
презентация [52,6 K], добавлен 27.08.2013Библиографический поиск в сети Интернет, его принципы и используемые методы. Приемы патентного поиска научно-практических разработок по теме своей научной работы, составление соответствующего отчета. Инженерное творчество в подготовке специалистов.
практическая работа [33,9 K], добавлен 14.04.2014Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.
презентация [572,6 K], добавлен 16.02.2015Основные направления использования сети Интернет в юридической деятельности. Карточка реквизитов как средство поиска документов в информационной базе. Автоматический поиск по словам и словосочетаниям, основанный на использовании словаря данного типа.
контрольная работа [765,3 K], добавлен 10.09.2010Основные протоколы, используемые в Интернет. Инструменты поиска в Интернете. Популярные поисковые системы. Как работают механизмы поиска. Средства поиска и структурирования. Автоматизированная навигация по Сети. Критерии качества работы поисковой машины.
реферат [19,7 K], добавлен 14.02.2012Организация поиска информации по заданной теме в сети Интернет. Поиск с помощью поисковых машин. Преимущества и недостатки метода поиска по ключевому слову (фразе). Поиск в каталогах информационных ресурсов. Преимущества и недостатки предметных каталогов.
курсовая работа [47,5 K], добавлен 03.11.2010Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима "расширенный поиск", который имеет каждая из поисковых систем в Интернете.
реферат [27,3 K], добавлен 06.08.2014Интернет и его возможности. Распространенный и недорогой способ подключения к интернет. Схема передачи информации по протоколу TCP/IP. Характеристики адресов разного класса. Поисковые системы, способы поиска и скачивания информации в глобальной сети.
курсовая работа [245,6 K], добавлен 25.09.2013Задачи, решаемые малым предприятием с использованием Интернет-ресурсов. Способы и схемы подключения к сети Интернет. Организация доступа к информации и требования к технологии управления сетью. Расчет суммарных затрат на разработку программного продукта.
дипломная работа [2,0 M], добавлен 17.10.2013Понятие и сущность интернета, его роль и значение в современном обществе. Общая характеристика основных способов защиты информации (браузеры, прокси-серверы и антивирусные программы) при работе в сети интернет, а также оценка их достоинств и недостатков.
реферат [30,3 K], добавлен 17.11.2010Рождение Интернета как Всемирной компьютерной сети. Поиск информации в сети. Интернет как общение, развлечение, самообразование, творчество, саморазвитие, личностный рост, место совершения покупок, сделок и средство заработка. Структура сети Интернет.
презентация [594,2 K], добавлен 24.11.2013Теоретические сведения об алгоритмах поиска подстроки в строке. Глобализация информации в сети Internet. Интеллектуальный поиск. Алгоритм последовательного (прямого) поиска, Рабина и их применение. Анализ алгоритмов. Реализация программного кода.
курсовая работа [230,8 K], добавлен 12.02.2009Понятие, развитие, формы организации Интернет. Сеть Интернет как информационный канал. Особенности средств массовой информации в глобальной сети, ее функции и возможности. Исследование электронных версий газет и информационных агентств в сети Интернет.
курсовая работа [2,6 M], добавлен 09.04.2011Общие принципы организации поиска информации в сети Интернет. Поиск с помощью каталогов информационных ресурсов и с помощью поисковых машин. Правила поиска информации, касающейся учета текущих обязательств и расчетов с покупателями и заказчиками.
курсовая работа [35,0 K], добавлен 09.11.2010Понятие глобальной компьютерной сети "Интернет". Основы классификации ее информационных ресурсов. Виды информации, хранимой в Интернете и профессиональных базах. Вопросы эффективности и технологии поиска информации в Интернете и профессиональных базах.
реферат [26,1 K], добавлен 22.06.2011История создания сети Интернет. Характеристика и причины "бегства" в него. Проблема безопасности, защиты информации. Классификации способов общения в Интернете. Правила поведения в чате. Понятие флейм и флуд. Признаки виртуального романа, его последствия.
аттестационная работа [50,9 K], добавлен 09.10.2009