Методы поиска заимствований в сети интернет

Рассмотрение содержания способов реализации поиска плагиата с использованием сети интернет. Исследование и характеристика способа реализации и внедрения этих способов для нового программного обеспечения, выполняющих поиск и анализ заимствований.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 03.12.2018
Размер файла 14,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ФГБОУ ВО «Московский государственный университет технологий и управления имени К.Г. Разумовского (Первый казачий университет)» Пензенский казачий институт технологий (филиал)

Методы поиска заимствований в сети интернет

Рубрика: 05.00.00 технические науки

Москаленко Екатерина Николаевна, Слесарев Юрий Николаевич

Аннотация

В данной статье рассматриваются способы реализации поиска плагиата с использованием сети Интернет, рассмотрен способ реализации и внедрения этих способов для нового программного обеспечения, выполняющих поиск и анализ заимствований.

Ключевые слова: запросы, онлайн-сервисы, плагиат, поиск google, проверка документов

Abstract

METHODS OF SEARCHING FOR BORROWINGS OF TEXT DOCUMENTS ON THE INTERNET

Moskalenko Ekaterina Nikolaevna1, Slesarev Yuri Nikolaevich1

1Moscow State University of Technology and Management named K.G. Razumovsky (First Cossack University) Penza Cossack Institute of Technology (Branch)

This article explores how to implement search for plagiarism using the Internet, and how to implement and implement these methods for new software that perform search and analysis of borrowing.

Keywords: google web search API

На настоящий момент времени нет ни одного онлайн-сервиса и ни одной программы, которые бы со 100% вероятностью позволяли выявить плагиат в Интернете. Но если использовать несколько сервисов и программ, то высока вероятность, что плагиат будет выявлен.

Один из вариантов реализации поиска плагиата в текстовых и научных работах студентов возможен за счет использования google web search API. Программа или он-лайн сервис отправляет запрос по API в поиск google и получает ответы, иными словами результаты запроса. Если ответ содержит данные и что-то найдено, программа или сервис сравнивает результаты и анализирует совпадения. Если совпадений найдено много, на проверку отправляется следующее предложение. Проверка производится до конца текстового документа. Однако, если совпадений не найдено по нескольким выбранным программой автоматически предложениям, делается вывод об отсутствии заимствований, т.к. в сети Интернет похожий текстовый документ отсутствует.

Поиск плагиата может осуществляться по собственной справочной коллекции работ студентов. Google Web Search API позволяет осуществить поиск плагиата на веб-страницах с помощью JavaScript. Результаты поиска можно интегрировать в собственные веб-страницы или использовать в любом собственном программном обеспечении. Поисковую систему можно настроить как для поиска текста, так и изображений.

С помощью Google Web Search API можно осуществить:

- создание пользовательских поисковых систем, которые осуществлять поиск по указанному набору сайтов или страниц;

- поиск изображений;

- настройку внешнего вида результатов поиска;

- структурировать поиск данных, чтобы персонализировать результаты поиска [1].

Тематическая поисковая система является инструментом, который фокусируется на определенной тематике. Иными словами, осуществлять поиск плагиата имеет смысл не по всей сети Интернет, а по статьям, сборникам журналов, научной литературе и подобным источникам информации. плагиат программный интернет

Можно выполнять точный и надежный расширенный поиск, используя стандартную систему google.com поисковой системы, выбрав правильные ключевые слова, используя операторы поиска и фильтрацию результатов.

К примеру, в поисковую систему для студентов в инженерных специальностей можно добавить ключевое слово «инженерное», для того, чтобы дифференцировать технические результаты поиска общего характера от неоднозначных запросов [2].

Иногда условие поиска может быть неоднозначным или иметь различное значение в зависимости от контекста, поэтому поиск необходимо делать более точным. К примеру, слова, часто используемые в работах студентов, могут носить шаблонный характер, что в свою очередь не позволяет сделать вывод о наличии заимствований в работах.

Однако необходимо учитывать методы скрытия заимствований. В тексте могут применяться синонимы, замена слов местами, русские буквы могут быть заменены на латинские и т.д.

Кроме того, проверку текстов можно улучшить за счет внесения дополнительных фраз-синонимов, которые могут часто использоваться студентами в их научных работах.

Для проверки текста на плагиат надо вставить в строку поиска часть проверяемого текста, заключив его в кавычки.

Кроме рассмотренных выше способов, есть другие не менее результативные API по проверке текста в Интернете, к ним можно отнести Plagspotter.com и CopyScape.com (Premium).

Для поисковой системы Яндекс можно использовать стандартное API поиска, где исходный текст разбивается на шинглы. Либо возможно так же использовать собственные разработанные алгоритмы, которые осуществляют поиск во всей сети Интернет. Такие алгоритмы существуют практически у всех разработанных систем поиска заимствований в текстовых документах.

Однако самый точный результат оценки оригинальности можно получить только за счет использования нескольких систем или средств проверки текстов.

Библиографический список

1. Свободная открытая энциклопедия «Википедия» // Сайт wikipediа.org

2. URL: https://ru.wikipediа.org/wiki (дата обращения: 10.04.2017)

3. Шарапов Р. В. Анализ подходов к обнаружению заимствованных текстов // Журнал «Современные наукоемкие технологии» -- М: Российская академия естествознания,2015 г. No 3, С. 47-49 (дата обращения: 05.04.2017)

Размещено на Allbest.ru

...

Подобные документы

  • Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.

    реферат [32,2 K], добавлен 02.11.2010

  • Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    реферат [17,2 K], добавлен 12.05.2010

  • Теоретические основы Интернет-технологий и основных служб сети Интернет. Ознакомление с возможностями подключения к сети Интернет. Основные службы сети. Принципы поиска информации в WWW. Обзор современных Интернет браузеров. Программы для общения в сети.

    курсовая работа [385,2 K], добавлен 18.06.2010

  • Выявление структуры и основных свойств незащищённой сети. Основные компоненты защиты системы. Исследование способов противодействия сетевым атакам. Разработка и формирование структуры защищённой сети с использованием технологии "Открытый Интернет".

    курсовая работа [1,2 M], добавлен 01.07.2011

  • Рост количества информации в мире, его увеличение в сети Интернет в геометрической прогрессии. Количество сайтов, зарегистрированных в поисковой системе Яндекс. Особенности эффективного поиска информации в сети Интернет. Схема информационных потоков.

    презентация [52,6 K], добавлен 27.08.2013

  • Библиографический поиск в сети Интернет, его принципы и используемые методы. Приемы патентного поиска научно-практических разработок по теме своей научной работы, составление соответствующего отчета. Инженерное творчество в подготовке специалистов.

    практическая работа [33,9 K], добавлен 14.04.2014

  • Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.

    презентация [572,6 K], добавлен 16.02.2015

  • Основные направления использования сети Интернет в юридической деятельности. Карточка реквизитов как средство поиска документов в информационной базе. Автоматический поиск по словам и словосочетаниям, основанный на использовании словаря данного типа.

    контрольная работа [765,3 K], добавлен 10.09.2010

  • Основные протоколы, используемые в Интернет. Инструменты поиска в Интернете. Популярные поисковые системы. Как работают механизмы поиска. Средства поиска и структурирования. Автоматизированная навигация по Сети. Критерии качества работы поисковой машины.

    реферат [19,7 K], добавлен 14.02.2012

  • Организация поиска информации по заданной теме в сети Интернет. Поиск с помощью поисковых машин. Преимущества и недостатки метода поиска по ключевому слову (фразе). Поиск в каталогах информационных ресурсов. Преимущества и недостатки предметных каталогов.

    курсовая работа [47,5 K], добавлен 03.11.2010

  • Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима "расширенный поиск", который имеет каждая из поисковых систем в Интернете.

    реферат [27,3 K], добавлен 06.08.2014

  • Интернет и его возможности. Распространенный и недорогой способ подключения к интернет. Схема передачи информации по протоколу TCP/IP. Характеристики адресов разного класса. Поисковые системы, способы поиска и скачивания информации в глобальной сети.

    курсовая работа [245,6 K], добавлен 25.09.2013

  • Задачи, решаемые малым предприятием с использованием Интернет-ресурсов. Способы и схемы подключения к сети Интернет. Организация доступа к информации и требования к технологии управления сетью. Расчет суммарных затрат на разработку программного продукта.

    дипломная работа [2,0 M], добавлен 17.10.2013

  • Понятие и сущность интернета, его роль и значение в современном обществе. Общая характеристика основных способов защиты информации (браузеры, прокси-серверы и антивирусные программы) при работе в сети интернет, а также оценка их достоинств и недостатков.

    реферат [30,3 K], добавлен 17.11.2010

  • Рождение Интернета как Всемирной компьютерной сети. Поиск информации в сети. Интернет как общение, развлечение, самообразование, творчество, саморазвитие, личностный рост, место совершения покупок, сделок и средство заработка. Структура сети Интернет.

    презентация [594,2 K], добавлен 24.11.2013

  • Теоретические сведения об алгоритмах поиска подстроки в строке. Глобализация информации в сети Internet. Интеллектуальный поиск. Алгоритм последовательного (прямого) поиска, Рабина и их применение. Анализ алгоритмов. Реализация программного кода.

    курсовая работа [230,8 K], добавлен 12.02.2009

  • Понятие, развитие, формы организации Интернет. Сеть Интернет как информационный канал. Особенности средств массовой информации в глобальной сети, ее функции и возможности. Исследование электронных версий газет и информационных агентств в сети Интернет.

    курсовая работа [2,6 M], добавлен 09.04.2011

  • Общие принципы организации поиска информации в сети Интернет. Поиск с помощью каталогов информационных ресурсов и с помощью поисковых машин. Правила поиска информации, касающейся учета текущих обязательств и расчетов с покупателями и заказчиками.

    курсовая работа [35,0 K], добавлен 09.11.2010

  • Понятие глобальной компьютерной сети "Интернет". Основы классификации ее информационных ресурсов. Виды информации, хранимой в Интернете и профессиональных базах. Вопросы эффективности и технологии поиска информации в Интернете и профессиональных базах.

    реферат [26,1 K], добавлен 22.06.2011

  • История создания сети Интернет. Характеристика и причины "бегства" в него. Проблема безопасности, защиты информации. Классификации способов общения в Интернете. Правила поведения в чате. Понятие флейм и флуд. Признаки виртуального романа, его последствия.

    аттестационная работа [50,9 K], добавлен 09.10.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.