Важливість технології "GPT-3" для сучасного та майбутнього мовознавства

Подана інформація про технологію "GPT-3" та її роль і значення у сучасній прикладній лінгвістиці, про вплив штучного інтелекту на взаємодію користувачів з комп’ютерами через мову. Переваги і недоліки використання штучного інтелекту для генерації тексту.

Рубрика Иностранные языки и языкознание
Вид статья
Язык украинский
Дата добавления 30.10.2022
Размер файла 1018,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

ВАЖЛИВІСТЬ ТЕХНОЛОГІЇ «GPT-3» ДЛЯ СУЧАСНОГО ТА МАЙБУТНЬОГО МОВОЗНАВСТВА

Б.Л. Писаренко, І.Г. Данилюк

Анотація. У цьому дослідженні подана інформація про технологію «GPT-3» та її роль і значення у сучасній прикладній лінгвістиці та дотичних спеціальностях, про вплив штучного інтелекту на взаємодію користувачів з комп'ютерами через мову. Методологічною основою роботи є системний підхід, принцип наукової об'єктивності, критичного та структурно-системного підходу до літературної та джерельної бази роботи. Специфіка досліджуваної теми передбачає застосування порівняльного та структурного методу, а також узагальнення, що дало можливість виявити зміни у версіях технології, прослідкувати її основні етапи розвитку та визначити переваги і недоліки використання штучного інтелекту для генерації тексту.

Ключові слова: алгоритм, глибинне навчання, текст, трансформер, штучний інтелект.

Аннотация. В данном исследовании представлена информация о технологии «GPT-З» и ее роль и значение в современной прикладной лингвистике и касательных специальностях, о влиянии искусственного интеллекта на взаимодействие пользователей с компьютерами через язык. Методологической основой работы является системный подход, принцип научной объективности, критического и структурно-системного подхода к литературному и источниковой базам работы. Специфика исследуемой темы предусматривает применение сравнительного и структурного метода, а также обобщения, что позволило выявить изменения в версиях технологии, проследить ее основные этапы развития и определить преимущества и недостатки искусственного интеллекта при генерации текста.

Ключевые слова: алгоритм, глубинное обучение, текст, трансформер, искусственный интеллект.

Abstract. This study provides information on GPT-З technology and its role and significance in modern applied linguistics and related specialties, and the impact of artificial intelligence on user interaction with computers through language. The methodological basis of the work is a systematic approach, the principle of scientific objectivity, critical and structural-systematic approach to the literary and source base of work. The specifics of the research topic involves the use of comparative and structural methods, as well as generalization, which made it possible to identify changes in versions of technology, trace its main stages of development and identify advantages and disadvantages of artificial intelligence in text generation.

Key words: algorithm, deep learning, text, transformer, artificial intelligence.

прикладна лінгвістика штучний інтелект генерація текст

Дедалі частіше ми звертаємо увагу на те, як швидко і непомітно технології, що використовують штучний інтелект (далі - ШІ), проникають у наше повсякденне життя. Коли ви розблоковуєте свій гаджет за допомогою «Face ID», замовляєте таксі через програму на смартфоні, розмовляєте з голосовими помічниками типу «Google Assistant» чи «Siri» - ви використовуєте ШІ. Він досить різноманітний, адже сфери його використання та вимоги до функціоналу досить широкі та часто неочікувані для звичайного користувача.

Поки що більшість сценаріїв взаємодії є простими: активна дія людини - відповідь штучного інтелекту. Наприклад, роботи, з якими ви можете «поспілкуватись», зателефонувавши на номер свого мобільного оператора, аби вирішити якусь проблему чи дізнатись інформацію. На жаль, ці роботи не є дуже розумними - вони не завжди розуміють питання користувачів, тому часто вважаються неефективними.

Однак з плином часу та, відповідно, розвитком технологій ШІ починає уже активніше взаємодіяти з людьми. Це завдяки технології, що має назву «GPT-З» та є алгоритмом компанії «OpenAI». «GPT» є скороченням від «Generative pre-trained transformer» - породжувальний попередньо тренований трансформер. Третє, на цей момент останнє покоління алгоритму було представлене у червні 2020 року. На думку прикладних лінгвістів і спеціалістів дотичних спеціальностей, технологія має надзвичайно великий потенціал для розвитку комп'ютерної лінгвістики у багатьох сферах, що дасть користувачам змогу легше та комфортніше «спілкуватись» з комп'ютерами, онлайн- сервісами та, наприклад, з набором технологій, що називають «розумним будинком».

Головним завданням технології «GPT-З» є генерація тексту. Модель настільки добре вміє генерувати тексти, що їх дуже легко переплутати з тими, що написані людьми. Архітектура «transformer» третього покоління цього алгоритму аналогічна другому поколінню, однак кількість параметрів та корпусів тексту, на яких проводилось глибинне навчання моделі неймовірне - 175 мільярдів параметрів та 570 гігабайтів тексту [1, с. 4]. Друге покоління, для прикладу, нараховувало лише 1.5 мільярди параметрів та 40 гігабайтів тексту [1, с. 4]. Основне завдання, яке вдалось виконати авторам цієї технології - спроектувати алгоритм обробки природньої мови більш універсальним, ніж це було у другому поколінні. Тепер алгоритм потребує набагато менше навчальних даних для виконання конкретного поставленого лінгвістичного завдання, хоча для створення та навчання самого алгоритму трансформера потрібно навпаки - більше матеріалів. «GPT-З» може відповідати на питання до опрацьованого тексту, писати поезію та новини, розгадувати анаграми, писати інструкції, створювати унікальні ноти для гри на гітарі, допомагати в написанні HTML-коду для веб-сайтів, перекладати з декількох мов, генерувати тексти у стилі різних авторів та виконувати багато інших корисних пов'язаних з мовою функцій.

Розробники «GPT-З» провели експеримент з людьми, яким було запропоновано визначити, чи тексти та заголовки є написані людиною, чи штучним інтелектом. Результати показали, що третє покоління, за оптимальної кількості параметрів, здатне генерувати тексти так, що люди, які проходять тест, лише у 50 % випадків здатні визначити точно, ким/чим був написаний текст чи заголовок - людиною чи штучним інтелектом (рис. 1).

Рис. 1. Людська здібність визначати тексти, згенеровані ШІ

Цей результат вельми вражає, адже, враховуючи, що здатність комп'ютерів генерувати текст ще не є досконалою, а лише починає показувати перші ефективні, хоч і невеликі результати, ми можемо очікувати повністю згенеровані ШІ тексти уже у цьому десятиріччі. Цікавим зразком використання технології «GPT-3» є стаття, що була повністю згенерована штучним інтелектом та опублікована у Інтернет-версії відомого газетного видання «The Guardian» (рис. 2).

Рис. 2. Згенерована «GPT-З» частина статті в газеті «The Guardian».

Ще зразком корисного застосування технології генерації текстів є програма «AI Writer», що була спроектована під керівництвом письменника-новеліста Ендрю Мейна. Користувачі мають змогу листуватися за допомогою електронної пошти зі штучним інтелектом, який відповідає у стилі певних історичних діячів. У цьому випадку глибинне навчання трансформера «GPT-3» було проведено на корпусах текстів, які містили письмову творчість та вислови конкретних історичних діячів. На даний момент для використання сервісу потрібна попередня реєстрація на сайті, а також є певні обмеження щодо кількості користувачів на певний відрізок часу, адже алгоритм потребує багато ресурсів та потужностей комп'ютерів для виконання поставленого лінгвістичного завдання.

До значних переваг породжувального попередньо тренованого трансформера третього покоління «GPT-3» можна сміливо віднести можливість писати будь-якого типу та жанру тексти, як оригінальні, так і у стилі певних людей, аналізувати величезні корпуси текстів за лічені хвилини, робити переклади на інші мови, допомагати як лінгвістам, так і працівникам дотичних спеціальностей у виконанні певних завдань, що потребують великих часових затрат, як, наприклад, написання новин, оглядів, наукових робіт, кодів для створення сайтів, обробку великих масивів текстів для створення корпусів чи словників і так далі. «GPT-З» навіть використовують для розважальних цілей - є багато онлайн-сервісів та програм, що породжують текстові пригодницькі ігри. Їх ексклюзивність полягає у тому, що користувач, який обрав собі ігрову роль, не вибирає дії свого героя із наданих варіантів, як це популярно зараз у сучасних іграх, а пише будь-які свої дії у певний рядок інтерфейсу гри, штучний інтелект це аналізує та генерує наступні події у сюжеті так, що вони напряму залежать від того, що написав гравець. Найяскравішим представником такого жанру ігор, що базуються на алгоритмах штучного інтелекту, є «AI Dungeon».

Однак технологія «GPT-З» має і свої недоліки, які поки що є вагомими і не дають можливості використовувати весь потенціал ШІ всім охочим. Першим, і, мабуть, найбільшим недоліком є велика потреба у технічно потужних комп'ютерах та серверах, адже вони виконують надзвичайно багато безперервних обчислень. Так, для створення та навчання технології «GPT-3» розробникам програми знадобилось декілька мільярдів доларів інвестованих та власних коштів та доступ до баз даних із п'ятьомастами мільярдами діаграмно кодованих лексем (для порівняння: кількість лексем у Вікіпедії - приблизно три мільярди) [1; с. 9]. Загалом алгоритм треновано на сотнях мільярдів слів, і, оскільки тренувальні дані були різноманітними, трансформер третього покоління більше не потребує жодних тренувань для виконання поставлених мовних завдань.

Окрім суто фінансових затрат, можна також відзначити потенційно небезпечні можливості ШІ. Перед публічною презентацією алгоритму дослідники детально описали потенційний шкідливий вплив технології на людство. До зразків некоректного використання віднесли дезінформацію, спам, фішинг, зловживання правовими та державними процесами, написання шахрайських академічних есе та соціально-інженерний претекстинг [2]. Автори звернули увагу на ці недоліки, аби закликати лінгвістів, психологів та юристів до дослідження стосовно зниження потенційного ризику технології «GPT-З».

Можна зробити висновок, що породжувальний попередньо тренований трансформер «GPT-З» є великим кроком вперед до глобального використання технологій штучного інтелекту для виконання завдань, що потребують генерацію та обробку природньої мови, великих масивів текстів та для полегшення й оптимізації взаємодії комп'ютерів зі звичайними користувачами.

Звісно, технологія ще не є досконалою, однак багато людей впевнені, що ШІ уже в цьому десятилітті буде відігравати значну роль у якості помічника для людини у виконанні певних завдань.

СПИСОК ЛІТЕРАТУРИ

1. Brown Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav. «Language Models are Few-Shot Learners». - Baltimore, Maryland, 2020. - 75 p. URL: https://arxiv.org/pdf/2005.14165v4.pdf. Дата звернення: 07.0З.21.

2. Sagar, Ram. OpenAI releases GPT-З, the largest model as far. Analytics India Magazine. 2020. URL: httpsV/analyticsindiamag.com/open-ai-gpW-language-model/. Дата звернення: 07.0З.21.

ДЖЕРЕЛА ІЛЮСТРАТИВНОГО МАТЕРІАЛУ

1) Brown Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav. «Language Models are Few-Shot Learners». Baltimore, Maryland, 2020. p. 27. URL: https://arxiv.org/pdf/2005.14165v4.pdf. Дата звернення: 07.0З.21.

2) A robot wrote this entire article. Are you scared yet, human? The Guardian. 2020. URL: https://www.theguardian.com/commentisfree/2020/sep/08/robot-wrote-this-article-gpt-3. Дата звернення: 07.0З.21.

Размещено на Allbest.ru

...

Подобные документы

  • Мовознавство, або лінгвістика, — наука про природну людську мову загалом і про всі мови світу як її індивідуальних представників. Основні завдання загального мовознавства. Місце мовознавства в системі наук. Прикладне мовознавство та його значення.

    реферат [37,9 K], добавлен 14.08.2008

  • Етнопсихолінгвістика як лінгвістична дисципліна на межі психолінгвістики, етнолінгвістики та етнології та напрям мовознавства, що вивчає мову в її відроджені до культури, що досліджує взаємодію етнокультури в еволюції і реалізації мовної діяльності.

    реферат [18,8 K], добавлен 12.01.2011

  • Правила узгодження часів, присудок у реченні. Головні функції герундія. Переклад тексту "Market economy" на українську мову. Приватизація: поняття, переваги та недоліки. Функції управління матеріальними потоками. Керівництво інформаційною системою.

    практическая работа [76,3 K], добавлен 04.09.2013

  • Функціональна лінгвістика, або функціоналізм - вивчення функціонування мови як засобу спілкування. Функціонально-семантичне поле: центр і периферія. Лінгвістика тексту - дослідження та правила побудови зв'язного тексту. Комунікативна лінгвістика.

    реферат [16,5 K], добавлен 14.08.2008

  • Ресурси реалізації лексико-семантичних аспектів у перекладах художніх творів на українську мову шляхом їх порівняно-порівняльного аналізу. Національно-культурні та мовні особливості тексту аналізованого твору, способи їх передачі на українську мову.

    курсовая работа [133,1 K], добавлен 24.03.2015

  • Зміст і завдання загального мовознавства. Алгоритми автоматичного машинного перекладу. Провідні концепції визначення мови в лінгвістиці. Метод лінгвістичної географії. Соціолінгвістичні і психолінгвістичні методи. Застосування математичних методів.

    шпаргалка [77,2 K], добавлен 23.03.2014

  • Неогумбольдтіанство — напрям у лінгвістиці, який характеризується прагненням вивчати мову в тісному зв'язку з культурою її носіїв. Європейське та американське неогумбольдтіанство. Лінгвістичні погляди Б. Уорфа і Сепіра про мислення, культуру та мову.

    реферат [26,8 K], добавлен 14.08.2008

  • Зародження мовознавства як науки, початкові уявлення про мову, відображені в Біблії. Веди - найдревніша пам'ятка староіндійської літератури, лінгвофілософські погляди давньоіндійських граматистів. Розвиток мовознавства в Древній Греції, Римській імперії.

    курсовая работа [50,7 K], добавлен 22.07.2009

  • Основні складові стилю мовлення. Головні напрямки усного мовлення, переваги та недоліки. Переваги письма, процес читання. Особливості розмовного, наукового, офіційно-ділового, публіцистичного та художнього стилю. Будова тексту, види зв’язків у ньому.

    презентация [201,7 K], добавлен 13.01.2012

  • Роль та значення конверсії для мовознавства. Класифікація універсальних та специфічних конверсійних моделей. Ступінь продуктивності даного словотвірного способу в сучасній німецькій і українській мовах. Перспективні напрямки розвитку даного мовного явища.

    курсовая работа [71,1 K], добавлен 08.05.2015

  • Політичний дискурс у сучасній лінгвістиці, характер новоутворень у ньому. Комунікативний і прагматичний аспект перекладу текстів політичного дискурсу. Складності під час перекладу рекламного дискурсу на українську мову і намітити шляхи їх усунення.

    курсовая работа [52,5 K], добавлен 19.10.2015

  • Значення модальності в лінгвістиці як мовної універсалії. Основне значення модальних дієслів у німецькій мові, форми модальних дієслів, їх функція у реченні. Інфінітивні речення з дієсловами mssen, sollen, drfen, knnen, wollen, mgen та їх тлумачення.

    курсовая работа [36,2 K], добавлен 24.02.2014

  • Теоретичні основи використання тропів в літературі. Поняття метафори у сучасній стилістиці. Ознака семантичної двуплановості. Номінативна, інформативна та мнемонічна функція тропу. Аналіз використання метафори у структурі художнього тексту Дена Брауна.

    курсовая работа [30,7 K], добавлен 08.04.2013

  • Визначення поняття терміну у лінгвістиці. Класифікація англійських термінів. Особливості відтворення комп'ютерної термінології українською мовою. Кількісний аналіз засобів перекладу англійських скорочень з обчислювальної техніки, Інтернету, програмування.

    курсовая работа [48,8 K], добавлен 22.02.2015

  • Використання та оформлення цитат. Розділові знаки при цитуванні. Вислови і цитати відомих людей про мову. Функції цитати як одного із засобів організації художнього простору тексту на прикладі твору Л.Н. Большакова "Повернення Григорія Вінського".

    курсовая работа [77,1 K], добавлен 29.08.2014

  • Дослідження особливостей та основних проблем художнього перекладу. Огляд засобів передачі іншомовних реалій. Характеристика ресурсів реалізації лексико-семантичних аспектів у перекладах художніх творів на українську мову шляхом їх порівняльного аналізу.

    курсовая работа [129,3 K], добавлен 04.12.2014

  • Основні характеристики казки та значення цього виду літературного твору. "Морфологія казки" Проппа. Надсинтаксичні рівні одиниць тексту: супрасинтаксичний, комунікативний. Закони компресії тексту. Переклад як складова частина утворення вторинних текстів.

    дипломная работа [104,3 K], добавлен 06.12.2015

  • Визначення поняття науково-технічного тексту. Характеристика лінгвістичних особливостей НТТ. Аналіз граматичних та синтаксичних особливостей перекладу з німецької на українську мову. Виявлення особливостей поняття науково-технічного тексту та дискурсу.

    статья [23,2 K], добавлен 06.09.2017

  • Короткий тлумачний словник по мовознавству. У словнику приведені значення слів, словосполук, виразів і термінів, що мають відношення до мовознавства та його основних напрямів. Розкрита природа, функції, будова та походження термінів й виразів.

    шпаргалка [84,3 K], добавлен 22.08.2008

  • Поняття дискурсу в сучасній лінгвістиці. Методи дослідження дискурсу. Визначення поняття "текст". Аспекти створення образності і виразності. Аналіз використання стилістичних засобів у романі Джерома К. Джерома "Троє в одному човні (не рахуючи собаки)".

    курсовая работа [456,2 K], добавлен 07.11.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.