Комп’ютерна лексикографія: виклики та перспективи
Дослідження лексики, пов’язаної з комп’ютерними технологіями. З'ясування та розкриття стану антропоцентричної когнітивної лінгвістики в Україні. Розробка методики організації лексикографічної роботи в інтернет мережах. Створення англомовних довідників.
Рубрика | Иностранные языки и языкознание |
Вид | статья |
Язык | украинский |
Дата добавления | 06.11.2020 |
Размер файла | 26,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Комп'ютерна лексикографія: виклики та перспективи
Юлія Калимон
Анотація
У статті досліджено сучасний стан комп'ютерної (електронної) лексикографії, який умовно поділяють на корпусний та електронний періоди. Все більша комп'ютеризація суспільства, на перший погляд, значно полегшила роботу лексикографів та лінгвістів, проте практично одразу виникла і низка проблем. Серед перших називають принципи укладання корпусів, вимоги до яких значно розширилися та на сучасному етапі розвитку корпусних технологій повинні задовольняти найширше коло можливих питань. Більшість таких принципів стандартизована та уніфікована для зручності дослідників.
Наступною ключовою проблемою, яка існує на сьогодні, є врахування не лише основних лексикографічних постулатів, але і технологічних та експлуатаційних особливостей новітніх медіа (смартфонів та планшетів). Зважаючи, що практична лексикографія передовсім покликана задовольнити потреби кінцевого споживача, сьогодні все актуальнішими стають процедури визначення потреб користувачів через залучення їх до опитувань та аналізу лог-файлів (де накопичується зібрана службова та статистична інформація про події в системі).
Зазначено, що все частіше до власне створення лексикографічних проектів залучають нефахівців галузі, які виконують прості завдання здебільшого на волонтерських засадах. Така практика теж вимагає виважених та чітких правил для того, щоб уникнути створення неякісного кінцевого продукту. Є окремі онлайн платформи, де можна набрати певну кількість волонтерів для виконання таких завдань.
Окремим аспектом розвитку новітньої лексикографії є поява, передовсім в англомовному світі, особливого типу лексикографії - лексикографії для розваги. Основним об'єктом дослідження тут є лексика, пов'язана з певними хобі, книгою, фільмом чи комп'ютерною грою. Наголошено на значущості й актуальності цієї тематики із антропоцентричною когнітивною парадигмою сучасної лінгвістики. З'ясовано та розкрито стан дослідження таких явищ за кордоном та в Україні. Новизна роботи полягає в аналізі сучасного стану досліджень, розробок та методик організації лексикографічної роботи, а також окреслено перспективні напрямки розвитку цієї галузі в Україні.
Ключові слова: комп'ютерна (електронна) лексикографія, корпус, роззначення, новітні медіа, словники.
Постановка наукової проблеми та її значення
Лексикографія, перебуваючи у тісному зв'язку із іншими мовознавчими дисциплінами, пройшла шлях від найпростіших глосаріїв часів античності до створення електронних інтегральних словників на основі корпусних даних, накопичивши достатню кількість матеріалу для окреслення своєї структури, мети та перспективного розвитку. [10; 12, с. 252-259; 13] Беручи початок від доби Відродження, українська лексикографія пережила свої злети та падіння, зважаючи на історичні обставини та події, які мали безпосередній вплив на українську мову, проте, як і європейська лексикографія, умовно поділяється на три періоди:
1) дословниковий - пояснення малозрозумілих слів (глос);
2) ранній словниковий - опис мови в давніх перекладних та одномовних словниках;
3) сучасний період, який поділяється на періоди становлення національної літературної мови і власне сучасної лексикографії (у межах якої виокремлюють етап корпусної та електронної), який триває і досі [26; 29; 34, с. 26-31].
Наприкінці минулого століття Україна отримала незалежність, що не могло не вплинути на розвиток усіх аспектів державного життя. Водночас із відкриттям кордонів - і фізично, і ментально - держава і досі переживає складний період свого становлення. Попри очевидні економічні труднощі, українська наука намагається відстежувати останні світові тенденції та надолужити втрачений час. Це стосується і лексикографії [24]. Поруч із класичною лексикографією стрімко розвивається і комп'ютерна (електронна). Її завдання полягає і у розробленні принципово нових комп'ютерних програм для лексикографічної роботи, і використання комп'ютерних словників, створених зокрема і завдяки зазначеним вище програмам, що свідчить про деяку її діалектичну природу [18; 28].
Мета статті - вивчити наявні здобутки та окреслити основні проблеми, які виникли протягом розвитку цієї новітньої галузі лексикографії. Завдання роботи полягає у визначенні шляхів вирішення труднощів та окреслення перспективних напрямів досліджень.
Методи та методики дослідження. На сучасному етапі розвитку лексикографії комп'ютерний (електронний) її складник займає провідну позицію. Про це свідчать численні напрацювання методики та теорії створення словників за допомогою новітніх комп'ютерних технологій, висвітлені в численних роботах вітчизняних та зарубіжних вчених. Опрацювання знакових робіт дало змогу окреслити основні тенденції розвитку цього напряму лінгвістики та проаналізувати її сучасний стан.
Результати та дискусії
Спершу традиційні (паперові) словники переводили в електронну форму - т. зв. машинозчитувані словники (machine readable dictionaries), де процес іноді гальмувався різноманітними технічними труднощами на кшталт різних носіїв даних, наборів символів, умовних позначок, тощо.
З часом вони нівелювалися завдяки появі програм розпізнавання текстів, удосконаленню програмного забезпечення (лематизатори, синтаксичні аналізатори, засоби зняття омонімії, конкордансери) [17; 23, с. 8; 32, с. 250-261]. Усе це було б неможливим без обговорення та представлення розробок на численних конференціях та, у багатьох випадках, співпраці різних наукових установ, а також не без підтримки державних грантів [6, с. 4-10]. Отже, поступово такі словники доповнювалися додатковим аудіо-візуальним супроводом, згодом стало можливим укладання різних комп'ютерних (електронних) словників, зокрема і для інтернету.
Портативні пристрої сприяли прискоренню появи словникових форм, альтернативних паперовій. Електронна лексикографія, особливо в західному світі, поступово ставала синонімом лексикографії. Деякі вчені, ба навіть потужні видавництва, заговорили про зникнення паперових версій словників, оскільки попит на електронну продукцію набагато вищий (як бачимо, їх прогноз не справдився, хоча поява електронних словників значно змінила кон'юнктуру ринку) [7, с. 2].
Усе більша комп'ютеризація суспільства, на перший погляд, значно полегшила роботу лексикографів та лінгвістів, проте практично одразу виникла і низка проблем, пов'язаних передовсім із продуктами комп'ютерної лексикографії.
Першою було недотримання авторських прав при випуску словників на електронних носіях, згодом обсяги доступної інформації та розширення потреб не лише звичайних користувачів, а й професійних дослідників та вчених, дали поштовх до розроблення складніших алгоритмів та систем у галузі: від вбудованих словників для перевірки орфографії до створення перекладних словників на основі паралельних корпусів, автоматичних словників чи розроблення інтегрованих лексикографічних комп'ютерних систем [14; 16; 28, с. 261-282]. Усе більшого розвитку отримують системи з розпізнавання усного мовлення та навіть інтерпретації жестової мови. Ще одним об'єктом комп'ютерної лексикографії є укладання словників із новими лінгвістичними об'єктами як одиницями реєстру.
Прикладами такого типу комп'ютерних словників є створювані на основі одномовних тлумачних словників семантичні (ідеографічні) словники; словники конотацій та асоціативні з елементами залучення користувачів (які не завжди є спеціалістами галузі чи лексикографами) до визначення реєстрових одиниць. [1; 22; 30, с. 47-51]. Окрім цього напрацювання в цій галузі сприяли появі нових методик вивчення іноземних мов на базі комп'ютерів (computer-assisted language learning - CALL) та електронних корпусів текстів (data-driven learning) [11].
Усе ж, попри ейфорію від можливостей, які надає комп'ютерна обробка та доступність великих корпусних даних через інтернет, лексикографи стикнулися з низкою проблем, деякі з них невирішені й сьогодні. З появою корпусів їх величина та спектр завдань, які вони мали б вирішувати, вимагали чогось більшого, ніж просто переведення тексту із паперової в електронну форму.
Першочерговими завданнями було створення збалансованих та репрезентативних корпусів, розроблення системи позначень складників тексту (структурне роззначення), списків тегів для маркування спочатку частин мови, а згодом і синтаксичних, семантичних та дискурсивних зв'язків (лінгвістичне роззначення), просодичного та стилістичного маркування. Усі ці напрацювання удосконалювались протягом десятиліть і на сьогодні частина з них уже досягла рівня повної автоматизації, а частина і далі є предметом дискусій.
Наступною проблемою для розв'язання стало розроблення уніфікованих стандартів роззначення корпусів, адже із процесами глобалізації постало питання і про можливість роботи з/над корпусом ученими та організаціями з різних країн, які потребували стандартизованого підходу в трактуванні роззначеного корпусу. Протягом останніх десятиріч більшість цих питань розв'язується доволі успішно. [5, с. 8-101; 15; 17; 18]
На початку ХХІ ст. розвиток мобільних технологій та поява портативних пристроїв сприяли розробленню словників, які б «вміщались» у кишені. Проте і тут все не так однозначно, як може видатися на перший погляд. Як слушно зауважують вчені у [9], із появою інтернету сучасна людина стала нетерплячою та прагне отримувати на будь-який свій запит швидку та конкретну відповідь, а отже концепція представлення знань у мобільних версіях словників має бути переглянута.
Лексикографи повинні враховувати фундаментальні лексикографічні аспекти, а також навчитися розуміти технологічні та експлуатаційні питання, властиві новим медіа.
Проте розроблення версії друкованого або цифрового словника у вигляді мобільного додатку, що відповідає потребам старих і нових груп користувачів, не така проста.
Звісно усі рішення лексикографів та розробників ґрунтуються на потребах цільових користувачів. Як зазначає М. Рандел [26], словник, доступний на комп'ютері або мобільному пристрої, має значні переваги перед аналогами-попередниками, з чим також погоджується Й. Гао [4]. Однак, на думку Р. Лью [20], дуже важливо розрізняти простір зберігання (storage space) та презентаційний простір (presentation space) у лексикографічному ресурсі.
Презентаційний простір дуже обмежений через розмір інтерфейсу смартфона або планшета, і це завжди слід пам'ятати при підготовці даних. Але Р. Лью також виокремлює ще й третю категорію простору, яку він називає перцептивним простором (perceptual space), який не є властивістю словника, а радше користувача. Це здатність користувача словника сприймати й обробляти дані.
Дослідник стверджує, що надмірне представлення мікроструктури може призвести до інформаційного перевантаження. (див. також [33] про проблеми, пов'язані з інформаційним перевантаженням у словниках). Можливість доступу до відповідного контенту за допомогою гіперпосилань у тексті фактично економить місце в пам'яті пристрою, що теж варто враховувати розробникам. Ще одним технічним аспектом є розв'язання питання, чи буде програма працювати в режимі онлайн, офлайн або ж повноцінний доступ буде можливий в обох випадках. P. Лью дійшов висновку, що дослідження потреб користувача необхідно для того, щоб установити який вміст одразу повинен бути відображений на екрані, а який слід приховати.
Дослідження показують, що в поєднанні з іншими методами, зокрема з аналізом логів, опитування потенційних користувачів може забезпечити дуже цінну інформацію для розроблення таких словників [7, c. 9]. Водночас усе частіше акцент робиться на тому, щоб підвищувати і рівень грамотного використання словника користувачами, коли доступ до інформації практично необмежений і ринок заповнений неякісним контентом.
На думку С. Грейнджер, електронне середовище поступово переводить лексикографію в більш загальну сферу «наукової інформатики» і навчання може мати форму довідкового модуля, інтегрованого у програму електронної грамотності. Це б забезпечило користувача необхідними знаннями для розрізнення хорошого та поганого лексикографічного продукту [7, c. 11].
Як бачимо сьогодні потенційний користувач, а не професійний лінгвіст чи лексикограф, стає рушійною силою для створення нових лексикографічних продуктів. Прийшовши з галузі бізнес-менеджменту, ця методика отримала назву краудсорсинґу (crowdsourcing), яка полягає в передачі певних виробничих функцій невизначеному колу осіб (на волонтерських засадах або з мінімальною оплатою, без укладання трудового договору) [22].
Залучення звичайних людей не є чимось новітнім у лексикографії, адже волонтери брали участь у створенні Окфордського словника англійської мови (OED) ще наприкінці ХІХ ст., коли вони надсилали свої пропозиції реєстрових слів та прикладів їх вживання. За останнє десятиліття існує певна кількість успішних проектів, де анотаторами виступали не професійні експерти, а звичайні люди, проте результат їхньої роботи відзначався високим ступенем точності - до 80 % [2].
Окрім цього, серед переваг цього методу також називають фінансову вигоду, адже йде менше витрат, ніж на оплату роботи професійних учених. Попри очевидні переваги, існують і певні аспекти, яким варто приділяти особливу увагу:
1) мотивація (у т. ч. і фінансова у випадку масштабних чи комерційних проектів);
2) розроблення мікрозавдань, посильних для виконання непрофесіоналами галузі;
3) контроль якості (полягає в розроблені «золотого стандарту» експертами для відсіювання зовсім некомпетентних людей; способів перевірки неоднозначних результатів через вирахування ступеня впевненості (confidence score) чи рецензування особливо складних випадків експертом (refereeing); лексика лінгвістика комп'ютерний англомовний
4) дотримання домовленостей щодо авторських прав та фінансових зобов'язань (тут усе залежить від проекту та місцевого законодавства).
Серед найпоширеніших платформ, де застосовують цю методику, називають Amazon Mechanical, CrowdFlower3 та Clickworker4. (2, с. 70-75) В українській сучасній лексикографії схожим методом послуговуються розробники проекту https://r2u.org.ua/, який починався як джерельна база для російсько-українського перекладу, а згодом переріс у потужний ресурс із розділами для українсько-англійського перекладу, амбітними планами створення великого електронного словника української мови (ВЕСУМ) та Браунського українського корпусу (БрУК). Характерною його рисою є залучення користувачів до обговорення та редагування [25, с. 90-93].
Цікавим прикладом лексикографування і професіоналами, і звичайними людьми є поширений в англомовних країнах вид лексикографії для задоволення (lexicography for fun), основним об'єктом якого є створення довідників для хобі та кросвордів, а також словників-енциклопедій до кінофільмів і комп'ютерних ігор, які виходять разом із новими ігровими і телевізійними проектами (напр., [3], [8], [25]). Створені вони за зразком словників мови письменників чи героїв творів, проте, зазвичай, барвисто оформлені, ілюстровані численними фотографіями. Усі ці проекти стали яскравим свідченням того, що лексикографія, здебільшого в англомовному світі, завдяки таким тлумачно-енциклопедичним виданням усе більше переходить у ширше коло reference science (т. зв. «довідникова наука»), про що говорив Т. МакАртур у [21].
Висновки та перспективи подальшого дослідження
Як бачимо, укладання словників частково перейшло у віртуальну площину, де до обговорення реєстрових одиниць та інших аспектів укладання словника залучають безпосередньо і користувачів. У підсумку можемо стверджувати, що комп'ютерна лексикографія є напрямом комп'ютерної лінгвістики, яка використовує теоретичні та методичні досягнення інших наукових дисциплін (лінгвістики, лексикографії, комп'ютерних та корпусних технологій) для найповнішого осягнення та опрацювання системи мови у всій її повноті та глибині і в синхронічному, і в діахронічних зрізах. З подальшою інтеграцією України у європейську спільноту очікуємо появи схожих проектів та можливостей для створення інноваційних типів словників і в українській лексикографії.
References
1. Burkhanov, Igor. 1999. Linguistic Foundations of Ideography: Semantic Analysis and Ideographic Dictionaries. Rzeszow: WSP.
2. Cibej, Jaka, Darja Fise, Kosem Iztok. “The role of crowdsourcing in lexicography” (paper presented at eLEX 2015 conference in Herstmonceux Castle (UK) from 11 to 13 August 2015).
3. Down, Ellie. 2005. The Unofficial Guide to Harry Potter. Chichester : Summersdale Publishers Ltd.
4. Gao, Yongwei “The Appification of Dictionaries: From a Chinese Perspective”. (paper presented at eLex 2013 conference in Tallinn (Estonia) from 17 to 19 October 2013).
5. Garside Roger, Geoffrey Leech, and Tony McEnery. 1997. Corpus Annotation: Linguistic Information from Computer Text Corpora. London : Longman.
6. Gouws, Rufus Hjalmar, Ulrich Heid, Wolfgang Schweickard, et al. 2013. An International Encyclopedia of Lexicography. Supplementary. Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin; Boston: De Gruyter Mouton.
7. Granger, Sylviane. 2012. “Introduction: Electronic lexicography-from challenge to opportunity”. Electronic Lexicography, edited by Sylviane Granger, and Magali Paquot. Oxford: Oxford University Press.
8. Hidalgo, Pablo. 2017. Star Wars: The Last Jedi. The Visual Dictionary. N. Y.: DK Publishing.
9. Holmer Louise, Martens von, Monica, and Skoldberg Emma. Making a dictionary app from a lexical database: the case of the Contemporary Dictionary of the Swedish Academy. (paper presented at eLEX 2015 conference in Herstmonceux Castle (UK) from 11 to 13 August 2015)
10. Horot, Yevheniya, Lesya Malimon. 2015. “Suchasna leksykohrafiya: problemy y perspektyvy”. Aktualni pytannya inozemnoyi filolohiyi 3: 42-48.
11. Danchevska, Yuliya. 2014. “Korpusy tekstiv u linhvodydaktytsi: zdobutky ta perspektyvy”. Nova pedahohichna dumka 1: 58-60.
12. Dubichynskyy, Volodymyr. 2013. “Ukraynskaya leksykohrafyya: istoriya i sovremennost”. Slavyanskaya leksykohrafyya. Moskva: Azbukovnik.
13. Kulchytska, Tetyana. 1999. Ukrayinska leksykohrafiyaXIX-XXst.: bibliohraf. pokazhchyk. NAN Ukrayiny: Lviv. nauk. b-ka im. V. Stefanyka.
14. Kulchytskyy I., Y. Danchevska, and I. Likhnyakevych. 2013. “Deyaki aspekty stvor. ta vykoryst. paralel. korpusiv”. Nauk. Vis. VNU im. L. Ukrayinky 20: 48-52.
15. Kulchytskyy Ihor. 2017. “Informat. Tekhnol. poperedn'oho opratsyuvannya pryrodomovnykh tekstiv. Informatsiyni tekhnolohiyi ta vzayemodiyi”.
16. Kulchytskyy, Ihor. 2002. Kompyuterno-tekhnolohichni aspekty stvorennya suchasnykh leksykohrafichnykh system. - K. : Nats. b-ka Ukrayiny im. V. I. Vernadskoho NAN Ukrayiny.
17. Kulchytskyy, Ihor. 2015. “Tekhnolohichni aspekty ukladannya korpusiv tekstiv”. Dani tekstovykh korpusiv u linhvistychnykh doslidzhennyakh. Lviv: Vydavnytstvo Lvivskoi politekhniky.
18. Kupriyanov, Yevhen. 2008. “Kompyuterna leksykohrafiya yak problema suchasnoho movoznavstva (istorychnyy aspekt)”. VisnykKharkivskoho natsionalnoho universytetu im. V.N. Karazina 53: 12-16.
19. Levchenko Olena, Ihor Kulchytskyy. 2013. “Tekhnolohiya peretvorennya p'atymovnoho slovnyka porivnyan u elektronnu formu”. Visnyk Natsionalnoho universytetu "Lvivska politekhnika" 770: 129-138.
20. Lew, Robert. Space restrictions in paper and electronic dictionaries and their implications for the design of production dictionaries. Accessed February 25, 2019. https://repozytorium.amu.edu.pl/bitstream/10593/799/1/ Lew_space_ restrictions _in_paper_and_electromc_dictionaries.pdf
21. McArthur, Tom. 1986. Worlds of Reference. Cambridge: Cambridge University Press.
22. Meyer, Christian, Andrea Abel. 2017. “User participation in the Internet era”. The Routledge Handbook of Lexicography. Abingdon; New York: Routledge.
23. Perebyynis, Valentyna, Viktor Sorokin. 2009. Tradytsiyna ta kompyuterna leksykohrafiya. Kyiv: Vyd. tsentr KNLU.
24. Polyuha, Lev. 2006. “Ukrayinske slovnytstvo na perelomi tysyacholit”. Ukrayinoznavchi studiyi 6-7:17-25.
25. Reynolds, David. 2000. Star Wars : the Visual Dictionary. The Ultimate Guide to Star Wars Characters and Creatures. N.Y.: Dorling Kindersley.
26. Rundell, Michael. Redefining the dictionary: From print to digital. Accessed February 20, 2019. https://www.kdictionaries.com/kdn/kdn21_2013.pdf
27. Rusanivskyy, V., V. Shyrokov. 2002. “Informatsiyno-linhvistychni osnovy suchasnoyi tlumachnoyi leksykohrafyi”. Movoznavstvo 6: 7-48.
28. Shyrokov, Volodymyr. 2011. Kompyuterna leksykohrafiya. Kyiv: Nauk. dumka.
29. Syvokozova, Viktoriya. 2013. “Do pytannya periodyzatsiyi ukrayinskoyi tlumachnoyi leksykohrafyi”. Movni i kontseptualni kartyny svitu 43: 61-62.
30. Snizhko, Nataliya. 2017. “Nova dzherelna baza ukrayinskoyi leksykohrafiyi v systemi intehralnykh
linhvistychnykh doslidzhen”. Lyudyna. Kompyuter. Komunikatsiya. Lviv:Vydavnytstvo Lvivskoyi politekhniky 47-51.
31. Starko, Vasyl. 2017. “Kompyuterni linhvistychni proekty hurtu r2u: stan ta zastosuvannya”. Ukrayinka mova. 3: 86-97.
32. Svensen, Bo. 1993. Practical Lexicography: Principles and Methods of Dictionary-Making. Translated by John Sykes and Kerstin Schofield. Oxford: Oxford University Press.
33. Tarp, Sven. 2012. “Online dictionaries: today and tomorrow”. Lexicographica. De Gruyter. 28: 253-268.
34. Trap-Jensen, Lars. Lexicography between NLP and Linguistics: Aspects of Theory and Practice (paper presented at eLEX 2017 conference in Leiden (the Netherlands) from 19 to 21 September 2017.
Аннотация
Компьютерная лексикография: вызовы и перспективы
Калымон Юлия
В статье исследовано современное состояние компьютерной (электронной) лексикографии, который условно разделяют на корпусный и электронный периоды. Все большая компьютеризация общества, на первый взгляд, значительно облегчила работу лексикографов и лингвистов, однако практически сразу возник и ряд проблем. Среди первых называют принципы составления корпусов, требования к которым значительно расширились со времен появления первых образцов и на современном этапе развития корпусных технологий должны быть способны отвечать на широкий круг возможных вопросов.
Большинство принципов, разработанных сейчас, стандартизированы и унифицированы для удобства исследователей ученых и простых пользователей.
Следующей ключевой проблемой, которая существует сегодня, является учет не только основных лексикографических постулатов, но и технологических и эксплуатационных особенностей новых медиа (смартфонов и планшетов).
Учитывая, что практическая лексикография прежде всего призвана удовлетворить потребности конечного пользователя, сегодня все более актуальными становятся процедуры определения потребностей пользователей путем привлечения их к опросам и анализе логов. Отмечено, что все чаще собственно к разработке лексикографических проектов привлекают неспециалистов отрасли, которые выполняют простые задачи, в основном на волонтерских началах. Такая практика тоже требует взвешенных и четких правил для того, чтобы избежать создания некачественного конечного продукта. Существуют отдельные онлайн платформы, где можно набрать определенное количество волонтеров для выполнения таких задач. Отдельным аспектом развития новой лексикографии является, прежде всего в англоязычном мире, особого типа лексикографии - лексикографии для развлечения. Основным объектом исследования здесь является лексика, связанная с определенными хобби, книгой, фильмом или компьютерной игрой. Подчеркнуто значимость и актуальность данной тематики с антропоцентрической когнитивной парадигмой современной лингвистики. Выяснено и раскрыто состояние исследования таких явлений за рубежом и в Украине. Новизна работы заключается в анализе современного состояния исследований, разработок и методик организации лексикографической работы, а также обозначены перспективные направления развития этой отрасли в Украине.
Ключевые слова: компьютерная (электронная) лексикография, корпус, разметка, новые медиа, словари.
Abstract
Computational Lexicography: Challenges and Perspectives
Kalymon Yulia
The article considers the modern state of computer (electronic) lexicography, which is traditionally divided into corpus and electronic ones. At first glance the increasing global computerization has greatly facilitated the work of lexicographers and linguists, however, a number of problems have arisen at once.
Among the first ones are the principles of corpora compilation, the requirements of which have considerably expanded since the appearance of the first ones, and at present stage of corpus technologies development corpora should be able to answer a wide range of possible inquiries and meet the needs of different users. Most of the principles developed up till now are standardized and unified for the convenience of both scientific and non-scientific research.
The next key issue that exists nowadays is not only the inclusion of the main lexicographic postulates, but also considering technological and operational features of the new media (smartphones and tablets). Provided practical lexicography is primarily intended to meet the needs of the end user, the procedures for determining the needs of users are becoming increasingly relevant today by involving them in surveys and analysis of logs. It is noted that more and more non-specialists of the field are involved in the actual development of lexicographic projects.
They perform simple tasks, mainly as volunteers. Such practices also require well-balanced and clear rules in order to avoid creating a low-quality final product. There exist a few online platforms where you can “hire” a number of volunteers to perform such tasks.
Another aspect of the development of new lexicography, mainly in the English-speaking world, is a special type of lexicography - lexicography for fun. The main object of research here is the vocabulary associated with certain hobbies, books, films or computer games. The article emphasizes the importance and relevance of this subject with anthropocentric cognitive paradigm of modern linguistics. The state of research of this phenomenon abroad and in Ukraine is clarified and disclosed. The novelty of the work is to analyze the current state of research, development and methods of organization of lexicographic work, as well as to indicate the perspectives of its development in Ukraine.
Key words: computational (electronic) lexicography, corpus, annotation, new media, dictionaries.
Размещено на Allbest.ru
...Подобные документы
Використання словників для з'ясування значення неологізму або з контексту. Способи передачі неологізмів сфери економіки, комп`ютерних технологій та Інтернет засобами української і російської мов. Особливості адекватного перекладу даних типів неологізмів.
дипломная работа [93,7 K], добавлен 20.03.2011Визначення поняття терміну у лінгвістиці. Класифікація англійських термінів. Особливості відтворення комп'ютерної термінології українською мовою. Кількісний аналіз засобів перекладу англійських скорочень з обчислювальної техніки, Інтернету, програмування.
курсовая работа [48,8 K], добавлен 22.02.2015База дослідження концептів в англійській мові. Дослідження когнітивної лінгвістики, структура та типологія концептів. Основні напрями концептуального аналізу лексики. Аналіз та визначення структури концепту "national park", його етимологія та дефініція.
курсовая работа [140,2 K], добавлен 30.04.2013Дослідження екстралінгвальних факторів появи й поширення комп'ютерних інновацій в англійській мові. Фактори використання та поширення великої кількості англійськомовних комп’ютерних інновацій не тільки серед носіїв англійської мови, ай у всьому світі.
статья [22,3 K], добавлен 19.09.2017Інтернет-мова як відображення нових форм комунікації. Особливості та класифікація інтернет-лексики сучасної китайської мови. Основні причини, які впливають на специфіку китайської інтернет-лексики, щодо труднощів перекладу та її тематичної класифікації.
курсовая работа [131,0 K], добавлен 13.12.2014Диференціація поглядів на поняття "дискурсу" як лінгвістичної проблеми. Місце комп’ютерного спілкування в комунікативному середовищі. Характерні риси англійського комп’ютерного дискурсу, його жанри та текстуальний аспект. Способи утворення сленгу.
курсовая работа [51,8 K], добавлен 22.11.2014Визначення та характеристика основних особливостей успішного та хибного провокатора. Вивчення результату мовленнєвих дій успішного провокатора, яким є досягнення комунікативної мети. Дослідження й аналіз антропоцентричної парадигми сучасної лінгвістики.
статья [26,0 K], добавлен 31.08.2017Когнітивізм: концепт лінгвістики. Порівняльно-історична, системно-структурна (таксономічна) й комунікативно-функціональна наукові парадигми мовознавства. Експансіонізм, антропоцентризм, функціоналізм та експланаторність когнітивної лінгвістики.
реферат [22,2 K], добавлен 14.08.2008Лексикографія як розділ мовознавства, пов’язаний зі створенням словників та опрацюванням їх теоретичних засад. Староукраїнська лексикографія. Українська лексикографія з кінця XVIII ст. по ХХ ст. Етапи розвитку концепції і принципів укладання словників.
статья [25,8 K], добавлен 14.02.2010Словоскладення як продуктивний спосіб словотвору в англійській мові. Поняття неологізму в сучасній лінгвістиці. Продуктивні способи деривації нових мовних одиниць. Особливості дії словоскладення та його модельний ряд. Інтернет як джерело неологізмів.
курсовая работа [54,4 K], добавлен 06.12.2015Розкриття стану проблеми роботи над переказом в психолого-педагогічній і методологічній літературі. Аналіз стану проблеми в практиці навчання сучасної школи. Організація та навчання усним і письмовим переказам. Види переказів і методика їх проведення.
курсовая работа [75,7 K], добавлен 24.11.2008Функціонування особових займенників у природній людській мові у контексті когнітивної лінгвістики, функціонально-семантичного поля та філософії говору. Характеристика дослідження граматики та психолінгвістики. Особливість пошуку мовних універсалій.
статья [42,9 K], добавлен 06.09.2017Розвиток та становлення когнітивної лінгвістики. Аналіз поняття концепту, фрейму, сценарію, стереотипу та скрипу. Визначення смислового наповнення концептів любов і кохання. Особливості їх концептуалізації у свідомості носіїв української мови та культури.
курсовая работа [89,9 K], добавлен 25.02.2013З'ясування основ стилістичного аспекту розшарування лексики в українській мові. Дослідження наявності маркованої лексики в драмі Лесі Українки "Лісова пісня". Аналіз окремих маркованих слів, їх естетичного аспекту та функціонального призначення.
курсовая работа [43,6 K], добавлен 30.09.2015Характеристика модальності як текстової категорії. З’ясування специфіки англомовних текстів та їхнього трактування мовою перекладу. Здійснення практичного аналізу передачі модальності при перекладі художніх творів з англійської мови на українську.
курсовая работа [44,4 K], добавлен 30.11.2015Звук і значення: теорія питання, історія вивчення, сучасний стан та перспективи. Опис методики та етапів роботи дослідження кольорової картини тексту та підтексту. Дослідження звукового складу віршів А. Ахматової з точки зору кольорофоносемантики.
курсовая работа [60,2 K], добавлен 18.05.2015Пошукові системи Інтернет-мережі. Популярні он-лайн перекладачі, переваги електронних словників. Використання ресурсів Інтернету при перекладі науково-технічної літератури. Помилки і неточності, що виникають в процесі комп’ютерного перекладу текстів.
курсовая работа [46,3 K], добавлен 09.02.2013Витоки юридичної лінгвістики. Види юридичного права. Класифікація лексики в кримінальному праві. Шляхи перекладу англійських термінів кримінального право на українську мову. Фактори ефективності перекладу юридичної лексики та перекладацькі трансформації.
курсовая работа [47,9 K], добавлен 18.12.2012Вивчення особливостей німецької мови та використання її діалектів в Європі. Характеристика українсько-німецьких мовних контактів. Визначення основних проблем історичної періодизації дослідження німецької економічної лінгвістики, її роль в науці.
реферат [30,5 K], добавлен 14.09.2011Розвиток тендерної лінгвістики. Як культурні та соціальні чинники впливають на формування мовної поведінки в осіб різної статі. Становлення тендерної лінгвістики як окремої галузі в українському мовознавстві. Мовні відмінності у соціальних групах.
статья [20,9 K], добавлен 07.02.2018