Кількісний аналіз систем письма: алфавіт нко

Вивчення походження й розвитку писемностей в регіоні Західної Африки. Розробка Соломаном Канте алфавіту нко для мов манден, що належать до родини манде і включають, зокрема, мови бамана, джула та манінка. Аналіз обчислення складності графічних форм.

Рубрика Иностранные языки и языкознание
Вид статья
Язык украинский
Дата добавления 24.05.2020
Размер файла 1,5 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Кількісний аналіз систем письма: алфавіт нко

Андрій Ровенчак

Писемність є важливим елементом культури. Завдяки їй ми можемо обмінюватися інформацією на віддалі, причому не лише розділені у просторі, але й відокремлені в часі. До винайдення сучасних засобів комунікації саме письмо - у різних його формах - було єдиним способом передати якісь відомості від людини до людини, не контактуючи безпосередньо. Відкритим залишається питання про те, з'явилася писемність один раз і потім поступово поширилася світом (моногенез) чи виникнення відбулося в кількох різних місцях незалежно (полігенез). В історії писемности натрапляємо на так зване предметне письмо, прикладами якого є ароко народу йоруба в Західній Африці чи кіпу з реґіону Анд у Південній Америці1. Графічні системи, які походять, найвірогідніше, від піктограм, розвинулися в різних народів до ідеографічного (ранні клинописи, китайські ієрогліфи), складового (кіпрське, японські складові азбуки) та алфавітного письма.

Найдавнішими відомими осередками розвитку писемности зараз уважають Межиріччя і Єгипет. Клинопис із долини Тигру і Євфрату та ієрогліфи з долини Нілу почергово випереджують одне одного в боротьбі за пріоритет у цьому питанні мірою того, як археологи виявляють нові знахідки Hans Jensen, Die Schrift in Vergangenheit und Gegenwart (Berlin: Deutscher Verlag der Wissenschaften, 1969), 21-23. Див. до прикладу: Larkin Mitchell, “Earliest Egyptian glyphs”, Archeology, 52, 2 (1999): 28-29.. Не виключено, що поява однієї з писемностей стала імпульсом до виникнення іншої внаслідок так званої «дифузії стимулу». У будь-якому разі єгипетські ієрогліфи зберігають першість за тяглістю писемної традиції, оскільки через ієратичну та демотичну форми збереглися обрисах окремих літер у таких алфавітах, як коптський чи нубійський.

Творення писемностей не є справою лише далекої історії. З цього погляду особливо цікавим є реґіон Західної Африки, де протягом ХІХ-ХХ століть виникла низка писемностей для місцевих мов Андрій Ровенчак, Джейсон Ґлейві, Африканські системи письма нового часу: Реґіон Суб- Сахари (Нью Гейвен-Львів-Абіджан: Athinkra, 2009); Andrij Rovenchak and Jason M. Glavy, African writing systems of the modern age: the Sub-Saharan region: First English Edition (revised and expanded from the original Ukrainian edition) (New Haven-Buena Park-New Rochelle- London-Lviv-Abidjan: Athinkra LLC, 2011).. Найбільше тут відзначилися представники родини мов манде (Mandй, див. рис. 1). Ще у першій чверті

XIX ст. силабарій (складове письмо) було створене для мови народу вай (Vai) в Ліберії - можливо, внаслідок «дифузії стимулу» від письма черокі (Cherokee) через американську місію Konrad Tuchscherer and P. E. H. Hair, “Cherokee and West Africa: Examining the origins of the Vai script”, History in Africa, 29 (2002): 427-486.. Століттям пізніше, вже у першій половині

XX ст., з'явилися силабарії менде (Mende), кпелле (Kpelle), лоома (Looma, Looma) та бамана (Bamana, Bambara) Gйrard Galtier, “Un exemple d'йcriture traditionnelle mandingue : le “masaba” des Bambara- Masasi du Mali”, Journal des africanistes, 57, 1 (1987): 255-266.. У цій статті зосередимо увагу на алфавітній писемності нко з цього ж реґіону.

Рис. 1. Родини африканських мов. Найбільші об'єднання, які класифіку¬ють як сім'ї і навіть макросім'ї: афразійські мови, ніло-сахарські мови (сюди також відносять сонгайські) та ніґеро-конґолезькі мови.

У південній части¬ні континенту виділяють різнорідну групу койсанських мов, якими розмов¬ляє автохтонне населення (на відміну від мов банту, що належать до ніґе- ро-конґолезьких). Мови манде належать до ніґеро-конґолезькоїмакросім'ї.

1. Алфавіт нко

Алфавітну писемність нко (Nko, N'ko, зНі) використовують переважно для мови манінка в Ґвінеї (Maninka-Mori). День писемности відзначають 14 квітня: саме тоді 1949 року ґвінейський просвітник Соломана Канте (Solomaana Kante, 1922-1987) завершив роботу над алфавітом нко, який планувався як писемність для мов манден (Manding, Manden), до яких, крім манінка, також належать споріднені бамана та джула (дьюла; Jula, Dyula, Dioula), див. рис. 2. Назва писемности походить від фрази N'ko «я кажу» мовами манден (складовий носовий /N/ позначає займенник першої особи однини). Нко є одним із трьох основних способів запису мов манден, разом із графікою на латинській основі та адаптаціями арабського письма, відомими під загальною назвою аджамі Valentin Vydrin, “Ajami script for the Mande languages”, in The Arabic script in Africa: Studies in the use of a writing system, eds. Meikal Mumin, Kees Versteegh. (Leiden-Boston: Brill, 2014), 199-224. (арабське )

Рис. 2. Мови манден. Різні варіянти (бамана, манінка, джула, мандінка) використовують як lingua franca в західноафриканському регіоні Coleman Donaldson, “Map of the Manding language continuum”. Zenodo (2018, December 30), https://doi.org/10.5281/zenodo.2528947.

Нко є, мабуть, найуспішнішою з нових писемностей, і не лише африканських. Мова манінка є рідною для понад 3,5 млн осіб11 у Ґвінеї, Малі та Сьєрра-Леоне. Завдяки активній діяльності спільноти нко цей алфавіт поширений також у Ліберії та Кот-д'Івуарі й у діяспорі (переважно в Ніґерії та Єгипті), а кількість користувачів може сягати від сотні тисяч до мільйона “Maninkakan, Eastern”, in Ethnologue: Languages of the World, Twentieth edition, eds. Gary F. Simons and Charles D. Fennig (Dallas, Texas: SIL International, 2017), online version: https:// www.ethnologue.com/language/emk. Andrij Rovenchak, “Quantitative studies in the corpus of Nko periodicals”, in Recent Contributions to Quantitative Linguistics, eds. Arjuna Tuzzi, Martina Benesova, Jan Macutek (Berlin-Boston: Mouton de Gruyter, 2015). 125-138..

Алфавіт нко налічує 27 літер (див. табл. 1), із яких 7 на позначення голосних, 1 для складового носового /N7, 19 для приголосних. Окремими знаками позначають носові приголосні, що виникають внаслідок асиміляції. За допомогою діякритичних знаків набір літер можна істотно розширити для позначення іншомовних звуків. У письмі нко є своїх 10 знаків для цифр, а також низка пунктуаційних знаків, які вживають разом із арабською пунктуацією. Напрямок письма - справа наліво.

Таблиця 1. Літери алфавіту нко.

Позначення «dental > n» відповідає асиміляції зубних після носових, а «y > ? » - аналогічній асиміляції фонеми /у/, що відповідає традиційному в африканістиці написанню для звука [j].

Вивчення писемностей зазвичай відбувається на межі кількох наукових дисциплін, скажімо, палеографії Ірина Нінелівна Войцехівська, «Палеографія», у кн. Енциклопедія історії України: у 10 т. Т. 8: Па-Прик, редкол.: В. А. Смолій (голова) та ін. ; Інститут історії України НАН України (Київ: Наукова думка, 2011), 34., що досліджує рукописні пам'ятки, історію й еволюцію письма, послуговується методами історії та мовознавства. Іґнац Ґельб Ignace Gelb, A Study of Writing (Chicago: University of Chicago Press, 1952). увів 1952 р. в обіг термін «граматологія» на позначення науки про письмо. Книга Жака Дерріди «Про граматологію» Jacques Derrida, De la grammatologie (Paris: Les Йditions de Minuit, 1967)., що вийшла друком 1967 р., містить, зокрема, філософський аналіз поняття «знак». Однак, попри давню традицію, можна сказати, що дослідження систем письма й сьогодні перебуває в зародковому стані. Так, наприклад, уважає Амалія Ґнана- десікан Amalia E. Gnanadesikan, “Towards a typology of phonemic scripts”, Writing Systems Research 9 (2017): 14-35.. У наступних розділах розглянемо підходи до аналізу писемности, що ґрунтуються на застосуванні кількісних методів. Маючи на меті не переобтяжувати виклад математичними виразами, все ж проілюструємо міркування числовими даними, даючи змогу читачам відчути справедливість зроблених висновків на підставі порівнянь.

2. Складність графічних форм

Складність певного об'єкта можна визначити як властивість, пов'язану зі сукупністю його багатьох взаємопов'язаних ознак, частин, якостей тощо Словник української мови: в 11 томах. Том 9 (Київ: Наукова думка, 1978), 277-278.. Це поняття досить широке Про поняття складности див. також у статті Юрія Головача в цьому номері., й у різних галузях науки використовують дуже різні способи оцінки - від простого підсумовування кількости компонентів до складних алгоритмів Damian Reyes, Alan L. Erera, and Martin W P Savelsbergh, “Complexity of routing problems with release dates and deadlines”, European Journal of Operational Research, 266, 1 (2018): 29-34; Chao Li and Pengjian Shang, “Complexity analysis based on generalized deviation for financial markets”, Physica A, 494 (2018): 118-128., що можуть включати нетривіяльний математичний апарат Bruce J. West, “Colloquium: Fractional calculus view of complexity: A tutorial”, Reviews of Modern Physics, 86, 4 (2014): 1169-1186.. Для кількісної характеристики складности графічних знаків Ґабріель Альтман Gabriel Altmann, “Script complexity”, Glottometrics, 8 (2004): 68-74. запропонував оцінити кожен графічний елемент за такими принципами:

- крапці відповідає 1;

- прямій лінії (/, I) - 2;

- дузі <180° (Э, J, «) - 3;

- неперервне з'єднання (як у літерах Б, С) оцінюється 1;

- ламане з'єднання (Ц V, Т) - 2;

- перетин (X) - 3.

Певні модифікації методу щодо врахування кількости з'єднань запропонував Ян Мачутек Jan Macutek, “Runes: complexity and distinctivity”, Glottometrics, 16 (2008): 1-16., а надалі також було враховано суцільне заповнення деяких елементів, що трапляється, зокрема, у вайському письмі Andrij Rovenchak, Jan Macutek, and Charles Riley, “Distribution of complexities in the Vai script”, Glottometrics, 18 (2009): 1-12.. Складність кожної літери обчислюють як суму відповідних складників.

Можна сказати, що розраховане за вказаними принципами значення складности буде приблизно відповідати інтуїтивному уявленню про це поняття, скажімо, літера «Ж» складніша за «Х», яка своєю чергою складніша за «І». Природно, отже, очікувати, що винахідник письма буде орієнтуватися на своє інтуїтивне відчуття і не створюватиме знаків складної форми на позначення часто вживаних звуків (а також складів чи інших комбінацій). Таку гіпотезу зручно перевірити на нових системах письма, створених для конкретних мов, оскільки адаптовані писемності обтяжені спадком тих мов, для яких їх застосовували початково.

У таблиці 2 наведено результати, одержані на підставі корпусу текстів мовою манінка Valentin Vydrin, Kirill Maslinsky, Andrij Rovenchak, Ibrahima Sory II Condй et al., Corpus Maninka de Rйfйrence et Corpus N'ko (2016-2017), mode d'accиs: http://cormand.huma num.fr/ cormani/projet.html., записаних алфавітом нко, обсяг якого понад 3,1 млн слів Valentin Vydrin, Andrij Rovenchak, and Kirill Maslinsky, “Maninka Reference Corpus: A Presentation”, in Actes de la confйrence conjointe JEP-TALN-RECITAL 2016, volume 11: TALAF (Paris: Association Francophone pour la Communication Parlйe (AFCP) et Association pour le Traitement Automatique des Langues (ATALA), 2016), 87-94.. Як видно з перших шести найчастотніших літер, що становлять понад половину всіх літер у текстах, складність лише незначно корелює з частотою вживання. Для числової оцінки можна розрахувати так званий коефіцієнт кореляції Пірсона г, який змінюється від -1 (зворотна кореляція) до +1 (пряма кореляція). Для літер нко отримаємо г = -0,38. Це значення як таке не є дуже інформативним, однак його можна порівняти, наприклад, зі складністю азбуки Морзе, яку було створено власне з таких міркувань, щоб найуживаніші літери мали найпростіші позначення. Коефіцієнт кореляції Пірсона для знаків азбуки Морзе в англійських текстах становить г = -0,82, тобто очікувано близький до -1, на відміну від значення для алфавіту нко, де така кореляція виявилася дуже незначною. Навіть більше, форма найчастотнішої (і найпростішої) літери на позначення /а/ безпосередньо пов'язана з арабською літерою 'аліф < І >.

Таблиця 2. Частоти і складність літер нко.

Літера

Фонетичне

значення

Абсолютна

частота

Відносна частота, i fi

Складність, Ci

1

/а/

1707136

18,9 %

2

l

/1/

744519

8,2 %

10

k

/к/

644025

7,1 %

10

Y

/і/

625359

6,9 %

12

d

/d/

538824

6,0 %

18

z

/є/

482959

5,3 %

6

Разом:

52,4 %

Отже, можемо зробити висновок, що міркування простоти накреслення літер не варто вважати основними для розробників писемности. Це твердження вимагає ще перевірки на інших системах письма, створених «під конкретну мову», серед яких і тубільні африканські, наприклад, вайський силабарій у Ліберії чи бамумське (Bamum) письмо в Камеруні, а також сила- барій для мови черокі на південному сході США.

3. Частотний аналіз і ортографічні принципи

Здавалось би, що алфавіт, створений для конкретної мови (чи групи мов) повинен мати просту ортографію, а в ідеалі - однозначну відповідність літер і фонем (чи спрощено - звуків). Цікаво з цього погляду проаналізувати нко, особливо з урахуванням того, що мова манінка є тональною.

Кількісну оцінку, яку ми застосуємо, називають ортографічною невизначеністю (англ. orthographic uncertainty). Цю величину розраховують за формулою, що походить з теорії інформації:

де N - загальна кількість фонем, а fk - кількість фонем, що мають k способів запису. Для ідеального алфавіту - з однозначною відповідністю «фонема-лі- тера» - матимемо U = 0.

В алфавіті нко є два відхилення від такої однозначної відповідносте Andrij Rovenchak and Valentin Vydrin, “Quantitative properties of the Nko writing system”, in Text and Language: Structures - Functions - Interrelations. Quantitative perspectives, eds. Peter Grzybek, Emmerich Kelih, Jan Macutek (Wien: Praesens, 2010), 171-181.. Перше пов'язане з тим, що деякі приголосні в певному фонетичному оточенні назалізуються (див. таблицю 1), унаслідок чого тверде /п/ і м'яке /ц/ матимуть по два варіянти написання. Крім того, можна вважати, що фонема /г/ реалізується також як /rr/, що позначається окремою рідкісною літерою, яка трапляється в записі ідеофонів. Друге відхилення є наслідком правила «економного написання» ґбаралі (^Ьатаїі): у двох складах із однаковими короткими голосними, що мають однаковий тон, першу не пишуть (за деякими винятками). Тобто короткі голосні матимуть по два варіянти написання, один із яких - це нульовий (порожній) символ. Класичним прикладом тут може бути одне з найуживаніших повнозначних слів, < лЗІ > Ьоїо `рука', у записі якого (читаємо справа наліво!) відсутнє перше /о/.

Розрахунок ортографічної невизначености в такому разі дає V = 0,37. Якщо подібні міркування повторити з урахуванням позначення тонів, внаслідок чого кількість голосних «фонем» значно збільшиться, то отримаємо менше значення V = 0,22. Отже, навіть у новому алфавітному письмі необов'язково досягають однозначного написання, якому відповідає V = 0, хоча й значення ортографічної невизначености залишається малим порівняно зі «старими» писемностями.

Для порівняння український алфавіт Solomija Buk, Jan Macutek, and Andrij Rovenchak, “Some properties of the Ukrainian writing system”, Glottometrics, 16 (2008): 63-79. характеризується невизначеністю V = 1,12. Внесок у це значення дають неоднозначності відображення голосних (наприклад, <а> і <я> на позначення /а/), м'яких приголосних (як-от <с> перед /і, є, ю, я/ і /ь/), п'ять варіянтів позначення /й/ - <й, є, ї, ю, я>, врахування асиміляції приголосних (наприклад, <к> у словах `якби', `вокзал' вимовляється як /ґ/) тощо. Аналогічний розрахунок в італійській ортографії Gerald Bernhard and Gabriel Altmann, “The phoneme-grapheme relationship in Italian”, in Analysis of Script. Properties of Characters and Writing Systems, eds. Gabriel Altmann and Fan Fengxiang (Berlin: de Gruyter), 11-21. дає V = 0,56 - таке низьке значення можна пояснити насамперед простотою запису голосних і меншою кількістю скупчень приголосних. У нко ж орто- графія ще простіша.

Цікаво, що особливості правопису нко можна обґрунтувати на підставі саме кількісних показників. Продемонструємо це на двох прикладах, перший із яких пов'язаний із правилом ґбаралі, а другий - із принципом позначення тонів.

Виявляється, що пари складів із однаковими короткими голосними досить часто трапляються в манінка, і в багатьох випадках саме вони є частот- нішими за інші можливі комбінації Andrij Rovenchak, “Phoneme distribution, syllabic structure, and tonal patterns in Nko texts”, Mandenkan: Bulletin semestriel d'йtudes linguistiques mandй, 47 (2011): P. 77-96., див. таблицю 3. Тому правило ґбаралі справді має кількісне підґрунтя, хоч і більш докладний аналіз вимагає врахуванням тонів голосних. писемність алфавіт мова графічний

Ортографія нко характеризується послідовним позначенням тонів. Їх у манінка виділяють чотири: високий, низький, висхідний і плаваючий. Оскільки голосні в манінка можуть бути короткі й довгі, то діякритичні знаки для тону враховують також довготу голосних, що дозволило обмежити кількість відповідних літер. Переважно трапляються високий і низький тони, причому перший - удвічі частіше за другий Andrij Rovenchak, “Quantitative studies in the corpus ofNko periodicals”, in Recent Contributions to Quantitative Linguistics, eds. Arjuna Tuzzi, Martina Benesova, Jan Macutek (Berlin-Boston: Mouton de Gruyter, 2015). 125-138.. Тому цілком логічним виглядає вибір не позначати на письмі саме високий тон над літерами для коротких голосних, оскільки вони трапляються значно частіше за довгі.

Таблиця 3. Пари складів із короткими голосними

Ca

Ce

Ce

Ci

Co

Ca

Cu

Ca

1967

53

239

961

197

130

421

Ce

128

189

1

20

42

5

18

Cs

183

16

887

85

18

65

37

Ci

695

63

94

386

72

81

30

Co

177

9

11

7

460

12

2

Ca

241

16

28

21

12

683

3

Cu

307

13

14

8

3

17

220

Для ілюстрації на рис. 3 наведено фраґмент сторінки з ґвінейського періодичного видання “'М^епїеге”. Звернемо увагу на те, що крапки під голосними позначають назалізацію. Водночас треба сказати, що відсутність діякритичного знака над останньою голосною слова відповідає наявності тонального артикля, який реалізується як плаваючий тон - причину такого ортографічного рішення також можна спробувати дослідити за допомогою кількісного аналізу.

Як бачимо з двох проаналізованих випадків, кількісні міркування добре обґрунтовують особливості ортографії нко. Цей висновок є очікуваним, оскільки правила правопису не повинні бути наслідком довільних рішень. Зважаючи на вказані кількісні характеристики, можемо також припустити, що для впровадження цих принципів було достатньо якісних оцінок - того, як людина відчуває рідну мову: пари складів з однаковими голосними в ма- нінка справді трапляються істотно частіше за інші, а високий тон удвічі переважає низький.

Рис. 3. Фрагмент сторінки 4 (записаноїяк «04» на вістрі стрілки у верхній правій частині сторінки: 40, тобто справа наліво, на відміну від того, як числа записують в арабському письмі) місячника “Wentere” (грудень 2015 р)., джерело: Bibliothиque йlectronique N'ko

Висновки

На кількох простих прикладах було продемонстровано низку кількісних підходів до аналізу писемности на прикладі алфавіту нко, який використовують як одну із систем письма для мови манінка та кількох споріднених мов у Західній Африці. Показано, до якої міри кількісні дані можуть прояснити функціонування писемности, зокрема з погляду форми літер і правил правопису.

На підставі текстів, записаних алфавітом нко, для мови манінка також було одержано деякі висновки, що ґрунтуються на законах квантитативної лінгвістики, таких як закон Ціпфа та закон Менцерата-Альтмана. Зокрема, аналіз наявного електронного корпусу текстів періодики обсягом близько 650 тис. слів дозволив оцінити розмір так званого «ядерного словника» (core vocabulary) та уточнити поняття мори як одиниці вимірювання довжини складів.

Результати описаних кількісних досліджень можуть бути корисними для вивчення фонотактики, просодичних елементів, у галузі історії письма та лексикографії, а також для порівняльних і контрастивних студій.

Анотація

У статті наведено інформацію про різні аспекти дослідження алфавіту нко, які можна відобразити кількісними параметрами. Насамперед за певними принципами обчислено складність графічних форм кожної з 27 літер, наприклад, крапці відповідає 1, прямому відрізку - 2, а дузі - 3; також певні ваги присвоюють різним типам з'єднання і перетину ліній. Далі зроблено частотний аналіз розподілу літер у корпусі текстів мовою манінка, записаних алфавітом нко, обсягом понад 3,1 млн слів. Це дало, зокрема, можливість простежити, наскільки складність графічної форми знаків корелює з їхньою частотністю. Виявилося, що така кореляція не надто істотна: коефіцієнт кореляції становить -0,38, тоді як, наприклад, для азбуки Морзе в англійських текстах він сягає -0,82. Повній зворотній кореляції, коли завжди простіші знаки використовують для частотніших літер, відповідає значення -1. Також показано, що частотний аналіз може слугувати додатковим обґрунтуванням деяких ортографічних принципів у нко, зокрема в позначенні тонів.

Наступної задачею був розрахунок так званої ортографічної невизначеносте: в ідеальному алфавіті, де є однозначна відповідність між фонемами (звуками) графемами (знаками) ця невизначеністю дорівнює нулеві. В алфавіті нко її значення досить малі: 0,37 без урахування позначення тонів та 0,22 з їх урахуванням. Для порівняння можна вказати значення, що відповідають «старими» писемностям: в українському алфавіті - 1,12, а дещо простіша італійська ортографія забезпечує невизначеність на рівні 0,56. Одержані результати можуть бути корисні для вивчення фонотактики, просодичних елементів, досліджень з історії письма та лексикографії, а також для порівняльних і контрастивних студій.

Ключові слова: алфавіт; мови манден; манінка; ортографія; складність графічної форми знаків.

The region of West Africa is of interest for the study of the origin and development of writing because a number of scripts were created there for several local languages during the 19th and 20th centuries, especially for the Mande family (the Vai, Mende, Kpelle, Looma, and Bamana syllabaries). In 1949 the Guinean enlightener Soulemayne Kantй developed the N'Ko alphabet for the Manding (Manden) languages, which belong to the Mande family and include, in particular, Bamana (Bambara), Jula (Dyula, Dioula), and Maninka. The name “N'Ko” originates from the phrase N ko `I say' in Manding languages. This script is predominantly used in Guinea for Maninka (Maninka-Mori), which is native to more than 3.5 million people in Guinea, Mali and Sierra Leone. The N'Ko alphabet is also widely used in Liberia, the Cфte d'Ivoire, and the African diaspora (mainly in Nigeria and Egypt) by a hundred thousand to a million persons.

This article provides information about studies of various aspects of the N'Ko alphabet. First of all, the complexity of the graphic forms of each of the 27 letters is calculated according to certain principles. For example, the point corresponds to 1, the straight line segment is 2, and the arc is 3; also certain weight is given to various types of connections and crossed lines. A frequency analysis of the distribution of letters is undertaken in the corpus of Maninka texts written in N'Ko, with more than 3.1 million words. This made it possible, in particular, to trace the extent to which the complexity of the graphic form of the signs correlates with their frequency. It appears that such a correlation is not very significant: the correlation coefficient is -0.38, whereas, for example, for the Morse code in English texts it reaches -0.82. The full inverse correlation, when simpler characters are always used to represent more frequent letters, corresponds to -1. It has also been shown that frequency analysis can serve as a further justification for certain orthographic principles in N'Ko, particularly of tone notation.

The next task was to calculate orthographic uncertainty: in an ideal alphabet, where there is a one-to-one correspondence between phonemes (sounds) and graphemes (signs), this uncertainty is equal to zero. In the N'Ko alphabet, its values are quite small: 0.37 without taking into account the tone notation, and 0.22 with tone notation. For comparison, the values corresponding to some “old” writing systems are as follows: in the Ukrainian alphabet, it equals 1.12, while a slightly simpler Italian orthography provides uncertainty at the level of 0.56.

The results obtained in this study can be useful for studying phonotactics, prosodic elements, and the history of writing and lexicography, as well as in comparative and contrastive studies.

Keywords: alphabet; Manding languages; Maninka; orthography; complexity of the graphic form of signs

Размещено на Allbest.ru

...

Подобные документы

  • Загальна характеристика основних гіпотез виникнення мови, у тому числі теорії божественності її появи. Історичні відомості про проведення "царських експериментів" з визначення природної, "першої правильної" мови. Аналіз походження та джерел Адамової мови.

    реферат [27,2 K], добавлен 11.09.2010

  • Походження мови як засобу спілкування. Гіпотеза звуконаслідувального походження мови. Сучасна лінгвістична наука. Зовнішні, внутрішні фактори, що зумовлюють зміни мов. Спорідненість територіальних діалектів. Функціонування мов у різні періоди їх розвитку.

    реферат [34,0 K], добавлен 21.07.2009

  • Вивчення історії становлення і розвитку англійської мови в Індії. Дослідження екстралінгвальних факторів, які мали вирішальне значення для формування англомовної картини світу в Індії. Аналіз лексичних та граматичних особливостей досліджуваної мови.

    дипломная работа [673,2 K], добавлен 24.11.2010

  • Вивчення мови англомовних міжнародних нормативно-правових документів (протоколів, конвенцій, угод, договорів та хартій), особливостей перекладу останніх відповідно до окремих типів граматичних трансформацій. Кількісний аналіз вживання їх різних типів.

    статья [25,3 K], добавлен 27.08.2017

  • Навчання української мови в 1-4 класах. Ознайомлення першокласників з різними частинами мови, дотримання граматичних норм. Аналіз лінгводидактичного матеріалу до вивчення частини мови "іменник" у початкових класах. Формування умінь ставити питання.

    курсовая работа [3,7 M], добавлен 17.03.2015

  • Культура мови як мовознавча та лінгводидактична наука, предмет та метода її вивчення. Зародки методичної термінології в часи Київської Русі, напрямки та головні етапи розвитку даного вчення. Сучасні лексикографічні праці з лінгводидактики, їх аналіз.

    контрольная работа [20,2 K], добавлен 13.03.2012

  • Способи перенесення власних імен з однієї мови в систему писемності. Проблема перекладу британських, французьких, українських та російських географічних назв. Переклад назв географічних об’єктів літерами українського алфавіту на прикладах друкованих ЗМІ.

    курсовая работа [44,6 K], добавлен 03.10.2014

  • Культура і мова. Характеристика й умови розвитку різновидів американських лінгвістичних субкультур. Аналіз лінгвістичних субкультур Великої Британії та їхнє місце в культурному розвитку країни. Аналіз однорідності регіональних варіантів англійської мови.

    курсовая работа [156,2 K], добавлен 17.01.2011

  • Виникнення та існування письма як особливого засобу спілкування. Послання та надмогильні надписи. Значення письма в історії суспільства. Предметне "письмо". Піктографія, ідеографія, фонографія. Збереження людського досвіду.

    реферат [14,8 K], добавлен 17.01.2007

  • Дослідження проблеми оцінювання сформованих умінь та навичок з іноземної мови у навчальному процесі в Україні. Характеристика та цілі міжнародних мовних тестів, особливості їх структури та рівень складності. Аналіз основних моментів підготовки до іспитів.

    статья [24,3 K], добавлен 06.09.2017

  • Албанська мова - державна мова Албанії, її належність до індоєвропейської родини та генетична близькість зі зниклими іллірійською та мессапською мовами. Лінгвістичні особливості албанської мови. Вільний порядок слів у реченні, граматична структура.

    реферат [21,4 K], добавлен 24.03.2012

  • Існуючі гіпотези щодо походження та етапів розвитку світових мов, оцінка їх переваг та недоліків. Закони, за якими розвиваються мови, зовнішні та внутрішні чинники даного процесу. Зв'язок розвитку мови з національним розвитком народу. Явище субстрату.

    реферат [41,1 K], добавлен 22.11.2010

  • Предмет та цілі германського мовознавства, його місце у циклі гуманітарних дисциплін. Індоєвропейська мовна сім’я. Вивчення історичних особливостей мови. Сучасні й давні германські мови, писемність германців. Періоди розвитку прагерманської мови.

    презентация [1,4 M], добавлен 19.09.2014

  • Збір та характеристика наукових та народних назв птахів, їх походження за етимологічними словниками. Аналіз та механізми взаємозв’язків між науковими та народними назвами та біологією птахів. Типологія наукових і народних назв за їх етимологією.

    курсовая работа [50,6 K], добавлен 20.12.2010

  • Вивчення діалектизмів на сучасному етапі та в історичному розрізі, їх походження та розвиток української мови. Діалектизми як лексика обмеженого функціонування. Аналіз використання діалектизмів у творі Марії Матіос "Солодка Даруся". Лексичні діалектизми.

    курсовая работа [44,3 K], добавлен 29.03.2009

  • Розгляд проблеми термінології, визначення її місця у структурі мови. Термін як особлива лексична одиниця. Сучасні тенденції розвитку економічної термінології. Вивчення розвитку термінів в галузі економіки. Модель лексикографічного опису мовної динаміки.

    статья [64,7 K], добавлен 17.08.2017

  • Проблеми лінгвістичного аналізу художніх творів. Мета лінгвостилістичного тлумачення - вивчення засобів мови у тексті. Методи проведення лінгвістичного аналізу на прикладі оповідання класика американської літератури XX ст. Дж. Стейнбека "The Pearl".

    курсовая работа [74,4 K], добавлен 28.10.2014

  • Характерні риси сучасної української літературної мови та особливості її використання. Історія становлення української графіки й орфографії, видання "Українського правопису" 1945 р. Походження іноземних слів, що використовуються в літературній мові.

    реферат [24,7 K], добавлен 04.07.2009

  • Вивчення типів запозичень, елементів чужої мови, які було перенесено до іншої мови в результаті мовних контактів. Огляд зберігання іноземними словами свого іншомовного походження у вигляді звукових, орфографічних, граматичних та семантичних особливостей.

    курсовая работа [80,5 K], добавлен 21.11.2011

  • Дослідження історії формування вірменської мови, створення національного алфавіту. Характеристика головних діалектів, граматичних особливостей та перших дослідників мови. Опис появи вірменів на Україні, друкарства та періодичних видань вірменською мовою.

    реферат [23,6 K], добавлен 18.05.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.