Система автоматичної оцінки якості машинного перекладу, що базується на алгоритмі метрики BLEU
Переваги систем машинного перекладу, методи його автоматичної оцінки. Розробка інтелектуальної системи автоматичної оцінки якості машинного перекладу з використанням метрики BLEU. Проблема кореляції автоматичної та експертної оцінки машинного перекладу.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | украинский |
Дата добавления | 17.01.2013 |
Размер файла | 3,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
,
де - постійні витрати на термін реалізації розробленого продукту, грн.;
- витрати на розробку, грн.; - ціна одиниці продукції, грн.;
- змінні витрати на одиницю продукції, грн.
і визначаються з таблиці доходів і витрат.
68218,30 грн.
3443,91/25 = 137,76 грн.
Виходячи із цих даних визначаємо точку беззбитковості:
(67133,20 + 41378,2) / (68218,30 - 137,76) = 1,59 ~ 2 (екз.);
3.6 Висновки по розділу 3
Розроблений програмний продукт "Білінговий програмний комплекс" задовольняє технічним вимогам споживачів, а його впровадження на ринку є економічно доцільним.
4. Охорона праці і навколишнього середовища
4.1 Загальні питання
Згідно ст.1 Закону України "Про охорону праці" [20] під охороною праці розуміється система правових, соціально-економічних, організаційно-технічних, санітарно-гігієнічних і лікувально-профілактичних заходів і засобів спрямованих на збереження здоров'я і працездатності людини в процесі праці.
Збереження здоров'я користувачів, персональних ЕОМ, всіх працюючих, підтримання ефективності та надійності їх праці на належному рівні є одним із аспектів застосування дисципліни - охорона праці.
У даній дипломній роботі на тему "Інтелектуальна система автоматичної оцінки якості машинного перекладу" розглядаються питання про створення системи, яка буде надавати можливість автоматично оцінювати якість машинного перекладу на основі еталонних текстів та порівнювати системи машинного перекладу. Основний засіб, що використався під час виконання дипломної роботи - персональний комп'ютер.
4.2 Виробнича санітарія
Питання охорони праці в даному розділі розглядаються стосовно працівників комп'ютерного відділу підприємства. У приміщенні працюють робітники, які виконують роботу з використанням ПЕОМ. Тому передбачаються умови праці з урахуванням санітарних норм ДНАОП 0.00 - 1.31 - 99 [21], тобто норма площі на одного працюючого не менш 6м2, об'єм - 20 м3. Дана дипломна робота розроблялася у робочому приміщенні, яке містить одне робоче місце та має розміри: довжина - 3.9 м, ширина - 3.5 м, висота - 3 м, загальна площа - 13.65 м2 та об'єм - 40.95 м3, що цілком відповідає нормам ДНАОП 0.00-1.31-99. Кімната з робочим місцем знаходиться на п'ятому поверху будинку.
При роботі на персональному комп'ютері на людину впливають ряд шкідливих і небезпечних факторів, що класифікуються відповідно ГОСТ 12.0.003-74 ССБТ "Небезпечні та шкідливі виробничі фактори. Класифікація" [22]. Основні з них приведені в таблиці 4.1
Таблиця 4.1 - Перелік небезпечних і шкідливих виробничих факторів у приміщенні
Найменування фактору |
Джерела виникнення |
Нормоване значення |
|
1. Розумова перенапруга |
Труднощі виробничого завдання |
Зниження витривалості до вихідного 40-50% [20] |
|
2. Перенапруга зорових аналізаторів |
Монітор ЕОМ |
Продовження реакції на світло та звук 40-50% [34] |
|
3. Статична напруга |
Постійна поза сидіння |
Зниження статичної витривалості на 40 % [34] |
|
4. Підвищена яскравість світла |
Невірне розташування монітору |
В=100 дк/м2 [34] |
|
5. Знижена контрастність |
Якість монітору |
К=|B0-Ф|/ВФ=0,9% B0-яскравість об'єкту, ВФ - яскравість фону [34] |
|
6. Підвищена пульсація світлового потоку |
Лампи денного світла, монітор ЕОМ |
Кп=5% [34] |
|
7. М'яке рентгенівське випромінювання |
Монітор (ЕПТ) |
На відстані 5 см від екрану рівень випромінювання не повинен перевищувати 100 мкр/год [30] |
|
8. Пряма та відбита близькість |
Невірне розташування ПК |
Показник Р=0 [21] |
|
9. Недолік природного освітлення |
Невірне розташування монітору, віконних отворів |
КПО не нижче 1,5% [33] |
|
10. Підвищений рівень іонізуючих випромінювань в робочій зоні |
Екрани та інші поверхні ЕОМ |
Кількість в 1 см3 повітря: позитивних іонів Ф=1500.3000, легких негативних іонів Ф=3000.5000 [29] |
|
11. Підвищений рівень статичної електрики |
Діелектрична поверхня комп'ютера, джерела живлення |
Е?20 кВ/м [20] |
|
12. Виробничий пил |
Статична електрика, накопичена на поверхні комп'ютера |
ПДК=4мг/м3 [21] |
4.3 Параметри мікроклімату
Робота оператора відноситься до категорії Іа (втрати енергії при виконанні роботи до 120 Вт) та не потребує фізичних напружень, але оскільки робота відноситься до категорії нервово-напруженої праці, то умови мікроклімату у приміщенні відповідають оптимальним значення у відповідності до ГОСТ 12.1.005-88 [23]. Оптимальні значення параметрів мікроклімату для робочого місця, оснащеного ПЕОМ, наведені в таблиці 4.2 Рівні іонізації повітря приміщень при роботі на ВДТ та ПЕОМ відповідно до СН 2152-80 [23] наведені в таблиці 4.3. Для підтримки допустимих значень мікроклімату та концентрації позитивних та негативних іонів необхідно передбачати установки або прилади зволоження та/або штучної іонізації, кондиціювання повітря.
Таблиця 4.2 - Нормовані параметри мікроклімату для приміщення з ПЕОМ
Пора року |
Категорія робіт |
Температура повітря |
Відносна вологість % |
Швидкість руху повітря, м/с |
|
Холодна |
Легка - І а |
21 - 23 |
40-60 |
Не більше 0.1 |
|
Тепла |
Легка - І а |
22-24 |
40-60 |
Не більше 0.1 |
Приміщення з ЕОМ повинні бути обладнані системами опалення, кондиціювання повітря або припливно-витяжною вентиляцією відповідно до СНиП 2.04.05-91 [20]. Параметри мікроклімату, іонного складу повітря, вміст шкідливих речовин на робочих місцях, оснащених відео терміналами, повинні відповідати вимогам СН 4088-86 [24], ГОСТ 12.1.005-88 [23], СН 2152-80 [25].
Таблиця 4.3 - Рівні іонізації повітря приміщень при роботі на ПЕОМ
Рівні |
Кількість іонів в 1 см куб. повітря |
||
n+ |
n - |
||
Мінімально необхідні |
400 |
600 |
|
Оптимальні |
1500-3000 |
3000-5000 |
|
Максимально допустимі |
50000 |
50000 |
4.4 Виробниче освітлення
Приміщення з ЕОМ повинні мати природне і штучне освітлення. Природне світло повинно проникати через бічні світлопрорізи, зорієнтовані, як правило, на північ чи північний схід, і забезпечувати коефіцієнт природної освітленості (КПО) не нижче 1,5 %.
При роботі з ПЕОМ використовується бічне одностороннє природне освітлення. Нормовані значення КПО для будинків, розташованих у IV поясі світлового клімату визначаються за формулою (4.1):
eIVн = eнIII*m*c (4.1)
де eнIII - значення КПО для III пояса світлового клімату складає 2;
m - коефіцієнт світлового клімату, m=0,9%, тому що четвертий пояс світлового клімату.
c - коефіцієнт сонячності клімату, дорівнює 1, тому що вікна розташовані на південь.
eIVн = 2*0,9*0,75 = 1,35%.
Для створення комфортних умов зорової праці середньої точності необхідні наступні дані по нормах освітлення, які наведено в таблиці 4.4.
Таблиця 4.4 - Характеристика виробничого освітлення
Характеристика зорової праці |
Мінімальний розмір об'єкта розпізнавання |
Фон |
Контраст |
Розряд і підрозряд зорової роботи |
Нормативне значення |
||||
Природне освітлення |
Штучне освітлення |
||||||||
ЕІІІн, % |
ЕІVн, % |
Комбіноване |
Загальне |
||||||
Висока точність |
Від 0,3 до 0,5 |
Світлий |
Середній |
ІІІ г |
2 |
1,5 |
400 |
200 |
4.5 Вимоги до рівнів шуму та вібрації
Ще одними із шкідливих виробничих факторів є шум та вібрація.
У робочому приміщенні рівень звукового тиску, рівень шуму та еквівалентні piвнi шуму відповідають вимогам ГОСТ 12.1.003-83 [26]. Відповідно до вимог ГОСТ 12.1.012-90 [27] вібро-прискорення не повинно перевищувати 33дБ, а вібро-швидкість - 75дБ.
Відповідно до вимог ГОСТ 12.1.003-83 [26], рівні звуку та еквівалентні рівні звуку в приміщеннях офісу, де працюють користувачі, програмісти та оператори, не повинні перевищувати 50 дБА. На виробництві рівень шуму в кабінеті становить - 40 дБ (А).
Для зниження шуму та вібрації, згідно ГОСТ 12.1.029-80 [23], використані:
амортизуючи приклади,
повстяні килимки під принтери,
шуму поглинаючі покриття стін, стель.
Згідно ГОСТ 12.1.012. - 90, [27] вібрація за способом передачі на людину поділяється на загальну та локальну.
У виробничому процесі даного підприємства спостерігається лише локальна вібрація, джерелом якої виступають вентилятори, принтер, сканер та системний блок.
4.6 Вимоги щодо рівня неіонізуючих електромагнітних випромінювань, електростатичних та магнітних полів
Рівні електромагнітного випромінювання та магнітних полів повинні відповідати вимогам ГОСТ 12.1.006-84 [29], СН 3206-85 [30] та ДСанПіН 3.3.2-007-98 [21].
Рівні інфрачервоного випромінювання не повинні перевищувати граничних відповідно до ГОСТ 12.1.005-88 [23] та СН 4088-86 [24] з урахуванням площі тіла, яка опромінюється, та ДСанПіН 3.3.2-007-98 [21].
Рівні ультрафіолетового випромінювання не повинні перевищувати допустимих відповідно до СН 4557-88 [31] та ДСанПіН 3.3.2-007-98 [21]. Гранично допустима напруженість електростатичного поля на робочих місцях не повинна перевищувати рівнів, наведених в ГОСТ 12.1.045-84 [27], СН 1757-77 [33] та ДСанПіН 3.3.2-007-98 [21].
Потужність експозиційної дози рентгенівського випромінювання на відстані 0,05 м від екрана та корпуса відео термінала при будь-яких положеннях регулювальних пристроїв відповідно до Норм радіаційної безпеки України (НРБУ-97), затверджених постановою державного санітарного лікаря Міністерства охорони здоров'я України від 18.08.97 № 58, не повинна перевищувати 7,74 х 10 в ступ. - 12 А/кГ, що відповідає еквівалентній дозі 0,1 мбер/год (100 мкР/год).
Відповідно до ГОСТ 12.1.005-88 [23] вміст озону в повітрі робочої зони не повинен перевищувати 0,1 мг/куб. м; вміст оксидів азоту - 5 мг/куб. м; вміст пилу - 4 мг/куб. м.
В таблиці 4.5 наведені допустимі значення параметрів неіонізуючих електромагнітних випромінювань.
Для зниження дії цих видів випромінювання рекомендується застосовувати монітори із зниженим рівнем випромінювання (MPR-II, TCO-92, TCO-99, TCO-03), а також дотримувати регламентовані режими праці і відпочинку.
Таблиця 4.5 - Допустимі значення параметрів неіонізуючих електромагнітних випромінювань
Найменування параметра |
Допустимі значення |
|
Напруженість електричної складової електромагнітного поля на відстані 50см від поверхні відео монітора |
10В/м |
|
Напруженість магнітної складової електромагнітного поля на відстані 50см від поверхні відео монітора |
0,3А/м |
|
Напруженість електростатичного поля не повинна перевищувати: для дорослих користувачів для дітей дошкільних установ і що вчаться в середніх спеціальних і вищих учбових закладів |
20кВ/м 15кВ/м |
4.7 Електробезпека
Комп'ютерна лабораторія є споживачем електричної енергії (трифазна мережа змінного струму напругою 220 В і частотою 50 Гц), трансформатор понижуючий з 380В до 220В. Споживання комп'ютера 300Вт. У приміщенні відсутні умови, що створюють "підвищену" небезпеку: вогкість, струмопровідний пил, струмопровідна підлога, висока температура.
4.8 Пожежна безпека
Приміщення у якому розташоване наше робоче місце ставиться до категорії В, тому що характеризується наявністю твердих горючих матеріалів відповідно до НАПБ Б.07-005-86 [34], клас зони по пожежної безпеки П-IIa згідно ПУЄ-87 [35]
Виходячи з категорії пожежної безпеки й поверховості будинку, ступінь вогнестійкості будинку II згідно ДБН В 1.1-07-2002 [36], тому що стіни приміщення кабінету цегляні.
Пожежна безпека забезпечується системою запобігання пожежі, системою пожежного захисту. У приміщенні є один вогнегасник марки ВВК-2 відповідно ДБН В 1.1-7.02 [36]
Запобігання пожежі досягається наступними заходами:
запобігання утворення горючого середовища
запобігання утворення в горючому середовищі джерел запалювання.
4.9 Охорона навколишнього середовища
Згідно з законом України "Про охорону навколишнього природного середовища" [37] ЕОМ не є джерелом яких-небудь шкідливих речовин, що забруднюють навколишнє середовище. В ході розробки та тестування "Інтелектуальної системи створення та використання психологічних тестів" утворюються відходи у вигляді використаного паперу та канцтоварів, які збираються в спеціальний контейнер, а потім відправляються на утилізацію.
4.10 Висновки
У даному розділі розглянуті та проаналізовані питання охорони праці та навколишнього середовища у виробничому приміщення, де проводилося виконання дипломного проекту, для зменшення негативного впливу шкідливих та небезпечних виробничих факторів на людину в процесі праці. Було встановлено, що додержання на робочому місці нормативних значень параметрів небезпечних та шкідливих виробничих факторів, метеорологічних умов, освітлення виробничих приміщень, електробезпеки, пожежної безпеки дозволяє забезпечити комфортні та безпечні умови праці працівників.
За час роботи персональний комп'ютер не наносить ніякої шкоди навколишньому середовищу. При виконанні дипломної роботи утворюються тверді побутові відходи (папір, канцелярські вироби та інші), а також комп'ютерні та інші види організаційної техніки, яка відпрацювала свій термін, тобто технічні відходи, які відпрацювали свій термін підлягають утилізації.
Висновки
В даній роботі детально описані основні етапи машинного перекладу, його специфіка, підходи до реалізації, переваги та недоліки таких систем. Розглянуто можливі методи оцінки машинного перекладу: інженерно-лінгвістичні, експертні, програмні та інші. Велику увагу приділено вивченню автоматичних методів оцінки якості МП та різних метрик такої оцінки (NIST, METEOR, BLEU, Word error rate). Докладно розглянуті їх алгоритми, критерії оцінки та співвідношення з людськими судженнями оцінки перекладу.
Доведено, що подібні підходи до оцінки якості перекладу результативні в сферах дослідження чи порівняння і та стрімко прогресують, завдяки новаторських ідеям.
Метою розробки була автоматизація процесу оцінки якості машинного перекладу на основі відомих метрик, базовою з яких є метрика BLEU. Було створено програму, для автоматичної оцінки якості МП за цією метрикою. За допомогою створеної програми було проведене дослідження з порівняльної оцінки якості перекладу СМП PROMTі Pragma.
Також доведено, що дана розробка відповідає технічним вимогам споживачів і є доцільною
Були розглянуті економічні питання, пов'язані з розробленою системою і проведена калькуляція цін.
Був проведений аналіз з охорони праці та визначені безпечні умови праці.
Список джерел інформації
1. http://www.computerbild.ru/soft/4860/
2. http://referat. repetitor.ua/
3. http://ru. wikipedia.org/wiki/Машинный перевод
4. http://www.krugosvet.ru/enc/gumanitarnye_nauki/lingvistika/MASHINNI_PEREVOD.html? page=0,0 Онлайн Энциклопедия Кругосвет
5. http://www.opticstoday.com/katalog-statej/stati-na-ukrainskom/shtuchnij-intelekt/sistemi-mashinnogo-perekladu.html
6. УДК 81'322.4 МЕТОДИ ОЦІНЮВАННЯ ЯКОСТІ КОМП'ЮТЕРНОГО ПЕРЕКЛАДУ Бірюков А. В.
7. http://ru. wikipedia.org/wiki/Перевод
8. Голуб І.Б. Російська мова та культура мовлення: навчальний посібник / І.Б. Голуб. - М., 2001. З.85
9. Кірсанова М.В. Сучасне діловодство / М.В. Кірсанова. - М., 1998. С.25
10. http://ru. wikipedia.org/wiki/Тестирование_по_стратегии_чёрного_ящика
11. http://ru. wikipedia.org/wiki/ISO_9126
12. Гласс Роберт Факты и заблуждения профессионального программирования - Пер. с англ. - СПб.: Символ-Плюс, 2007. - 240 с., ил.
13. Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu IBM T. J. Watson Research Center Yorktown Heights, NY 10598, USA fpapineni,roukos,toddward,weijingg@us. ibm.com
14. Papineni, K., Roukos, S., Ward, T., and Zhu, WJ (2002)." BLEU: a method for automatic evaluation of machine translation " in ACL-2002: 40th Annual meeting of the Association for Computational Linguistics pp.311-318
15. "Automatic Evaluation of Machine Translation Quality Using N-gram Co-Occurrence Statistics". Retrieved 2010-04-17.
16. McCowan et al. 2005: On the Use of Information Retrieval Measures for Speech Recognition Evaluation
17. Banerjee, S. and Lavie, A. (2005)"METEOR: An Automatic Metric for MT Evaluation with Improved Correlation with Human Judgments" in Proceedings of Workshop on Intrinsic and Extrinsic Evaluation Measures for MT and/or Summarization at the 43rd Annual Meeting of the Association of Computational Linguistics (ACL-2005), Ann Arbor, Michigan, June 2005
18. http://www.e-promt.ru/
19. http://www.pragma5.com/rus/about.html
20. Закон України "Про охорону праці". - Введений 01.11.2002 р.
21. ДСанПін 3.3.2-007-98. Державні санітарні правила і норми роботи з візуальними дисплейними терміналами електронно-обчислювальних машин. - К., 1998.
22. ГОСТ 12.0.003-74 ССБТ "Небезпечні та шкідливі виробничі фактори. Класифікація". - Введений 01.01.1976 р., змінений 1987г.
23. ГОСТ 12.1.005-88 ССБТ. Общие санитарно-гигиенические требования к воздуху рабочей зоны. - Введ.01.01.89. - М: Издательство стандартов, 1998.
24. СН 4088-86 "Санітарні норми мікроклімату виробничих приміщень".
25. СН 2152-80 "Санітарно-гігієнічні норми допустимих рівнів іонізації повітря виробничих і громадських приміщень".
26. ГОСТ 12.1.003-83*. Шум. Общие требования безопасности. - Введ.01.07.90г. - М: Издательство стандартов, 1996.
27. ГОСТ 12.1.012-90. Вибрационная безопасность. Общие требования. - Введ.01.07.91. - М: Издательство стандартов, 2006. - 30с.
28. ГОСТ 12.1.029-80 ССБТ Средства и методы защиты от шума. Классификация. Введен 31.10.1980 г. переиздан Апрель 2001 г.
29. ГОСТ 12.1.006-84 "Система стандартов безопасности труда. Электромагнитные поля радиочастот. Допустимые уровни на рабочих местах и требования к проведению контроля". - Введен 01.01.1986 г.
30. СН 3206-85 "Гранично допустимі рівні магнітних полів частотою 50 Гц".
31. СН 4557-88 "Санитарные нормы ультрафиолетового излучения в производственных помещениях".
32. ГОСТ 12.1.045-84 "Электростатические поля. Допустимые уровни на рабочих местах и требования к проведению контроля". - Введен 01.07.1985
33. СН 1757-77 "Санитарно-гигиенические нормы предельно-допустимой напряженности электростатического поля".
34. НАПБ Б.07.005 - 86 (ОНТП 24 - 86). Нормативний акт пожежної безпеки. Визначення категорії будівель і споруд по вибухопожежній і пожежній небезпеці. - К: Будіздат 1987.
35. ПУЭ-87. Правила устройства електроустановок. - М.: Энергоатомиздат, 1988. - 648с.
36. ДБН В.1.1 - 7 - 2002. Державні будівельні норми. Захист від пожежі. Пожежна безпека об'єктів будівництва. К.: 2003 - 41с.
37. Закон України "Про охорону навколишнього природного середовища". - Введ.01.07.1991 р.
Додаток
Додаток А
У файлі Program. cs. відбувається оголошення класу, підключення бібліотек для роботи з візуальними об'єктами та описуються деякі основні властивості та методи програми.
Application. EnableVisualStyles - цей метод включає візуальні стилі програми. Елементи керування будуть вимальовуватися за допомогою візуальних стилів, якщо елемент керування та операційна система підтримує їх.
Деякі елементи управління Windows Forms можуть зробити свій текст, використовуючи або TextRenderer клас, який заснований на графічній бібліотеки GDI, або клас Graphics, який заснований на бібліотеці GDI + графіка. UseCompatibleTextRendering - властивість, призначена для забезпечення візуальної сумісності між елементами управління Windows Forms, які відображають текст класу TextRenderer, NET Framework 1.0, NET Framework 1.1 програм, які виконують відтворення тексту за допомогою класу Graphics. У більшості випадків, якщо ваш додаток не оновлюється с.net Framework 1.0 або NET Framework 1.1, то рекомендується залишити значення UseCompatibleTextRendering за замовчуванням false. У Visual C # 2005 або більш пізнії, виклик SetCompatibleTextRenderingDefault автоматично генерується у файлі Program. cs.
Application.run (new Form1 ()) - як правило, основною функцією програма викликає цей метод і передає на нього головне вікно програми.
Цей метод додає обробник події для параметра MainForm на закриту подію. Обробник подій викликає ExitThread, щоб очистити програму.
using System;
using System. Collections. Generic;
using System. Windows. Forms;
namespace WindowsApplication1
{
static class Program
{
// / <summary>
// / The main entry point for the application.
// / </summary>
[STAThread]
static void Main ()
{
Application. EnableVisualStyles ();
Application. SetCompatibleTextRenderingDefault (false);
Application.run (new Form1 ());
}
}
}
Додаток А1
Візуальний інтерфейс розробленої програми знаходиться в файлі Form1. Designer.
namespace WindowsApplication1
{
partial class Form1
{
// / <summary>
// / Required designer variable.
// / </summary>
private System.componentModel. IContainer components = null;
// / <summary>
// / Clean up any resources being used.
// / </summary>
// / <param name="disposing">true if managed resources should be disposed; otherwise, false. </param>
protected override void Dispose (bool disposing)
{
if (disposing && (components! = null))
{
components. Dispose ();
}
base. Dispose (disposing);
}
#region Windows Form Designer generated code
// / <summary>
// / Required method for Designer support - do not modify
// / the contents of this method with the code editor.
// / </summary>
private void InitializeComponent ()
{
this. label1 = new System. Windows. Forms. Label ();
this. label2 = new System. Windows. Forms. Label ();
this. label3 = new System. Windows. Forms. Label ();
this. textBox1 = new System. Windows. Forms. TextBox ();
this. textBox2 = new System. Windows. Forms. TextBox ();
this. button1 = new System. Windows. Forms. Button ();
this. SuspendLayout ();
//
// label1
//
this. label1. AutoSize = true;
this. label1. Font = new System. Drawing. Font ("Microsoft Sans Serif", 10F, System. Drawing. FontStyle. Bold, System. Drawing. GraphicsUnit. Point, ( (byte) (204)));
this. label1. Location = new System. Drawing. Point (59, 55);
this. label1. Name = "label1";
this. label1. Size = new System. Drawing. Size (155, 17);
this. label1. TabIndex = 0;
this. label1. Text = "Переклад експерта";
//
// label2
//
this. label2. AutoSize = true;
this. label2. Font = new System. Drawing. Font ("Microsoft Sans Serif", 10F, System. Drawing. FontStyle. Bold, System. Drawing. GraphicsUnit. Point, ( (byte) (204)));
this. label2. Location = new System. Drawing. Point (59, 298);
this. label2. Name = "label2";
this. label2. Size = new System. Drawing. Size (162, 17);
this. label2. TabIndex = 1;
this. label2. Text = "Машинний переклад";
//
// label3
//
this. label3. AutoSize = true;
this. label3. Font = new System. Drawing. Font ("Microsoft Sans Serif", 10F, System. Drawing. FontStyle. Bold, System. Drawing. GraphicsUnit. Point, ( (byte) (204)));
this. label3. Location = new System. Drawing. Point (224, 510);
this. label3. Name = "label3";
this. label3. Size = new System. Drawing. Size (13, 17);
this. label3. TabIndex = 2;
this. label3. Text = " ";
//
// textBox1
//
this. textBox1. Font = new System. Drawing. Font ("Microsoft Sans Serif", 10F, System. Drawing. FontStyle. Regular, System. Drawing. GraphicsUnit. Point, ( (byte) (204)));
this. textBox1. Location = new System. Drawing. Point (227, 55);
this. textBox1. Multiline = true;
this. textBox1. Name = "textBox1";
this. textBox1. Size = new System. Drawing. Size (600, 180);
this. textBox1. TabIndex = 3;
//
// textBox2
//
this. textBox2. Font = new System. Drawing. Font ("Microsoft Sans Serif", 10F, System. Drawing. FontStyle. Regular, System. Drawing. GraphicsUnit. Point, ( (byte) (204)));
this. textBox2. Location = new System. Drawing. Point (227, 298);
this. textBox2. Multiline = true;
this. textBox2. Name = "textBox2";
this. textBox2. Size = new System. Drawing. Size (600, 180);
this. textBox2. TabIndex = 4;
//
// button1
//
this. button1. Font = new System. Drawing. Font ("Microsoft Sans Serif", 10F, System. Drawing. FontStyle. Bold, System. Drawing. GraphicsUnit. Point, ( (byte) (204)));
this. button1. Location = new System. Drawing. Point (62, 503);
this. button1. Name = "button1";
this. button1. Size = new System. Drawing. Size (91, 31);
this. button1. TabIndex = 5;
this. button1. Text = "Оцінка";
this. button1. UseVisualStyleBackColor = true;
this. button1. Click += new System. EventHandler (this. button1_Click);
//
// Form1
//
this. AutoScaleDimensions = new System. Drawing. SizeF (6F, 13F);
this. AutoScaleMode = System. Windows. Forms. AutoScaleMode. Font;
this. ClientSize = new System. Drawing. Size (852, 614);
this. Controls. Add (this. button1);
this. Controls. Add (this. textBox2);
this. Controls. Add (this. textBox1);
this. Controls. Add (this. label3);
this. Controls. Add (this. label2);
this. Controls. Add (this. label1);
this. Name = "Form1";
this. Text = "Form1";
this. ResumeLayout (false);
this. PerformLayout ();
}
#endregion
private System. Windows. Forms. Label label1;
private System. Windows. Forms. Label label2;
private System. Windows. Forms. Label label3;
private System. Windows. Forms. TextBox textBox1;
private System. Windows. Forms. TextBox textBox2;
private System. Windows. Forms. Button button1;
}
Додаток А2
Візуальний інтерфейс розробленої програми
Додаток А3
Приклад підрахунку якості машинного перекладу
Додаток А4
Алгоритм розрахунку за метрикою BLEU закладений у файлі Form1. cs.
using System;
using System. Collections. Generic;
using System.componentModel;
using System. Data;
using System. Drawing;
using System. Text;
using System. Windows. Forms;
namespace WindowsApplication1
{
public partial class Form1: Form
{
public Form1 ()
{
InitializeComponent ();
}
private void button1_Click (object sender, EventArgs e)
{
String [] words = new String [3000]; // Вспомогательный массив вырезанных слов
String expert = textBox1. Text; // Исходный текст перевода эксперта
String machine = textBox2. Text; // Исходный текст машинного перевода
String [] expertWords = new String [3000]; // Массив не повторяющихся слов перевода эксперта
int [] expertWordsFr = new int [3000]; // Массив частот слов перевода эксперта
int NExpertWords; // Количество слов перевода эксперта
String [] machineWords = new String [3000]; // Массив не повторяющихся слов машинного перевода
int [] machineWordsFr = new int [3000]; // Массив частот слов машинного перевода
int NMachineWords; // Количество слов машинного перевода
// Извлечение слов из перевода эксперта
String word = "";
int j = 0;
for (int i = 0; i < expert. Length; i++)
if ( (expert [i] >= 'A') && (expert [i] <= 'Z') ||
(expert [i] >= 'a') && (expert [i] <= 'z') ||
(expert [i] >= 'А') && (expert [i] <= 'Я') ||
(expert [i] >= 'а') && (expert [i] <= 'я'))
word += expert [i];
else
{
if (word! = "")
{
words [j] = word;
word = "";
j++;
}
continue;
}
if (word! = "")
{
words [j] = word;
word = "";
j++;
}
// Подсчет частот встречаемости слов в переводе эксперта
int n = 0;
for (int i = 0; i < j; i++)
{
for (int i1 = 0; i1 < n; i1++)
if (words [i] == expertWords [i1])
{
expertWordsFr [i1] ++;
goto m1;
}
expertWords [n] = words [i];
expertWordsFr [n] = 1;
n++;
m1: continue;
}
NExpertWords = n;
// Извлечение слов из машинного перевода
word = "";
j = 0;
for (int i = 0; i < machine. Length; i++)
if ( (machine [i] >= 'A') && (machine [i] <= 'Z') ||
(machine [i] >= 'a') && (machine [i] <= 'z') ||
(machine [i] >= 'А') && (machine [i] <= 'Я') ||
(machine [i] >= 'а') && (machine [i] <= 'я'))
word += machine [i];
else
{
if (word! = "")
{
words [j] = word;
word = "";
j++;
}
continue;
}
if (word! = "")
{
words [j] = word;
word = "";
j++;
}
// Подсчет частот встречаемости слов в машинном переводе
n = 0;
for (int i = 0; i < j; i++)
{
for (int i1 = 0; i1 < n; i1++)
if (words [i] == machineWords [i1])
{
machineWordsFr [i1] ++;
goto m1;
}
machineWords [n] = words [i];
machineWordsFr [n] = 1;
n++;
m1: continue;
}
NMachineWords = n;
// Вычисление значения оценки
int sum = 0; // Значение числителя оценки
for (int i = 0; i < NExpertWords; i++)
for (int i1 = 0; i1 < NMachineWords; i1++)
if (expertWords [i] == machineWords [i1])
if (expertWordsFr [i] < machineWordsFr [i1])
sum += expertWordsFr [i];
else
sum += machineWordsFr [i1];
int sumNM = 0; // Сумма частот слов машинного перевода
for (int i = 0; i < NMachineWords; i++)
sumNM += machineWordsFr [i];
double result; // Результат оценки
if (sumNM! = 0)
result = (double) sum / sumNM;
else
result = 0.0;
if (result. ToString (). Length <= 4)
label3. Text = "Подібність дорівнює " + result. ToString ();
else
label3. Text = "Подібність дорівнює " + result. ToString (). Substring (0,4);
}
}
}
Размещено на Allbest.ru
...Подобные документы
Історія машинного перекладу як науково-прикладного напряму. Теорія машинного перекладу. Особливості використання систем, орієнтованих на персональні комп’ютери. Напрямки розвитку та застосування машинного перекладу. Приклади систем машинного перекладу.
реферат [21,5 K], добавлен 19.02.2011Автоматизований та машинний види перекладу. Можливості подолання мовного бар’єру у спілкуванні. Існуючі класифікації систем машинного перекладу. Лінгвістичне дослідження міри автоматизованості перекладацької системи. Словник і синтаксис вхідної мови.
статья [23,5 K], добавлен 14.08.2017Причини та історія виникнення машинного перекладу. Його функції, можливості, переваги та недоліки. Основні підходи до автоматичного перекладу. Принцип роботи Google Translator Toolkit, порівняння системи з її аналогами та іншими онлайн-сервісами.
дипломная работа [1,7 M], добавлен 16.07.2013Особливості автоматизованого перекладу іноземних мов. Розробка програми для перекладу слів та певних мовних конструкцій молодіжного сленгу на загальновживану мову. Опис структури файлів. Специфікація функцій програми, оцінка достовірності результатів.
курсовая работа [943,8 K], добавлен 15.03.2014Використання комп'ютерного моделювання. Особливості проектування моделі автоматичної системи управління технологічним процесом. Визначення кількості пропущених через відмову даних та часу знаходження системи в загальмованому стані. Опис алгоритму моделі.
контрольная работа [501,7 K], добавлен 13.01.2014Аналіз існуючих методів оцінки конкурентноспроможності підприємства. Процес навчання нечіткої експертної системи. Модель комлексної оцінки конкурентоспроможності страхової компанії методом візуального моделювання пакету Simulink середовища Matlab.
дипломная работа [2,0 M], добавлен 27.05.2014История автоматизированного перевода. Современные компьютерные программы перевода. Сфера использования машинного перевода. Формы организации взаимодействия человека и ЭВМ в машинном переводе. Интерредактирование и постредактирование машинного перевода.
курсовая работа [30,0 K], добавлен 19.06.2015Структура і функції інформаційної системи. Ситуаційний аналіз процесу оцінки проектів. Аналіз процесу розробки та створення технічного завдання. Створення протоколу якості системи. Структура та принцип роботи програмного продукту, опис прецендентів.
курсовая работа [980,0 K], добавлен 22.09.2014Класифікація експертних систем. Представлення знань, переваги та слабкі місця. База знань як елемент експертної системи. Сфера застосувань та перспективи розвитку. Створення експертної системи для оцінки ступеня підготовленості студента до іспиту.
курсовая работа [1,4 M], добавлен 04.02.2014У роботі розглянуті особливості промислових об’єктів регулювання. Обгрунтована необхідність застосування двоконтурних автоматичних систем регулювання з динамічною корекцією для покращання якості регулювання складних у динамічному відношенні об’єктів.
дипломная работа [382,0 K], добавлен 11.10.2017Человеко-машинный интерфейс. Текстовый и смешанный (псевдографический) интерфейсы. Применение человеко-машинного интерфейса в промышленности. Программные средства для разработки человеко-машинного интерфейса. Среда разработки мнемосхем GraphworX32.
дипломная работа [5,3 M], добавлен 19.03.2010Теоретичне дослідження особливостей проектування систем дистанційного навчання. Створення програмного забезпечення процедури статистичної обробки результатів тестування знань і оцінки якості тесту. Економічне обґрунтування доцільності розробки програми.
дипломная работа [3,6 M], добавлен 22.10.2012История возникновения, эволюция машинного перевода. Основные требования к коммуникативной эквивалентности. Последовательность формальных операций в системе машинного перевода, ее концепции развития. Переводчик для офиса. Преимущества электронных словарей.
презентация [455,3 K], добавлен 22.10.2013Получение и обработка данных о веб-сайте. Иерархическая классификация, алгоритмы машинного обучения. Решающие деревья, плоские классификаторы. Метрики оценки качества. Полная точность (accuracy), кросс-валидация. Параллельные вычисления, хранение данных.
курсовая работа [276,8 K], добавлен 04.09.2016Вибір і обґрунтування інструментальних засобів. Проектування блок-схем алгоритмів та їх оптимізація. Розробка вихідних текстів програмного забезпечення. Інструкція до проектованої системи. Алгоритм базової стратегії пошуку вузлів та оцінки якості.
дипломная работа [2,8 M], добавлен 05.12.2014Порядок використання комп'ютера для автоматичного перекладу текстів, умови доцільності використання спеціального програмного забезпечення. Характеристика програми PROMT, її можливості та опис інтерфейсу, принцип та правила роботи. Переклад Web-сторінок.
реферат [14,9 K], добавлен 21.09.2009Проблеми процесу тестування програмного забезпечення. Розробка алгоритму автоматичної генерації тестів і тестового набору для ручного виконання. Побудова тестів для системи "Банкомат" і для баг-трекінгової системи, представленої графом із циклами.
дипломная работа [1,2 M], добавлен 26.02.2014Моделирование системы массового обслуживания. Анализ зависимости влияния экзогенных переменных модели однофазной одноканальной СМО на эндогенные переменные. План машинного эксперимента множественного регрессионного анализа и метода наименьших квадратов.
лабораторная работа [107,5 K], добавлен 15.06.2010Конкурентоспроможність страхового продукту та ринку. Фазифікація та дефазифікація. Етапи моделювання комплексної оцінки конкурентоспроможності компанії. Комп’ютерна реалізація моделі. Графіки функцій належності гаусівського типу вхідних змінних системи.
курсовая работа [1,7 M], добавлен 14.06.2014Розробка програмного забезпечення для розв'язку системи лінійних рівнянь за формулами Крамера, головні особливості мови Turbo Pascal. Методи розв'язування задачі, архітектура програми та її опис. Контрольний приклад та результат машинного експерименту.
курсовая работа [47,7 K], добавлен 23.04.2010