Система автоматичної оцінки якості машинного перекладу, що базується на алгоритмі метрики BLEU
Переваги систем машинного перекладу, методи його автоматичної оцінки. Розробка інтелектуальної системи автоматичної оцінки якості машинного перекладу з використанням метрики BLEU. Проблема кореляції автоматичної та експертної оцінки машинного перекладу.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | украинский |
Дата добавления | 17.01.2013 |
Размер файла | 3,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
У випадку декількох варіантів для порівняння буде сумою довжини тих речень, яких найближча до довжини машинного перекладу.
Якщо в цілому говорити про якість роботи метрики BLEU, то незважаючи на значну критику, BLEU має високу кореляцію з людськими оцінками якості перекладу та є орієнтиром для створення нових метрик.
NIST. Це метрика оцінки якості перекладу, що зроблена за допомогою СМП. Назва йде від Американського Національного Інституту Стандартів та Технологій (US National Institute of Standards and Technology).
Метрика NIST базується на алгоритмі метрики BLEU, але з деякими відмінностями. BLEU при підрахунку N-грамної точності вносить рівну вагу для кожного з них, а NIST враховує наскільки інформативні N-грами. Чим частотною є N-грама, тим більшу вагу вона отримує. Наприклад, дуже частотна біграма "on the" отримує меншу вагу, ніж рідка біграма "interesting calculations" [15]. NIST також по-іншому підраховує штрафні бали, оскільки малі зміни у довжині перекладу не так сильно впливають на загальну оцінку.
Показник помилкових слів (Word error rate, WER). Є загальною метрикою якості розпізнавання мовлення та систем машинного перекладу. Вся складність вимірювання якості полягає в тому, що розглядається послідовність слів, яка може відрізнятися за кількістю слів від послідовності слів у порівняльному перекладі (які можуть бути вірними). WER бере за основу принцип відстані Левенштейна, який працює на рівні слів (лексем), замість рівня фонем. Ця задача вирішується шляхом узгодження перших розпізнаних слів з еталонною (вимовленою) послідовністю слів за використанням динамічного вирівнювання строки [16]. WER вимірюється наступним чином:
У цій формулі розглядаються наступні параметри:
· - кількість замін;
· - число вилучень;
· - число вставок;
· - кількість слів в тексті;
Якщо мова йде про оцінку якості розпізнавання слів, використовується критерій точність слів (word accuracy, WAcc):
У даній формулі , тобто кількість вірно розпізнаних слів.
Зазначимо, що оскільки - кількість слів в тексті, WER може бути більше, ніж 1.0 і таким чином WAcc може бути меншою за 0.0. Це тільки одна з багатьох проблем, що виникають в процесі використання загальної формули. Однак при розгляданні подібних проблем, не враховується, що різні типи помилок в різній мірі впливають на успішність результату. Наприклад, деякі помилки можуть бути досить руйнівними, а інші помилки дуже легко виправити. Ці фактори специфічні для кожного конкретного синтаксису, що оцінюється. Ще однією проблемою є те, що, навіть з кращими вирівнювання, формула не може відрізнити заміщення помилки з комбінованих видалення плюс вставки помилки.
У 1990 році було запропоновано використовувати зважений показник ефективності точності, де помилки заміщення є зваженими в єдність, але помилки або видалення та вставки є зваженими тільки на 0,5, таким чином:
Метрика METEOR. призначена для виправлення деяких недоліків, властивих BLEU метриці. Метрика працює на основі зваженого середнього гармонійної уніграмної точності (precision) і уніграмної повноти (recall). Середнім гармонійним кількох позитивних чисел називається число, зворотне до середнього арифметичного, тобто число:
METEOR також включає деякі інші властивості, не відображені в інших метриках, таких, як синонімія відповідності, де замість узгодження тільки за точною формою слова, метрика також враховує синоніми. Наприклад, слово "good" у еталонному перекладі при порівнянні з МП, де замість цього слова буде слово "well", буде враховано метрикою як вірне. Метрика представляє собою набір модулів, що реалізують відповідні стратегії. Можна додавати нові модулі.
Розглянемо алгоритм метрики METEOR більш детально. Як і в BLEU, основною одиницею оцінки є речення, алгоритм спочатку створює вирівнювання (рисунок 2.1) між двома реченнями, потім перекладає рядок речення МП і рядок еталонного речення.
Рисунок 2.1 - Приклад вирівнювання речень алгоритму METEOR
Вирівнювання (узгодження) представляє собою множину відображень між уніграмами. Відображення можна розглядати як відношення уніграми одного рядка з уніграмою іншого рядка. При цьому існує обмеження: кожна уніграма у МП має відображати (0 або 1) уніграм еталонного перекладу та навпаки. При будь-якому вирівнюванні уніграма одного рядка не може відображатися на більш, ніж одну уніграму іншого рядка [17].
Вирівнювання робиться поступово через ряд етапів, які контролюються модулями. Модуль також є алгоритмом, наприклад модуль "wn_synonymy" відображає синоніми, використовуючи WordNet, а модуль "exact" врахує точні слова. Кожен етап розбивається на окремі фази. У першій фазі усі можливі відображення уніграм збираються для використовування модулем на даному етапі. На другому етапі, найбільша підмножина цих відображень обирається для отримання вирівнювання (погодження), як це визначено вище. Якщо є два ряди з тим же числом відображень, вирівнювання вибирається з найменшою кількістю хрестів, тобто з меншою кількістю перехрещень двох відображень. Етапи виконуються послідовно, і кожен етап тільки додає до вирівнювання уніграми, які не брали участі в попередніх етапах. Після остаточного вирівнювання оцінка уніграмної точності обчислюється таким чином:
У цій формулі показує число уніграм в машинному перекладі, які також знайдені в еталонному тексті, і - загальне число уніграм в машинному перекладі.
Уніграмна повнота обчислюється за формулою:
У даній формулі показує число уніграм в машинному перекладі, - загальну кількість уніграм в еталонному тексті. Точність і повнота об'єднуються з використанням середнього гармонійного в наступній формулі, причому повнота має в 9 раз більшу вагу, ніж точність:
Заходи, які були введені ефективні лише для окремих слів, але не по відношенню до більш великих сегментів, які з'являються в обох текстах перекладу. Для того, щоб прийняти це до уваги, вимірювання довжини N-грам використовуються для обчислення штрафу для вирівнювання. Чим більш відображень, які не є суміжними у еталонних реченнях та реченнях МП, тим вище штраф. Для того щоб обчислити цю помилку, уніграми групуються в якомога менші частини, де частина визначається як множину уніграм, які суміжні в гіпотезі і еталоні. Чим більше суміжних відображень між МП і еталоном, тим менше цих частин. Переклад, що збігається з еталоном, отримує лише одну частину. Штраф розраховується за наступною формулою:
У даній формулі - число частин, і - це число уніграм, які були зіставлені. Остаточний результат для сегменту розраховується нижче. Штраф викликає зниження до 50%:
Для розрахунку оцінки за увесь корпус або набір сегментів, береться уся сукупність значень , , та потім об'єднуються за допомогою попередньої формули. Алгоритм метрики METEOR також може одночасно порівнювати один текст МП з кількома текстами еталонного перекладу чи навпаки.
2.3 Проблема кореляції автоматичної та експертної оцінки машинного перекладу
Кореляція - є мірою схожості оцінки якості МП за автоматичними метриками з людськими судженнями. Кореляція зазвичай перевіряється на двох рівнях: на рівні речень, де бали розраховуються по метриці для переведених речень, і після корелюється з людською оцінкою для тих же речень. І на рівні корпусу, де бали за речення зводяться воєдино для людського судження та метрики судження, і ці суми очок підсумовуються, вказуючи на взаємозв'язок. Дані щодо кореляції на рівні речень рідко повідомляється, хоча наведені цифри кореляції, які показують, що, на рівні речень кореляція істотно гірше, ніж кореляція на рівні корпус.
На практиці, коли машинний переклад оцінюється за приведеними та іншими метриками, виникає досить багато серйозних проблем, зокрема проблем кореляції автоматичної оцінки (оцінки за метрикою) з людськими судженнями (оцінкою експерта) стосовно якості перекладу та отриманих результатів. Зрозуміло, що людська оцінка якості перекладу - це золотий стандарт та найвищий еталон оцінки, проте експертні методи оцінки більш дорогі та займають багато часу, тому не завжди актуальні. При оцінці перекладу людина має дбати про збереження його об'єктивності. Майже усі популярні метрики (BLEU, NIST, METEOR) засновані на людських судженнях, однак далеко не завжди дають адекватну оцінку якості перекладу і показують високу кореляцію в порівнянні з експертними підходами. Це пов'язано з чималою кількістю аспектів. Звернемо увагу на основні з них.
По-перше проблема кореляції автоматичної та експертної оцінки тісно пов'язана з якістю СМП, за допомогою якого виконувався переклад, тобто з вірністю та точністю вихідного машинного перекладу, який ми хочемо оцінити з еталонним варіантом. Дуже низька ймовірність, що метрика присудить машинному перекладу оцінку 1, тобто повну відповідність тексту-еталону, тому що навіть при якісному машинному перекладі майже неможливо повністю зберегти структуру речень, яка була у еталонному перекладі. Мова йдеться про те, що існує багато альтернативних варіантів перекладу і зовсім необов'язково в них співпадає багато слів. На це вже зверталася увага у таблиці 2.1, де однакові за змістом переклади, мають різну кількість слів, тобто різну побудову та довжину речення, що може мати вплив на оцінку перекладу з використанням автоматичної метрики. Це говорить про те, що метрика працює краще на рівні великих корпусів текстів, ніж на рівні окремих речень, отже чим більший обсяг тексту оцінюється, тим вище кореляція.
По-друге, як правило, існує багато варіантів правильного перекладу більш-менш довгого речення і більшість з них будуть суттєво різнитися за словарним складом, а саме відповідність словарного складу МП до есталонного перекладу і є основою всіх автоматичних метрик оцінки МП. Експертна оцінка також є досить суб'єктивною. Тому, вивчаючи проблему кореляції автоматичних оцінок з експертними, як правило, використовують, по-перше декілька еталонних перекладів, виконаних різними людьми, і по-друге - декілька експертних оцінок, з яких беруть середнє значення.
По-третє, важливо розуміти, що важливе не абсолютне значення метрики. Наприклад результат BLEU= 0,8 може бути гіршим за підрахунок NIST = 0,25. Більш інформативною є відносна різниця в покажчиках однієї метрики за різних умов. Тому частіше автоматичні метрики використовують для порівняння, скажімо, роботи різних СМП, різних версій однієї СМП, роботи однієї СМП з текстами різних типів. Для більш прозорого та точного результату можна одночасно оцінити якість МП за кількома метриками і якості остаточної оцінки використовувати комбіноване значення, наприклад, зважену суму окремих оцінок. Це може не бути виключним результатом, проте матиме значну дослідницьку вагу або надати можливість для розглядання можливих методів корегування перекладу.
Також повідомлялося, що кореляція залежить від типу та тематики перекладеного тексту. Кореляції приділяється багато уваги, коли йдеться про оцінку перекладів текстів, які мало схожі за походженням та будовою речень (наприклад, переклад з англійської на арабську).
Навіть якщо метрика добре корелює з людських суджень в одному дослідженні на одному корпусі, ця успішна кореляція не може бути перенесеною на інший корпус. Гарні оцінки метрики, за типами тексту або областей, мають важливе значення для повторного використання метрики. Метрика, яка працює тільки для тексту в конкретній області є корисною, але менш корисною, ніж та, яка працює в багатьох областях, тому що створення нової метрики для кожної нової оцінки є небажаним.
За останній час дослідження показали, що метрики можуть ефективно використовуватися для оцінки невеликих за обсягом текстів. METEOR показав дуже високий результат: до 0,964 кореляції з людськими судженнями на рівні корпусу, в порівнянні з досягненням BLEU 0,817 на тому ж наборі даних. На рівні речення, максимальна кореляція з людською оцінкою була досягнута для BLEU: 0,403.
2.4 Оцінка якості перекладу PROMT і Pragma за метрикою BLUE
Для розробки інтелектуальної системи оцінки якості машинного перекладу популярних систем машинного перекладу PROMT 9.0 Professional та Pragma 5. x обрано метрику BLEU, алгоритм якої детально описаний в розділі 2.2 Основними причинами вибору BLEU є:
- ефективна методика оцінки, на якій базуються інші популярні метрики (NIST, METEOR);
- неважка програмна реалізація алгоритму;
- високий показник кореляції з людськими методами оцінки МП.
2.4.1 Характеристики системи машинного перекладу PROMT
Буде розглянута трансферна СМП PROMT 9.0 Professional.
Словник. Практично у всіх системах, які претендують на те, щоб вважатися системами перекладу, проблема представлення морфологічних моделей так чи інакше вирішується. Але одні системи можуть розпізнати мільйон словоформ при обсязі словника в п'ятдесят тисяч словникових статей, а інші при обсязі словника в сто тисяч словникових статей можуть розпізнати саме ці сто тисяч. У системах сімейства PROMT розроблено практично унікальний по повноті морфологічний опис для всіх мов, з якими системи вміють працювати. Словник містить 800 типів словозміни для російської мови, більше 300 типів як для німецької, так і для французької мови, і навіть для англійської, який не належить до флективних мов, виділено понад 250 типів словозміни. Множина закінчень для кожної мови зберігається у вигляді деревних структур, що забезпечує не тільки ефективний спосіб зберігання, але й ефективний алгоритм морфологічного аналізу. Крім того, використована модель морфології дозволила розробити експертну систему для користувача - творця словника. Ця система фактично автоматизує процедуру виділення основи і визначення типу словозміни при введенні нових словникових статей. Однак, розробка опису морфології дозволяє вирішити тільки проблему того, що є заголовком словникової статті, по якому відбувається ідентифікація одиниці тексту й одиниці словника. Але ж ідентифікація слова з тексту зі словникової статтею відбувається не заради ідентифікації, як це потрібно в спеллер або електронних словниках, вона необхідна для виконання програмою власне процедур перекладу [18].
Граматика. Замість прийнятого лінгвістичного підходу, який передбачає виділення послідовних процесів аналізу і синтезу пропозиції, в основу архітектури систем було покладено уявлення процесу перекладу як процесу з "об'єктно-орієнтованою" організацією, заснованою на ієрархії компонентів речення, що оброблюються. Це дозволило зробити системи PROMT стійкими і відкритими. Крім того, такий підхід дав можливість застосування різних формалізмів для опису перекладу різних рівнів. У системах працюють і мережні граматики, близькі за типом до розширених мереж переходів, і процедурні алгоритми заповнення та трансформацій фреймових структур для аналізу складних предикатів. Система PROMT виконує переклад типу TRANSFER. Але це дуже проста відповідь, він практично не відбиває особливостей архітектури системи PROMT. Алгоритми перекладу для систем типу TRANSFER будуються як композиція трьох процесів: аналіз вхідного речення в термінах структур вхідної мови, перетворення цієї структури в аналогічну структуру вихідної мови (TRANSFER) і потім синтез вихідного речення за отриманою структурою. У системі PROMT виділяється рівень лексичних одиниць, рівень груп, рівень простих пропозицій і рівень складних пропозицій. Всі ці процеси пов'язані і взаємодіють ієрархічно відповідно до ієрархії текстових одиниць, обмінюючись синтезуються і успадкованими ознаками. Такий пристрій алгоритмів дозволяє використовувати різні формальні методи для опису алгоритмів різних рівнів.
Розглянемо рівень лексичних одиниць: лексична одиниця - це слово чи словосполучення, яке є одиницею найнижчого рівня. І у випадку вхідного, і у випадку вихідної мови слово описується як сукупність основи і закінчення. Це забезпечує можливість, з одного боку, розпізнавання вхідних слів і аналізу вхідної морфології і, з іншого боку, зручного синтезу вихідних слів за їх морфологічної інформації (основа, тип словозміни і адреса закінчення в масиві закінчень цього типу). Таким чином, якщо ввести правила перетворення вхідної морфологічної інформації у вихідну морфологічну інформацію, здійснюється TRANSFER на морфологічному рівні.
Рівень груп розглядає структури більш складні: групи іменників, прикметників, прислівників і складні дієслівні форми. Цей рівень при аналізі, ґрунтуючись на формальних мережних граматиках, уміє з'єднувати групи в синтаксичні одиниці, кожна з яких характеризується синтезованою структурної інформацією й головним елементом групи. За вхідний структурі, отриманої в термінах безпосередніх складових, разом із синтезованими ознаками формується вихідна група як набір лексичних одиниць зі значеннями морфологічних ознак, які можуть успадковуватися виходячи з результатів аналізу групи. Таким чином реалізується TRANSFER на рівні груп.
Аналіз простих пропозицій як структур, які з синтаксичних одиниць, виконується на основі фреймових предикатних структур, які дозволяють ефективно виконувати перетворення. Дієслово вважається для простих пропозицій головним елементом і його валентності визначають заповнення відповідного фрейму. Для кожного типу фреймів існує деякий закон перетворення у вихідний фрейм і оформлення актантів. Таким чином здійснюється TRANSFER на рівні пропозицій. Аналіз складних пропозицій потрібно у випадку формування узгодження часів і правильного перекладу спілок.
Ключові переваги та можливості СМП PROMT Professional 9.0. наведені на таблиці 2.2.
Таблиця 2.2 - перелік переваг та можливостей СМП PROMT Professional 9.0.
Максимальні можливості для управління якістю перекладу |
Словники та онлайнові словникові бази доповнюють основний словниковий запас програми |
|
Підтримка найбільш поширених офісних додатків і форматів файлів |
Переклад файлів. pdf,. doc,. xls,. ppt,. msg,.html,. xml, відкритого Office.org Writer |
|
Переклад pdf-файлів у зручному для користувача режимі |
Тексти PDF-файлів можна перекладати безпосередньо в редакторі PROMT зі збереженням вихідного форматування, а також в інтерфейсі програм Adobe Acrobat і Adobe Pro |
|
Створення та використання баз Translation Memory |
Використання бази перекладених текстів дозволяє економити час при роботі з типовими документами і підтримувати єдину корпоративну термінологію |
|
Підтримка системи перевірки орфографії ОРФО |
Переклад без помилок і друкарських помилок |
|
Пакетний режим перекладу документів |
Можливість перекладати декілька файлів одночасно |
|
Програма, зручна при роботі |
Зручний і зрозумілий інтерфейс. Повні і зрозумілі довідкові матеріали. Доступ до ресурсів і сервісів PROMT |
2.4.2 Характеристики системи машинного перекладу Pragma
Розглянемо систему машинного перекладу Pragma 5. x
Pragma 5. x - це багатомовна програма машинного перекладу для перекладу текстових документів з однієї мови на іншу. Програма підтримує сім мов: англійська, російська, українська, німецька, латиська, польська і французька. Pragma 5. x виконує переклад безпосередньо у вікні активного застосування або в окремому вікні швидкого перекладу. За допомогою програми можна переводити текстову інформацію, представлену у вигляді документів MS Word, Інтернет сторінок, поштових повідомлень, довідок, а також вміст різних текстових вікон. За рахунок автоматизації багатьох функцій Pragma 5. x дуже проста у використанні [19].
На відміну від інших програм машинного перекладу, в проекті Pragma використовується багатомовна технологія перекладу, в якій для вибраної кількості мов підтримуються всі можливі напрями перекладу. Наприклад, для трьох мов - англійська, російська та українська існує 6 напрямів перекладу:
англо-російський, російсько-англійський, англо-український, українсько-англійський, російсько-український, україно-російський. У назві Pragma 5. x останнє число указує на кількість включених мов. Так, Pragma 5.2 - працює з будь-якими двома мовами, Pragma 5.3 - з трьома і так далі Pragma 5.7 включає повний набір всіх доступних на даний момент мов.
Окрім основних перекладних словників, є також словники спеціальних термінів з 50-ти різних тематик. У ці словники включені досить рідкісні і специфічні терміни. Якщо передбачається переклад спеціалізованих документів, то підключення цих словників може підвищити якість перекладу.
На відміну від попередніх версій, Pragma 5. x не вбудовується в додатки, а працює як системна утиліта і дозволяє переводити "з літу" в активному додатку. Запуск на переклад у всіх застосуваннях виконується через значок в системній панелі. Pragma 5. x підтримує нові мови - польську та французьку. Число можливих напрямів перекладу складає 42. Трохи змінено інтерфейс програми. Зовнішній вигляд став більш "привабливим". Програма підтримує найостанніші розробки Майкрософт - Windows 7, Internet Explorer 8, Office 2007. Змінилася процедура активації програми. Як і раніше, є он-лайн реєстрація через Інтернет, а також - оф-лайн локально. Відповідний режим вибирається автоматично. Включено модуль перевірки цілісності і функціональної працездатності програми. Pragma 5. x має нову програму інсталяції.
Організація словників. Кожна мова локалізована в окремому модулі. Всього є 7 мовних модулів: англійський, німецький, французький, латиський, польський, російський і український. Оскільки Pragma побудована за модульним принципом, то також є можливість вибору необхідних мовних модулів і комбінування з них необхідних напрямів перекладу. Необхідно враховувати наступну особливість організації системи. Російська мова є основною мовою, майже для всіх напрямів перекладу. Це означає, що при перекладі, скажімо, з латиської мови на українську обов'язково необхідна наявність російської мови. Виняток становить польська мова. Через граматичну близькість польської і української мов, основною мовою, для польської є українська мова. Тому при виборі польського модуля наявність українського обов'язково. При оновленні програма автоматично враховує ці особливості.
Разом з системними словниками, користувач має можливість поповнювати і редагувати свої особисті словники. Словники користувача мають найвищий пріоритет при перекладі, це дозволяє корегувати перекладні значення слів і виразів.
Інтерфейс та основні можливості Pragma 5. x. Відразу після установки програми Pragma 5. x в системній панелі задач, поряд з годинником з'являється її значок. Цей значок є точкою входу в Монітор Pragma 5. x. Натискання лівої кнопки мишки по значку активізує процес перекладу в активному вікні застосування (саме верхнє вікно). Pragma 5. x взаємодіє з різними додатками Windows через один і той же значок в системній панелі.
Рисунок 2.1 - місцезнаходження Pragma Monitor на панелі задач
При натисненні правої кнопки мишки по значку Pragma Монітор з'являється спливаюче меню. У цьому меню відображені всі основні функції програми.
Рисунок 2.2 - основні функції Pragma Монітор
Опишемо ці функції та можливості більш докладно:
· Швидкий переклад - відкриття вікна для швидкого перекладу. У цьому вікні відображується переклад тексту, який міститься в буфер обміну (Clipboard).
· Коректор словника - запуск утиліти роботи зі словником користувача. Дозволяє коректувати, додавати і видаляти словникові статті.
· Активація - перехід до активації програми. Даний пункт меню присутній тільки в тому випадку, якщо програма не активована.
· Настройки - перегляд і настройки параметрів роботи програми.
· Перевірка - запуск модуля тестування програмного комплексу на працездатність функцій всіх.
· Оновлення - завантаження оновлень програмних модулів, необхідних словників та їх установка.
· Довідка - довідкові матеріали по роботі з програмою.
· Про програму - загальні відомості про версію програми і встановлені словники
· Вихід - завершення роботи Pragma монітору.
2.5 Програмна реалізація
Для вирішення завдання, пов'язаного з розробкою системи автоматичної оцінки якості машинного перекладу, яка забезпечує розрахунок параметрів складного комплексу робіт за допомогою комп'ютера, треба вирішити наступні питання:
1) В якій програмній середі буде розроблятися система;
2) Який алгоритм має розроблена програма;
3) Який вигляд буде мати проект діалогу;
Система тестується й розробляється на ПК, які мають операційну систему Windows XP або вище. Такий вибір був здійснений з метою спростити розробку, тестування та роботу з даним програмним продуктом, тому що основна частина персональних комп'ютерів в на базі розробки системи (НТУ "ХПІ") мають операційну систему Windows.
Для реалізації проекту було обрано середовище розробки Visual C#. Тому, що система передбачає постійне та довгострокове спілкування користувача з системою, це пов'язане з тим, що користувач багато разів буде змінювати вхідні параметри, тому середовищем розробки необхідно обрати те середовище, яке має можливість забезпечити швидку розробку функціонального інтерфейсу. Крім цього, розроблена система має виглядати сучасною та зручною для використання. Середа Microsoft Visual C# 2008 відповідає усім приведеним параметрам і має ряд корисних відмінностей від середи розробки Visual C++. Можна підкреслити деякі з них:
1) Простір імен. У C # можливо визначати псевдоніми для класів. У C++ / CLI псевдоніми можуть посилатися лише на інші простори імен, але не на класи. У C++ / CLI не можна визначати ієрархічні простору імен в одному операторі namespace замість цього простору імен повинні бути вкладені одна в одну. С ++ / CLI (керований C ++) - це розширення C ++, відповідне стандарту ECMA (ECMA 372). Значна перевага C ++ / CLI полягає у здатності змішувати некерований (native) код з керованим кодом.
2) Визначення типів. Визначають два основних типи: типи значень (value type), які зберігають дані безпосередньо і посилальні типи (reference type), які зберігають посилання на значення. Типи значень зберігаються в стеку, посилальні - у керованій купі. У C # посилальні типи визначаються класами і зумовленими посилальними типами (object і string), а типи значень - структурами і зумовленими типами значень (int, bool, double, ulong.). У C++ / CLI клас і структура - це майже одне і те ж, але в ньому розділяються керовані і некеровані класи. Керовані класи повинні бути позначені ключовим словом ref для посилального типу та value для типу значення. Типи значень зазвичай зберігаються в стеку, керовані посилальні типи - у керованій купі, некеровані посилальні типи - в некерованою купі.
3) Виведення типу. C# 3.0 дозволяє визначати локальну змінну без явного оголошення типу - за допомогою ключового слова var. У С + стандарту 0х для цієї мети з'явилося ключове слово auto, але auto не може використовуватися для оголошення анонімних типів.
4) Методи. Методи завжди оголошуються всередині класу. Синтаксис C++ / CLI дуже схожий на C# за винятком того, що модифікатор доступу не є частиною оголошення методу, а записується перед ним. У C++ / CLI відсутні часткові класи. У C ++ / CLI немає розширюючих методів.
5) Модифікатори параметрів. За стандартом типи значень передаються за значенням, а посилальні типи - за посиланням. Якщо тип значень, переданий у вигляді параметра, повинен бути змінений всередині викликаного методу, в C # ви можете використовувати модифікатор параметра ref. У C++ / CLI визначена операція керованої посилання "%". Ця операція подібна операції посилання "&" в C++, але з тією відмінністю, що "%" може використовуватися з керованими типами, і збирач сміття може відслідковувати такі об'єкти у випадку, якщо вони будуть переміщатися всередині керованої купи. При виклику методу з посиланнями параметром, тільки мова C# вимагає застосування модифікатора параметра. C++ / CLI не робить різниці при виклику методу з модифікатором параметра або без нього. C# тут має перевагу, відразу помітну при виклику методу, який може міняти значення переданого йому параметра.
6) Конструктор. При виклику одного конструктора з іншого в C# потрібно ініціалізація членів. У C ++ / CLI можна викликати конструктор як метод.
7) Властивості. Щоб визначити властивість, в C# потрібно тільки визначити засоби доступу set і get всередині блоку властивості. Засіб доступу set автоматично створює значення змінної компілятором C#. C++ / CLI властивість визначається ключовим словом property. У C# існують також автоматичні властивості
8) Масиви. У C# при оголошенні масиву створюється клас, успадкований від базового класу Array. Масиви, не успадковані від Array можливо розміщувати тільки в стеку в unsafe контексті. С ++ CLI має керовані (успадковані від Array) і некеровані масиви.
9) Наслідування. У С++ / CLI дозволено множинне спадкування тільки для некерованих класів, керовані класи, також як і класи в C# підтримують лише одне спадкування реалізації і необмежену кількість наслідувань інтерфейсу
Був перерахований ряд основних відмінностей C# від С++ / CLI та деякі переваги у різних аспектах програмування. Описані лише основні моменти ідуть без використання наглядних прикладів, бо це мало б дуже громіздкий вигляд.
Перейдемо до опису алгоритму програми, що буде підраховувати точність перекладу за метрикою BLEU. Зрозуміло, що в порівняні з класичним алгоритмом BLEU його програмна реалізація набуде деякі особливості та відмінності, але результат оцінки при цьому буде повністю задовільним, бо включає в себе основні аспекти підрахунку метрики, беручи до уваги уніграмну точність та модифікований показник частоти повторюваності слів до загальної кількості слів машинного перекладу. Загальний алгоритм метрики BLEU детально описується у пункті 2.2 Отже, приведемо алгоритм BLEU score програми (рис.2.3).
Рисунок 2.3 - Алгоритм програмної реалізації
Перед докладним розглядом алгоритму розглянемо інтерфейс програми (рис.2.4), що являє собою екранну форму.
Рисунок 2.3 - Вигляд інтерфейсу програмної реалізації
Екранна форма інтерфейсу програми включає в себе два поля для введення тексту, та кнопку "оцінка", що підраховує подібність текстів, тобто наскільки точно слова машинного перекладу відповідають словам тексту-еталону, що в деякій мірі дозволяє отримати результат якості (точності) машинного перекладу за автоматичним методом оцінки метрики BLEU.
При введенні двох текстів програма розглядає їх як дві строки. Спочатку проходить процес вилучення слів зі строки перекладу експерту, тобто з тексту вилучаються лише усі слова без інших знаків та виносяться в окремий масив. При цьому не враховується форма слова чи знаки пунктуації. Для кожного з цих слів вираховується частота на основі підрахунку кількості появ у тексті для кожного слова. Кожна поява слова збільшує частоту на 1. Ті ж заходи проводяться для кожного слова з масиву машинного перекладу. На основі отриманих частот відраховується значення оцінки. Для кожного з окремих слів знаходиться відношення мінімальної частоти кількості його появ до загальної кількості слів у машинному перекладі, як цього потребує принцип метрики BLEU: де - модифікована обмежена частота, що виражена сумою мінімумів частот; - частота слова у МП; - частота слова у перекладі еталону.
У знаменнику завжди буде загальна кількість слів машинного перекладу, виражена у його частоті, а вищеописаний чисельник - є мінімумом суми частот для всіх відповідних слів. Саме ці вагомі маніпуляції дозволяють підготувати дані для підрахунку кінцевого результату оцінки на етапі "обчислення значення оцінки точності перекладу", що дасть уяву на основі подібності текстів про якість машинного перекладу в порівнянні з перекладом ескперту-людини. Отже модифікована уніграмна точність за критеріями метрики BLEU буде дорівнювати:
Де - модифікована обмежена частота з попередньої формули;
кількість слів у машинному перекладі.
2.6 Організація експерименту
Основною метою експерименту є порівняльна автоматична оцінка якості двох популярних СМП PROMT 9.0 Professional і Pragma 5. x. Для цього необхідно підготувати вхідні дані для програми, якими будуть відповідні переклади еталонних текстів, зроблені з використанням вище представлених СМП. Для оцінки якості перекладу будуть використані масиви текстів на різні тематики: художня та наукова. Такий підхід допоможе більш прозоро порівняти СМП в умовах перекладу принципово-різних за побудовою та змістом текстів. Як відомо, базові метрики показують високу кореляцію при перекладі технічних чи наукових текстів, але буде актуально дослідити можливості системи для перекладу невеликих масивів текстів, узятих з оповідань, віршів, пісень, тощо. Наведемо основні моменти підготовки масиву тексту для порівняльної оцінки.
Для зберігання порівняльних текстів перекладів створені окремі папки, залежно від тематики перекладу (наприклад, "переводы худ", переводы "науч"). Тексти розміщаються у текстових файлах формату. docx. У відповідній директорії тексти розподіляються у окремих файлах, залежно від мови (англійська чи російська) та способу перекладу (переклад людини, або еталон чи машинний переклад PROMT, Pragma). Шрифт чи будова тексту у файлі не мають значення, бо програма розглядає весь текст як одну строку.
Спочатку ми маємо тільки еталонні тексти перекладів, на які у майбутньому будуть посилатися тексти машинного перекладу. Щоб підготувати масиви тексту машинного перекладу ми маємо перекласти відповідні еталонні тексти з використанням СМП PROMT і Pragma.
Щоб перекласти текст за допомогою СМП Pragma достатньо відкрити файл з текстом для перекладу та натиснути лівою кнопкою миші на значку Pragma Monitor на панелі задач (рис.2.1). З'явиться меню перекладу (рис.2.5), де є наступні рішення: вибір мови, тематика та можливість вибору місця зберігання перекладу тексту (замінити поточний текст на переклад, розмістити переклад у кінці файлу-оригіналу чи згенерувати новий текстовий документ для тексту перекладу).
Рисунок 2.5 - меню перекладу Pragma для Microsoft Word
Для більш правильного перекладу рекомендується підключати відповідні до тематики словники, щоб ураховувати різноманітні особливості тексту. Також існує варіант швидкого перекладу, але при цьому втрачається формат вхідного тексту, тому цей метод для роботи не розглядається.
Якщо використовується СМП PROMT 9.0, процесс перекладу набуває більше можливостей, описані у пункті 2.4.2 В головному вікні вкладки "Translation" є різноманітні варіанти перекладу, залежно від формату файлу вхідного тексту (рис.2.6). Оскільки вхідний текст для перекладу має формат. docx слід вибрати завдання Translate Word Document. Цей варіант збереже структуру вихідного файлу перекладу та його внутрішню побудову. У наступному вікні, подібно до перекладу Pragma, запропоновано вибрати файл для перекладу, мову та тематичну специфіку перекладу, що на відміну від Pragma має більш розвинений спектр словників. Рекомендується розглянути меню перекладу СМП PROMT 9.0 Professional, бо воно більш орієнтовано для використання на підприємствах та інших галузях, завдяки розвиненим можливостям для перекладу документів та файлів зовсім різних розширень з підключенням конкретних систем словників. Звернемо уваги на рисунок 2.6.
Рисунок 2.6 - меню перекладу PROMT
Після вище приведених робіт з перекладачами можна отримати чотири варіанти перекладу, по два на кожний з СМП. На основі цих машинних перекладів будується дослідження з визначення їх якості, тобто подібності до еталонних текстів за принципом автоматичної оцінки якості BLEU.
Тепер для остаточної організації експерименту з дослідження якості МП залишається скопіювати текст еталону та його машинний еквівалентний переклад у відповідні поля програми. Щоб отримати результати точності машинного перекладу необхідно натиснути кнопку "оцінка" у програмі. Один з розрахунків дослідження наведено на рисунку 2.7 На основі еталонного тексту розглядається перша частина першої глави класичного детективу "Почему же не Эванс? ” відомого письменника Агати Крісті. Тестується переклад з англійської на російську мову, зроблений СМП Pragma.
Рисунок 2.7 - здійснення експерименту з автоматичної оцінки якості МП
Як видно з проведеного експерименту результат точності машинного перекладу виглядає невисоким, але це досить очікуваний результат для якості машинного перекладу художніх текстів. Проведемо аналогічний експеримент для перекладу СМП PROMT 9.0 Professional (рис.2.8), щоб порівняти результати.
Рисунок 2.8 - точність перекладу для СМП PROMT 9.0 Professional
Отже, отримали майже однакові результати точності англо-російського перекладу для тексту художньої тематики. Pragma 5. x отримав оцінку 0,38 (38%), PROMT 9.0 - 0,40 (40%). В наступному пункті розділу наглядно описані результати дослідження на основі середніх показників точності, отриманих розглянутими СМП.
2.7 Результати
Після проведеного дослідження на основі порівняння перекладу текстів з різних тематик можна відвести деякі підсумки за підрахунком середніх балів. Перший текст, на якому проводилося тестування мав назву "Почему же не Эванс? ” жанру класичного детективу, отже художньої тематики. Для експерименту була взята перша частина першої глави твору. Будуть розглянуті лише англо-російський та російсько-англійський варіації перекладу, бо в наявності присутні тільки еталонні варіанти перекладу на англійську та російську мови. Для порівняльного результату береться оцінка за відсотками. Переклад експерту завжди дорівнює 100%, оскільки для експерименту він є еталоном. Для художнього тексту отримали наступні показники якості, що наведені в таблиці 2.3.
Таблиця 2.3 - оцінка якості МП для частини з класичного детективу Агати Крісті "Почему же не Эванс? ”
Назва СМП |
Якість англо-російського перекладу |
Якість російсько-англійського перекладу |
|
PROMT 9.0 |
0,40 (40%) |
0,45 (45%) |
|
Pragma 5. x |
0,38 (38%) |
0,48 (48%) |
Показники якості приблизно однакові, але при проведенні багатьох експериментів можна отримати більш прозорі результати. Для реалізації експерименту з автоматичної оцінки якості перекладу наукового тексту узята стаття медичних тез на тему "Взаємозв'язок гиперурикемії з клінічними, гемодинамічними та метаболічними показниками у хворих на гіпертонічну хворобу". Даний текст є дуже спеціалізованим та має велику кількість термінів, але має менший розмір за попередній художній текст. Результати оцінки наведені в таблиці 2.4.
Таблиця 2.4 - оцінка якості МП для наукових медичних тез на тему: "Взаємозв'язок гиперурикемії з клінічними, гемодинамічними та етаболічними показниками у хворих на гіпертонічну хворобу"
Назва СМП |
Якість англо-російського перекладу |
Якість російсько-англійського перекладу |
|
PROMT 9.0 |
0,41 (41%) |
0,62 (62%) |
|
Pragma 5. x |
0,40 (40%) |
0,64 (64%) |
Показники якості МП для англо-російського перекладу показали невисокі показники у порівнянні з попереднім художнім текстом, однак бачимо значний підйом якості перекладу з російської на англійську.
Останнім експериментом буде текст на тематику програмування "Новые возможности управления жизненным циклом приложений в Visual Studio 2010". Результати даного експерименту приведені в таблиці 2.5.
Таблиця 2.5 - оцінка якості МП для тексту "Новые возможности управления жизненным циклом приложений в Visual Studio 2010"
Назва СМП |
Якість англо-російського перекладу |
Якість російсько - англійського перекладу |
|
PROMT 9.0 |
0,39 (39%) |
0,46 (46%) |
|
Pragma 5. x |
0,34 (34%) |
0,47 (47%) |
Для більш поглибленого дослідження при перекладі останнього технічного тексту будуть підключені відповідні до тематики тексту словники. При перекладі Pragma замість загальної тематики буде обрана специфіка "информатика". Відповідно при використанні СМП PROMT замість "general lexicon" підключаються словники "software". Результаті експерименту наведені в таблиці 2.6.
Таблиця 2.6 - оцінка якості МП для тексту "Новые возможности управления жизненным циклом приложений в Visual Studio 2010" з використаннях спеціалізованих словників
Назва СМП |
Якість англо-російського перекладу |
Якість російсько-англійського перекладу |
|
PROMT 9.0 |
0,47 (47%) (+6%) |
0,48 (48%) (+2%) |
|
Pragma 5. x |
0,35 (35%) (+1%) |
0,48 (48%) (+2%) |
Були продемонстровані всього декілька можливих варіацій перекладу, але про якість перекладу можна зробити деякі висновки, що загалом СМП PROMT і Pragma, незважаючи на досить різні підходи до побудови та перекладу, показують майже однакові результати, тому є необхідність у подальшому дослідженні цієї теми з використанням нових СМП, різних тематичних словників, більшої кількості мов та різних метрик автоматичної оцінки, що базуються на BLEU, але при цьому враховують різні моменти (наприклад, наявність синонімів) в процесі оцінки МП.
3. Техніко-економічне обгрунтвання розробки
Метою роботи було розробка інтелектуальної системи автоматичної оцінки якості машинного перекладу.
Програма реалізована в операційній системі Microsoft Windows 7. Програмна реалізація виконана у середовищі пакету розробки Microsoft Visual C# 2008 Express Edition.
3.1 Опис об'єкта розробки
Робота проводилась з використанням ПК наступної конфігурації: 21.5" Samsung SyncMaster P2250/Intel (R) Core (TM) i7 CPU 860 (2.8GHz) / 4Gb RAM/ 1 Tb / GeForce GTX 470/DVD RW / LAN / FM / Wi-Fi / Windows 7 Maximum Edition.
3.2 Опис програмного продукту
Розроблений програмний продукт призначений для використання перекладачами та експертами з оцінки якості МП.
Програмний комплекс складається з програмного проекту, OS Windows та призначений для використання на ПК чи ноутбуках.
Основні параметри аналізованого продукту наведені в таблиці 3.1.
Таблиця 3.1 - Основні параметри програмного продукту
Найменування |
BLEU score |
|
Операційна система |
Windows 7, Windows Server 2003-2008 R2 (32-Bit x86), Windows Vista Service Pack 2, Windows XP Service Pack 3 |
|
Оперативна пам'ять |
від 256 МБ ОЗУ |
|
Процесор |
від 900 МГц |
3.3 Оцінка ринку збуту
Основним регіоном продажу розробленого програмного продукту є вся територія України. Але також є не виключеним продаж цього продукту і за її межами.
Таблиця 3.2 - Сегментація ринку за споживачами
Області використання (сегменти) |
Код сегменту |
Споживачі |
|
I |
|||
Перекладачі |
А |
* |
|
Експерти з оцінки МП |
Б |
* |
де I - розробники програмного забезпечення.
Таблиця 3.3 - Аналіз ємності сегментів ринку
Область використання (сегменти) |
Кількість об'єктів, що використовують виріб |
Передбачуване число продажів одному об'єкту (шт.) |
Передбачувана ємність сегменту (шт.) |
|
Перекладачі |
20 |
1 |
20 |
|
Експерти з оцінки МП |
5 |
1 |
5 |
|
РАЗОМ Ємність ринку |
25 |
Параметрична сегментація ринку виробляється шляхом виділення параметрів продукту й оцінки ступеня важливості кожного параметра для кожного споживчого сегмента по п'ятибальній шкалі.
Прогнозована кількість продажів (табл. 3.4).
Таблиця 3.4 - Прогнозована кількість продажів
Найменування показника |
Сума, грн. |
||||
1-й рік |
2-й рік |
3-й рік |
Усього |
||
Кількість продажів |
5 |
10 |
10 |
25 |
3.4 Розрахунок витрат на розробку програмного продукту
Використання показників собівартості в практиці, у всіх випадках вимагає забезпечення однаковості витрат, що враховуються в її складі. Для забезпечення такої однаковості конкретний склад витрат, відносних до собівартості, регламентується типовим положенням по плануванню, обліку та калькулюванню собівартості продукції (робіт, послуг) в промисловості (постанова KM від 26.07.07 р. №475).
Метою обліку собівартості продукції є своєчасне, повне та достовірне визначення фактичних витрат, пов'язаних з виробництвом продукції, обчислення фактичної собівартості окремих видів та всієї продукції, а також контроль за використанням матеріальних, трудових та грошових ресурсів.
Витрати, що включаються в собівартість продукції (робіт, послуг) групуються за наступними елементами:
матеріальні витрати;
витрати на оплату праці;
відрахування на соціальні заходи;
інші витрати.
3.4.1 Визначення потреби в матеріальних ресурсах
До матеріальних витрат відносяться витрати на сировину і матеріали у виробничій діяльності підприємства. Розрахунок ведеться по формулі:
,
Де Нрі - норма витрати і-го матеріалу на одиницю продукції:
Ці - ціна одиниці і-го виду матеріалу;
m - кількість видів матеріалу:
Змат = (20 * 5) + (500 * 0,3) + (1 * 1000) = 1250 грн.
Розрахунки вартості сировини та матеріалів представлені нижче в таблиці 3.5.
Таблиця 3.5 - Розрахунок вартості сировини та матеріалів
Матеріали |
Кількість, шт. |
Вартість, грн. |
Загальна вартість, грн. |
Призначення |
|
DVD диски |
25 |
4 |
100 |
Збереження та тиражування програми |
|
Папір А4 |
500 |
0,3 |
150 |
Роздруківка вихідних текстів |
|
Фарба для принтера |
1 |
600 |
1000 |
Роздруківка документації |
|
Транспортно-заготівельні витрати |
1 |
125 |
125 |
10% від загальної вартості матеріалів |
|
Сумарна вартість, грн. |
1375 |
3.4.2 Витрати на оплату праці
Розрахунок витрат на основну заробітну плату показаний у таблиці 3.6.
Таблиця 3.6 - Розрахунок заробітної платні
Посада |
Оклад, грн. |
Кількість, людина |
Час зайнятості, місяців |
Участь, % |
Основна заробітна плата, грн. |
|
Керівник проекту |
5000 |
1 |
3 |
25 |
8000 |
|
Перекладач |
4500 |
1 |
3 |
75 |
10000 |
|
Разом |
18000 |
3.4.3 Розрахунок додаткової заробітної плати
Додаткова заробітна плата (Здод) включає доплати, надбавки, гарантійні і компенсаційні виплати, передбачені законодавством.
Додаткову заробітну плату приймаємо 10% от Зосн.
Здод = 18000 * 0,1= 1800 грн.
3.4.4 Розрахунок амортизації
Затрати на амортизацію обчислимо за формулою:
де ? розрахунок вартості обладнання;
? норма амортизації (60%);
? період розробки (місяць).
(12000 * 0,6 * 3) / 12 = 1800 грн.
Таблиця 3.7 - Розрахунок вартості обладнання
Пристрій |
Кількість, шт. |
Вартість, грн. |
Загальна вартість, грн. |
Призначення |
|
ACPI комп'ютер на базі x86 |
1 |
11000 |
11000 |
Для написання програми, оформлення документації |
|
Принтер Canon LBP 2900 |
1 |
1000 |
1000 |
Друк документації |
|
Разом () |
12000 |
3.4.5 Відрахування на соціальні заходи
На обов'язкове державне пенсійне страхування відводиться 32% від суми Зосн та Здоп:
Зпенс = (18000 + 1800) *0,32 = 6336 грн.
На загальнообов'язкове державне соціальне страхування на фонд зайнятості відводиться 2,5% від суми Зосн та Здоп:
Зфзп = (18000 + 1800) * 0,025 = 495 грн.
На індивідуальне страхування персоналу підприємства відводиться 0,01% від суми Зосн та Здоп:
Зінд. стр = (18000 + 1800) * 0,01=198,00 грн.
На обов'язкове медичне страхування відводиться 2,9% від суми Зосн та Здоп:
Змед. стр = (18000 + 1800) * 0,029 = 574,20 грн.
3.4.6 Загальновиробничі витрати
До статті калькуляції "Загальновиробничі витрати" належать витрати на керування виробництвом; на амортизацію основних засобів загальнозаводського призначення; на витрати некапітального характеру, пов'язані з удосконаленням технологій та організації виробництва, покращенням якості продукції, підвищенням її надійності, довговічності та інших експлуатаційних властивостей; витрати на обслуговування виробничого процесу.
Загальновиробничі витрати приймаємо у розмірі 30% від Зосн.
Зосн. вир. = 18000 * 0,3 = 5400 грн.
3.4.7 Адміністративні витрати
До статті "Адміністративні витрати" належать такі загальногосподарські витрати, які спрямовані на обслуговування і керування фірмою: пов'язані з керуванням підприємством; з утриманням та обслуговуванням основних засобів; з обслуговуванням виробничого процесу. Сюди відносяться податки, збори та інші передбачені законодавством обов'язкові сплати, а також витрати, пов'язані з професійною підготовкою або перепідготовкою робітників апарату керування та іншого загальногосподарського персоналу. Витрати приймаємо у розмірі 20% від Зосн.
Задм. витр. = 18000 * 0,2 = 3600 грн.
3.4.8 Витрати на збут
До даної статті належать витрати, пов'язані з реалізацією (збутом) продукції (товарів, робіт, послуг), також витрати на утримання підрозділів підприємства, які пов'язані зі збутом продукції; тару упаковку продукції; витрати по доставці продукції і на вантаження в транспортні засоби; комісійні збори і т.д. Приймаємо у розмірі 5% від виробничої собівартості.
3.4.9 Калькуляція собівартості
На підставі проведених розрахунків складаємо калькуляцію собівартості на програмний продукт. Результати калькуляції наведені у таблиці 3.8.
Таблиця 3.8 - Калькуляція собівартості продукту "Білінговий програмний комплекс"
Найменування статті витрат |
Сума, грн. |
|
1 Вартість матеріалів і напівфабрикатів |
1250 |
|
2 Транспортно-заготівельні витрати |
125 |
|
3 Основна заробітна плата |
18000 |
|
4 Додаткова заробітна плата |
1800 |
|
5 Відрахування на соціальні заходи |
7603,2 |
|
6 Амортизація |
1800 |
|
7 Загальновиробничі витрати |
5400 |
|
8 Виробнича собівартість |
35978,2 |
|
9 Адміністративні витрати |
3600 |
|
10 Витрати на збут (5% від пункту8) |
1798,91 |
|
11 Прибуток (25% від суми пунктів 8-10) |
10344,4 |
|
12 Ціна розробника (сума пунктів 8-10) |
41377,1 |
|
15 Роздрібна торгова націнка (надбавка, 25% від пункту 12) |
10344,3 |
|
16 ПДВ (20% від пункту 12) |
8275,42 |
|
17 Роздрібна ціна (сума пунктів 12, 15, 16) |
59996,8 |
3.5 Фінансовий план
Цей розділ узагальнює матеріали попередніх розділів і представляє їх у вартісному вираженні та містить таблицю доходів і витрат (табл.3.9).
Таблиця 3.9 - Доходи і витрати
Найменування показника |
Сума, грн. |
|||||
1-й рік |
2-й рік |
3-й рік |
Усього |
|||
Кількість продажів |
5 |
10 |
10 |
25 |
||
Доходи від продажів (Д) |
299984,05 |
599968,10 |
599968,10 |
1499920,24 |
||
Постійні витрати |
Основна заробітна плата |
18000 |
0 |
0 |
18000 |
|
Додаткова заробітна плата |
1800 |
0 |
0 |
1800 |
||
Відрахування на соціальні заходи |
7603, 20 |
0 |
0 |
7603, 20 |
||
Амортизація (А) |
1800 |
0 |
0 |
1800 |
||
Загальновиробничі витрати |
5400,00 |
0 |
0 |
5400,00 |
||
Адміністративні витрати |
2130,00 |
0,00 |
0,00 |
2130,00 |
||