Компьютерные программы, автоматизирующие оценку объектов и контент-анализ текста
Использование математических методов для оценки дидактических объектов. Способы автоматизации оценки объектов методом парных сравнений и определения различных видов информации в тексте с помощью компьютера. Возможности программ, написанных в Free Pascal.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 02.06.2016 |
Размер файла | 1,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Глазовский государственный педагогический институт им. В.Г.Короленко
КОМПЬЮТЕРНЫЕ ПРОГРАММЫ, АВТОМАТИЗИРУЮЩИЕ ОЦЕНКУ ОБЪЕКТОВ И КОНТЕНТ-АНАЛИЗ ТЕКСТА
Майер Роберт Валерьевич
доктор педагогических наук, профессор
кафедры физики и дидактики физики
Аннотация
программа автоматизация текст компьютер
Развитие теории обучения требует использования математических методов для оценки дидактических объектов. Предлагаются простые способы автоматизации оценки объектов методом парных сравнений и определения различных видов информации в тексте с помощью компьютера. Представлены тексты программ, написанных в среде Free Pascal, использование которых позволяет: 1) оценить дидактическую сложность понятий, обозначающих физические приборы, величины и физические эксперименты; 2) произвести контент-анализа параграфов различных учебников физики.
Ключевые слова: дидактика, дидактические объекты, информация, контент - анализ, оценка объектов, парные сравнения, педагогика, сложность понятия, теоретические знания, эмпирические знания
Введение
В последнее время повысился интерес к применению математических методов в педагогике [2, 3]. Для использования математических моделей, установления качественных и количественных закономерностей необходимо уметь оценивать различные качества педагогических объектов, уровень знаний учеником учебного материала, сложность понятия, формулы, темы, задачи, информативность рисунка и т.д. Также большое значение имеет проблема определения количества того или иного вида информации (например, эмпирической, теоретической, математической) в учебном тексте, лекции, ответе ученика.
Оценка и ранжирование нескольких десятков объектов - довольно трудоемкий процесс для того, чтобы его выполнять вручную. Так, для оценки 30 объектов методом парных сравнений необходимо осуществить не менее 450 различных сопоставлений, в ходе каждого из которых эксперт должен соотнести степень наличия оцениваемого качества в двух сравниваемых объектах. Поэтому лучше автоматизировать этот процесс с помощью компьютерной программы, которая случайным образом предъявляет сравниваемые объекты, воспринимает ответы эксперта и записывает результаты в файл. При этом важно, чтобы эксперт имел возможность сделать перерыв, сохранить результаты, а на следующий день вернуться и продолжить работу.
Контент-анализ многостраничных текстов, подсчет различных терминов-маркеров самим экспертом - дело трудоемкое, а его результат зависит от различных случайных факторов. Повысить объективность контент-анализа учебного текста и повторяемость получающихся результатов возможно с помощью компьютерной программы, которая, используя словарь-тезаурус, подсчитывает частоты упоминания различных терминов в текстовом файле, учитывает их сложность и принадлежность к тому или иному классу. Работа эксперта в этом случае сводится к следующему: 1) составление словаря-тезауруса; 2) классификация и оценка входящих в него терминов; 3) подготовка файла с анализируемым текстом; 4) запуск программы анализирующей текст; 5) интерпретация результатов.
1. Программа для парного сравнения объектов
Для оценки объектов методом парных сравнений используется программа ПР-1, написанная в среде Free Pascal (рис. 1). Допустим, необходимо оценить сложность понятий [7, 9] из школьного курса физики. С помощью Far_manager создают файл vhod.txt, содержащий список из N=25 оцениваемых понятий (рис. 2.1), случайно выбирают понятие с номером N0=8 и запускают компьютерную программу ПР-1. На экране появляются понятие N0=8, а строчкой ниже - случайным образом выбранное понятие из списка, например, понятие 12. Эксперт должен сравнить оцениваемые качества этих двух объектов и ввести с клавиатуры символы “+”, “0” или “-“. Плюс означает, что оцениваемого качества в объекте 1 больше, чем в объекте 2, ноль - примерно одинаково, а минус - меньше, чем в объекте 2.
После нажатия на клавишу “Enter” снова появляется понятие с номером N0=8 и случайно выбранное понятие 23. Эксперт снова производит сравнение и ставит оценку “+”, “-“ или “0”. Программа написана так, что понятие с номером N0 не сравнивается с собой (известно, что результат “0”) и не сравнивается дважды ни с каким другим понятием. После окончания процедуры сравнения понятия 8 со всеми остальными понятиями из входного файла (рис. 2.1), программа создает текстовый файл vihod.txt из одной строки, содержащий номер объекта N0=8 и результаты его сравнений с понятием 1, понятием 2, …., понятием N в виде “+ + + … + 0 0 - + … - 0 + - -” (рис. 2.2). Затем эксперт повторяет ту же самую процедуру с другим объектом, например, с понятием N0=10. В случае необходимости эксперт может сделать перерыв или отложить процедуру сравнения на следующий день. С помощью текстового редактора из получающихся строчек (рис. 2.2) формируется двумерная матрица NxN, похожая на представленную на рис. 2.3. В результате полного перебора всего списка понятий каждая пара понятий сравнивалась дважды (сначала i-ое с j-тым, а потом наоборот), что позволяет уменьшить влияние случайных факторов. Результаты сравнения двух объектов записываются на пересечении соответствующих строки и столбца. С левого верхнего угла к правому нижнему идет диагональ из нулей.
Для получения оценок объектов получившаяся двумерная матрица из плюсов, нулей и единиц (рис. 2.3) анализируется программой ПР-2 (рис. 3), которая для каждой i-ой строки находит сумму всех плюсов и из нее вычитает сумму всех минусов. Получающийся результат A_i для каждой строки выводится на экран. Если в программе ПР-2 активизировать x[j,i] и закомментировать x[i,j], то она аналогичным образом обработает столбцы матрицы. Соответствующие результаты B_i (i=1, 2, …, N) выводятся на экран. Величина K оцениваемого качества i-ого объекта считается пропорциональной разности A_i-B_i. К ней можно прибавить некоторую постоянную и результат умножить на коэффициент так, чтобы максимальное значение характеристики K равнялось единице, а минимальное - нулю.
2. Программа для контент-анализа текста
Метод контент-анализа, заключается в “переводе в количественные показатели массовой текстовой информации” и их последующей статистической обработке [1]. Для оценки количества содержащихся в тексте эмпирических, теоретических и математических знаний следует определить число использований “эмпирических” терминов (обозначающих объекты и явления, приборы и устройства), “теоретических” терминов (названия физических величин), математических терминов (математические величины, операции, символы в формулах) и общенаучных терминов (например, “докажем”, “измерения”, “проанализируем” и т.д.). Единицей измерения объема информации является одно упоминание термина. Так как в русском языке средняя длина слова 6,3 буквы (включая пробел), то для нахождения суммарного числа слов N (объема информации в тексте I) достаточно общее количество букв разделить на 6,3.
Методика такого качественно-количественного анализа содержания учебных текстов предполагает выбор исчерпывающих и взаимоисключающих критериев и определение правила для надежного фиксирования нужных характеристик текста так, чтобы получающиеся результаты не зависели от эксперта, имели высокую повторяемость и отражали объективные характеристики текста [1]. Физический текст включает в себя собственно текстовую информацию, рисунки (графическая информация) и формулы. Чтобы оценить количество информации в рисунках и формулах будем заменять их максимально короткими предложениями, которые полно передают заключенную в них учебную информацию. Речь идет о полезной информации, необходимой для усвоения соответствующего параграфа учебника (ненужная информация, содержащаяся в рисунках не учитывается).
Приближенно можно считать, что количество “формульной” информации пропорционально числу математических символов, встречающихся в тексте и в формулах. Каждый символ соответствует некоторому понятию. Сложность символов будем оценивать по пятибальной шкале: 1. Сложность S=1: одиночные символы (не вектора), сумма, разность, произведение и деление. 2. Сложность S=2: возведение в степень, извлечение корня, сложение и вычитание векторов. 3. Сложность S=3: формула содержит тригонометрические функции, логарифмы, скалярное произведение векторов. 4. Сложность S=4: пределы, дифференциалы, производные, векторное произведение. 5. Сложность S=5: интегралы, операторы и т.д. Подсчитывается число математических символов в параграфе со сложностью S=1, 2, 3, 4, 5, и результаты присваиваются элементам матрицы mat_sim[i] (программа Analizer, процедура Formuli).
На рис. 4 представлена специальная программа Analyzer (среда Free Pascal), которая, используя словарь-тезаурус, подсчитывает частоты упоминания различных физических и математических терминов в текстовом файле. Контент-анализ текста осуществляется следующим образом: 1. Определяют сложность и количество “формульной” информации путем подсчета числа математических символов различной сложности в тексте и формулах; результаты вводят в mat_sim[i]. 2. Заменяют рисунки краткими описаниями, содержащими информацию об изображенных на рисунках физических и математических объектах. 3. Создают текстовый файл в формате vhod1.txt, содержащий анализируемый текст с описаниями рисунков без формул (рис. 5). 4. Составляют список физических математических и общенаучных терминов, встречающихся в данном тексте. Для этого используют программы Word_stat, Word_count, Word_statistic, которые можно найти в Интернете. 5. Создают словарь-тезаурус текста, содержащий общие части однокоренных терминов (например, слова дифракция, дифрагировать, дифракционный - общая часть “дифра”), который сохраняют в файле slovar.txt (рис. 6.1). 6. Каждый термин относят к одному из классов “эмпирический”, “теоретический”, “математический”, “общенаучный”, и оценивают его сложность по шкале 1-2-3; результаты записывают в файл slovar.txt. 7. Запускают программу Analyzer, которая обращаясь к файлу slovar.txt, анализирует текст, хранящийся в файле vhod1.txt, а результаты записывает в файл vihod1.txt. Также создается профиль текста, состоящий из матрицы наиболее часто встречающихся слов и их частот (рис. 6.2). 8. Интерпретируют полученные результаты, создают таблицы, строят гистограммы и т.д.
Заключение
В статье предложены простые варианты решения проблемы автоматизации оценки объектов методом парных сравнений и определения количества различных видов информации в тексте. Сравнение, оценка и ранжирование объектов, а также определение количества различных видов информации в тексте - важные процедуры измерения, использующиеся в гуманитарных науках. С помощью программ ПР-1 и ПР-2 (рис. 1 и 3), помогающих реализовать метод парных сравнений, удалось оценить дидактическую сложность понятий, обозначающих физические приборы, величины и физические эксперименты [7, 9]. Все это позволило осуществить классификацию учебников и тем школьного курса физики на основе оценки их физической и математической сложности, установить закономерности распределения учебного материала [5, 6, 8]. Программа ПР-3 (рис. 4) применялась для контент-анализа параграфов различных учебников физики [4].
Библиографический список
1. Аверьянов Л.Я. Контент-анализ. Монография. М.: РГИУ, 2007. 286 с.
2. Битинас Б. Многомерный анализ в педагогике и педагогической психологии. Вильнюс, 1971. 347 с.
3. Дюк В.А. Компьютерная психодиагностика. С.П.: Братство, 1994. 364 с.
4. Майер Р.В. Автоматизированный метод количества различных видов информации и ее сложности в физическом тексте с помощью ПЭВМ // ”Известия высших учебных заведений. Поволжский регион. Гуманитарные науки”. N3 2014. С. 203 - 212.
5. Майер Р.В. Классификация тем школьного курса физики на основе оценки их физической и математической сложности // Инновации в образовании. 2014. № 9. С. 29-38.
6. Майер Р. В. Метод оценки физической сложности тем школьного курса физики // Концепт. 2014. № 08 (август). ART 14199. URL: http://e-koncept.ru/2014/14199.htm. Гос. рег. Эл. No ФС 77-49965.
7. Майер Р.В. Оценка дидактической сложности физических понятий методом парных сравнений // Мир науки. Научный интернет-журнал [Электронный ресурс]. 2014, Выпуск 3. 8 с. http://mir-nauki.com.
8. Майер Р.В. Оценка дидактической сложности различных учебников физики // Современные научные исследования и инновации. Май 2014. № 5 [Электронный ресурс]. URL: http://web.snauka.ru/issues/2014/05/34429.
9. Майер Р.В. Эффективный метод оценки дидактической сложности физических понятий // Фундамент. исследования. N 11. 2014. C. 904-909.
10. Психосемантика слова и лингвостатистика текста: Методические рекомендации к спецкурсу / Сост. А.П. Варфоломеев. Калининград: Калинингр. Ун-т, 2000. 37 с.
11. Толстова Ю.Н. Основы многомерного шкалирования: учебное пособие. М.: КДУ, 2006. 160 с.
Размещено на Allbest.ru
...Подобные документы
Изучение теоретических положений, раскрывающие структуру линейных и нелинейных стационарных и динамических объектов, математическое описание и решение задачи анализа объектов. Использование для решения функции системы математических расчетов MathCAD.
контрольная работа [317,7 K], добавлен 16.01.2009Описания объектов, свойств, методов, формы и основных модулей текста программы в среде Delphi. Создание Windows-приложения на алгоритмическом языке Object Pascal в среде визуального программирования. Анализ результатов тестирования программного продукта.
курсовая работа [2,4 M], добавлен 27.08.2012Графические возможности текстовых процессоров Microsoft Office Word и Open office.org. Вставка в документы рисунков и других объектов. Встраивание и связывание объектов. Преобразование текста посредством Microsoft WordArt. Виды графических объектов.
реферат [4,3 M], добавлен 17.06.2015Разработка программы, реализующей метод принятия решения на основе паутинной диаграммы, исходя из количества объектов исследования, их весов и критериев оценки. Листинг программного кода и пример работы программы: расчет площади многоугольников-объектов.
контрольная работа [1,1 M], добавлен 10.06.2011Организационная и функциональная структура объекта автоматизации. Методы и средства защиты информации. Инвентаризация объектов, потенциально требующих защиты. Классификация объектов информационной системы. Анализ возможных каналов утечки информации.
контрольная работа [312,5 K], добавлен 30.09.2012Основы работы на языке высокого уровня Turbo Pascal. Основное оборудование и программное обеспечение. Операторы, необходимы для работы в графической среде Turbo Pascal. Запуск графического режима. Текст программы в графической среде Turbo Pascal.
лабораторная работа [12,7 K], добавлен 14.05.2011Изучение теоретических положений, раскрывающих структуру линейных и нелинейных стационарных и динамических объектов. Математическое описание и решение задачи анализа такого рода объектов. Анализ линейных стационарных объектов. Средства матричной алгебры.
контрольная работа [1,4 M], добавлен 14.02.2009Общие сведения о OpenGL и его использование для разработки логотипа. Разработка программы: функции, их использование в программе. Построение модели и возможность перемещения объектов. Задание освещения объектов моделирования и проработка элементов фона.
курсовая работа [447,7 K], добавлен 14.07.2012Решение циклических программ и программ вычисления функции с условием. Уравнение в табличном редакторе Microsoft Excel и в Turbo Pascal. Вычисление определенного интеграла методом прямоугольников, трапеции, Симпсона. Линейные и нелинейные уравнения.
курсовая работа [233,6 K], добавлен 27.12.2009Этапы построения математической модели статического объекта, использование полиномов Чебышева. Характеристика и основное предназначение программы Matlab. Анализ функциональной модели Брюле, Джонсоном и Клетским. Методы исследования динамических объектов.
курсовая работа [1,3 M], добавлен 21.05.2012Исследование свойств и поведения динамических объектов, описываемых системами обыкновенных нелинейных дифференциальных уравнений. Описание методов, программ и алгоритмов решения систем линейных и нелинейных алгебраических уравнений в системе MathCAD.
контрольная работа [255,1 K], добавлен 16.01.2009Подходы к автоматизации процесса управления и планирования уборочных работ. Возможности программы Access. Определение связей информационных объектов и построение информационно-логической модели для СПК "Литковское". Анализ входной и выходной информации.
курсовая работа [263,0 K], добавлен 07.07.2013Моделирование пространства и способы представления пространственных объектов. Хранение и извлечение пространственных объектов. Применение географических баз данных. Классификация объектов на основе размерности. Мозаичное и векторное представление.
презентация [179,5 K], добавлен 11.10.2013Функциональные возможности программного продукта. Требования к программным и аппаратным средствам. Обоснование выбора наилучшей модели для прогнозирования стоимостных показателей объектов. Разработка пользовательского интерфейса и модулей программы.
дипломная работа [2,3 M], добавлен 24.06.2013Автоматизация работ по учету отремонтированных, реконструированных, модернизированных строительных объектов и объектов, подлежащих ликвидации. Анализ полученных данных, проектирование базы данных для хранения информации о заказах, клиентах и затратах.
курсовая работа [6,0 M], добавлен 01.07.2010Методика сериализации объектов и её практическое применение. Клонирование объектов при помощи сериализации. Обработка действий мыши и клавиатуры. Изучение классов Menu, MenuBar, MenuItem, Dialog, FileDialog пакета java.awt, использование таблиц.
лабораторная работа [180,8 K], добавлен 30.06.2009Планы видов характеристик как прикладные объекты конфигурации, предназначенные для хранения информации о характеристиках различных объектов. Функциональные возможности регистра расчета. Построение отчета по продажам и остаткам товаров на указанную дату.
курсовая работа [2,7 M], добавлен 25.05.2014Разработка интерфейса для объединения в структуру данных множества объектов различных классов (абстрактный базовый класс TObject). Создание таблиц (коллекций) объектов с помощью механизма объектно-ориентированного программирования - полиморфизма.
курсовая работа [175,7 K], добавлен 06.08.2013Free Pascal как свободная реализация языка Паскаль, совместимая с Borland Pascal и Object Pascal - Delphi, но при этом обладающая и некоторыми дополнительными возможностями. Основы алгоритмизации и программирования, создание визуальных приложений.
учебное пособие [4,2 M], добавлен 13.12.2011Реализация алгоритмов вычисления математических объектов на конкретных вычислительных машинах. Числовые данные в практических задачах. Анализ математических моделей, связанных с применением вычислительных машин в различных областях научной деятельности.
курсовая работа [369,3 K], добавлен 13.01.2018