Учеба студентами анализа больших данных

Обучение студентов и аспирантов высших учебных заведений методам анализа больших данных. Особенность использования математических моделей при изучении крупной информации. Одоление психолого-познавательных барьеров при последующей визуализации данных.

Рубрика Педагогика
Вид статья
Язык русский
Дата добавления 20.04.2018
Размер файла 159,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ORCID: 0000-0003-4361-833X, кандидат биологических наук, Российский университет дружбы народов

Работа выполнена при поддержке гранта РГНФ № 15-06-10860 а

ПРЕОДОЛЕНИЕ ПСИХОЛОГО-ПОЗНАВАТЕЛЬНЫХ БАРЬЕРОВ СВЯЗАННЫХ С АНАЛИЗОМ И ВИЗУАЛИЗАЦИЕЙ БОЛЬШИХ ДАННЫХ

Сорокин Л.В.

Попробуем задать простой вопрос и получить «простой» ответ, а заодно приведем пример анализа больших данных (БД) и продемонстрируем возникающие при этом психолого-познавательные барьеры (ППБ) [1], [2].

Часто в процессе обучения студентов и в научной работе возникают «непреодолимые» преграды и предубеждения. Однако присутствие психолого-познавательных барьеров не означает отрицание возможности получения научного результата. Особенно в процессе обучения необходимо продемонстрировать нестандартные решения, альтернативные возможности и междисциплинарные подходы [3], [4]. Часто бывает, что проблемы одного подхода снимаются при привлечении методов и аппарата из смежных научных направлений.

Постановка задачи

В предыдущей работе [5] мы рассмотрели преодоление ППБ при анализе БД. На практике, вызывает затруднение не только анализ БД, но и приходится сталкиваться с затруднениями при визуализации результата анализа БД.

Приведем пример из курса основы безопасности жизнедеятельности - произошло землетрясение и всем рекомендуют покинуть здания, как можно быстрее. Попробуем ответить на вопрос, сколько есть времени у людей для безопасной эвакуации из зданий после землетрясения? Обычно говорят, что после первого толчка опасные для здания колебания нарастают за 15-20 секунд. В этот момент уже целесообразно покинуть здание. Однако, если сразу покинуть здание не удалось, то необходимо определить, сколько времени остается до повторных толчков (серии автершоков).

Этот вопрос подразумевает априорное знание большого объема данных о предшествовавших землетрясениях [6]. Кроме того необходимо иметь представление о физических процессах, связанных с подготовкой землетрясений и высвобождением энергии в процессе самого землетрясения [7].

Попытка решения задачи по проверке гипотезы о наличии связи между сейсмическими событиями с самого начала выглядит как неразрешимая задача. Психолого-познавательные барьеры и установившиеся представления в этой области настолько сильны, что сама постановка вопроса о возможной связи между землетрясениями, обычно сразу отвергается.

Считается, что сейсмические события (землетрясения) происходят с определенной периодичностью (десятки и сотни лет) [7] и это связано с медленным накоплением деформации, а в ряде случаев с изменением электропроводности породы и изменением скоростей (S) и (P) сейсмических волн в непосредственной близости от места подготовки землетрясения. Однако этих данных недостаточно для предсказания землетрясений.

В ранее проведенных исследованиях [8], [9] описано инициирование землетрясений при прохождении через их очаг сейсмических волн от других землетрясений. Это новый подход, описывающий триггерный эффект, в результате которого сейсмическая волна от одного землетрясения может спровоцировать другое землетрясение. Таким образом, из случайного массива больших данных сейсмических событий по всему земному шару можно выявить связанные во времени и пространстве землетрясения.

Преодолев ППБ при постановке задачи исследования можно перейти к анализу БД. Приведем пример как это можно осуществить.

Вычислительная модель

Для расчета времени распространения сейсмических волн в коре, мантии и ядре Земли применена известная математическая модель AK135 [10], являющаяся развитием модели IASPEI [11]. Модель IASPEI была разработана B. Kennett [11] для расчета времен распространения большого набора фаз сейсмических волн. Вычислительный алгоритм для модели IASPEI описан R. Buland & C.H. Chapman (1983) [12]. Последняя версия IASPEI [11] включает в себя набор из 38 фаз сейсмических волн.

Основываясь на модели IASPEI [11], Brian Kennett разработал модель AK135 [10], в которой удалось осуществить более точное приближение к профилю скоростей продольных (P) и поперечных (S) сейсмических волн в верхней мантии и коре Земли. Без учета региональной модели скоростей распространения сейсмических волн точность вычисления времени распространения сейсмических волн для разных угловых расстояний составляет 3-5 секунд. При выполнении данных расчетов не учитывалась элиптическая коррекция, что внесло дополнительную погрешность до 7 секунд [10]. Все типы волн, которые были заложены в модель AK135, были проанализированы на предмет возможной инициации ими сейсмических событий.

Для каждого землетрясения проведено вычисление времени распространения 38 сейсмических волн и определены другие землетрясения, которые произошли в момент прохождения через их очаг сейсмической волны.

Анализ больших данных

Информация о времени, месте, магнитуде и глубине землетрясений взята из каталога USGS PDE [6]. В работе [13] анализу подвергнут 30 летний период времени с 1 января 1975 г. по 31 декабря 2004 г. включительно. Данная выборка содержит 470291 землетрясение с известными магнитудами. Проведенный в работе [13] анализ БД, выявил, что среди них 308485 землетрясений произошло во временном окне один час после предыдущего события, а из них 26431 землетрясений произошло на расстоянии в 1 угловой градус от эпицентра предыдущего события.

Возникает вопрос как можно просто и понятно представить результат анализа БД в графической форме?

ППБ при анализе результата и визуализации больших данных

С одной стороны мы имеем временной ряд из последовательности землетрясений, а с другой стороны все землетрясения происходят в планете Земля и могут быть описаны в сферических координатах с поправкой на геоид.

Переход в другую координатную систему, связанную с распространением сейсмических волн в Земле позволяет структурировать данные для их анализа и визуализации.

В качестве решения данной проблемы в работе [8] было предложено простое решение: координатная система была связана с центром координат самого землетрясения, а по осям отложены время распространения сейсмической волны, угловое расстояние и число событий. Применение данного подхода позволяет сгруппировать данные о сейсмических событиях по их пространственно-временным характеристикам. Данное построение хорошо известно в геометрии и сейсмологии и называется «годографом», однако для пространственно-временного анализа БД было применено в работе [8]. Результат исследования [13] был доложен в Воронеже (2006 г.) на конференции «Активные геологические и геофизические процессы в литосфере. Методы, средства и результаты изучения». На рисунке 1 представлен участок годографа, на котором отображена зависимость числа афтершоков в координатах: угловое расстояние и интервал времени между парными событиями [13]. По горизонтальной оси - время между афтершоками в интервале времени 60 минут. В глубину - угловое расстояние между афтершоками (один градус с шагом в 2 минуты). По вертикальной оси - число афтершоков.

Рис. 1 - Годограф зависимости числа афтершоков в координатах: угловое расстояние и интервал времени между парными событиями. Источник: Сорокин Л.В.

Пространственно-временные связи последовательности афтершоков [13] математический информация познавательный барьер

В работе [13] результат селекции афтершоков (26431 парное событие) визуализирован в более привычной форме годографа (рис. 1), что существенно облегчает восприятие большого массива данных. Данный годограф построен для всех событий, удовлетворивших условию отбора. Практически все события сгруппировались относительно моментов времени вступления сейсмических волн в точках с координатами эпицентров данных афтершоков. Таким образом, в работе [13] осуществлен переход в систему координат связывающую время распространения сейсмических волн с угловым расстоянием между эпицентрами землетрясений очаговой зоны. Половина всех исследованных событий за период в 30 лет, находящихся на расстояниях до одного углового градуса и лежащих во временном окне 60 минут, оказалась в интервале времени ± 30 секунд от расчетного времени прохождения сейсмической волны через эпицентр афтершока, а 25% всех событий - в интервале времени ± 10 секунд.

Из рисунка 1 видно, что в первую минуту после вступления сейсмической волны от основного толчка землетрясения наблюдается рой землетрясений в очаговой зоне. Следующий максимум сейсмической активности в зоне очага землетрясения наблюдается между 8-ой и 9-ой минутами после основного толчка. Таким образом, можно сделать однозначный вывод, что после основного толчка землетрясения и до начала серии афтершоков имеется интервал времени в 7 минут для безопасной эвакуации из зданий.

В последующих исследованиях этот подход был применен в работе [14] для анализа пространственно-временных связи последовательности афтершоков катастрофического землетрясения 26 декабря 2004 в Индонезии.

Обсуждение

Преодоление ППБ при анализе больших данных и их последующей визуализации позволило просто и красиво решить сложную задачу по определению безопасного интервала времени для эвакуации из зданий при землетрясении. Такие приемы как переход в другую координатную систему и выбор наиболее значимых параметров позволяют структурировать данные для их анализа и визуализации. Применение методов анализа БД и их визуализации может быть востребовано при обучении студентов и аспирантов высших учебных заведений.

Список литературы

1. Пилипенко А.И. Феномен психолого-познавательных барьеров в обучении: опыт теоретического исследования. / А.И. Пилипенко. - Курск: КГТУ, - 1995. - 103 с.

2. Белянина И.Н., Богомаз И.В. Познавательные барьеры студентов вуза и педагогические условия их преодоления / И.Н. Белянина // Вестник ТГПУ. - 2014. 2 (143), - C. 114-116.

3. Баранова Н.М., Сорокин Л.В. Компьютерные прикладные программы в формировании стиля мышления будущего специалиста / Н.М. Баранова // Международный научно-исследовательский журнал International research journal, № 11(42), Екатеринбург, - 2015. - С. 60-63. DOI: 10.18454/IRJ.2015.42.202

4. Сорокин Л.В., Баранова Н.М. Применение системы MATLAB для развития методов математического мышления у студентов экономических специальностей / Л.В. Сорокин // Международный научно-исследовательский журнал International research journal, № 11(42), Екатеринбург, - 2015. - С. 99-102. DOI: 10.18454/IRJ.2015.42.093

5. Сорокин Л. В., Баранова Н. М., Преодоление психолого-познавательных барьеров студентов вуза при обучении анализу больших данных / Л.В. Сорокин // Международный научно-исследовательский журнал International research journal, № 12 (54), часть 4, Екатеринбург, - 2016. - С. 86-90. DOI: 10.18454/IRJ.2016.54.066

6. Eiby, G.A. Earthquakes / G.A. Eiby. - London: Heinemann, 1980. - 209 p. ISBN 0 435 35076 4

7. Сорокин Л.В. Динамика инициирования землетрясений сейсмическими волнами / Л.В. Сорокин // Геодинамика и геологические изменения в окружающей среде северных регионов: Материалы Всероссийской конференции с международным участием. В 2 т. Т. II. Архангельск: Институт экологических проблем Севера УрО РАН, 2004, Том 2, - С. 258-261.

8. Сорокин Л. В. Инициирование землетрясений сейсмическими волнами / Л. В. Сорокин // Вестник РУДН: Серия «Физика». 2005. №1(13). - С. 141-148., ISSN:2312-9735, URL: http://elibrary.ru/item.asp?id=11743126 (дата обращения 28.11.2016).

9. Kennett B.L.N. Seismological Tables: AK135. / B.L.N. Kennett. - Research School of Earth Sciences. The Australian National University. Canberra. 2005. - 81 p.

10. Kennett B.L.N. IASPEI 1991 Seismological Tables. / B.L.N. Kennett. - Research School of Earth Sciences Australian National University. Canberra. 1991.

11. Buland. R and C.H. Chapman. The computation of seismic travel times / R. Buland. - Bull. Seism. Sot. Am. - 1983. - v. 73, - P. 1271-1302

12. Сорокин Л.В. Пространственно-временные связи последовательности афтершоков / Л.В. Сорокин // Активные геологические и геофизические процессы в литосфере. Методы, средства и результаты изучения: материалы XII международной конференции 18-23 сентября 2006 года: в 2 т. - Воронеж: Воронежский государственный университет, - 2006. - Том II. -336 с. С. 170-175.

13. Сорокин Л.В. Пространственно-временные связи последовательности афтершоков катастрофического землетрясения 26 декабря 2004 / Л.В. Сорокин // Геофизика XXI столетия: 2006 год. Сборник трудов Восьмых геофизических чтения имений им. В.В. Федынского (2-4 марта 2006 г., Москва). - Тверь: ООО “Издательство ГЕРС”, - 2007. - С. 238-243. ISBN 5-89176-226-9

Аннотация

При обучении студентов и аспирантов высших учебных заведений методам анализа больших данных, возможно появление психолого-познавательных барьеров. Одной из задач их успешного обучения является преодоление психолого-познавательных барьеров, как при анализе больших данных, так и при их последующей визуализации. Использование математических моделей при анализе больших данных позволяет выявить в них скрытые закономерности. Такие приемы как переход в другую координатную систему и выбор наиболее значимых параметров позволяют структурировать большие данные для их анализа и визуализации.

Ключевые слова: преодоление когнитивных затруднений, психолого-познавательные барьеры, преодоление познавательных барьеров, индивидуальные образовательные траектории, большие данные, MATLAB, математическое моделирование, экономический анализ.

Cognitive barriers can be observed during the education of undergraduate and graduate university students' by methods and technologies of big data analysis. One of the aims of successful learning is the cognitive barriers overcoming during the big data analysis and results visualization. With the help of mathematical models it is possible to reveal hidden patterns in big data. Transformation to another coordinate system and the most significant parameters choice can be helpful for big data structuring and for data analysis and visualization.

Keywords: cognitive barriers, cognitive difficulties, cognitive problems, individual education trajectory, big data, MATLAB, mathematical models, economic analysis.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.