Создание онтологической модели предметной области на основе дистрибутивно-семантического подхода

Онтологии как компьютерные ресурсы, содержащие формализованное описание фрагмента знаний о мире. Семантическая структуризация – выстраивание когнитивного моста от способа описания мира человеком к методу представления информации в памяти компьютера.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 11.06.2018
Размер файла 1,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

К одной из главных проблем компьютерной лингвистики относят семантический анализ больших электронных коллекций. Для определения тематической структуры у каждого документа используется тематическое моделирование. Данный способ определяет, к каким темам относится каждый из документов, основанный на переходе от терминов к найденным тематикам. Это выполняется при помощи параллельных или распределенных алгоритмов для разрешения проблем синонимии и полисемии терминов, а также для эффективного решения следующих задач:

· тематического поиска;

· классификации;

· суммаризации и аннотации коллекций документов.

В ходе выполнения выпускной квалификационной работы были выполнены следующие задачи:

· проведен отбор ключевых терминов, которые задают предметную область «Компьютерная графика, визуализация и виртуальная реальность»;

· осуществлен семантический поиск по заданным ключевым словам;

· создан корпус ПО на основе данных из Интернета;

· сформирован список наиболее значимых понятий ПО из ключевых терминов и значимых словосочетаний;

· построена онтология ПО.

Построенная в данной работе онтология, дополняет структуру поиска в корпусе предметной области. Данная онтологическая модель является словарем естественного, или общего языка, понятного всем участвующим в обмене. Внутри себя каждая система (источник, приемник) может хранить информацию в любом естественном для нее представлении. Экспортируя эту информацию наружу - система должна представить ее в обобщенном виде, для чего используется «словарь», представляющий собой элементы общепринятой информационной модели.

Список литературы

1. Bacon E., Hagel G., Charnine M., Foggie R., Kirk B., Schagaev I., Kravtsov G. WEDUCA: Web-enhanced design of university curricula // Proceedings of the FECS'13: The International Conference on Frontiers in Education: Computer Science and Computer Engineering, July 22-25, 2013, Las Vegas, Nevada, USA, CSREA Press, 2013. P. 288-294.

2. Banko, M., and Brill, E. (2001) `Scaling to very very large corpora for natural language disambiguation', Proceedings of ACL-01.

3. Baroni, M., and Bernardini, S. (2004) `BootCaT: Boot strapping corpora and terms from the web', Proceedings of the Fourth Language Resources and Evaluation Conference.

4. Baumgartner R. Datalog-Related Aspects in Lixto Visual Developer // Datalog Reloaded. Lecture Notes in Computer Science. 2011. Vol. 6702. P. 145-160.

5. Berjon R., Faulkner S., Leithead T., Navara E. D., O'Connor E., Pfeiffer S., Hickson I.HTML5: A Vocabulary and Associated APIs for HTML and XHTML // W3C Candidate Recommendation. 2013.

6. Charnine M.M., Kuznetsov I.P., Kozerenko E.B. Semantic Navigator for Internet Search.// Proceeding of International Conference on Machine Learning, 27- 30, 2005 Las Vegas, USA, CSREA Press, pp 60-65, 2005.

7. Church K., Hanks P. Word association norms, mutual information, and lexicography // Computational Linguistics, 1996. Vol. 16. No. 1. P. 22-29

8. Clark, A., Cussens, J., Sakas, W., Xantho, A. (eds.)(2005) Proceedings of the Workshop on Psycho computational Models of Human Language Acquisition of ACL 05.New Brunswick: ACL.

9. Clarke, C., Cormack, G., Laszlo, M., Lynam, T., and Terra, E. (2002) `The impact of corpus size on question answering performance.' Proceedings of the 25th ACM SIGIR Conference on Research and Development in Information Retrieval.

10. D. Blei, A. Ng and M. Jordan. Latent Dirichlet Allocation. Journal of Machine Learning Research, No 3, pp. 993-1022, 2003.

11. D. Blei and J. Griffiths, V. Jordan and J. Tenenbaum Hierarchical topic models and the nested Chinese restaurant process. Neural Information Processing Systems 16, 2003.

12. Dunning T. Accurate methods for the statistics of surprise and coincidence // Computational Linguistics, 1993.Vol. 19. No. 1. P. 61-74.

13. Elisabeth Bacon, George Hagel, Michael Charnine, Richard Foggie, Brian Kirk, Igor Schagaev, and George Kravtsov. WEDUCA: Web-enhanced design of university curricula. // Proceedings of the FECS'13: The International Conference on Frontiers in Education: Computer Science and Computer Engineering. July 22-25, 2013. Las Vegas, Nevada, USA. CSREA Press. C. 288-294.

14. Emerson, T., O'Neil, J. (2006) `Experience building a large corpus for Chinese lexicon construction.' In [6].

15. Fletcher, B. (2004) `Making the Web more useful as a source for linguistic corpora'. In Corpus Linguistics in North America 2002, U. Connor and T. Upton (eds.) Amsterdam: Rodopi.

16. G. Salton. Automatic text processing: the transformation, analysis, and retrieval of information by computer. Addison-Wesley, 1989.

17. Galina, M. Charnine, N. Somin, V. Nikolaev, Yu. Morozova, O. Zolotarev, “Metod for generating subject area associative portraits: different examples”, Proceedings of the 2015 International Conference on Artificial Intelligence (ICAI 2015), WORLDCOMP'15, July 27-30, 2015, Las Vegas Nevada, USA, v.I, pp.288-294,ISBN: 1-60132-405-7, 1-60132-406-5 (1-60132-407-3).

18. Ghani, R., Jones, R., Mladenic, D. (2001) `Using the Web to create minority language corpora'. Proceedings of the 10th International Conference on Information and Knowledge Management.

19. Jiao H. Chinese Keyword Extraction Based on N-Gram and Word Co- occurrence. Proceeding CISW '07 Proceedings of the 2007 International Conference on Computational Intelligence and Security Workshops. Harbin, 2007. pp. 152-155., 34; Sarkar, K. An N-Gram Based Method for Bengali Key phrase Extraction / K. Sarkar // Information Systems for Indian Languages. Springer Berlin Heidelberg, 2011, pp. 36-41.

20. Jones K.S. A Statistical Interpretation of Term Specificity and its Application in Retrieval. Journal of Documentation. 2004, vol. 60, no. 5, pp. 493- 502, Salton G.A Vector Space Model for Automatic Indexing. Communications of the ACM. 1975,vol. 18, no. 11, pp. 613-620.]

21. K. Stevens, P. Kegelmeyer, D. Andrzejewski, D.Buttler. Exploring Topic Coherence over many models and many topics. In the Proceedings of EMNLP- CoNLL, pp. 952-961, 2012.

22. Lenci A. Distributional semantics in linguistic and cognitive research. // Rivista di Linguistica, 2008. Vol. 1. Р. 1-30; Charnine M., Charnine V. Keywen category structure. // Wordclay, USA, 2008. 60 p.

23. Luhn H.P. A Statistical Approach to Mechanized Encoding and Searching of Literary Information. IBM Journal of Research and Development. 1957, vol. 1, no. 4, pp. 309-317.

24. M. Charnine, A. Petrov, I. Kuznezov. Association-Based Identification of Internet User Interests. // Proceedings of the 2013 International Conference on Artificial Intelligence (ICAI 2013). V. I. WORLDCOMP'13. July 22-25, 2013. Las Vegas Nevada. USA. CSREA Press. C. 77-81.

25. M. Charnine, N. Somin, S. Klimenko, V. Ezhela, "Linguistic Approach to Scientometrics", Proceedings of the 2015 International Conference on Artificial Intelligence (ICAI 2015), WORLDCOMP'15, July 27-30, 2015, Las Vegas, Nevada, USA, v.II, pp.812-817,ISBN: 1-60132-405-7, 1-60132-406-5 (1-60132-407-3).

26. M. Charnine, N. Somin, V. Nikolaev. "Conceptual Text Generation Based on Key Phrases"//Proceedings of the 2014 International Conference on Artificial Intelligence (ICAI 2014), vol. I, WORLDCOMP'14, July 21-24, 2014. Las Vegas Nevada, USA. CSREA Press, pp.639-643.

27. M. Charnine, V. Protasov. Optimal Automated Method for Collaborative Development of Universiry Curricula. // Proceedings of the 2013 International Conference on Artificial Intelligence (ICAI 2013). V. I. WORLDCOMP'13. July 22- 25, 2013. Las Vegas Nevada. USA. CSREA Press. C. 96-100.

28. M. M. Charnine, I. P. Kuznetsov, E. B. Kozerenko,. Technological peculiarity of knowledge extraction for logical-analytical systems. WORLDCOMP'12 July 16-19, 2012. Las Vegas, USA.// CSREA Press, pp. 49-55, 2012.

29. M. M. Charnine, et al. Intelligent Tools for the Semantic Internet Navigator Design. // Труды конф. RCDL. Переяславль-Залесский. 2012. C. 274- 283.

30. M. Charnine, S. Klimenko, "Measuring of “Idea-based” Influence of Scientific Papers "Proceedings of the 2015 International Conference on Information Science and Security (ICISS 2015), December 14-16, 2015, Seoul, South Korea, pp.160-164.

31. Mair, Ch. (2003) `Tracking ongoing grammatical change and recent diversification in present-day standard English: the complementary role of small and large corpora', paper presented at the Annual ICAME Conference.

32. Manning C., Raghavan P., Sch.utze H. Introduction to information retrieval. Cambridge: Cambridge University Press, 2008]. Baroni и Lenci [Baroni M., Lenci A. Distributional memory: A general framework for corpus-based semantics. Comput. Linguistics, 2010. Vol. 36. Iss. 4. P. 673-721.

33. Manning, Ch., and Sch Ё utze, H. (1999) Foundations of Statistical Natural Language Processing. Cambridge MA:MIT Press.

34. Marathe M., Patil S. H., Garje G. V., Bewoor M. S. Extracting Content Blocks from Web Pages // International Journal of Recent Trends in Engineering, 2009. Vol. 2. No. 4. P. 62-64.

35. McEnery, T., and Wilson, A. (2001) Corpus Linguistics, 2nd edition. Edinburgh: Edinburgh University Press.

36. Meng W., Yu C., Liu K. L. Building Efficient and Effective Metasearch Engines // ACM Computing Surveys (CSUR). 2002. Vol. 34. No. 1. P. 48-89.

37. Michael Charnine, “Keywen Automated Writing Tools”, Booktango, USA, 2013, ISBN 978-1-46892-205-9.

38. Michael Charnine, Vladimir Charnine. Keywen Category Structure.// Wordclay, USA, 2008, pp.1-60 (монография).

39. O. Zolotarev, M. Charnine, A. Matskevich, K. Kuznetsov, “Business Intelligence Processing on the Base of Unstructured Information Analysis from Different Sources Including Mass Media and Internet”, Proceedings of the 2015 International Conference on Artificial Intelligence (ICAI 2015), WORLDCOMP'15, July 27-30, 2015, Las Vegas Nevada, USA, v.I, pp.295-299,ISBN: 1-60132-405-7, 1- 60132-406-5 (1-60132-407-3).

40. O. Zolotarev, M. Charnine, A. Matskevich. "Conceptual Business Process Structuring by Extracting Knowledge from Natural Language Texts"//Proceedings of the 2014 International Conference on Artificial Intelligence (ICAI 2014), vol.I, WORLDCOMP'14, July 21-24, 2014. Las Vegas Nevada, USA. CSREA Press, pp.82-87.

41. Osgood C., Suci G., Tannenbaum P. The measurement of meaning. -- University of Illinois Press, 1957.

42. Porter M.F. An Algorithm for Suffix Stripping. Readings in Information Retrieval. Morgan Kaufmann Publishers Inc., 1997, pp. 313-316.

43. Q. He, K. Chang, E. Lim, A. Banerjee. Keep It Smile with Time: A Reexamination of Probabilistic Topic Detection Models. In the Proceedings of IEEE Transactions Pattern Analysis and Machine Intelligence. Volume 32, Issue 10, pp. 1795-1808, 2010

44. Rapp, Reinhard. Word sense discovery based on sense descriptor dissimilarity. Proceedings of the 9th MT Summit, New Orleans, LA. 2003, pp. 315- 322

45. Sahlgren M. The Word-Space Model: Using distributional analysis to represent syntagmatic and paradigmatic relations between words in high-dimensional vector spaces (Ph.D. Thesis). -- Department of Linguistics, Stockholm University, 2006.

46. Sahlgren M. Towards pertinent evaluation methodologies for word-space models // LREC 2006: 5th Conference (International) on Language Resources and Evaluation Proceedings. // Genoa, Italy, 2006

47. Sahlgren M. The Distributional Hypothesis. From context to meaning (англ.) // Distributional models of the lexicon in linguistics and cognitive science (Special issue of the Italian Journal of Linguistics), Rivista di Linguistica : журнал. -- 2008. -- Vol. 20, no. 1. -- P. 33-53.

48. Sahlgren M., Karlgren J. Automatic Bilingual Lexicon Acquisition Using Random Indexing of Parallel Corpora (англ.) // Journal of Natural Language Engineering, Special Issue on Parallel Texts : журнал. -- 2005. -- Vol. 11, fasc. 3.

49. Sahlgren M. The Word-Space Model: Using distributional analysis to represent syntagmatic and paradigmatic relations between words in high-dimensional vector spaces. Ph.D. Thesis. // Department of Linguistics, Stockholm University, 2006

50. Sharoff, S. (2006) `Creating general-purpose corpora using automated search engine queries', in [6].

51. Sinclair, J. (2003) `Corpora for lexicography', in A practical guide to lexicography, P. Van Sterkenberg (ed.) Amsterdam: John Benjamins.

52. Storrer, A., and BeiЯwenger, M. (to appear) `Corpora of computer- mediated communication', in Corpus linguistics: An international handbook, A. L Ё udeling and M. Kyt Ё o(eds.). Berlin: Mouton de Gruyter.

53. The SMART retrieval system: Experiments in automatic document processing. / Ed. G.M. Salton. // Prentice-Hall, 1971

54. Thelwall, M. (2005) Creating and using Web corpora. International Journal of Corpus Linguistics 10(4), 517-541.

55. Turney P. D., Pantel P. From frequency to meaning: Vector space models of semantics. // Journal of Artificial Intelligence Research (JAIR), 2010, №37. P. 141-188

56. Turney, P. (2001) `Mining the Web for synonyms: PMIIR versus LSA on TOEFL'. Proceedings of ECML 2001,491-502.

57. Turney, Peter. A uniform approach to analogies, synonyms, antonyms and associations. Proceedings of COLING, Manchester, 2008, pp. 905-912

58. Ueyama, M. (2006) `Creation of general-purpose Japanese Web corpora with different search engine query strategies', in [6].

59. V. Protasov, M. Charnine, E. Melnikov. "The Crowdsourcing Linguistic Technology for Experts Assessment"//Proceedings of the 2014 International Conference on Artificial Intelligence (ICAI 2014), vol.I, WORLDCOMP'14, July 21- 24, 2014. Las Vegas Nevada, USA. CSREA Press, pp.656-661.

60. V.V. Ezhela, S.V. Klimenko, A.N. Raikov, M.M. Sharnin,"A semantic approach to the evaluation of the quality of academic publications", Automatic Documentation and Mathematical Linguistics 07/2015, 49(4), pp.117-121, DOI: 10.3103/S0005105515040020.

61. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учеб. пособие /Е.И. Большакова, Э.С. Клышински, Д.В. Ландэ [и др.]. - М.: МИЭМ, 2011. - 272 с.

62. Агеев М. С., Вершинников И. В., Добров Б. В. Извлечение значимой информации из web-страниц для задач информационного поиска// Интернет-математика2005. Автоматическая обработка веб-данных. М., 2005. С. 283-301.

63. Алексеев П.М., Герман-Прозорова Л.П., Пиотровский Р.Г., Шепетова О.П. Основы статистической оптимизации преподавания иностранных языков. Статистика речи и автоматический анализ текста. Л., 1974. С. 195-234. [Alekseev P.M., German-Prozorova L.P., Piotrovskii R.G., Shepetova O.P. Osnovy statisticheskoy optimizatsii prepodavaniya inostrannykh yazykov (Basics of the Statistical Optimization of Foreign Languages Teaching). Statistika rechi i avtomaticheskiy analiz teksta (Statistics of Speech and Automatic Analysis of the Text). Leningrad, 1974,pp. 195-234.], Salton G. On the Specification of Term Values in Automatic Indexing. Journal of Documentation. 1973, vol. 29, no. 4, pp. 351-372.

64. Астраханцев, Н.А. Автоматическое извлечение терминов из коллекции текстов предметной области с помощью Википедии //Труды Института системного программирования РАН. - 2014. - Т. 26, № 4. - С. 7-20

65. Баканова, Н.Б. Исследование ключевых слов как инструмент оптимизации управления электронными документами / Н.Б. Баканова, И.В. Усманова //Современные проблемы науки и образования: электрон . науч. журн. - 2014. - № 2.

66. Борисов Т. Н., Клименко С. В., Рыков В. В., Хламов М. А., Шарнин М. М. Построение онтологий для обеспечения информационной поддержки лиц, принимающих решения по проблеме распространения отравляющих веществ из контейнеров и корпусов боеприпасов подводного захоронения // Ситуационные центры и информационно-аналитические системы класса 4i для задач мониторинга и безопасности (SC-IAS4i-VRTerro2013): Труды II Международной научной конференции (Протвино, 25-29 ноября 2013). - Протвино: ИФТИ, 2013. С. 255-261. (В библиографии 2013 года не отражена.)

67. Борисов Т.Н., Бронецкий А.Е., Клименко С.В., Рыков В.В., Шарнин М.М. Автономные необитаемые подводные аппараты: автоматическое формирование ассоциативного портрета предметной области // Сборник трудов Международной конференции «Ситуационные центры и информационно-аналитические системы класса 4i для задач мониторинга и безопасности» SCVRT2013-14, Протвино, Парк Дракино, 25--28 ноября 2013-2014 гг. Изд. ИФТИ, Москва-Протвино, 2013-2014, ISBN 978-5-88835-027-0, С.38-43

68. Браславский, П.И. Сравнение пяти методов извлечения терминов произвольной длины /П.И. Браславский, Е.А. Соколов //Компьютерная лингвистика и интеллектуальные технологии : по атериалам ежегод. Междунар. конф. «Диалог`2008». Вып. 7(14). -Москва: Изд-во РГГУ, 2008. - С. 67-74.

69. В.В. Ежела, С.В. Клименко, А.Н. Райков, М.М. Шарнин, "Семантический подход к оценке качества научных публикаций", Научно-техническая информация (НТИ), Сер.2, Информационные процессы и системы, 2015, № 7, С.13-18, ISSN 0548-0027.

70. Воронцов К.В. Лекции по тематическому моделированию, 2013.

71. Гринева М., Гринев М. Анализ текстовых документов для извлечения тематически сгруппированных ключевых терминов, 2009.

72. Гринева, М. Анализ текстовых документов для извлечения тематически сгруппированных ключевых терминов /М. Гринева, М. Гринев //Труды Института системного программирования РАН. Т.16. - 2009. - С. 155- 165.

73. Добров Б.В., Лукашевич Н.В. Тезаурус РуТез как ресурс для решения задач информационного поиска, 2009.

74. Захаров, В.П. Автоматическое выявление терминологических словосочетаний /В.П. Захаров, М.В. Хохлова //Структурная и прикладная лингвистика. Вып.10. - Санкт-Петербург: Изд-во С.-Петерб. ун-та, 2014. - С. 182-200.

75. Захаров, В.П. Анализ эффективности статистических методов выявления коллокаций в текстах на русском языке /В.П. Захаров, М.В. Хохлова//Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. Междунар. конф. «Диалог`2010». Вып. 9(16). - Москва: Изд-во РГГУ, 2010. - С. 137-143.

76. Камшилова, О.Н. Малые формы научного текста: ключевые слова и аннотация (информационный аспект) //Известия Российского государственного педагогического университета им. А.И. Герцена. - 2013. - № 156. - С. 106- 117.10.

77. Клышинский Э. С., Кочеткова Н. А., Логачева В. К. Метод кластеризации слов с использованием информации об их синтаксической связности (рус.) // Научно-техническая информация. Серия 2: Информационные процессы и системы : журнал. -- 2013. -- № 11. -- С. 36-43.

78. Кретов А.А. Маркемы и ключевые слова в научных текстах// Мир лингвистики и коммуникации: электрон.научн.журн.-2012-.-Т.1, №27.-С.1-13

79. Кретов, А.А. Маркемы и ключевые слова в научных текстах //Мир лингвистики и коммуникации: электрон. науч. журн. - 2012. - Т. 1, № 27. - С. 1-13.

80. Кудрявцев К.Я. Спектральный метод поиска ключевых слов в полнотекстовых БД//Информационные технологии.-2010.-Т.1, №4.-С.2-8

81. Кудрявцев, К.Я. Спектральный метод поиска ключевых слов в полнотекстовых базах данных //Информационные технологии. - 2010. - N 4. - С. 2-8.

82. Кузнецов Р. Ф. Извлечение значимой информации изweb-страниц с использованием предложений// RCDL'2006: Сб. тез. постерных докл. VIII Всерос. конф. СПб.: НУ ЦСИ, 2006. 274 с.

83. Лукашевич, Н.В. Комбинирование признаков для автоматического извлечения терминов /Н.В. Лукашевич, Ю.М. Логачев //Вычислительные методы и программирование. Т.11. -2010. - С. 108-116.

84. М. М. Шарнин, Н. В. Сомин, И. П. Кузнецов, Ю. И. Морозова, И. В. Галина, Е. Б. Козеренко. Статистические механизмы формирования ассоциативных портретов предметных областей на основе естественно- языковых текстов больших объемов для систем извлечения знаний. // Информатика и её применения. 2013. Т.7. №2. Стр.92-99.

85. М.М. Шарнин, О.В. Золотарев, Н.В. Сомин "Извлечение и обработка знаний из неструктурированных текстов деловой сферы и социальных сетей"//4-я международная научно-практическая конференция "Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты", Москва, МГУ, 22-24 октября.

86. Малинина, Ю.В. Автоматическое выявление таксономии в области преобразований программ на основе анализа семантических связей в публикациях //Конструирование и оптимизация параллельных программ. - С. 156-163

87. Маннинг, К.Д. Введение в информационный поиск: пер. с англ. /К.Д. Маннинг, П. Рагхаван. - М. [и др.]: Вильямс, 2011.

88. Морозова Ю. И., Козеренко Е. Б., Будзко В. И., Кузнецов К. И., Шарнин М. М. Семантическая структуризация текстовых знаний для систем аналитического мониторинга больших объемов информации в социальной сфере // Журнал: «Системы высокой доступности», 2014. Т. 10. № 3. С. 21-35.

89. Морозова Ю. И., Козеренко Е. Б., Шарнин М. М. Методика извлечения пословных переводных соответствий из параллельных текстов с применением моделей дистрибутивной семантики (рус.) // Системы и средства информатики: журнал. -- 2014. -- Т. 24, вып. 1.

90. О.В. Золотарев, М.М. Шарнин "Методы извлечения знаний из текстов естественного языка и построение моделей бизнес-процессов на основе выделения процессов, объектов, их связей и характеристик"//Труды IXX международной конференции CPT'2014, Ларнака, Кипр, 11-18 мая 2014, Издательство Института физико-технической информатики (ИФТИ).

91. Пекар В.И. Дистрибутивная модель сочетаемостных ограничений глаголов (рус.) // Труды международного семинара Диалог 2004 по компьютерной лингвистике: конференция. -- 2004.

92. Пиотровский Р.Г., Бектаев К.Б., Пиотровская А.А. Математическая лингвистика: учеб. пособие для пед. институтов. М.: Высшая школа, 1977. 383 с. [Piotrovskiy R.G.., Bektaev K.B., Piotrovskaya A.A. Matematicheskaya lingvistika. (Mathematical Linguistics). Moscow, Vysshaya shkola, 1977, 383 p.

93. Протасов В. И., Шарнин М. М., Мельников И. Е. “Применение технологии самоуправляемого краудсорсинга для сертификации экспертов” // Ситуационные центры и информационно-аналитические системы класса 4i для задач мониторинга и безопасности (SC-IAS4i-VRTerro2013): Труды II Международной научной конференции (Протвино, 25-29 ноября 2013). - Протвино: ИФТИ, 2013. С. 262-266.

94. Рубцова, Ю.В. Методы автоматического извлечения терминов в динамически обновляемых коллекциях для построения словаря эмоциональной лексики на основе микроблоговой платформы Twitter //Доклады ТУСУРа. - Томск, 2014. - № 3(33). - С. 140-144.

95. Терминологический анализ текста на основе лексико-синтаксических шаблонов / Н.Э. Ефремова, Е.И. Большакова, А.А. Носков, В.Ю. Антонов //Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. Междунар. конф. «Диалог`2010». Вып. 9(16). - Москва: Изд-во РГГУ, 2010. - С. 124-129.

96. Хохлова, М.В. Экспериментальная проверка методов выделения коллокаций // Инструментарий русистики: корпусные подходы. - Хельсинки, 2008. - С. 343-356.

97. Шарнин М. М., Петров А.В., Кузнецов И.П. “Методика учёта интересов пользователя при работе в сети Internet на основе его профиля и ассоциативных связей”// Труды XV Всероссийской научной конференции RСDL'2013 «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». Ярославль, 14-17 октября 2013. Ярославский государственный университет им. П.Г. Демидова (ЯрГУ), 2013. C. 86-90.

98. Шарнин М. М., Родина И. В. Механизмы формирования лингво- статистического портрета предметной области мониторинга общественного мнения для технологии обработки «Больших данных» // Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты (ISC-14): Материалы III Международной научно-практической конференции (Москва, 18-19 сентября 2014): Сборник статей и тезисов. - М.: МГГУ им. М.А. Шолохова, 2014. С. 66-70.

99. Шарнин М.М., Кузнецов И.П. Автоматическое формирование электронных энциклопедий и справочных пособий по информации из сети "Интернет". //Системы и средства информатики. Вып.14, ИПИ РАН, 2004 г., с. 210-223.

100. Шарнин М.М., Кузнецов И.П. Особенности семантического поиска информационных объектов на основе технологии баз знаний. // «Информатика и ее применения» т.6, Вып. 2. 2012, стр. 47-56.2012.

101. Шарнин М.М., Мацкевич А.Г., Кузнецов И.П. Технология извлечения структур знаний с использованием аппарата расширенных семантических сетей. // Журнал «Искусственный интеллект», НАН Украины, 2012. Том 4.

102. Шарнин М.М., Протасов Владислав Иванович Оптимальный автоматизированный метод коллективной разработки учебных программ ВУЗов//Труды XVIII международной конференции «Технологии будущего для человечества» (CPT'2013), Ларнака, Кипр, 12-19 мая 2013 //с.312- 314//Издательство Института физико-технической информатики (ИФТИ).

103. Шарнин М.М., Рыков Владимир Васильевич, Клименко Станислав Владимирович Автономные необитаемые подводные аппараты: автоматическое формирование ассоциативного портрета предметной области//Труды Международной научной конференции MEDIAS.//Изд-во Института физико- технической информатики (ИФТИ).

104. Шарнин М.М., Сомин Н.В., Галина И.В., Родина И.В., Николаев В.Г.Осмысленные генеранты: метод порождения текстов повышенной информативности из релевантных фраз. // Труды XIX международной конференции CPT2014. Ларнака, Кипр. 12-18 мая 2014. //Изд-во Института физико-технической информатики (ИФТИ), 2015. С. 87- 91.

105. Шарнин М.М., Шагаев И., Протасов В.И., Родина И.В., Золотарев О.В., Попова О.А., "Использование веб-семантики для совершенствования образовательных программ вузов", Вестник МГГУ им. М.А. Шолохова, Филологические науки, 2015, № 2, с.97-112.

106. Шереметьева, С.О. Методы и модели автоматического извлечения ключевых слов / С.О. Шереметьева, П.Г. Осминин //Вестник Южно-Уральского государственного ун-та. -2015. - № 1, т.12. - С. 76-81.

107. Ягунова Е.В., Пивоварова Л.М. Природа коллокаций в русском языке. Опыт автоматического извлечения и классификации на материале новостных текстов, 2010.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.