Автоматическое определение пропущенных реагентов и продуктов в уравнениях химических реакций

Неуравновешенность в уравнениях химических реакций, которая приводит к тому, что некоторые реакции не могут быть найдены в ходе структурных поисков. Решение проблемы автоматического определения пропущенных реагентов, конденсированный граф реакции.

Рубрика Химия
Вид статья
Язык русский
Дата добавления 12.03.2021
Размер файла 170,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Казанский (Приволжский) федеральный университет

Университет Страсбурга

Автоматическое определение пропущенных реагентов и продуктов в уравнениях химических реакций

Р.И. Нугманов, Т.И. Маджидов, И.С. Антипин, А.А. Варнек

Аннотация

Одной из проблем при работе с базами данных по химическим реакциям является то, что в них большинство реакций является стехиометрически неуравновешенным, то есть в них отсутствует информация об одном или нескольких реагентах либо продуктах. Неуравновешенность приводит к тому, что некоторые реакции не могут быть найдены в ходе структурных поисков. Было предложено решение этой проблемы, основанное на использовании подхода конденсированного графа реакции. Конденсированный граф реакции является сжатым представлением реакционного превращения, в котором переходящие друг в друга атомы реагента и продукта совмещены. В результате в полученном псевдомолекулярном графе идентифицируются обычные химические связи, а также так называемые динамические связи, соответствующие изменению порядка связи. Ключевое наблюдение, использованное в этом сообщении, заключается в том, что хотя конденсированный граф содержит всю известную структурную информацию о химической реакции, он может быть построен и для незаполненной химической реакции. В ходе обратного преобразования конденсированного графа в химическую реакцию восстанавливается информация о пропущенных реагентах и продуктах. Имеются некоторые ограничения этого подхода, связанные с тем, что предложенным способом не может быть восстановлена информация о пропущенных коэффициентах в реакции. Для решения такой проблемы предложен алгоритм, основанный на использовании изоморфного вложения. Такой алгоритм обнаруживает схожие мотивы в конденсированном графе и при необходимости добавляет коэффициент перед реагентом и/или продуктом либо копирует их в уравнении реакции необходимое количество раз.

Ключевые слова: хемоинформатика, химические реакции, стехиометрическая балансировка реакций, конденсированный граф реакции

An Approach for Automated Detection of Missing Reagents and Products in Chemical Reaction Equations

R.I. Nugmanov, T.I. Madzhidov, I.S. Antipin, A.A. Varnek

Abstract

One of the problems of chemical reactions databases management is the fact that most reactions in them are stoichiometrically unbalanced, i.e., they lack information about one or more reagents or products. It leads to the problem that some reactions cannot be found in structural searches. A solution of the problem based on the use of the Condensed Graph of Reaction (CGR) approach has been suggested. The CGR is a compressed representation of the reaction transformation in which the atoms of the reagent and the product are aligned. As a result, so-called dynamic bonds corresponding to changes in the bond order during the chemical transformation are identified in the pseudomolecular graph along with the usual chemical bonds. The key observation is that the Condensed Graph, on the one hand, contains all required structural information on chemical reaction and, on the other hand, can be constructed for an unbalanced chemical reaction with missing reagents or products. During the inverse transformation of the Condensed Graph into a chemical reaction, the information on the missing reagents and products can be restored. There are some limitations to this approach, because information about coefficients missing in the reaction cannot be retrieved by the proposed method. To solve such problems, an algorithm based on the use of isomorphic embedding has been developed. This algorithm reveals similar motifs in the Condensed Graph and, if necessary, adds a coefficient before the reagent and/or product, or copies them the required number of times in the reaction equation.

Keywords: chemoinformatics, chemical reactions, stoichiometric reaction balancing, Condensed Graph of Reaction

Введение

В современном мире поиск информации является неотъемлемой частью эффективной работы во многих сферах деятельности и, в особенности, в науке и наукоемком производстве (химической, фармацевтической промышленности). Поиск информации в базах данных соединений и реакций стал для химиков частью рутинной работы.

Качество введенной в базу данных информации и ее полнота являются ключевыми факторами, определяющими, насколько эффективно проводится поиск, насколько часто в ходе поиска появляются ошибочные результаты и насколько результаты поиска будут полезными. Если проблемы работы с базами данных химических структур, как правило, связаны с особенностями химических объектов: таутомеризацией [1], проблемами стандартизации представления структур молекул или просто ошибками ввода [2], то для баз данных химических реакций добавляются проблемы неполноты. В настоящее время в доступных коммерческих базах данных химических реакций (таких, как Reaxys [3], поисковая система SciFinder [4]) подавляющее большинство реакций (90-95%) хранится в стехиометрически неуравновешенном виде, то есть некоторые реагенты или продукты в них упущены и приведены только ключевые компоненты [5]. Информация о растворителях и реагентах зачастую бывает приведена либо в специальных текстовых полях, либо в общем описании синтеза. Если какая -то структура оказывается пропущенной в уравнении реакции, то она не может быть найдена в ходе структурного поиска (рис. 1), что приводит к тому, что информация о реакции оказывается недоступной. Идентификация пропущенных в реакционном уравнении структур является достаточно сложной, а иногда и невозможной. До настоящего времени была опубликована только одна работа [6], в которой был описан весьма сложный алгоритм поиска пропущенных реагентов.

Мы предлагаем простой и эффективный способ для поиска структур пропущенных реагентов в химических реакциях. Предлагаемая технология основана на подходе конденсированного графа реакции (КГР) [7, 8]. Получаемые в результате такой обработки стехиометрически уравновешенные реакции, помимо задач хранения и поиска, можно использовать при классификации реакций по типам [9] и установлении количественных соотношений между характеристиками реакций и структурами соединений [10-12]. При этом обращается внимание на то, что в некоторых особо сложных случаях структура реагента не может быть установлена в принципе, поскольку отсутствует необходимая для этого информация. Примером может быть реакция, приведенная на рис. 1, а. Поскольку в ней пропущена информация о продукте и реагенте одновременно, на основании приведенного реакционного уравнения невозможно установить, является ли эта реакция гидролизом, сольволизом или переэтерификацией, и, соответственно, невозможно заполнить информацию о пропущенных реагентах и продуктах без дополнительных сведений.

Рис. 1. Пример незаполненной (а) и заполненной (б) реакции. Если пользователя интересуют реакции, в которые вовлечены молекулы Q, то незаполненная реакция (а) не будет приведена в результатах, тогда как заполненная (б) будет

Экспериментальные результаты и их обсуждение

КГР представляет собой визуализацию структурной информации, закодированной в реакционном уравнении, в виде одного псевдомолекулярного графа, в котором вершинами являются атомы, а ребрами, соединяющими атомы, - либо обычные химические связи (одинарные, двойные и т. п.), либо так называемые динамические связи, обозначающие разрыв, образование или изменение порядка связи (рис. 2). КГР (рис. 2, б) может быть получен из реакции (рис. 2, а) наложением соответствующих друг другу атомов и идентификацией изменившихся в реакции связей после установления соответствия между атомами реагентов и продуктов (атом-атомного отображения). Существует взаимная однозначность между структурным представлением реакции и ее КГР, то есть можно осуществлять конвертацию одного превращения в другое без потери информации.

Рис. 2. Химическая реакция (а) и ее конденсированный граф (б). Номера рядом с атомами соответствуют атом-атомному отображению. В КГР зачеркнутая связь означает разорванную одинарную, кружком помечена образованная одинарная С-О-связь. Превращение КГР в реакцию (в) позволяет идентифицировать пропущенные реагенты и продукты

Ключевым наблюдением, полезным для поиска пропущенных реагентов, является то, что КГР может быть построен даже для незаполненной химической реакции. Обратное преобразование графа в реакцию позволяет идентифицировать пропущенные реагенты и продукты (см. рис. 2, в). Полученная реакция будет сбалансированной по атомам. В этом и заключается суть предлагаемого нами подхода восстановления информации о пропущенном реагенте или продукте.

Рис. 3. а) Несбалансированная по коэффициентам и продуктам химическая реакция (а1), ее конденсированный граф (а2) и конечная сбалансированная реакция (а3). В КГР выделены общие фрагменты и показан процесс копирования утерянной информации об уходящей группе. 6) Несбалансированная реакция (61), некорректно сбалансированная (62) и восстановленная (63) на основе эмпирического правила (64), вносящего информацию о пропущенных реагентах и ряде продуктов

реагент уравнение химическая реакция

Однако у предложенного подхода есть некоторые ограничения, приводящие в некоторых случаях к ошибкам в структурах реагентов и продуктов: зачастую в реакции участвует несколько реагентов одного типа, но коэффициенты в реакции не указаны (рис. 3, а). В этом случае предложенный алгоритм не способен полностью уравновесить реакцию. Для балансировки коэффициентов реакции был реализован алгоритм, который с помощью подструктурного поиска идентифицирует, сколько раз в КГР повторяется один и тот же фрагмент (выделен пунктирной линией на рис. 3, а), и дублирует соответствующие реагенты и продукты требуемое число раз. Вторую проблему для предложенного подхода представляют изменения в формальных зарядах и степенях окисления атомов в реагентах и продуктах (см. рис. 3, 6). В результате, в некоторых случаях (реакциях окисления-восстановления) структура реагента или продукта устанавливается некорректно. Для этого нами был создан основанный на эмпирических правилах алгоритм, который применяет предложенные правила для трансформации КГР в полностью сбалансированную реакцию с корректными структурами реагентов и продуктов. Принцип работы алгоритма заключается в изменении частей КГР, удовлетворяющих определенному правилу, в соответствии с заранее определенным шаблоном (рис. 3, 64). С помощью изоморфного вложения левой части шаблона идентифицируется часть КГР, требующая модификации, после применения правила создается скорректированный КГР, конвертация которого обратно в реакцию приводит к корректно стехиометрически уравновешенной реакции (рис. 3, 63). Набор правил замены создавался вручную и включал в себя пять самых распространенных типов реакций: гидролиза некоторых групп и этерификации. Для расширения применимости подхода возможно добавление новых правил. Эти технологии легли в основу разработанного нами алгоритма для стехиометрического уравновешивания реакций CGRBalancer.

Заключение

С использованием технологии конденсированного графа реакции был реализован достаточно простой и эффективный алгоритм, способный идентифицировать структуры пропущенных реагентов и продуктов в химических реакциях. Процесс поиска занимает доли секунд на одну реакцию, не требует анализа механизма реакции и возвращает реалистичные стехиометрически уравновешенные реакции, если в исходной реакции не было упущено слишком много информации. Данный подход, лежащий в основе алгоритма CGRBalancer, может быть использован для заполнения пропущенной информации в больших базах данных химических реакций.

Литература

1. Sitzmann M., Ihlenfeldt W.-D., NicklausM.C. Tautomerism in large databases // J. Comput.- Aided Mol. Des. - 2010. - V. 24, No 6-7. - P. 521-551. - doi: 10.1007/s10822-010-9346-4.

2. WilliamsA.J., Ekins S., Tkachenko V. Towards a gold standard: Regarding quality in public domain chemistry databases and approaches to improving the situation // Drug Discovery Today. - 2012. - V. 17, No 13. - P. 685-701. - doi: 10.1016/j.drudis.2012.02.013.

3. Reaxys, version 1.7.8. - Elsevier. - URL: www.reaxys.com.

4. Ridley D. Information Retrieval: SciFinder. - John Wiley & Sons, 2009. - 226 p. - doi: 10.1002/9780470749418.

5. Kraut H., Eiblmaier J., Grethe G., Low P., Matuszczyk H., Sailer H. Algorithm for reaction classification // J. Chem. Inf. Model. - 2013. - V. 53, No 11. - P. 2884-2895. - doi: 10.1021/ci400442f.

6. Patel H., Bodkin M.J., Chen B., Gillet V.J. Knowledge-based approach to de Novo design using reaction vectors // J. Chem. Inf. Model. - 2009. - V. 49, No 5. - P. 1163-1184. - doi: 10.1021/ci800413m.

7. Hoonakker F., Lachiche N., Varnek A. Condensed Graph of Reaction: Considering a chemical reaction as one single pseudo molecule // Int. J. Artif. Intell. Tools. - 2011. - V. 20, No 2. - P. 253-270.

8. Varnek A., Fourches D., Hoonakker F., Solov'ev V.P. Substructural fragments: An universal language to encode reactions, molecular and supramolecular structures // J. Com- put.-Aided Mol. Des. - 2005. - V. 19, No 9-10. - P. 693-703. - doi: 10.1007/s10822- 005-9008-0.

9. Schneider N., Lowe D.M., Sayle R.A., Landrum G.A. Development of a novel fingerprint for chemical reactions and its application to large-scale reaction classification and similarity // J. Chem. Inf. Model. - 2015. - V. 55, No 1. - P. 39-53. - doi: 10.1021/ci5006614.

10. Madzhidov T.I., Bodrov A. V., Gimadiev T.R., Nugmanov R.I., Antipin I.S., Varnek A. Structure-reactivity relationship in bimolecular elimination reactions based on the condensed graph of a reaction // J. Struct. Chem. - 2015. - V. 56, No 7. - P. 1227-1234. - doi: 10.1134/S002247661507001X.

11. Madzhidov T.I., Polishchuk P.G., Nugmanov R.I., Bodrov A. V., Lin A.I., Baskin I.I., Antipin I.S., Varnek A. Structure-reactivity relationships in terms of the condensed graphs of reactions // Russ. J. Org. Chem. - 2014. - V. 50, No 4. - P. 459-463. - doi: 10.1134/S1070428014040010.

12. Nugmanov R.I., Madzhidov T.I., Khaliullina G.R., Baskin I.I., Antipin I.S., Varnek A.

13. Development of “structure-property” models in nucleophilic substitution reactions involving azides // J. Struct. Chem. - 2014. - V. 55, No 6. - P. 1026-1032. - doi: 10.1134/S0022476614060043.

Figure Captions

Fig. 1. The example of unbalanced (a) and balanced (b) reactions. If the user is interested in the reactions involving molecule Q, the unfilled reaction (a) will not be retrieved as the results of the search, while the filled reaction (b) will be.

Fig. 2. Chemical reaction (a) and its Condensed Graph (b). The numbers next to atoms correspond to atom-to-atom mapping. In CGR, a crossed bond means a cleaved bond, a circle marks formed single C-O bond. Converting CGR into reaction (c) allows identification of the missed reagents and products.

Fig. 3. a) Unbalanced reaction with missed coefficients and products (a1), its Condensed Graph (a2) and the final balanced reaction (a3). Using CGR, common fragments are identified. The process of restoration of the lost information about the outgoing group is shown. b) An unbalanced reaction (b1), incorrectly balanced (b2), and restored (b3) on the basis of the empirical rule (b4), which provides information about the missing reagents and a number of products.

References

1. Sitzmann M., Ihlenfeldt W.-D., Nicklaus M.C. Tautomerism in large databases. J. Comput.-Aided Mol. Des., 2010, vol. 24, nos. 6-7, pp. 521-551. doi: 10.1007/s10822-010-9346-4.

2. Williams A.J., Ekins S., Tkachenko V. Towards a gold standard: Regarding quality in public domain chemistry databases and approaches to improving the situation. Drug Discovery Today, 2012, vol. 17, no. 13, pp. 685-701. doi: 10.1016/j.drudis.2012.02.013.

3. Reaxys, version 1.7.8. Elsevier. Available at: www.reaxys.com.

4. Ridley D. Information Retrieval: SciFinder. John Wiley & Sons, 2009. 226 p. doi: 10.1002/9780470749418.

5. Kraut H., Eiblmaier J., Grethe G., Low P., Matuszczyk H., Sailer H. Algorithm for reaction classification. J. Chem. Inf Model., 2013, vol. 53, no. 11, pp. 2884-2895. doi: 10.1021/ci400442f

6. Patel H., Bodkin M.J., Chen B., Gillet V.J. Knowledge-based approach to de Novo design using reaction vectors. J. Chem. Inf. Model., 2009, vol. 49, no. 5, pp. 1163-1184. doi: 10.1021/ci800413m.

7. Hoonakker F., Lachiche N., Varnek A. Condensed Graph of Reaction: Considering a chemical reaction as one single pseudo molecule. Int. J. Artif Intell. Tools, 2011, vol. 20, no. 2, pp. 253-270.

8. Varnek A., Fourches D., Hoonakker F., Solov'ev V.P. Substructural fragments: An universal language to encode reactions, molecular and supramolecular structures. J. Comput.-Aided Mol. Des., 2005, vol. 19, nos. 9-10, pp. 693-703. doi: 10.1007/s10822-005-9008-0.

9. Schneider N., Lowe D.M., Sayle R.A., Landrum G.A. Development of a novel fingerprint for chemical reactions and its application to large-scale reaction classification and similarity. J. Chem. Inf Model., 2015, vol. 55, no. 1, pp. 39-53. doi: 10.1021/ci5006614.

10. Madzhidov T.I., Bodrov A. V., Gimadiev T.R., Nugmanov R.I., Antipin I.S., Varnek A. Structure- reactivity relationship in bimolecular elimination reactions based on the condensed graph of a reaction. J. Struct. Chem., 2015, vol. 56, no. 7, pp. 1227-1234. doi: 10.1134/S002247661507001X.

11. Madzhidov T.I., Polishchuk P.G., Nugmanov R.I., Bodrov A. V., Lin A.I., Baskin I.I., Antipin I.S., Vamek A. Structure-reactivity relationships in terms of the condensed graphs of reactions. Russ. J. Org. Chem., 2014, vol. 50, no. 4, pp. 459-463. doi: 10.1134/S1070428014040010.

12. Nugmanov R.I., Madzhidov T.I., Khaliullina G.R., Baskin I.I., Antipin I.S., Varnek A. Development of “structure-property” models in nucleophilic substitution reactions involving azides. J. Struct. Chem., 2014, vol. 55, no. 6, pp. 1026-1032. doi: 10.1134/S0022476614060043.

Размещено на Allbest.ru

...

Подобные документы

  • Методы построения кинетических моделей гомогенных химических реакций. Расчет изменения концентраций в ходе химической реакции. Сравнительный анализ численных методов Эйлера и Рунге-Кутта. Влияние температуры на выход продуктов и степень превращения.

    контрольная работа [242,5 K], добавлен 12.05.2015

  • Основные условия процесса превращения одного или нескольких исходных веществ в отличающиеся от них по химическому составу или строению вещества. Протекание химических реакций при смешении или физическом контакте реагентов и участии катализаторов.

    презентация [693,8 K], добавлен 08.08.2015

  • Зависимость химической реакции от концентрации реагирующих веществ при постоянной температуре. Скорость химических реакций в гетерогенных системах. Влияние концентрации исходных веществ и продуктов реакции на химическое равновесие в гомогенной системе.

    контрольная работа [43,3 K], добавлен 04.04.2009

  • Реакции, протекающие между ионами в растворах. Порядок составления ионных уравнений реакций. Формулы в ионных уравнениях. Обратимые и необратимые реакции обмена в водных растворах электролитов. Реакции с образованием малодиссоциирующих веществ.

    презентация [1,6 M], добавлен 28.02.2012

  • Основные понятия и законы химической кинетики. Кинетическая классификация простых гомогенных химических реакций. Способы определения порядка реакции. Влияние температуры на скорость химических реакций. Сущность процесса катализа, сферы его использования.

    реферат [48,6 K], добавлен 16.11.2009

  • Понятие и условия прохождения химических реакций. Характеристика реакций соединения, разложения, замещения, обмена и их применение в промышленности. Окислительно-восстановительные реакции в основе металлургии, суть валентности, виды переэтерификации.

    реферат [146,6 K], добавлен 27.01.2012

  • Общее понятие о химической реакции, ее сущность, признаки и условия проведения. Структура химических уравнений, их особенности и отличия от математических уравнений. Классификация и виды химических реакций: соединения, разложения, обмена, замещения.

    реферат [773,3 K], добавлен 25.07.2010

  • Роль скорости химических реакций, образования и расходования компонентов. Кинетика химических реакций. Зависимость скорости реакции от концентрации исходных веществ. Скорость расходования исходных веществ и образования продуктов. Закон действующих масс.

    реферат [275,9 K], добавлен 26.10.2008

  • Понятие и расчет скорости химических реакций, ее научное и практическое значение и применение. Формулировка закона действующих масс. Факторы, влияющие на скорость химических реакций. Примеры реакций, протекающих в гомогенных и гетерогенных системах.

    презентация [1,6 M], добавлен 30.04.2012

  • Методы построения кинетических моделей гомогенных химических реакций. Исследование влияния температуры на выход продуктов и степень превращения. Рекомендации по условиям проведения реакций с целью получения максимального выхода целевых продуктов.

    лабораторная работа [357,5 K], добавлен 19.12.2016

  • Особенности химических реакций в полимерах. Деструкция полимеров под действием тепла и химических сред. Химические реакции при действии света и ионизирующих излучений. Формирование сетчатых структур в полимерах. Реакции полимеров с кислородом и озоном.

    контрольная работа [4,5 M], добавлен 08.03.2015

  • Понятие и виды сложных реакций. Обратимые реакции различных порядков. Простейший случай двух параллельных необратимых реакций первого порядка. Механизм и стадии последовательных реакций. Особенности и скорость протекания цепных и сопряженных реакций.

    лекция [143,1 K], добавлен 28.02.2009

  • Стадии взаимодействия газообразных реагентов на поверхности твердого катализатора. Соотношение скоростей химической реакции и диффузии на примере необратимой реакции. Расчет адиабатических реакторов для реакций, протекающих в кинетической области.

    презентация [428,6 K], добавлен 17.03.2014

  • Описание свойств хитозана, воздействие на макромолекулу различных химических реагентов. Виды химических реакций в которые она вступает: гидролиз, окисление. Способы получения эфиров, привитых сополимеров хитозана, взаимодействие с его основаниями.

    курсовая работа [36,8 K], добавлен 13.12.2010

  • Тепловые эффекты химических реакций, а также основные факторы, влияющие на их динамику. Закон Гесса: понятие и содержание, сферы практического применения. Энтропия системы и анализ уравнения Больцмана. Направления химических реакций и энергия Гиббса.

    лекция [34,1 K], добавлен 13.02.2015

  • Химическая реакция как превращение вещества, сопровождающееся изменением его состава и (или) строения. Признаки химических реакций и условия их протекания. Классификация химических реакций по различным признакам и формы их записи в виде уравнений.

    реферат [68,7 K], добавлен 25.07.2010

  • Этапы изучения процессов горения и взрывов. Основные виды взрывов, их классификация по типу химических реакций и плотности вещества. Реакции разложения, окислительно-восстановительные, полимеризации, изомеризации и конденсации, смесей в основе взрывов.

    реферат [99,8 K], добавлен 06.06.2011

  • Определение содержания химической кинетики и понятие скорости реакции. Доказательство закона действующих масс и анализ факторов, влияющих на скорость химических реакций. Измерение общей энергии активации гомогенных и гетерогенных реакций, их обратимость.

    презентация [100,2 K], добавлен 11.08.2013

  • Рассмотрение химических реакций, протекающих в реакторах. Проблемы выбора модели автоматического регулятора. Знакомство с особенностями моделирования системы управления реакционным аппаратом на основе анализа уравнений кинетики химической реакции.

    дипломная работа [1,4 M], добавлен 14.01.2015

  • Ознакомление с понятием и предметом химической кинетики. Рассмотрение условий химической реакции. Определение скорости реакции как изменения концентрации реагирующих веществ в единицу времени. Изучение общего влияния природы веществ и температуры.

    презентация [923,5 K], добавлен 25.10.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.