Полный текст
Ключевые слова: bioinformatics, Glycine max, Glycine soja, In silico, Machine learning, PrankWEB, биоинформатика
Аннотация
Знание о топологии молекулярных полостей и сайтах связывания является важным предиктором в биологических исследованиях аффинности химических агентов/лиганд к белку. Без знаний о расположении ключевых аминокислот не получится проводить адекватные исследования. Потому поиск и идентификация молекулярной полости является важной и актуальной задаче в белковой инженерии, drug design/discovery и других направлениях. В данной статье предлагается комплексный подход в прогнозирование топологии и координат молекулярной полости с использованием метода по гомологии и программного обеспечения, на основе машинного обучения. В качестве испытательной модели для представленного метода был выбран фермент дикой сои (Glycine soja Sieb & Zucc.) бета-амилаза. Для этого фермента был найден соответствующий и самый близкий аннотированный гомолог – бета-амилаза культурной сои (Glycine max (L.) Merr.). С использованием алгоритма выравнивания был получен список аминокислот, которые по предсказанию являются сайтом связывания с субстратом: 6, 25, 71, 103, 120, 130, 171, 203, 288, 322, 332, 377, 400, 434, 471, 481, 482. Параллельно с этим проводилось вычисление полости молекулярного кармана в веб-сервисе PrankWEB. Получены три гипотетических кармана с разным рейтингом, а также аминокислоты, образующие их. Для первого кармана: 99 ,100, 185, 187, 193, 199, 201, 296, 298, 299, 301, 302, 343, 347, 352, 383, 384, 420. Для второго кармана: 18, 21, 54, 56, 90, 94, 99, 102, 179, 185, 296, 420, 421. Для третьего кармана: 14, 16, 49, 86, 176, 177, 415, 452, 455, 457, 459. Первые два кармана в рейтинге точности прогноза имеют схожие аминокислоты, что говорит о высокой точности прогноза. Данные полученные с референсной бета-амилазы культурной сои, при помощи нейронной сети, соотносятся с такими же результатами для дикой сои, что говорит о воспроизводимости методики.
Ключевые слова: bioinformatics, Glycine max, Glycine soja, In silico, Machine learning, PrankWEB, биоинформатика
Об авторах
Список литературы
1. Walters, D. E. (n.d.). Predictive Models of Protein-Active Sites. Protein Structure Prediction, 349–358. doi:10.1385/1-59259-368-2:349
2. Dávid Jakubec, Petr Škoda, Radoslav Krivák, Marian Novotný and David Hoksza. PrankWeb 3: accelerated ligand-binding site predictions for experimental and modelled protein structures. Nucleic Acids Research. May 2022
3. Lukáš Jendele and Radoslav Krivák and Petr Škoda and Marian Novotný and David Hoksza. PrankWeb: a web server for ligand binding site prediction and visualization. Nucleic Acids Research. May 2019
4. Radoslav Krivák and David Hoksza. P2Rank: machine learning based tool for rapid and accurate prediction of ligand binding sites from protein structure. Journal of Cheminformatics. Aug 2018
Для цитирования
Тимкин П. Д., Пензин А. А. Комбинированное прогнозирование топологии молекулярной полости белка // Агронаука. 2023. Том 1. № 1. C.104–107.