Комп'ютерні технології для розробки ліків використовуються вже кілька років. Останнім часом у фармацевтичній та науковій сферах спостерігається перехід до використання обчислювальних інструментів. Цьому сприяє велика кількість даних про характеристики лігандів і зв'язування з терапевтичними цілями, тривимірні (3D) структури білків, а також поява віртуальних бібліотек на вимогу, що містять мільярди малих молекул, подібних до лікарських засобів. Для повного використання цих ресурсів потрібні швидкі обчислювальні підходи для ефективного і швидкого гігамасштабного скринінгу.
У цьому огляді дослідники проаналізували існуючі дані про комп'ютеризовані підходи у відкритті та розробці лікарських засобів (DDD).
Технологія дуже великомасштабної інтеграції (VLS) для виявлення високоякісних збігів
Банк білкових даних (Protein Data Bank, PDB) містить понад 200 000 структур білків. Кріоелектронна мікроскопія високої роздільної здатності та рентгенівське випромінювання охоплюють >90% сімейств білків, а прогалини, що залишилися, заповнюються моделюванням AlphaFold2 та/або гомологією. Хімічні простори, що використовуються для скринінгу та синтезу потенційних кандидатів у лікарські засоби, збільшилися з 107 готових молекул до >3,0 x 1010 молекул, синтезованих на вимогу з 2015 по 2022 рік, з потенціалом розширення до >1015 сполук.
У порівнянні з HTS (105-107) та відкриттям лігандів на основі фрагментів (FBLD, 103-105), скринінг гігантських бібліотек, кодованих дезоксирибонуклеїновою кислотою (ДНК) (1010), та гігантський VLS використовують значно більші початкові бібліотеки (1010-1015). Частота виявлення (%) при HTS-скринінгу та гігамасштабному скринінгу DEL подібна (0,01-0,5), вища для FBLD (1,0-5,0) і найвища для VLS (10-40a, де a - частка передбачуваних виявлень, які були підтверджені експериментально).
Спорідненість до початкових цілей дуже слабка для FBLD (невеликі фрагменти розміром від 100 до 1 000,0 мкМ), слабка (від 1,0 до 10 мкМ) для HTS, середня для скринінгу DEL (від 0,1 до 10 мкМ) і від середнього до високого рівня (від 0,010 до 10 мкМ) для VLS. На додаток до кількісної оптимізації на основі співвідношення структура-активність (QSAR) для ідентифікації лідів, HTS вимагає індивідуального синтезу співвідношення структура-активність, FBLD - вирощування або злиття фрагментів, а скринінг DEL - ресинтезу немічених мітками хітів.
VLS передбачає кількісну оптимізацію взаємозв'язків структура-активність на основі структур каталогу і вимагає однієї десятої (від 0,0 до 50) від кількості індивідуальних процесів синтезу, необхідних для HTS, FBLD і DEL скринінгу для ідентифікації лідів. Крім того, HTS і FBLD не генерують нових збігів. Процеси HTS вимагають стрибків або модифікацій, а FBLD - раціональних конструкцій для досягнення новизни з точки зору інтелектуальної власності (ІВ). Навпаки, більшість результатів VLS є новими.
Обмеження HTS включають скромні розміри бібліотек, невідомі способи зв'язування та дороге обладнання; обмеження FBLD включають потребу в дорогому обладнанні для ядерного магнітного резонансу (ЯМР), поверхневого плазмонного резонансу (ППР) та рентгенівської візуалізації, а також багато етапів оптимізації; скринінг DEL призводить до кількох хибнопозитивних результатів і вимагає ресинтезу хіт-дезоксирибонуклеїнової кислоти. VLS вимагає обчислювальних ресурсів, які при використанні модульного типу VLS зменшуються у понад 1 000 разів.
Алгоритми віртуального скринінгу базуються на білкових структурах, лігандах або на обох. Алгоритми на основі білків вимагають структур високої роздільної здатності, тоді як алгоритми на основі лігандів потребують великих наборів даних про активність лігандів. Гібридний скринінг вимагає даних про активність лігандів і 3D-комплексів білок-ліганд для створення тривимірних відбитків взаємодії та моделей на основі штучного інтелекту (ШІ).
Типи хімічних бібліотек та комп'ютерні технології для прискорення відкриття лікарських засобів
Фармацевтичні компанії проводять власний скринінг величезної кількості сполук, тоді як колекції від постачальників дозволяють швидко (<1,0 тижня) отримувати наявні молекули з унікальними хімічними структурами, які можна легко шукати і які сумісні з високопродуктивним скринінгом (HTS). Однак вартість управління фізичними бібліотеками препаратів, їх повільне зростання і невеликий розмір обмежують їх застосування.
REAL та хімічні простори на вимогу дозволяють швидко паралельно синтезувати молекули на вимогу з понад 12 000 будівельних блоків, що проходять понад 180 реакцій, з коефіцієнтом успішності понад 80,0% та доставкою протягом 2,0-3,0 тижнів. Приклади включають Galaxy від WuXi, Enamine REAL та CHEMriya від Otava. Включення додаткових синтезаторів (наприклад, за допомогою алгоритму V-SYNTHES) і реакційних скаффолдів забезпечує високу новизну і швидке поліноміальне зростання для розробки ліків на основі віртуального хімічного простору.
Алгоритм V-SYNTHES може бути використаний для ефективного скринінгу >31 мільярда сполук, включаючи >3.0 x1010 сполук з REAL простору і >1015 сполук з розширених хімічних просторів, шляхом повного перерахування молекул, які оптимально підходять для тих чи інших цілей. Генеративні простори (GDB-13,17,18 та GDBChEMBL) включають всі теоретично можливі молекули та хімічні простори. Лише теоретична вірогідність, передбачена на рівні від 1023 до 1060 молекул, подібних до наркотиків, обмежує ці області.
Незважаючи на широке охоплення просторів, коефіцієнти успішності та шляхи реакцій отриманих сполук не відомі, що вимагає комп'ютерної оцінки їхньої здатності до синтезу кандидатів на лікарські засоби. У генеративних просторах атомні графи використовуються для генерації насичених вуглеводневих структур і скелетів, що складаються з ненасичених молекул. Скелети розширюються шляхом заміщення гетероатомів і перетворюються на повноцінні сполуки.
Комп'ютерне відкриття ліків базується на легкодоступних віртуальних хімічних просторах, що створюються за запитом або генеруються, а також на обчислювальних інструментах, що базуються на структурі та штучному інтелекті, які спрощують процес відкриття ліків. У порівнянні зі стандартним терміном відкриття від гена до свинцю, який становить від чотирьох до шести років, комп'ютерні технології можуть визначити потенційних кандидатів на лікарські засоби протягом 2,0-12 місяців.
Використання швидких, гнучких підходів до стикування, глибокого навчання або скорингу з більш точними інструментами постобробки, заснованими на квантовій механіці та збуреннях вільної енергії (FEP), може збільшити кількість високоафінних збігів для гігамасштабних хімічних просторів. Крім того, швидке поширення недорогих хмарних обчислень, спеціалізованих чіпів і прискорення графічних процесорів (GPU) також сприяють розвитку обчислювальних інструментів.
Виходячи з результатів огляду, екосистема DDD, схоже, трансформується від автоматизованої до керованої комп'ютером для швидкого та економічно ефективного відкриття ліків з використанням складних інструментів прогнозування потенціалу, а також потужних і селективних зачіпок. Однак комп'ютерні оцінки потребують перевірки шляхом проведення експериментів in vitro та in vivo на кожному кроці конвеєра відкриття ліків.
Посилання на журнал: Sadybekov, A.V., Katritch, V. Computational approaches streamlining drug discovery. Nature 616, 673–685 (2023). DOI: https://doi.org/10.1038/s41586-023-05905-z, https://www.nature.com/articles/s41586-023-05905-z