Краткий ответ: Генеративный ИИ в основном ускоряет ранние этапы разработки лекарств, генерируя молекулы-кандидаты или последовательности белков, предлагая пути синтеза и выдвигая проверяемые гипотезы, что позволяет командам проводить меньше «слепых» экспериментов. Он работает лучше всего, когда вы устанавливаете жесткие ограничения и проверяете результаты; если же его использовать как оракула, он может с уверенностью вводить в заблуждение.
Основные выводы:
Ускорение : Используйте GenAI для расширения генерации идей, а затем сузьте круг поиска с помощью тщательной фильтрации.
Ограничения : Перед генерацией необходимо указать диапазоны свойств, правила построения структуры и ограничения на новизну.
Проверка достоверности : Рассматривайте результаты как гипотезы; подтверждайте их с помощью анализов и ортогональных моделей.
Отслеживаемость : Регистрируйте подсказки, результаты и обоснования, чтобы решения оставались подлежащими аудиту и проверке.
Устойчивость к злоупотреблениям : Предотвращение утечек и чрезмерной самоуверенности с помощью управления, контроля доступа и проверки человеком.

Статьи, которые могут вас заинтересовать после этой:
🔗 Роль ИИ в здравоохранении
Как ИИ улучшает диагностику, рабочие процессы, уход за пациентами и результаты лечения.
🔗 Заменит ли ИИ врачей-радиологов?
В книге исследуется, как автоматизация дополняет радиологию, и что при этом остается человечным.
🔗 Заменит ли ИИ врачей?
Честный взгляд на влияние ИИ на работу и практику врачей.
🔗 Лучшие инструменты для научных открытий в области искусственного интеллекта
Лучшие инструменты для лабораторий искусственного интеллекта, позволяющие ускорить эксперименты, анализ и открытия.
Роль генеративного ИИ в разработке лекарств — одним словом 😮💨
Генеративный ИИ помогает командам разработчиков лекарств создавать молекулы-кандидаты, прогнозировать их свойства, предлагать модификации, разрабатывать пути синтеза, исследовать биологические гипотезы и сокращать циклы итераций — особенно на ранних стадиях исследований и оптимизации ведущих соединений. Nature 2023 (обзор исследований лигандов) Elsevier 2024 обзор (генеративные модели в разработке лекарств de novo)
Да, оно также может уверенно генерировать бессмыслицу. Это часть процесса. Как очень увлеченный стажер с ракетным двигателем. Руководство для врачей (риск галлюцинаций) npj Digital Medicine 2025 (галлюцинации + рамки безопасности)
Почему это важнее, чем многие признают 💥
Большая часть исследовательской работы — это «поиск». Поиск в химическом пространстве, поиск в биологии, поиск в литературе, поиск взаимосвязи структуры и функции. Проблема в том, что химическое пространство… по сути, практически бесконечно. (Calls of Chemical Research 2015 (химическое пространство) Irwin & Shoichet 2009 (масштаб химического пространства))
Можно потратить несколько жизней, просто перебирая «разумные» варианты.
Генеративный ИИ меняет рабочий процесс, выводя его за рамки:
-
«Давайте проверим, что нам придёт в голову»
к:
-
«Давайте создадим более широкий и продуманный набор вариантов, а затем протестируем лучшие из них»
Речь идёт не об отмене экспериментов, а о выборе более качественных экспериментов . 🧠 Nature 2023 (обзор исследований по поиску лигандов)
Кроме того, и это недостаточно обсуждается, это помогает командам общаться между представителями разных дисциплин . Химики, биологи, специалисты по фармакокинетике и метаболизму, специалисты по вычислительным наукам… у всех разные ментальные модели. Хорошая генеративная система может служить общим блокнотом для набросков. ( Обзор Frontiers in Drug Discovery 2024)
Что делает генеративный ИИ эффективным инструментом для разработки лекарств? ✅
Не все генеративные ИИ одинаковы. «Хорошая» версия для этой области меньше ориентирована на эффектные демонстрации и больше на непривлекательную надежность (непривлекательность здесь — достоинство). Nature 2023 (обзор открытия лигандов)
Как правило, хорошая система генеративного ИИ включает в себя:
-
Привязка к предметной области : обучение или адаптация к химическим, биологическим и фармакологическим данным (а не только к общему тексту) 🧬 Обзор Elsevier 2024 (генеративные модели)
-
Поколение, основанное на ограничениях : оно может подчиняться таким правилам, как диапазоны липофильности, ограничения структуры, особенности связывающих участков, цели селективности. JCIM 2024 (диффузионные модели в разработке лекарств de novo) REINVENT 4 (открытая структура)
-
Осведомленность о свойствах : она позволяет создавать молекулы, которые не только являются новыми, но и «не являются нелепыми» с точки зрения ADMET. ADMETlab 2.0 (почему ранние ADMET-тесты важны).
-
Отчетность о неопределенности : она сигнализирует о том, когда это предположение, а когда оно обосновано (даже приблизительный доверительный интервал помогает). Принципы валидации QSAR ОЭСР (область применимости).
-
Управление с участием человека : химики могут быстро направлять, отклонять и корректировать результаты. Nature 2023 (контекст рабочего процесса и технологий открытия).
-
Прослеживаемость : вы можете увидеть, почему было сделано то или иное предложение (хотя бы частично), иначе вы действуете вслепую. Рекомендации ОЭСР по QSAR (прозрачность модели + валидация).
-
Инструмент оценки : докинг, QSAR, фильтры, проверки ретросинтеза — все это встроено 🔧 Nature 2023 (обзор открытия лигандов) Машинное обучение в CASP (Coley 2018)
-
Контроль предвзятости и утечки информации : чтобы избежать проникновения запоминания обучающих данных (да, такое случается) USENIX 2021 (извлечение обучающих данных) Vogt 2023 (проблемы новизны/уникальности)
Если ваш генеративный ИИ не может работать с ограничениями, он, по сути, превращается в генератор новизны. Весело на вечеринках. Менее весело в программе разработки наркотиков.
Где место генеративного ИИ в процессе разработки лекарств 🧭
Вот простая ментальная схема. Генеративный ИИ может внести свой вклад практически на каждом этапе, но он показывает наилучшие результаты там, где итерации обходятся дорого, а пространство гипотез огромно. Nature 2023 (обзор открытия лигандов)
Типичные точки контакта:
-
Поиск и валидация мишеней (гипотезы, картирование сигнальных путей, предложения по биомаркерам). Обзор журнала Frontiers in Drug Discovery 2024.
-
Идентификация потенциальных кандидатов (расширение виртуального скрининга, генерация новых кандидатов) Nature Biotechnology 2019 (GENTRL)
-
Оптимизация лидов (подбор аналогов, многопараметрическая настройка) REINVENT 4
-
Поддержка доклинических исследований (прогнозирование ADMET-свойств, иногда подсказки по рецептуре) ADMETlab 2.0
-
CMC и планирование синтеза (предложения по ретросинтезу, отбор маршрутов) AiZynthFinder 2020 Coley 2017 (компьютерный ретросинтез)
-
Работа с информацией (анализ литературы, обзоры конкурентной среды) 📚 Тенденции 2025 (магистерские программы в области разработки лекарств)
Во многих программах наибольшие успехи достигаются за счет интеграции рабочих процессов , а не за счет какой-либо одной «гениальной» модели. Модель — это двигатель, а конвейер обработки данных — это автомобиль. Nature 2023 (обзор поиска лигандов)
Сравнительная таблица: популярные подходы генеративного ИИ, используемые в разработке лекарств 📊
Таблица немного несовершенна, потому что в реальной жизни тоже есть некоторые несовершенства.
| Инструмент / Подход | Лучше всего подходит для (аудитории) | Приблизительно дорого | Почему это работает (и когда не работает) |
|---|---|---|---|
| Генераторы новых молекул (SMILES, графы) | Медицинская химия + компьютерная химия | $$-$$$ | Отлично справляется с быстрым поиском новых аналогов 😎, но может выдавать нестабильные, неподходящие соединения. REINVENT 4 GENTRL (Nature Biotech 2019) |
| Генераторы белков/структур | Биологические группы, структурная биология | $$$ | Помогает предлагать последовательности и структуры, но «выглядит правдоподобно» — это не то же самое, что «работает». AlphaFold (Nature 2021) RFdiffusion (Nature 2023) |
| Молекулярный дизайн диффузионного типа | Передовые команды машинного обучения | $$-$$$$ | Уверенное владение обусловливанием ограничений и разнообразием — настройка может быть… целой проблемой. JCIM 2024 (диффузионные модели) PMC 2025 обзор диффузионных моделей |
| Вспомогательные средства для прогнозирования характеристик недвижимости (комбинация QSAR + GenAI) | ДМПК, проектные группы | $$ | Хорошо подходит для сортировки и ранжирования — плохо, если воспринимать как истину в последней инстанции 😬 OECD (область применимости) ADMETlab 2.0 |
| Планировщики ретросинтеза | Технологическая химия, КМЦ | $$-$$$ | Ускоряет разработку маршрутов, но для оценки их осуществимости и безопасности по-прежнему необходимы участие человека. AiZynthFinder 2020 Coley 2018 (CASP) |
| Многомодальные лабораторные пилотные проекты (текстовые данные + данные анализа) | Переводческие группы | $$$ | Полезно для извлечения сигналов из разных наборов данных — подвержено чрезмерной уверенности, если данные неравномерны. Nature 2024 (эффекты пакетной обработки в клеточной визуализации) npj Digital Medicine 2025 (мультимодальный подход в биотехнологиях) |
| Литературные материалы и помощь в выдвижении гипотез | На практике все | $ | Значительно сокращает время чтения, но галлюцинации могут быть коварными, как исчезновение носков. Patterns 2025 (LLMs in drug discovery) Руководство для врачей (галлюцинации) |
| Разработанные собственными силами модели фундаментов | Крупные фармацевтические компании, хорошо финансируемые биотехнологические фирмы | $$$$ | Наилучший контроль + интеграция — но также дорого и медленно в реализации (извините, это правда). Обзор Frontiers in Drug Discovery 2024. |
Примечание: цены сильно различаются в зависимости от масштаба, вычислительных мощностей, лицензирования и того, нужна ли вашей команде система "подключи и работай" или "давайте построим космический корабль"
Более подробный обзор: Генеративный ИИ для поиска хитов и создания новых дизайнов 🧩
Это ключевой пример использования: создание молекул-кандидатов с нуля (или на основе каркаса), соответствующих целевому профилю. Nature Biotechnology 2019 (GENTRL) REINVENT 4
Как это обычно работает на практике:
-
Определите ограничения
-
класс мишени, форма связывающего кармана, известные лиганды
-
Диапазоны свойств (растворимость, logP, PSA и т. д.) Липинского (в контексте правила 5)
-
Ограничения, связанные с новизной (избегать известных IP-зон) 🧠 Фогт 2023 (оценка новизны)
-
-
Сгенерировать кандидатов
-
перепрыгивание через строительные леса
-
рост фрагментов
-
предложения по «украшению этого ядра»
-
Многоцелевая генерация (связывание + проницаемость + нетоксичность) REINVENT 4 Elsevier 2024 (генеративные модели)
-
-
Фильтровать агрессивно
-
правила медицинской химии
-
PAINS и реактивные групповые фильтры Baell & Holloway 2010 (PAINS)
-
Проверки синтезируемости AiZynthFinder 2020
-
Докинг / оценка (несовершенный, но полезный метод) Nature 2023 (обзор поиска лигандов)
-
-
Выберите небольшой набор для синтеза
-
Люди всё ещё выбирают, потому что иногда они чувствуют запах глупостей
-
Неприятная правда: ценность заключается не только в «новых молекулах». Ценность заключается в новых молекулах, которые соответствуют ограничениям вашей программы . Последняя часть – это всё. Nature 2023 (обзор открытия лигандов)
Кроме того, сейчас прозвучит небольшое преувеличение: если всё сделать правильно, может показаться, что вы наняли команду неутомимых молодых химиков, которые никогда не спят и никогда не жалуются. С другой стороны, они также не понимают, почему конкретная стратегия защиты — это кошмар, так что… баланс 😅.
Подробнее: Оптимизация лидов с помощью генеративного ИИ (многопараметрическая настройка) 🎛️
Оптимизация лидов — это то, где мечты часто усложняются.
Вы хотите:
-
повышение эффективности
-
селективность вверх
-
метаболическая стабильность повышается
-
растворимость
-
сигналы безопасности отключены
-
проницаемость «в самый раз»
-
И при этом оставаться синтезируемым
Это классическая многоцелевая оптимизация. Генеративный ИИ необычайно хорошо умеет предлагать набор компромиссных решений, а не делать вид, что существует одно идеальное соединение. Обзор REINVENT 4
Практические способы использования этого инструмента командами:
-
Аналогичное предложение : «Создать 30 вариантов, которые снижают клиренс, но сохраняют эффективность».
-
Сканирование замещений : направленное исследование вместо перебора.
-
Переход на новый уровень разработки : когда основной компонент сталкивается с препятствием (токсичностью, интеллектуальной собственностью или стабильностью).
-
Пояснительные предложения : «Эта полярная группа может способствовать растворимости, но может ухудшить проницаемость» (не всегда верно, но полезно).
Одно предостережение: модели прогнозирования свойств могут быть ненадежными. Если ваши обучающие данные не соответствуют вашей химической серии, модель может быть заведомо неверной. Очень неверной. И она не покраснеет от стыда. Принципы валидации QSAR ОЭСР (область применимости) Уивер 2008 (область применимости QSAR)
Более детальный анализ: ADMET, токсичность и скрининг «пожалуйста, не закрывайте программу» 🧯
В области ADMET многие кандидаты тихо терпят неудачу. Генеративный ИИ не решает биологические проблемы, но он может уменьшить количество предотвратимых ошибок. ADMETlab 2.0 Waring 2015 (отсев участников)
Общие роли:
-
Прогнозирование метаболических рисков (места метаболизма, тенденции выведения)
-
Выявление вероятных токсических мотивов (предупреждения, индикаторы реактивных промежуточных продуктов)
-
Оценка диапазонов растворимости и проницаемости
-
Предлагаются модификации для снижения риска hERG или повышения стабильности 🧪 FDA (вопросы и ответы по ICH E14/S7B) EMA (обзор ICH E14/S7B)
Наиболее эффективная схема обычно выглядит так: использовать GenAI для предложения вариантов, но применять специализированные модели и эксперименты для их проверки.
Генеративный ИИ — это двигатель генерации идей. Проверка по-прежнему осуществляется в ходе экспериментов.
Подробнее: Генеративный ИИ для биотехнологий и белковой инженерии 🧬✨
Разработка лекарств — это не только исследования малых молекул. Генеративный искусственный интеллект также используется для:
-
генерация последовательности антител
-
предложения по созреванию сродства
-
улучшение стабильности белка
-
инженерия ферментов
-
Исследование пептидной терапии ProteinMPNN (Science 2022) Rives 2021 (языковые модели белков)
Генерация белков и последовательностей может быть очень эффективной, потому что «язык» последовательностей удивительно хорошо соответствует методам машинного обучения. Но вот краткий обзор: он хорошо соответствует… до тех пор, пока не перестает соответствовать. Потому что ограничения, связанные с иммуногенностью, экспрессией, паттернами гликозилирования и возможностью разработки, могут быть очень серьезными. AlphaFold (Nature 2021) ProteinGenerator (Nat Biotech 2024)
Таким образом, оптимальные конфигурации включают в себя:
-
фильтры для оценки возможности разработки
-
оценка риска иммуногенности
-
ограничения технологичности производства
-
Петли для влажной лабораторной работы для быстрой итерации 🧫
Если вы их пропустите, то получите великолепную последовательность, которая ведёт себя как настоящая дива во время съёмки.
Более подробный обзор: предложения по планированию синтеза и ретросинтезу 🧰
Генеративный искусственный интеллект проникает не только в процесс разработки молекул, но и в химические процессы.
Специалисты по планированию ретросинтеза могут:
-
предложить пути к целевому соединению
-
предложить коммерчески доступные исходные материалы
-
ранжировать маршруты по количеству шагов или предполагаемой осуществимости
-
AiZynthFinder 2020 Coley 2018 (CASP) помогает химикам быстро отсеивать «милые, но невозможные» идеи
Это может значительно сэкономить время, особенно при исследовании множества потенциальных структур. Тем не менее, роль человека здесь очень важна, потому что:
-
изменения доступности реагентов
-
Проблемы безопасности и масштабирования вполне реальны
-
Некоторые шаги выглядят хорошо на бумаге, но постоянно терпят неудачу
Не совсем удачная метафора, но я все равно ее использую: ИИ для ретросинтеза — это как GPS, который в основном прав, за исключением того, что иногда он прокладывает вам маршрут через озеро и настаивает, что это короткий путь. 🚗🌊 Коли 2017 (компьютерный ретросинтез)
Данные, мультимодальные модели и суровая реальность лабораторий 🧾🧪
Генеративный ИИ обожает данные. Лаборатории создают данные. На бумаге это звучит просто.
Ха. Нет.
Реальные лабораторные данные:
-
неполный
-
шумный
-
полны эффектов пакетной обработки данных. Лик и др. 2010 (эффекты пакетной обработки данных). Nature 2024 (эффекты пакетной обработки данных в клеточной визуализации).
-
разбросаны по различным форматам
-
повезло с "креативными" правилами именования
Мультимодальные генеративные системы могут сочетать в себе:
-
результаты анализа
-
химические структуры
-
изображения (микроскопия, гистология)
-
омиксные технологии (транскриптомика, протеомика)
-
текст (протоколы, электронные лабораторные журналы, отчеты) npj Цифровая медицина 2025 (мультимодальный подход в биотехнологиях) Анализ медицинских изображений 2025 (мультимодальный ИИ в медицине)
Когда это работает, это потрясающе. Вы можете выявлять неочевидные закономерности и предлагать эксперименты, которые отдельный специалист мог бы упустить из виду.
Когда что-то терпит неудачу, это происходит тихо. Это не хлопает дверью. Это лишь подталкивает вас к уверенному ошибочному выводу. Вот почему управление, валидация и проверка предметной области не являются необязательными. Руководство для клиницистов (галлюцинации) npj Digital Medicine 2025 (галлюцинации + структура безопасности)
Риски, ограничения и раздел «не дайте себя обмануть беглым языком» ⚠️
Если вы запомните только одно, запомните это: генеративный ИИ убедителен. Он может казаться правым, будучи при этом неправым. Руководство для врачей (галлюцинации)
Основные риски:
-
Механизмы галлюцинаций : правдоподобные биологические процессы, которые не соответствуют действительности. Руководство для врачей (по галлюцинациям).
-
Утечка данных : создание чего-то слишком похожего на известные соединения. USENIX 2021 (извлечение обучающих данных). Vogt 2023 (проблемы новизны/уникальности).
-
Чрезмерная оптимизация : погоня за прогнозируемыми показателями, которые не подтверждаются в условиях in vitro. Nature 2023 (обзор процесса поиска лигандов).
-
Смещение : обучающие данные, смещенные в сторону определенных хемотипов или целевых объектов (Фогт, 2023) (оценка модели + смещение/новизна).
-
Ложная новизна : «новые» молекулы, которые на самом деле являются тривиальными вариантами. Фогт, 2023.
-
Пробелы в объяснимости : трудно обосновать решения перед заинтересованными сторонами. Принципы валидации QSAR ОЭСР.
-
Вопросы безопасности и интеллектуальной собственности : конфиденциальные данные программы в подсказках 😬 USENIX 2021 (извлечение обучающих данных)
Меры, которые помогают на практике:
-
вовлекать людей в процесс принятия решений
-
Запись подсказок и вывода в журнал для обеспечения отслеживаемости
-
Проверить с помощью ортогональных методов (анализов, альтернативных моделей)
-
Автоматическое применение ограничений и фильтров
-
Рассматривайте результаты как гипотезы, а не как скрижали истины (руководство ОЭСР по QSAR).
Генеративный ИИ — это мощный инструмент. Однако, инструменты не сделают вас плотником… они просто позволяют быстрее совершать ошибки, если вы не знаете, что делаете.
Как команды внедряют генеративный ИИ без хаоса 🧩🛠️
Часто командам нужно использовать это, не превращая организацию в подобие научной ярмарки. Практический путь внедрения выглядит следующим образом:
-
Начните с одного узкого места (расширение области поиска, создание аналогов, сортировка литературы) Nature 2023 (обзор открытия лигандов)
-
Создайте эффективную систему оценки (фильтры + стыковка + проверка свойств + химический анализ) REINVENT 4 AiZynthFinder 2020
-
Оценка результатов (сэкономленное время, процент успешных результатов, снижение оттока кадров) Уоринг, 2015 (отток кадров)
-
Интеграция с существующими инструментами (электронная лабораторная книга, реестр соединений, базы данных анализов). Ресурс электронной лабораторной книги Эдинбурга.
-
Создание правил использования (что может быть запрошено, что остается в автономном режиме, этапы проверки) USENIX 2021 (риск извлечения данных)
-
Обучайте людей бережно (серьезно, большинство ошибок происходит из-за неправильного использования, а не из-за модели). Руководство для врачей (галлюцинации)
Кроме того, не стоит недооценивать культуру. Если химики почувствуют, что им навязывают ИИ, они его проигнорируют. Если же это сэкономит им время и будет соответствовать их профессиональным знаниям, они быстро его внедрят. Люди такие забавные 🙂.
Какова роль генеративного ИИ в разработке лекарств, если посмотреть на ситуацию в более широком контексте? 🔭
В более широком смысле, задача состоит не в том, чтобы «заменить ученых», а в том, чтобы «расширить научные горизонты». Nature 2023 (обзор открытия лигандов)
Это помогает командам:
-
каждую неделю изучать больше гипотез
-
предлагать больше структур-кандидатов за цикл
-
более разумно расставлять приоритеты в экспериментах
-
сжатие циклов итераций между проектированием и тестированием
-
Обмен знаниями между различными подразделениями. Patterns 2025 (магистерские программы в области разработки лекарств).
И, пожалуй, самый недооцененный момент: это помогает не тратить дорогостоящую человеческую креативность на повторяющиеся задачи. Люди должны думать о механизме, стратегии и интерпретации, а не тратить дни на составление списков вариантов вручную. Nature 2023 (обзор открытия лигандов)
Итак, да, роль генеративного ИИ в разработке лекарств заключается в том, чтобы быть ускорителем, генератором, фильтром, а иногда и источником проблем. Но это ценная роль.
Заключительное резюме 🧾✅
Генеративный ИИ становится ключевой возможностью в современной разработке лекарств, поскольку он может генерировать молекулы, гипотезы, последовательности и пути синтеза быстрее, чем люди, и может помочь командам выбирать более эффективные эксперименты. Обзор Frontiers in Drug Discovery 2024, Nature 2023 (обзор по разработке лигандов).
Краткий обзор:
-
Лучше всего подходит для этапов раннего поиска и оптимизации лидов REINVENT 4
-
Он поддерживает малые молекулы и биопрепараты GENTRL (Nature Biotech 2019) ProteinMPNN (Science 2022)
-
Это повышает производительность за счет расширения потока идей (Nature 2023, обзор процесса поиска лигандов).
-
Необходимы ограничения, проверка и участие людей, чтобы избежать самоуверенной бессмыслицы. Принципы QSAR ОЭСР. Руководство для клиницистов (галлюцинации).
-
Наибольшие успехи достигаются за счет интеграции рабочих процессов , а не за счет маркетинговой шумихи (Nature 2023, обзор открытия лигандов).
Если относиться к нему как к соратнику, а не как к оракулу, он действительно может продвигать программы вперед. А если относиться к нему как к оракулу… ну, тогда вы можете снова пойти по следам GPS в озеро. 🚗🌊
Часто задаваемые вопросы
Какова роль генеративного искусственного интеллекта в разработке лекарств?
Генеративный ИИ в первую очередь расширяет воронку идей на ранних этапах исследований и оптимизации потенциальных лекарственных препаратов, предлагая молекулы-кандидаты, последовательности белков, пути синтеза и биологические гипотезы. Его ценность заключается не столько в «замене экспериментов», сколько в «выборе лучших экспериментов» путем генерации множества вариантов и последующей тщательной фильтрации. Он лучше всего работает как ускоритель в рамках дисциплинированного рабочего процесса, а не как самостоятельный инструмент принятия решений.
В каких областях процесса разработки лекарств генеративный ИИ показывает наилучшие результаты?
Как правило, он приносит наибольшую пользу там, где пространство гипотез огромно, а итерации обходятся дорого, например, при выявлении потенциальных кандидатов, разработке новых препаратов и оптимизации ведущих соединений. Команды также используют его для сортировки ADMET-маркеров, предоставления рекомендаций по ретроспективному анализу и поддержки литературы или гипотез. Наибольший выигрыш обычно достигается за счет интеграции генерации с фильтрами, оценкой и экспертной оценкой, а не за счет ожидания, что одна модель будет «умной»
Как установить ограничения, чтобы генеративные модели не создавали бесполезные молекулы?
Практический подход заключается в определении ограничений до генерации: диапазоны свойств (например, растворимость или целевые значения logP), правила для каркаса или субструктуры, особенности сайтов связывания и ограничения новизны. Затем применяются фильтры медицинской химии (включая PAINS/реактивные группы) и проверки синтезируемости. Генерация с учетом ограничений особенно полезна при диффузионном молекулярном дизайне и в таких системах, как REINVENT 4, где можно кодировать многоцелевые задачи.
Как командам следует проверять результаты работы GenAI, чтобы избежать иллюзий и чрезмерной самоуверенности?
Рассматривайте каждый результат как гипотезу, а не как вывод, и подтверждайте его с помощью анализов и ортогональных моделей. Сочетайте генерацию с агрессивной фильтрацией, докингом или оценкой, где это уместно, и проверками применимости для предикторов в стиле QSAR. По возможности делайте неопределенность видимой, поскольку модели могут быть заведомо неверны в отношении химических реакций, выходящих за пределы распределения, или сомнительных биологических утверждений. Контроль со стороны человека остается ключевым элементом обеспечения безопасности.
Как предотвратить утечку данных, риски, связанные с интеллектуальной собственностью, и «запоминание» результатов?
Используйте механизмы управления и контроля доступа, чтобы конфиденциальные данные программы не попадали случайно в подсказки, и регистрируйте подсказки/результаты для аудита. Внедряйте проверки на новизну и сходство, чтобы сгенерированные кандидаты не были слишком близки к известным соединениям или защищенным регионам. Соблюдайте четкие правила относительно того, какие данные разрешены во внешних системах, и отдавайте предпочтение контролируемым средам для работы с конфиденциальной информацией. Человеческий контроль помогает выявлять «слишком знакомые» предложения на ранней стадии.
Как генеративный ИИ используется для оптимизации лидов и многопараметрической настройки?
В оптимизации потенциальных лекарственных препаратов генеративный ИИ ценен тем, что может предлагать несколько компромиссных решений вместо погони за одним «идеальным» соединением. Типичные рабочие процессы включают в себя предложение аналогов, направленное сканирование заместителей и переход между структурами, когда ограничения по эффективности, токсичности или интеллектуальной собственности препятствуют прогрессу. Прогнозирование свойств может быть ненадежным, поэтому команды обычно ранжируют кандидатов с помощью нескольких моделей, а затем экспериментально подтверждают лучшие варианты.
Может ли генеративный искусственный интеллект помочь и в разработке биопрепаратов, и в белковой инженерии?
Да, команды используют его для генерации последовательностей антител, разработки идей по улучшению аффинности, повышения стабильности, а также для исследования ферментов или пептидов. Генерация белков/последовательностей может выглядеть правдоподобной, но не быть пригодной для разработки, поэтому важно применять фильтры, учитывающие возможность разработки, иммуногенность и технологичность производства. Структурные инструменты, такие как AlphaFold, могут помочь в рассуждениях, но «правдоподобная структура» все еще не является доказательством экспрессии, функции или безопасности. Эксперименты в лабораторных условиях остаются необходимыми.
Каким образом генеративный ИИ поддерживает планирование синтеза и ретросинтез?
Специалисты по планированию ретросинтеза могут предлагать маршруты, исходные материалы и ранжировать маршруты, чтобы ускорить процесс генерации идей и быстро отсеять нецелесообразные пути. Инструменты и подходы, подобные планированию в стиле AiZynthFinder, наиболее эффективны в сочетании с проверками осуществимости в реальных условиях, проводимыми химиками. Доступность, безопасность, ограничения масштабирования и «бумажные реакции», которые терпят неудачу на практике, по-прежнему требуют оценки человеческого фактора. При таком подходе экономится время, не создавая впечатления, что проблема в химии решена.
Ссылки
-
Nature - Обзор открытия лигандов (2023) - nature.com
-
Nature Biotechnology - GENTRL (2019) - nature.com
-
Nature - AlphaFold (2021) - nature.com
-
Nature - RFdiffusion (2023) - nature.com
-
Nature Biotechnology - ProteinGenerator (2024) - nature.com
-
Nature Communications - Эффекты пакетной обработки в клеточной визуализации (2024) - nature.com
-
npj Цифровая медицина - Галлюцинации + концепция безопасности (2025) - nature.com
-
npj Цифровая медицина - Мультимодальный подход в биотехнологиях (2025) - nature.com
-
Наука - ProteinMPNN (2022) - science.org
-
Клеточные паттерны - LLM в разработке лекарств (2025) - cell.com
-
ScienceDirect (Elsevier) - Генеративные модели в разработке лекарств de novo (2024) - sciencedirect.com
-
ScienceDirect (Elsevier) - Фогт (2023): проблемы новизны/уникальности - sciencedirect.com
-
Анализ медицинских изображений (ScienceDirect) - Мультимодальный ИИ в медицине (2025) - sciencedirect.com
-
PubMed Central - Руководство для врачей (риск галлюцинаций) - nih.gov
-
Отчеты о химических исследованиях (издательство ACS) - Химическое пространство (2015) - acs.org
-
PubMed Central - Ирвин и Шоичет (2009): масштаб химического пространства - nih.gov
-
Frontiers in Drug Discovery (PubMed Central) - Обзор (2024) - nih.gov
-
Журнал химической информации и моделирования (издательство ACS) - Диффузионные модели в разработке новых лекарственных препаратов (2024) - acs.org
-
PubMed Central - REINVENT 4 (открытая платформа) - nih.gov
-
PubMed Central - ADMETlab 2.0 (важные аспекты ADMET на ранних этапах) - nih.gov
-
ОЭСР — Принципы валидации моделей (Q)SAR в целях регулирования — oecd.org
-
ОЭСР — Руководство по валидации моделей (Q)SAR — oecd.org
-
Отчеты о химических исследованиях (издательство ACS) - Компьютерное планирование синтеза / CASP (Коли, 2018) - acs.org
-
ACS Central Science (ACS Publications) - Компьютерная ретросинтеза (Коли, 2017) - acs.org
-
PubMed Central - AiZynthFinder (2020) - nih.gov
-
PubMed - Липинский: Правило 5 контекст - nih.gov
-
Журнал медицинской химии (издательство ACS) - Baell & Holloway (2010): Боль - acs.org
-
PubMed - Waring (2015): attrition - nih.gov
-
PubMed - Ривз (2021): модели белкового языка - nih.gov
-
PubMed Central - Leek et al. (2010): эффекты партии - nih.gov
-
PubMed Central - Обзор диффузии (2025) - nih.gov
-
FDA - E14 и S7B: клиническая и доклиническая оценка удлинения интервала QT/QTc и проаритмического потенциала (вопросы и ответы) - fda.gov
-
Европейское агентство по лекарственным средствам - Обзор руководства ICH E14/S7B - europa.eu
-
USENIX - Carlini et al. (2021): извлечение обучающих данных из языковых моделей - usenix.org
-
Эдинбургский университет – Служба цифровых исследований – Электронный лабораторный журнал (ELN) – ed.ac.uk
-
ScienceDirect (Elsevier) - Уивер (2008): Область применения QSAR - sciencedirect.com