Вся информация, необходимая для существования живых организмов, в зашифрованном виде, содержится в их геномной ДНК. Применительно к человеку это «текст», записанный четырьмя «буквами», длина которого около 3,1 миллиарда знаков. Сам текст (т.е. последовательность букв) вчерне известен уже около 25 лет, что в заголовках звучало как: «Расшифрован геном человека». Сейчас уже прочитаны и его наименее разборчивые участки. Но знание последовательности букв в тексте не равноценно пониманию его смысла. Смысл был понятен лишь приблизительно для 2% генома человека – той его части, которая кодирует белки (структурные последовательности).
Оставшиеся приблизительно 98% генома (неструктурные последовательности) первоначально были броско, но крайне неудачно названы «мусорной ДНК». Что и как закодировано в них?
Оказалось, что в неструктурных последовательностях закодировано множество регуляторных сигналов от координированного действия которых зависит когда и в какой степени включаются и выключаются различные генетические элементы. А это, в конечном итоге, обеспечивает всё, начиная с развития организма из двух слившихся половых клеток и заканчивая его старением и смертью.
Типов таких регуляторных последовательностей известно много. Долгое время знания о них пополнялись только экспериментально и в «индивидуальном порядке» - конкретные механизмы регуляции конкретного гена. С появлением нового поколения молекулярно-биологических ИИ инструментов, первою ласточкой среди которых была АльфаФолд (https://prof-afv.livejournal.com/87693.html), появились и «специализированные» ИИ инструменты, заточенные на определённые типы регуляторных последовательностей (например, PromoterAI ).
Но оставалось нерешённой задача «тотальной расшифровки» регуляторной информации в достаточно больших геномных текстах. Более того, ещё совсем недавно она казалась неразрешимой.
И вот эта задача решена, по крайней мере, в первом приближении. В препринте, опубликованном командой DeepMind (ИИ подразделение Google), представлен ИИ «расшифровщик» геномных регуляторных последовательностей AlphaGenome/АльфаГеном. Он (она?) может находить и интерпретировать регуляторные последовательности в фрагментах генома человека длиной до 1 миллиона нуклеотидов. Надежность предсказаний, судя по разнообразным проверкам с использованием последовательностей не входивших в программу обучения АльфаГеном, высокая, хотя пока и не 100%-ая (https://storage.googleapis.com/deepmind-media/papers/alphagenome.pdf ).
Для некоммерческого использования Альфа Геном доступен уже сейчас на сайте DeepMind. После публикации статьи будет раскрыт и его(её?) код.
ИИ революция продолжается!
Проф-АФВ
P.S. Некоторые из ранее опубликованных постов с полки «Искусственный Интеллект в биомедицине» (https://prof-afv.livejournal.com/142551.html ):
Высокоточное предсказание 3-D структуры белков по их аминокислотной последовательности (27-7-2021); https://prof-afv.livejournal.com/87693.html
Возможности Искусственного Интеллекта в медицине пока сильно преувеличены (13-1-2023); https://prof-afv.livejournal.com/136452.html
ИИ близок к тому, чтобы начать «подсиживать» докторов (17-1-2024); https://prof-afv.livejournal.com/184587.html
АльфаФолд научили предсказывать конформацию белков при их взаимодействии с другими молекулами (11-5-2024); https://prof-afv.livejournal.com/189724.html
АльфаФолд3 (предсказатель 3D-структуры белков "в объятиях" с другими молекулами) в открытом доступе (13-11-2024); https://prof-afv.livejournal.com/199462.html
EVO – первый ИИ-движимый «конструктор геномов» с почти универсальными «способностями» (17-11-2024); https://prof-afv.livejournal.com/199906.html
Новое высокоэффективное противоядие против яда кобры сконструировано ИИ (18-1-2025); https://prof-afv.livejournal.com/204372.html
Универсальный ИИ дизайнер и аналитик геномов EVO-2 (22-2-2025); https://prof-afv.livejournal.com/206211.html
Подробнее https://prof-afv.livejournal.com/212658.html?...