جایزه تحقیقات پزشکی پایه لاسکر امسال به دمیس هاسابیس و جان جامپر به خاطر مشارکتشان در ایجاد سیستم هوش مصنوعی AlphaFold که ساختار سهبعدی پروتئینها را بر اساس توالی مرتبه اول اسیدهای آمینه پیشبینی میکند، اهدا شد.
نتایج آنها مشکلی را که مدتهاست جامعه علمی را آزار داده است، حل میکند و دری را برای تسریع تحقیقات در حوزه زیستپزشکی میگشاید. پروتئینها نقش محوری در توسعه بیماری دارند: در بیماری آلزایمر، آنها تا میخورند و به هم میچسبند؛ در سرطان، عملکرد تنظیمی آنها از بین میرود؛ در اختلالات متابولیک مادرزادی، آنها ناکارآمد هستند؛ در فیبروز کیستیک، آنها به فضای اشتباهی در سلول میروند. اینها تنها چند مورد از مکانیسمهای زیادی هستند که باعث بیماری میشوند. مدلهای دقیق ساختار پروتئین میتوانند پیکربندیهای اتمی را ارائه دهند، طراحی یا انتخاب مولکولهای با میل ترکیبی بالا را هدایت کنند و کشف دارو را تسریع بخشند.
ساختارهای پروتئین عموماً توسط کریستالوگرافی اشعه ایکس، رزونانس مغناطیسی هستهای و میکروسکوپ الکترونی کرایو تعیین میشوند. این روشها گران و زمانبر هستند. این امر منجر به پایگاههای داده ساختار پروتئین سهبعدی موجود با تنها حدود ۲۰۰۰۰۰ داده ساختاری میشود، در حالی که فناوری توالییابی DNA بیش از ۸ میلیون توالی پروتئین تولید کرده است. در دهه ۱۹۶۰، آنفینسن و همکارانش کشف کردند که توالی تکبعدی اسیدهای آمینه میتواند به طور خودبهخودی و مکرر به یک ترکیب سهبعدی عملکردی تبدیل شود (شکل ۱A) و اینکه «چاپرونهای» مولکولی میتوانند این فرآیند را تسریع و تسهیل کنند. این مشاهدات منجر به یک چالش ۶۰ ساله در زیستشناسی مولکولی میشود: پیشبینی ساختار سهبعدی پروتئینها از توالی تکبعدی اسیدهای آمینه. با موفقیت پروژه ژنوم انسان، توانایی ما در به دست آوردن توالیهای تکبعدی اسید آمینه تا حد زیادی بهبود یافته است و این چالش حتی ضروریتر شده است.
پیشبینی ساختارهای پروتئین به چند دلیل دشوار است. اول، تمام موقعیتهای سهبعدی ممکن برای هر اتم در هر اسید آمینه نیاز به کاوش زیادی دارد. دوم، پروتئینها حداکثر استفاده را از مکمل بودن در ساختار شیمیایی خود میکنند تا اتمها را به طور مؤثر پیکربندی کنند. از آنجایی که پروتئینها معمولاً صدها "دهنده" پیوند هیدروژنی (معمولاً اکسیژن) دارند که باید نزدیک به "گیرنده" پیوند هیدروژنی (معمولاً نیتروژن متصل به هیدروژن) باشند، یافتن صورتبندیهایی که تقریباً هر دهنده نزدیک به گیرنده باشد، میتواند بسیار دشوار باشد. سوم، نمونههای محدودی برای آموزش روشهای تجربی وجود دارد، بنابراین لازم است که برهمکنشهای سهبعدی بالقوه بین اسیدهای آمینه بر اساس توالیهای تکبعدی با استفاده از اطلاعات مربوط به تکامل پروتئینهای مربوطه درک شود.
فیزیک برای اولین بار برای مدلسازی برهمکنش اتمها در جستجوی بهترین ترکیببندی استفاده شد و روشی برای پیشبینی ساختار پروتئینها توسعه داده شد. کارپلاس، لویت و وارشل به خاطر کارشان در شبیهسازی محاسباتی پروتئینها، جایزه نوبل شیمی ۲۰۱۳ را دریافت کردند. با این حال، روشهای مبتنی بر فیزیک از نظر محاسباتی گران هستند و نیاز به پردازش تقریبی دارند، بنابراین نمیتوان ساختارهای سهبعدی دقیق را پیشبینی کرد. رویکرد «مبتنی بر دانش» دیگر، استفاده از پایگاههای داده ساختارها و توالیهای شناخته شده برای آموزش مدلها از طریق هوش مصنوعی و یادگیری ماشین (AI-ML) است. هاسابیس و جامپر عناصر فیزیک و هوش مصنوعی-یادگیری ماشین را به کار میگیرند، اما نوآوری و جهش در عملکرد این رویکرد عمدتاً از هوش مصنوعی-یادگیری ماشین ناشی میشود. این دو محقق به طور خلاقانه پایگاههای داده عمومی بزرگ را با منابع محاسباتی در سطح صنعتی ترکیب کردند تا AlphaFold را ایجاد کنند.
چگونه بفهمیم که آنها معمای پیشبینی ساختاری را «حل» کردهاند؟ در سال ۱۹۹۴، مسابقه ارزیابی انتقادی پیشبینی ساختار (CASP) تأسیس شد که هر دو سال یکبار برای پیگیری پیشرفت پیشبینی ساختاری برگزار میشود. محققان توالی تکبعدی پروتئینی را که ساختار آن را اخیراً حل کردهاند، اما نتایج آن هنوز منتشر نشده است، به اشتراک میگذارند. پیشبینیکننده با استفاده از این توالی تکبعدی، ساختار سهبعدی را پیشبینی میکند و ارزیاب بهطور مستقل کیفیت نتایج پیشبینیشده را با مقایسه آنها با ساختار سهبعدی ارائه شده توسط آزمایشگر (که فقط در اختیار ارزیاب قرار میگیرد) قضاوت میکند. CASP بررسیهای کور واقعی انجام میدهد و جهشهای عملکردی دورهای مرتبط با نوآوری روششناختی را ثبت میکند. در چهاردهمین کنفرانس CASP در سال ۲۰۲۰، نتایج پیشبینی AlphaFold چنان جهشی در عملکرد نشان داد که برگزارکنندگان اعلام کردند که مشکل پیشبینی ساختار سهبعدی حل شده است: دقت اکثر پیشبینیها نزدیک به اندازهگیریهای تجربی بود.
اهمیت گستردهتر این است که کار هسابیس و جامپر به طور قانعکنندهای نشان میدهد که چگونه هوش مصنوعی-یادگیری ماشین میتواند علم را متحول کند. تحقیقات این گروه نشان میدهد که هوش مصنوعی-یادگیری ماشین میتواند فرضیههای علمی پیچیدهای را از منابع داده متعدد بسازد، مکانیسمهای توجه (مشابه مکانیسمهای موجود در ChatGPT) میتوانند وابستگیها و همبستگیهای کلیدی را در منابع داده کشف کنند، و هوش مصنوعی-یادگیری ماشین میتواند کیفیت نتایج خروجی خود را خود قضاوت کند. هوش مصنوعی-یادگیری ماشین اساساً علمورزی میکند.
زمان ارسال: ۲۳ سپتامبر ۲۰۲۳




