با این مدل، پژوهشگران ممکن است قادر به کشف داروهای آنتی‌بادی باشند که بتوانند دامنه وسیعی از بیماری‌های عفونی را هدف قرار دهند.

پژوهشگران پیشرفت‌های قابل توجهی در پیش‌بینی ساختار یک پروتئین از توالی آن با استفاده از مدل‌های هوش مصنوعی به نام مدل‌های زبانی بزرگ کرده‌اند. با این حال، به کارگیری این رویکرد برای آنتی‌بادی‌ها دشوارتر بوده است، به طور عمده به دلیل درجه بالای تنوع ذاتی در این پروتئین‌ها است.

برای غلبه بر این محدودیت، محققان MIT یک روش محاسباتی توسعه داده‌اند که به مدل‌های زبانی بزرگ اجازه می‌دهد ساختارهای آنتی‌بادی را با دقت بیشتری پیش‌بینی کنند. این کار می‌تواند به محققان کمک کند تا از میان میلیون‌ها آنتی‌بادی ممکن، آن‌هایی که می‌توانند برای درمان SARSCoV-2 و سایر بیماری‌های عفونی استفاده شوند را شناسایی کنند.

 

سارس-CoV-2، ویروسی است که مسئول بیماری COVID-19 می‌باشد.  این ویروس به خانواده‌ ویروس‌های کرونا تعلق دارد و برای اولین بار در دسامبر ۲۰۱۹ در ووهان چین شناسایی شد.

بونی برگر، استاد ریاضیات و رئیس گروه محاسبات و بیولوژی در آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) و یکی از نویسندگان ارشد این مطالعه، می‌گوید: «روش ما به ما اجازه می‌دهد که مقیاس‌پذیری داشته باشیم، در حالی که دیگران این کار را نمی‌توانند، به حدی که می‌توانیم واقعاً چند سوزن را در کاه پیدا کنیم.

اگر بتوانیم به جلوگیری از ورود شرکت‌های دارویی به آزمایش‌های بالینی با چیزی نادرست کمک کنیم، این می‌تواند صرفه‌جویی زیادی در هزینه‌ها داشته باشد.»

این تکنیک، که بر مدل‌سازی نواحی ابرمتغیر آنتی‌بادی‌ها متمرکز است، پتانسیل تحلیل کل مجموعه‌های آنتی‌بادی از افراد را نیز دارد. این می‌تواند برای مطالعه پاسخ ایمنی افرادی که به بیماری‌هایی مانند HIV بسیار خوب واکنش نشان می‌دهند مفید باشد، تا کمک کند بفهمیم چرا آنتی‌بادی‌های آن‌ها به طور موثر ویروس را دفع می‌کنند.

برایان برایسون، استاد asociado مهندسی بیولوژیکی در MIT و عضو موسسه راگون در MGH، MIT و هاروارد، همچنین نویسنده ارشد مقاله‌ای است که به‌تازگی در *Proceedings of the National Academy of Sciences* منتشر شده است.

روهیت سینگ، دانشمند پیشین تحقیقات CSAIL که اکنون استاد کمکی آمار زیستی، بیوانفورماتیک و زیست‌شناسی سلولی در دانشگاه دوک است و چیهو ایم ’22، نویسندگان اصلی این مقاله هستند. محققانی از شرکت سانوفی و ETH زوریخ نیز در این تحقیق همکاری کردند.

 

مدل‌سازی هایپر واری

پروتئین‌ها از زنجیره‌های بلند اسیدهای آمینه تشکیل شده‌اند که می‌توانند به تعداد بسیار زیادی از ساختارهای ممکن تا شده شوند. در سال‌های اخیر، پیش‌بینی این ساختارها با استفاده از برنامه‌های هوش مصنوعی مانند AlphaFold بسیار آسان‌تر شده است.

بسیاری از این برنامه‌ها، مانند ESMFold و OmegaFold، بر اساس مدل‌های زبانی بزرگ ساخته شده‌اند که در اصل برای تحلیل مقادیر وسیع متن توسعه پیدا کرده‌اند و به این ترتیب می‌توانند یاد بگیرند که کلمه بعدی در یک توالی چیست.

 

این رویکرد می‌تواند برای توالی‌های پروتئینی نیز کار کند – با یادگیری اینکه کدام ساختارهای پروتئینی با الگوهای مختلف اسیدهای آمینه بیشتر احتمال دارد شکل بگیرند.

اما این تکنیک همیشه روی آنتی‌بادی‌ها موثر نیست، به‌ویژه روی بخشی از آنتی‌بادی که به آن منطقه هایپرمتغیر گفته می‌شود.

آنتی‌بادی‌ها معمولاً دارای ساختار Y شکل هستند و این مناطق هایپرمتغیر در نوک‌های Y قرار دارند، جایی که آنها پروتئین‌های خارجی یا همان آنتی‌ژن‌ها را شناسایی و به آنها متصل می‌شوند. قسمت پایینی Y حمایت ساختاری را فراهم می‌کند و به آنتی‌بادی‌ها کمک می‌کند تا با سلول‌های ایمنی تعامل داشته باشند.

مناطق هایپرمتغیر در طول متفاوت هستند اما معمولاً کمتر از ۴۰ اسید آمینه دارند. تخمین زده شده‌است که سیستم ایمنی انسان می‌تواند تا ۱ کوینتیلیون آنتی‌بادی مختلف تولید کند با تغییر توالی این اسیدهای آمینه، که به بدن کمک می‌کند تا به تنوع عظیمی از آنتی‌ژن‌های بالقوه پاسخ دهد.

 

کوینتیلیون (quintillion) یک عدد بزرگ است که معادل \(10^{18}\) یا ۱۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰ است. در سیستم عددی آمریکایی، کوینتیلیون بعد از کوادریلیون می‌آید. برای بهتر درک کردن، می‌توان به این شکل نوشت:

۱ کوینتیلیون = ۱۰۰۰ کوادریلیون

آن توالی‌ها به‌طور تکاملی تحت constrains مشابه با سایر توالی‌های پروتئینی نیستند، بنابراین برای مدل‌های زبانی بزرگ دشوار است که یاد بگیرند چگونه ساختارهای آنها را به‌دقت پیش‌بینی کنند.

“قسمتی از دلیلی که مدل‌های زبانی می‌توانند ساختار پروتئین‌ها را به خوبی پیش‌بینی کنند این است که تکامل این توالی‌ها را به‌نحو‌هایی محدود می‌کند که مدل می‌تواند بفهمد آن محدودیت‌ها چه معنایی دارند” ، سینگ می‌گوید. “این شبیه به یادگیری قواعد گرامر با نگاه کردن به زمینه کلمات در یک جمله است که به شما امکان می‌دهد بفهمید چه معنا دارد.”

 

برای مدل‌سازی این نواحی هایپرمتغیر، پژوهشگران دو ماژول ایجاد کردند که بر اساس مدل‌های زبانی موجود پروتئین ساخته شده‌اند.

یکی از این ماژول‌ها بر روی توالی‌های هایپرمتغیر حدود ۳۰۰۰ ساختار آنتی‌بادی موجود در بانک داده‌های پروتئین (PDB) آموزش دیده است، به این ترتیب که یاد بگیرد کدام توالی‌ها تمایل دارند ساختارهای مشابه تولید کنند.

ماژول دیگر بر روی داده‌هایی که حدود ۳۷۰۰ توالی آنتی‌بادی را با قدرت اتصال آن‌ها به سه آنتی‌ژن مختلف همبستگی می‌دهد، آموزش دیده است.

مدل محاسباتی resulting، که به عنوان AbMap شناخته می‌شود، قادر است ساختارهای آنتی‌بادی و قدرت اتصال آن‌ها را بر اساس توالی‌های اسید آمینه آن‌ها پیش‌بینی کند. برای نشان دادن کارآیی این مدل، پژوهشگران از آن برای پیش‌بینی ساختار آنتی‌بادی‌هایی که به شدت پروتئین اسپایک ویروس SARS-CoV-2 را خنثی می‌کنند، استفاده کردند.

پژوهشگران با مجموعه‌ای از آنتی‌بادی‌هایی که پیش‌بینی شده بودند به این هدف متصل شوند، شروع کردند و سپس میلیون‌ها واریانت با تغییر نواحی هایپرمتغیر تولید کردند. مدل آن‌ها توانست ساختارهای آنتی‌بادی را که بیشترین موفقیت را خواهند داشت، با دقت بیشتری نسبت به مدل‌های ساختاری پروتئین سنتی که بر اساس مدل‌های زبانی بزرگ هستند، شناسایی کند.

سپس، محققان گام اضافی‌تری برداشتند و آنتی‌بادی‌ها را به گروه‌هایی با ساختارهای مشابه تقسیم‌بندی کردند.

آن‌ها آنتی‌بادی‌هایی را از هر یک از این خوشه‌ها انتخاب کردند تا به‌صورت تجربی آزمایش کنند و با محققان سنوفی همکاری کردند. نتایج این آزمایش‌ها نشان داد که ۸۲ درصد از این آنتی‌بادی‌ها قدرت پیوند بهتری نسبت به آنتی‌بادی‌های اولیه‌ای که به مدل افزوده شده بودند، داشتند.

شناسایی تنوعی از کاندیداهای خوب در اوایل فرآیند توسعه می‌تواند به شرکت‌های دارویی کمک کند تا از صرف هزینه‌های زیاد برای آزمایش کاندیداهایی که در مراحل بعدی شکست می‌خورند، اجتناب کنند، به گفته محققان.

 

سینگ می‌گوید: «آنها نمی‌خواهند همه تخم‌هایشان را در یک سبد بگذارند. آنها نمی خواهند بگویند، من این یک آنتی بادی را می گیرم و آن را از طریق آزمایشات بالینی مصرف می کنم، و سپس معلوم می شود که سمی است. آن‌ها ترجیح می‌دهند مجموعه‌ای از امکانات خوب داشته باشند و همه آن‌ها را پیش ببرند، تا در صورت اشتباه، چند انتخاب داشته باشند.»

مقایسه آنتی‌بادی‌ها

با استفاده از این تکنیک، پژوهشگران می‌توانند به برخی سوالات دیرینه درباره اینکه چرا واکنش افراد به عفونت متفاوت است، پاسخ دهند. به عنوان مثال، چرا برخی افراد اشکال شدیدتری از کووید را تجربه می‌کنند و چرا برخی از افرادی که در معرض HIV قرار می‌گیرند، هرگز آلوده نمی‌شوند؟

دانشمندان سعی کرده‌اند به این سوالات پاسخ دهند با انجام توالی‌یابی RNA تک‌سلولی از سلول‌های ایمنی افراد و مقایسه آن‌ها—پروسه‌ای که به عنوان تجزیه و تحلیل مجموعه آنتی‌بادی‌ها شناخته می‌شود. کارهای قبلی نشان داده‌اند که مجموعه آنتی‌بادی‌ها از دو فرد مختلف ممکن است تنها ۱۰ درصد همپوشانی داشته باشد.

با این حال، توالی‌یابی تصویری جامع از عملکرد آنتی‌بادی‌ها ارائه نمی‌دهد، زیرا دو آنتی‌بادی که توالی‌های متفاوتی دارند ممکن است ساختار و عملکرد مشابهی داشته باشند.

مدل جدید می‌تواند به حل این مشکل کمک کند با تولید سریع ساختارهای تمام آنتی‌بادی‌های موجود در یک فرد. در این مطالعه، پژوهشگران نشان دادند که وقتی ساختار مورد توجه قرار می‌گیرد، همپوشانی بین افراد بسیار بیشتر از ۱۰ درصدی است که در مقایسه‌های توالی مشاهده می‌شود.

آنها اکنون قصد دارند بیشتر بررسی کنند که این ساختارها چگونه می‌توانند به پاسخ کلی ایمنی بدن در برابر یک پاتوژن خاص کمک کنند.

سینگ می‌گوید: “این جاست که یک مدل زبانی به زیبایی جا می‌گیرد زیرا دارای مقیاس‌پذیری تحلیل‌های مبتنی بر توالی است، اما به دقت تحلیل‌های مبتنی بر ساختار نزدیک می‌شود.”

 

Reference

Revolutionizing Antibody Discovery: MIT’s AI Breakthrough

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *