با این مدل، پژوهشگران ممکن است قادر به کشف داروهای آنتیبادی باشند که بتوانند دامنه وسیعی از بیماریهای عفونی را هدف قرار دهند.
پژوهشگران پیشرفتهای قابل توجهی در پیشبینی ساختار یک پروتئین از توالی آن با استفاده از مدلهای هوش مصنوعی به نام مدلهای زبانی بزرگ کردهاند. با این حال، به کارگیری این رویکرد برای آنتیبادیها دشوارتر بوده است، به طور عمده به دلیل درجه بالای تنوع ذاتی در این پروتئینها است.
برای غلبه بر این محدودیت، محققان MIT یک روش محاسباتی توسعه دادهاند که به مدلهای زبانی بزرگ اجازه میدهد ساختارهای آنتیبادی را با دقت بیشتری پیشبینی کنند. این کار میتواند به محققان کمک کند تا از میان میلیونها آنتیبادی ممکن، آنهایی که میتوانند برای درمان SARS–CoV-2 و سایر بیماریهای عفونی استفاده شوند را شناسایی کنند.
سارس-CoV-2، ویروسی است که مسئول بیماری COVID-19 میباشد. این ویروس به خانواده ویروسهای کرونا تعلق دارد و برای اولین بار در دسامبر ۲۰۱۹ در ووهان چین شناسایی شد.
بونی برگر، استاد ریاضیات و رئیس گروه محاسبات و بیولوژی در آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) و یکی از نویسندگان ارشد این مطالعه، میگوید: «روش ما به ما اجازه میدهد که مقیاسپذیری داشته باشیم، در حالی که دیگران این کار را نمیتوانند، به حدی که میتوانیم واقعاً چند سوزن را در کاه پیدا کنیم.
اگر بتوانیم به جلوگیری از ورود شرکتهای دارویی به آزمایشهای بالینی با چیزی نادرست کمک کنیم، این میتواند صرفهجویی زیادی در هزینهها داشته باشد.»
این تکنیک، که بر مدلسازی نواحی ابرمتغیر آنتیبادیها متمرکز است، پتانسیل تحلیل کل مجموعههای آنتیبادی از افراد را نیز دارد. این میتواند برای مطالعه پاسخ ایمنی افرادی که به بیماریهایی مانند HIV بسیار خوب واکنش نشان میدهند مفید باشد، تا کمک کند بفهمیم چرا آنتیبادیهای آنها به طور موثر ویروس را دفع میکنند.
برایان برایسون، استاد asociado مهندسی بیولوژیکی در MIT و عضو موسسه راگون در MGH، MIT و هاروارد، همچنین نویسنده ارشد مقالهای است که بهتازگی در *Proceedings of the National Academy of Sciences* منتشر شده است.
روهیت سینگ، دانشمند پیشین تحقیقات CSAIL که اکنون استاد کمکی آمار زیستی، بیوانفورماتیک و زیستشناسی سلولی در دانشگاه دوک است و چیهو ایم ’22، نویسندگان اصلی این مقاله هستند. محققانی از شرکت سانوفی و ETH زوریخ نیز در این تحقیق همکاری کردند.
مدلسازی هایپر واری
پروتئینها از زنجیرههای بلند اسیدهای آمینه تشکیل شدهاند که میتوانند به تعداد بسیار زیادی از ساختارهای ممکن تا شده شوند. در سالهای اخیر، پیشبینی این ساختارها با استفاده از برنامههای هوش مصنوعی مانند AlphaFold بسیار آسانتر شده است.
بسیاری از این برنامهها، مانند ESMFold و OmegaFold، بر اساس مدلهای زبانی بزرگ ساخته شدهاند که در اصل برای تحلیل مقادیر وسیع متن توسعه پیدا کردهاند و به این ترتیب میتوانند یاد بگیرند که کلمه بعدی در یک توالی چیست.
این رویکرد میتواند برای توالیهای پروتئینی نیز کار کند – با یادگیری اینکه کدام ساختارهای پروتئینی با الگوهای مختلف اسیدهای آمینه بیشتر احتمال دارد شکل بگیرند.
اما این تکنیک همیشه روی آنتیبادیها موثر نیست، بهویژه روی بخشی از آنتیبادی که به آن منطقه هایپرمتغیر گفته میشود.
آنتیبادیها معمولاً دارای ساختار Y شکل هستند و این مناطق هایپرمتغیر در نوکهای Y قرار دارند، جایی که آنها پروتئینهای خارجی یا همان آنتیژنها را شناسایی و به آنها متصل میشوند. قسمت پایینی Y حمایت ساختاری را فراهم میکند و به آنتیبادیها کمک میکند تا با سلولهای ایمنی تعامل داشته باشند.
مناطق هایپرمتغیر در طول متفاوت هستند اما معمولاً کمتر از ۴۰ اسید آمینه دارند. تخمین زده شدهاست که سیستم ایمنی انسان میتواند تا ۱ کوینتیلیون آنتیبادی مختلف تولید کند با تغییر توالی این اسیدهای آمینه، که به بدن کمک میکند تا به تنوع عظیمی از آنتیژنهای بالقوه پاسخ دهد.
کوینتیلیون (quintillion) یک عدد بزرگ است که معادل \(10^{18}\) یا ۱۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰ است. در سیستم عددی آمریکایی، کوینتیلیون بعد از کوادریلیون میآید. برای بهتر درک کردن، میتوان به این شکل نوشت:
۱ کوینتیلیون = ۱۰۰۰ کوادریلیون
آن توالیها بهطور تکاملی تحت constrains مشابه با سایر توالیهای پروتئینی نیستند، بنابراین برای مدلهای زبانی بزرگ دشوار است که یاد بگیرند چگونه ساختارهای آنها را بهدقت پیشبینی کنند.
“قسمتی از دلیلی که مدلهای زبانی میتوانند ساختار پروتئینها را به خوبی پیشبینی کنند این است که تکامل این توالیها را بهنحوهایی محدود میکند که مدل میتواند بفهمد آن محدودیتها چه معنایی دارند” ، سینگ میگوید. “این شبیه به یادگیری قواعد گرامر با نگاه کردن به زمینه کلمات در یک جمله است که به شما امکان میدهد بفهمید چه معنا دارد.”
برای مدلسازی این نواحی هایپرمتغیر، پژوهشگران دو ماژول ایجاد کردند که بر اساس مدلهای زبانی موجود پروتئین ساخته شدهاند.
یکی از این ماژولها بر روی توالیهای هایپرمتغیر حدود ۳۰۰۰ ساختار آنتیبادی موجود در بانک دادههای پروتئین (PDB) آموزش دیده است، به این ترتیب که یاد بگیرد کدام توالیها تمایل دارند ساختارهای مشابه تولید کنند.
ماژول دیگر بر روی دادههایی که حدود ۳۷۰۰ توالی آنتیبادی را با قدرت اتصال آنها به سه آنتیژن مختلف همبستگی میدهد، آموزش دیده است.
مدل محاسباتی resulting، که به عنوان AbMap شناخته میشود، قادر است ساختارهای آنتیبادی و قدرت اتصال آنها را بر اساس توالیهای اسید آمینه آنها پیشبینی کند. برای نشان دادن کارآیی این مدل، پژوهشگران از آن برای پیشبینی ساختار آنتیبادیهایی که به شدت پروتئین اسپایک ویروس SARS-CoV-2 را خنثی میکنند، استفاده کردند.
پژوهشگران با مجموعهای از آنتیبادیهایی که پیشبینی شده بودند به این هدف متصل شوند، شروع کردند و سپس میلیونها واریانت با تغییر نواحی هایپرمتغیر تولید کردند. مدل آنها توانست ساختارهای آنتیبادی را که بیشترین موفقیت را خواهند داشت، با دقت بیشتری نسبت به مدلهای ساختاری پروتئین سنتی که بر اساس مدلهای زبانی بزرگ هستند، شناسایی کند.
سپس، محققان گام اضافیتری برداشتند و آنتیبادیها را به گروههایی با ساختارهای مشابه تقسیمبندی کردند.
آنها آنتیبادیهایی را از هر یک از این خوشهها انتخاب کردند تا بهصورت تجربی آزمایش کنند و با محققان سنوفی همکاری کردند. نتایج این آزمایشها نشان داد که ۸۲ درصد از این آنتیبادیها قدرت پیوند بهتری نسبت به آنتیبادیهای اولیهای که به مدل افزوده شده بودند، داشتند.
شناسایی تنوعی از کاندیداهای خوب در اوایل فرآیند توسعه میتواند به شرکتهای دارویی کمک کند تا از صرف هزینههای زیاد برای آزمایش کاندیداهایی که در مراحل بعدی شکست میخورند، اجتناب کنند، به گفته محققان.
مقایسه آنتیبادیها
با استفاده از این تکنیک، پژوهشگران میتوانند به برخی سوالات دیرینه درباره اینکه چرا واکنش افراد به عفونت متفاوت است، پاسخ دهند. به عنوان مثال، چرا برخی افراد اشکال شدیدتری از کووید را تجربه میکنند و چرا برخی از افرادی که در معرض HIV قرار میگیرند، هرگز آلوده نمیشوند؟
دانشمندان سعی کردهاند به این سوالات پاسخ دهند با انجام توالییابی RNA تکسلولی از سلولهای ایمنی افراد و مقایسه آنها—پروسهای که به عنوان تجزیه و تحلیل مجموعه آنتیبادیها شناخته میشود. کارهای قبلی نشان دادهاند که مجموعه آنتیبادیها از دو فرد مختلف ممکن است تنها ۱۰ درصد همپوشانی داشته باشد.
با این حال، توالییابی تصویری جامع از عملکرد آنتیبادیها ارائه نمیدهد، زیرا دو آنتیبادی که توالیهای متفاوتی دارند ممکن است ساختار و عملکرد مشابهی داشته باشند.
مدل جدید میتواند به حل این مشکل کمک کند با تولید سریع ساختارهای تمام آنتیبادیهای موجود در یک فرد. در این مطالعه، پژوهشگران نشان دادند که وقتی ساختار مورد توجه قرار میگیرد، همپوشانی بین افراد بسیار بیشتر از ۱۰ درصدی است که در مقایسههای توالی مشاهده میشود.
آنها اکنون قصد دارند بیشتر بررسی کنند که این ساختارها چگونه میتوانند به پاسخ کلی ایمنی بدن در برابر یک پاتوژن خاص کمک کنند.
سینگ میگوید: “این جاست که یک مدل زبانی به زیبایی جا میگیرد زیرا دارای مقیاسپذیری تحلیلهای مبتنی بر توالی است، اما به دقت تحلیلهای مبتنی بر ساختار نزدیک میشود.”
Reference