اوراکلی برای پیش‌بینی تکامل تنظیم ژن —


زیست‌شناسان محاسباتی یک مدل شبکه عصبی ایجاد کرده‌اند که قادر به پیش‌بینی چگونگی تأثیر تغییرات توالی‌های DNA غیرکدکننده در مخمر بر بیان ژن است. آنها همچنین روشی منحصر به فرد برای نمایش این داده ها در دو بعد ابداع کردند، که درک تکامل گذشته و آینده توالی های غیر کدکننده در موجودات فراتر از مخمر را آسان می کند – و حتی الگوهای بیان ژن سفارشی را برای ژن درمانی و کاربردهای صنعتی طراحی می کنند.

علیرغم تعداد زیادی ژنی که هر سلول انسانی حاوی آن است، این توالی‌های DNA به اصطلاح «کدکننده» تنها 1 درصد از کل ژنوم ما را تشکیل می‌دهند. 99 درصد باقیمانده از DNA “غیر کد کننده” تشکیل شده است — که بر خلاف DNA کد کننده، دستورالعمل ساخت پروتئین را ندارد.

یکی از عملکردهای حیاتی این DNA غیرکدکننده، که به آن DNA “تنظیمی” نیز می‌گویند، کمک به روشن و خاموش کردن ژن‌ها و کنترل مقدار (در صورت وجود) پروتئین است. با گذشت زمان، زمانی که سلول‌ها DNA خود را برای رشد و تقسیم تکثیر می‌کنند، جهش‌ها اغلب در این مناطق غیر کدکننده ظاهر می‌شوند – گاهی اوقات عملکرد آنها را تغییر می‌دهند و نحوه کنترل بیان ژن را تغییر می‌دهند. بسیاری از این جهش ها بی اهمیت هستند و برخی حتی سودمند هستند. با این حال، گاهی اوقات، آنها می توانند با افزایش خطر ابتلا به بیماری های رایج، مانند دیابت نوع 2، یا موارد تهدید کننده زندگی، از جمله سرطان، مرتبط باشند.

برای درک بهتر پیامدهای چنین جهش‌هایی، محققان به سختی روی نقشه‌های ریاضی کار کرده‌اند که به آنها اجازه می‌دهد به ژنوم یک موجود زنده نگاه کنند، پیش‌بینی کنند که کدام ژن بیان می‌شود، و تعیین کنند که این بیان چگونه بر ویژگی‌های قابل مشاهده ارگانیسم تأثیر می‌گذارد. این نقشه‌ها، که مناظر تناسب اندام نامیده می‌شوند، تقریباً یک قرن پیش مفهوم‌سازی شدند تا بفهمند که چگونه ترکیب ژنتیکی بر یک معیار رایج تناسب اندام به ویژه تأثیر می‌گذارد: موفقیت باروری. مناظر اولیه تناسب اندام بسیار ساده بودند و اغلب بر تعداد محدودی جهش تمرکز می کردند. مجموعه داده های بسیار غنی تری در حال حاضر در دسترس هستند، اما محققان هنوز به ابزارهای اضافی برای توصیف و تجسم چنین داده های پیچیده ای نیاز دارند. این توانایی نه تنها درک بهتری از چگونگی تکامل ژن‌های فردی در طول زمان را تسهیل می‌کند، بلکه به پیش‌بینی تغییرات توالی و بیان ممکن در آینده نیز کمک می‌کند.

در یک مطالعه جدید منتشر شده در 9 مارس در طبیعت، تیمی از دانشمندان چارچوبی را برای مطالعه مناظر تناسب اندام DNA تنظیمی ایجاد کرده اند. آنها یک مدل شبکه عصبی ایجاد کردند که وقتی روی صدها میلیون اندازه‌گیری تجربی آموزش داده شد، می‌توانست پیش‌بینی کند که چگونه تغییرات در این توالی‌های غیرکدکننده در مخمر بر بیان ژن تأثیر می‌گذارد. آنها همچنین روشی منحصربفرد برای نمایش مناظر در دو بعد ابداع کردند که درک گذشته و پیش‌بینی تکامل آینده توالی‌های غیرکدکننده در موجودات فراتر از مخمر را آسان می‌کند – و حتی الگوهای بیان ژن سفارشی را برای ژن درمانی و کاربردهای صنعتی طراحی می‌کنند. .

ما اکنون یک «اوراکل» داریم که می‌توان از آن سؤال کرد: اگر همه جهش‌های ممکن این دنباله را امتحان کنیم، چه می‌شود؟ یا، چه دنباله جدیدی باید طراحی کنیم تا بیان دلخواه را به ما بدهد؟» Aviv Regev، استاد زیست شناسی در MIT (در مرخصی)، عضو اصلی موسسه Broad از هاروارد و MIT (در مرخصی)، رئیس تحقیقات Genentech و توسعه اولیه، و نویسنده ارشد این مطالعه می گوید. دانشمندان اکنون می‌توانند از این مدل برای سؤال یا سناریوی تکاملی خود و برای مشکلات دیگر مانند ساخت توالی‌هایی که بیان ژن را به روش‌های دلخواه کنترل می‌کنند، استفاده کنند. من همچنین در مورد احتمالات محققان یادگیری ماشینی علاقه‌مند به تفسیرپذیری هیجان‌زده هستم؛ آنها می‌توانند سؤالات خود را بپرسند. برعکس، برای درک بهتر زیست شناسی زیربنایی.”

قبل از این مطالعه، بسیاری از محققان به سادگی مدل های خود را بر روی جهش های شناخته شده (یا تغییرات جزئی آن) که در طبیعت وجود دارد آموزش داده بودند. با این حال، تیم Regev می خواست با ایجاد مدل های بی طرفانه خود که قادر به پیش بینی تناسب اندام و بیان ژن یک ارگانیسم بر اساس هر توالی DNA ممکن است – حتی توالی هایی که قبلاً هرگز ندیده بودند – یک قدم فراتر بروند. این همچنین محققان را قادر می سازد تا از چنین مدل هایی برای مهندسی سلول ها برای اهداف دارویی، از جمله درمان های جدید برای سرطان و اختلالات خود ایمنی استفاده کنند.

برای دستیابی به این هدف، Eeshit Dhaval Vaishnav، دانشجوی کارشناسی ارشد MIT و نویسنده اول، Carl de Boer، اکنون استادیار دانشگاه بریتیش کلمبیا، و همکارانشان یک مدل شبکه عصبی برای پیش‌بینی بیان ژن ایجاد کردند. آنها آن را بر روی مجموعه داده ای آموزش دادند که با قرار دادن میلیون ها توالی DNA کاملا تصادفی غیر کدکننده در مخمر ایجاد شده بود و مشاهده کردند که چگونه هر توالی تصادفی بر بیان ژن تأثیر می گذارد. آنها بر روی زیرمجموعه خاصی از توالی های DNA غیر کدکننده به نام پروموترها تمرکز کردند که به عنوان محل اتصال پروتئین ها عمل می کنند که می توانند ژن های مجاور را روشن یا خاموش کنند.

رجو می‌گوید: «این کار نشان می‌دهد که وقتی انواع جدیدی از آزمایش‌ها را برای تولید داده‌های مناسب برای آموزش مدل‌ها طراحی می‌کنیم، چه فرصت‌هایی را به وجود می‌آورند. “در مفهوم گسترده تر، من معتقدم این نوع رویکردها برای بسیاری از مشکلات مهم خواهند بود – مانند درک انواع ژنتیکی در مناطق نظارتی که خطر بیماری را در ژنوم انسان ایجاد می کنند، اما همچنین برای پیش بینی تاثیر ترکیبی از جهش ها یا طراحی جدید. مولکول ها.”

رجو، وایشناو، دو بوئر و نویسندگان همکارشان در ادامه توانایی‌های پیش‌بینی مدل خود را به روش‌های مختلف آزمایش کردند تا نشان دهند چگونه می‌تواند به ابهام‌زدایی از گذشته تکاملی – و آینده احتمالی – مروجین خاص کمک کند. وایشناو توضیح می دهد: «ایجاد یک مدل دقیق مطمئناً یک دستاورد بود، اما، برای من، این فقط یک نقطه شروع بود.

ابتدا، برای تعیین اینکه آیا مدل آنها می‌تواند به کاربردهای زیست‌شناسی مصنوعی مانند تولید آنتی‌بیوتیک‌ها، آنزیم‌ها و غذا کمک کند یا خیر، محققان استفاده از آن را برای طراحی مروج‌هایی که می‌توانند سطوح بیان دلخواه را برای هر ژن مورد علاقه ایجاد کنند، تمرین کردند. آنها سپس سایر مقالات علمی را بررسی کردند تا سؤالات اساسی تکاملی را شناسایی کنند تا ببینند آیا مدل آنها می تواند به آنها پاسخ دهد یا خیر. این تیم حتی تا آنجا پیش رفت که به مدل خود مجموعه ای از داده های جمعیتی دنیای واقعی را از یک مطالعه موجود، که حاوی اطلاعات ژنتیکی از گونه های مخمر در سراسر جهان بود، ارائه داد. با انجام این کار، آنها توانستند هزاران سال فشارهای انتخابی گذشته را که ژنوم مخمرهای امروزی را تراشیده است، ترسیم کنند.

اما، به منظور ایجاد ابزار قدرتمندی که بتواند هر ژنومی را کاوش کند، محققان می‌دانستند که باید راهی برای پیش‌بینی تکامل توالی‌های غیرکدکننده حتی بدون چنین مجموعه داده‌های جمعیتی جامعی بیابند. برای پرداختن به این هدف، Vaishnav و همکارانش یک تکنیک محاسباتی ابداع کردند که به آنها اجازه می‌دهد پیش‌بینی‌ها را از چارچوب خود بر روی یک نمودار دو بعدی ترسیم کنند. این به آنها کمک کرد تا به روشی بسیار ساده نشان دهند که چگونه هر توالی DNA غیر کدکننده بر بیان و تناسب ژن تأثیر می گذارد، بدون اینکه نیازی به انجام آزمایش های وقت گیر در آزمایشگاه باشد.

وایشناو توضیح می‌دهد: «یکی از مشکلات حل‌نشده در مناظر تناسب اندام این بود که ما رویکردی برای تجسم آن‌ها به گونه‌ای نداشتیم که به طور معناداری ویژگی‌های تکاملی توالی‌ها را به تصویر بکشد. “من واقعاً می خواستم راهی برای پر کردن این شکاف پیدا کنم و به چشم انداز دیرینه ایجاد یک چشم انداز تناسب اندام کامل کمک کنم.”

مارتین تیلور، استاد ژنتیک در واحد ژنتیک انسانی شورای تحقیقات پزشکی دانشگاه ادینبورگ که در این تحقیق شرکت نداشت، می‌گوید این مطالعه نشان می‌دهد که هوش مصنوعی نه تنها می‌تواند تأثیر تغییرات تنظیم‌کننده DNA را پیش‌بینی کند، بلکه اصول اساسی را نیز آشکار می‌کند. که میلیون ها سال تکامل را اداره می کند.

علیرغم این واقعیت که این مدل فقط بر روی کسری از DNA تنظیم کننده مخمر در چند شرایط رشد آموزش دیده است، او تحت تأثیر قرار گرفته است که می تواند چنین پیش بینی های مفیدی در مورد تکامل تنظیم ژن در پستانداران انجام دهد.

او توضیح می‌دهد: «کاربردهای کوتاه‌مدت آشکاری مانند طراحی سفارشی DNA تنظیم‌کننده مخمر در آب‌جوسازی، پخت و بیوتکنولوژی وجود دارد. “اما گسترش این کار همچنین می تواند به شناسایی جهش های بیماری در DNA تنظیم کننده انسان کمک کند که در حال حاضر یافتن آنها دشوار است و تا حد زیادی در کلینیک نادیده گرفته می شود. این کار نشان می دهد آینده روشنی برای مدل های هوش مصنوعی تنظیم ژن وجود دارد که بر روی غنی تر و پیچیده تر آموزش داده شده اند. و مجموعه داده های متنوع تر.”

حتی قبل از انتشار رسمی این مطالعه، Vaishnav شروع به دریافت پرس و جو از سایر محققان کرد که امیدوار بودند از این مدل برای ابداع توالی‌های DNA غیر کدکننده برای استفاده در ژن درمانی استفاده کنند.

وایشناو می گوید: «مردم دهه ها است که در حال مطالعه تکامل مقرراتی و مناظر تناسب اندام هستند. “من فکر می کنم چارچوب ما راه طولانی را در پاسخ به سوالات اساسی و باز در مورد تکامل و تکامل DNA تنظیم کننده ژن پیش خواهد برد – و حتی به ما کمک می کند تا توالی های بیولوژیکی را برای کاربردهای جدید هیجان انگیز طراحی کنیم.”