
Geneformer، مدل جدید هوش مصنوعی توسعه یافته توسط تئودوریس و همکارانش، می تواند در بسیاری از زمینه های زیست شناسی استفاده شود و به کشف اهداف دارویی احتمالی برای بیماری کمک کند. اعتبار: موسسه گلدستون
محققان موسسه گلادستون، موسسه برود MIT و هاروارد و موسسه سرطان دانا فاربر به هوش مصنوعی (AI) روی آورده اند تا به آنها کمک کنند تا بفهمند چگونه شبکه های بزرگ ژن های انسانی به هم پیوسته عملکرد سلول ها را کنترل می کنند و چگونه اختلالات در آن شبکه ها را کنترل می کنند. باعث بیماری شود
مدلهای زبان بزرگ، که بهعنوان مدلهای پایه نیز شناخته میشوند، سیستمهای هوش مصنوعی هستند که دانش بنیادی را از مقادیر انبوه دادههای عمومی میآموزند و سپس آن دانش را برای انجام وظایف جدید به کار میگیرند – فرآیندی به نام یادگیری انتقالی. این سیستمها اخیراً با انتشار ChatGPT، یک ربات چت که بر اساس مدلی از OpenAI ساخته شده است، توجه جریان اصلی را به خود جلب کردهاند.
در کار جدید، منتشر شده در مجله طبیعتدکتر کریستینا تئودوریس، دستیار محقق گلادستون، یک مدل پایه برای درک چگونگی تعامل ژن ها ایجاد کرد. مدل جدید که Geneformer نام دارد، از مقادیر انبوهی از دادهها در مورد تعاملات ژنی از طیف گستردهای از بافتهای انسانی یاد میگیرد و این دانش را برای پیشبینی در مورد اینکه چگونه ممکن است در بیماریها اشتباه پیش برود، منتقل میکند.
تئودوریس و تیمش از Geneformer برای روشن کردن چگونگی خراب شدن سلولهای قلب در بیماریهای قلبی استفاده کردند. با این حال، این روش می تواند بسیاری از انواع سلول ها و بیماری های دیگر را نیز درمان کند.
تئودوریس که همچنین استادیار دپارتمان اطفال در دانشگاه کالیفرنیا سانفرانسیسکو است، میگوید: Geneformer در بسیاری از زمینههای زیستشناسی، از جمله کشف اهداف دارویی احتمالی برای بیماریها، کاربردهای گستردهای دارد. این رویکرد توانایی ما را برای طراحی درمانهای اصلاحکننده شبکه در بیماریهایی که در آنها با دادههای محدود مانع پیشرفت شدهاند، بسیار افزایش میدهد.»
تئودوریس Geneformer را در طول دوره فوق دکتری با X. Shirley Liu، Ph.D.، مدیر سابق مرکز اپی ژنتیک سرطان عملکردی در موسسه سرطان Dana-Farber، و Patrick Ellinor، MD، Ph.D.، مدیر بیماری های قلبی عروقی طراحی کرد. ابتکار در موسسه براد – هر دو نویسنده مطالعه جدید.
نمای شبکه
بسیاری از ژن ها، هنگامی که فعال هستند، آبشارهایی از فعالیت مولکولی را به راه می اندازند که ژن های دیگر را تحریک می کند تا فعالیت خود را بالا یا پایین بیاورند. برخی از آن ژنها به نوبه خود بر روی ژنهای دیگر تأثیر میگذارند یا به عقب برمیگردند و اولین ژن را ترمز میکنند. بنابراین، هنگامی که یک دانشمند ارتباط بین چند ده ژن مرتبط را ترسیم می کند، نقشه شبکه حاصل اغلب مانند یک تار عنکبوت درهم به نظر می رسد.
اگر نقشهبرداری تعداد انگشت شماری از ژنها به این روش کثیف است، تلاش برای درک ارتباط بین تمام 20000 ژن در ژنوم انسان یک چالش بزرگ است. اما چنین نقشه شبکه عظیمی به محققان بینشی در مورد چگونگی تغییر کل شبکههای ژنها با بیماری و چگونگی معکوس کردن آن تغییرات ارائه میدهد.
تئودوریس میگوید: «اگر دارویی ژنی را که در شبکه محیطی است مورد هدف قرار دهد، ممکن است تأثیر کوچکی بر نحوه عملکرد سلول یا فقط مدیریت علائم یک بیماری داشته باشد». اما با بازگرداندن سطوح طبیعی ژنهایی که نقش اصلی را در شبکه بازی میکنند، میتوانید روند بیماری زمینهای را درمان کنید و تأثیر بسیار بیشتری داشته باشید.»
هوش مصنوعی “یادگیری انتقالی”
به طور معمول، برای نقشهبرداری شبکههای ژنی، محققان به مجموعه دادههای عظیمی که شامل بسیاری از سلولهای مشابه هستند، تکیه میکنند. آنها از زیرمجموعهای از سیستمهای هوش مصنوعی به نام پلتفرمهای یادگیری ماشینی استفاده میکنند تا الگوهای درون دادهها را کار کنند. به عنوان مثال، یک الگوریتم یادگیری ماشینی را می توان بر روی تعداد زیادی نمونه از بیماران مبتلا به بیماری قلبی و بدون آن آموزش داد و سپس الگوهای شبکه ژنی را که نمونه های بیمار را از نمونه های سالم متمایز می کند، یاد گرفت.
با این حال، مدلهای یادگیری ماشین استاندارد در زیستشناسی فقط برای انجام یک کار واحد آموزش داده میشوند. برای اینکه مدلها کار متفاوتی را انجام دهند، باید از ابتدا روی دادههای جدید دوباره آموزش داده شوند. بنابراین، اگر محققان نمونه اول اکنون بخواهند سلولهای کلیه، ریه یا مغز بیمار را از همتایان سالم خود شناسایی کنند، باید از نو شروع کنند و الگوریتم جدیدی را با دادههای آن بافتها آموزش دهند.
مسئله این است که برای برخی بیماری ها، داده های موجود کافی برای آموزش این مدل های یادگیری ماشینی وجود ندارد.
در مطالعه جدید، تئودوریس، الینور و همکارانشان با استفاده از تکنیک یادگیری ماشینی به نام «یادگیری انتقالی» برای آموزش Geneformer به عنوان یک مدل پایه که دانش اصلی آن میتواند به وظایف جدید منتقل شود، با این مشکل مقابله کردند.
اول، آنها Geneformer را از قبل آموزش دادند تا با دادن اطلاعات مربوط به سطح فعالیت ژن ها در حدود 30 میلیون سلول از طیف وسیعی از بافت های انسانی، درک اساسی از نحوه تعامل ژن ها را داشته باشد.
برای نشان دادن اینکه رویکرد یادگیری انتقالی کار می کند، دانشمندان سپس Geneformer را به دقت تنظیم کردند تا در مورد ارتباط بین ژن ها پیش بینی کنند، یا اینکه آیا کاهش سطح ژن های خاص باعث ایجاد بیماری می شود یا خیر. Geneformer به دلیل دانش بنیادی که در طول فرآیند پیشآموزشی به دست آورد، توانست این پیشبینیها را با دقت بسیار بالاتری نسبت به رویکردهای جایگزین انجام دهد.
علاوه بر این، Geneformer قادر به پیشبینی دقیق بود حتی زمانی که فقط تعداد بسیار کمی از نمونههای دادههای مرتبط را نشان میداد.
تئودوریس میگوید: «این بدان معناست که Geneformer را میتوان برای پیشبینی بیماریهایی که پیشرفت تحقیقات در آنها کند بوده است، به کار برد، زیرا ما به مجموعه دادههای به اندازه کافی بزرگ، مانند بیماریهای نادر و آنهایی که بر بافتهایی تأثیر میگذارند که نمونهبرداری در کلینیک دشوار است، دسترسی نداریم». .
درس هایی برای بیماری قلبی
تیم تئودوریس در مرحله بعد شروع به استفاده از یادگیری انتقالی برای پیشبرد اکتشافات بیماری قلبی کردند. آنها ابتدا از Geneformer خواستند پیش بینی کند که کدام ژن ها بر رشد کاردیومیوسیت ها، سلول های عضلانی قلب، اثر مضر خواهند داشت.
در میان ژنهای برتر شناساییشده توسط این مدل، بسیاری از آنها قبلاً با بیماری قلبی مرتبط بودند.
تئودوریس میگوید: «این واقعیت که این مدل ژنهایی را پیشبینی میکرد که ما از قبل میدانستیم برای بیماریهای قلبی واقعاً مهم هستند، به ما اطمینان بیشتری داد که قادر به پیشبینی دقیق است.
با این حال، سایر ژن های بالقوه مهم شناسایی شده توسط Geneformer قبلاً با بیماری قلبی مرتبط نبوده اند، مانند ژن TEAD4. زمانی که محققان TEAD4 را از کاردیومیوسیت ها در آزمایشگاه حذف کردند، سلول ها دیگر قادر به ضرب و شتم قوی مانند سلول های سالم نبودند.
بنابراین، Geneformer از یادگیری انتقال برای نتیجهگیری جدید استفاده کرده بود: حتی با وجود اینکه هیچ اطلاعاتی در مورد سلولهای فاقد TEAD4 داده نشده بود، نقش مهمی را که TEAD4 در عملکرد قلب ایفا میکند به درستی پیشبینی کرد.
در نهایت، این گروه از Geneformer خواست تا پیشبینی کند که کدام ژنها باید هدف قرار گیرند تا کاردیومیوسیتهای بیمار شبیه سلولهای سالم در سطح شبکه ژنی شوند. هنگامی که محققان دو مورد از اهداف پیشنهادی را در سلولهای مبتلا به کاردیومیوپاتی (بیماری عضله قلب) آزمایش کردند، در واقع دریافتند که حذف ژنهای پیشبینیشده با استفاده از فناوری ویرایش ژن CRISPR، توانایی ضربان قلبهای بیمار را بازیابی میکند.
تئودوریس میگوید: «در جریان یادگیری اینکه یک شبکه ژنی معمولی چگونه به نظر میرسد و یک شبکه ژنی بیمار چگونه است، Geneformer توانست متوجه شود که چه ویژگیهایی را میتوان برای جابجایی بین حالتهای سالم و بیمار هدف قرار داد. رویکرد یادگیری انتقالی به ما این امکان را داد که بر چالش دادههای محدود بیمار برای شناسایی مؤثر پروتئینهای احتمالی برای هدف قرار دادن داروها در سلولهای بیمار غلبه کنیم.
الینور میگوید: «یکی از مزایای استفاده از Geneformer، توانایی پیشبینی این بود که کدام ژنها میتوانند به تغییر سلولها بین حالتهای سالم و بیماری کمک کنند.» ما توانستیم این پیشبینیها را در کاردیومیوسیتها در آزمایشگاه خود در موسسه برود تأیید کنیم.
محققان در حال برنامه ریزی برای گسترش تعداد و انواع سلول هایی هستند که Geneformer تجزیه و تحلیل کرده است تا توانایی آن در تجزیه و تحلیل شبکه های ژنی را افزایش دهد. آنها همچنین این مدل را منبع باز ساخته اند تا دانشمندان دیگر بتوانند از آن استفاده کنند.
تئودوریس میگوید: «با رویکردهای استاندارد، شما باید یک مدل را برای هر برنامه جدید از ابتدا آموزش دهید. نکته واقعاً هیجانانگیز در مورد رویکرد ما این است که دانش بنیادی Geneformer در مورد شبکههای ژنی اکنون میتواند برای پاسخ به بسیاری از سؤالات بیولوژیکی منتقل شود و ما مشتاقانه منتظریم ببینیم افراد دیگر با آن چه میکنند.
اطلاعات بیشتر:
پاتریک الینور، یادگیری انتقالی امکان پیشبینی در زیستشناسی شبکه را فراهم میکند، طبیعت (2023). DOI: 10.1038/s41586-023-06139-9. www.nature.com/articles/s41586-023-06139-9
ارائه شده توسط موسسه گلادستون
نقل قول: سیستم هوش مصنوعی عواقب تغییرات ژن را پیش بینی می کند (2023، 31 مه) در 31 مه 2023 از https://medicalxpress.com/news/2023-05-artificial-intelligence-consequences-gene-modifications.html بازیابی شده است.
این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.