یک تیم تحقیقاتی از جانز هاپکینز پزشکی و دانشگاه جانز هاپکینز یک مدل آماری یادگیری ماشینی را ایجاد و آزمایش کردهاند که – با استفاده از دادههای سوابق الکترونیکی سلامت – به زودی میتواند پیشبینی کند که چه کسی به طور طبیعی در برابر عفونت SARS-CoV-2 مقاوم است. ، ویروسی که باعث COVID-19 می شود. اعتبار: ME Newman، جانز هاپکینز پزشکی، با استفاده از تصاویر مالکیت عمومی، از جمله میکروگراف الکترونی عفونت SARS-CoV-2 توسط موسسه ملی آلرژی و بیماریهای عفونی
محققان از جانز هاپکینز پزشکی و دانشگاه جانز هاپکینز آنچه را که به عقیده آنها ممکن است یکی از اولین مدلها برای پیشبینی افرادی باشد که با وجود قرار گرفتن در معرض SARS-CoV-2 بیشترین احتمال مقاومت در برابر COVID-19 را دارند، ایجاد و آزمایش کردهاند. ویروسی که باعث آن می شود.
این مطالعه امروز به صورت آنلاین در مجله گزارش شده است PLOS ONE.
لید میگوید: «اگر بتوانیم تشخیص دهیم که چه افرادی به طور طبیعی قادر به جلوگیری از ابتلا به SARS-CoV-2 هستند، ممکن است بتوانیم علاوه بر عوامل اجتماعی و رفتاری، بیاموزیم که تفاوتهای ژنتیکی و محیطی بر دفاع آنها در برابر ویروس تأثیر میگذارد. نویسنده مطالعه کارن (کای-ون) یانگ، یک دانشجوی فارغ التحصیل مهندسی زیست پزشکی در آزمایشگاه تحقیق و نوآوری انفورماتیک ترجمه در دانشگاه جانز هاپکینز. این بینش می تواند منجر به اقدامات پیشگیرانه جدید و درمان های بسیار هدفمندتر شود.»
برای مطالعه خود، تیم تحقیقاتی تعیین کرد که آیا یک مدل آماری یادگیری ماشینی میتواند از ویژگیهای سلامت ذخیرهشده در پروندههای سلامت الکترونیکی – ارائه دادههای بیمار مانند بیماریهای همراه (سایر شرایط پزشکی) و داروهای تجویز شده – به عنوان ابزاری برای مشخص کردن افراد مبتلا استفاده کند یا خیر. یک توانایی طبیعی برای جلوگیری از عفونت SARS-CoV-2. یانگ میگوید، این افراد را میتوان برای درک بهتر عواملی که مقاومت آنها را قادر میسازد مورد مطالعه قرار داد.
مدل یادگیری ماشینی یک برنامه یا سیستم رایانه ای است که از الگوریتم های ریاضی برای یافتن الگوهای آماری استفاده می کند و سپس الگوها را در حرکت رو به جلو اعمال می کند. این به چنین سیستم هایی توانایی تقلید از تفکر و استدلال انسان را می دهد و مشابه مغز در طول زمان یاد می گیرد.
“استفاده از یک سیستم یادگیری ماشینی برای تشخیص الگوهای پیچیده در تعداد زیادی از افراد مبتلا به کووید-19، تیم دیگری از محققان پزشکی جانز هاپکینز را در سال 2021 قادر ساخت تا روند بیماری یک بیمار را پیشبینی کنند و احتمال شدید شدن آن را تعیین کنند.” دکتر استوارت ری، یکی از نویسندگان ارشد این مطالعه، معاون رئیس پزشکی یکپارچگی و تجزیه و تحلیل داده ها و استاد پزشکی در دانشکده پزشکی دانشگاه جان هاپکینز می گوید. “بر اساس موفقیت آنها، تیم ما به این فکر کرد که آیا می توان از همین رویکرد برای پیش بینی اینکه چه کسانی در فاصله نزدیک در معرض SARS-CoV-2 قرار می گیرند و هنوز هم آلوده نمی شوند، استفاده شود.”
برای نشان دادن توانایی مدل در پیشبینی مقاومت به کووید-19، محققان ابتدا دادههایی را از یک ثبت بالینی به نام ثبت پلتفرم تجزیه و تحلیل پزشکی دقیق COVID-19 جانز هاپکینز (JH-CROWN) به دست آوردند. این رجیستری حاوی اطلاعاتی برای بیمارانی است که در سیستم بهداشت جانز هاپکینز مشاهده شدهاند و مشکوک به عفونت SARS-CoV-2 یا تأیید شدهاند.
برای مطالعه مقاومتی خود، محققان تنها افرادی را شامل میشوند که بین ۱۰ ژوئن ۲۰۲۰ تا ۱۵ دسامبر ۲۰۲۰ آزمایش کووید-۱۹ دریافت کردهاند و دلیل آزمایش «قرار گرفتن بالقوه در معرض ویروس» را گزارش کردهاند.
تاریخ پایان نقطه ای بود که در آن تلاش های گسترده واکسیناسیون کووید-19 در ایالات متحده آغاز شد. به گفته محققان، انتخاب این تاریخ به آنها این امکان را داد که از تأثیر واکسنهای پیشگیری از عفونت به جای مقاومت طبیعی بر یافتههای خود اجتناب کنند.
8536 شرکتکننده در این مطالعه که قرار گرفتن در معرض را دلیل انجام آزمایش کووید-19 گزارش کردند به دو گروه تقسیم شدند: آنهایی که محل سکونت مشترکی (که در این مطالعه «خانوار» نامیده میشود) با هیچ بیمار کووید-19 نداشتند یا محل سکونتشان 10 نفر یا بیشتر بود. بیماران؛ و کسانی که با 10 نفر یا کمتر در یک محل سکونت مشترک بودند که حداقل یکی از آنها بیمار COVID-19 است. گروه اول با 8476 نفر از شرکت کنندگان به عنوان مجموعه آموزش و آزمون تعیین شد، در حالی که گروه دوم به نام مجموعه شاخص خانوار (HHI) دارای 60 عضو بود و به عنوان یک مجموعه تست جداگانه مورد استفاده قرار گرفت.
به گفته محققان، نگه داشتن تعداد خانوار به 10 یا کمتر، افرادی را که در مجتمعهای آپارتمانی، خوابگاهها و سایر مناطق زندگی چند واحدی با تراکم بالاتر زندگی میکنند که در آن قرار گرفتن در معرض یک فرد خاص برای SARS-CoV-2 با شدت کمتری زندگی میکنند، کنار گذاشته میشود.
برای شناسایی الگوها و شرکتکنندگان خوشهای بهگونهای که آنهایی که به طور طبیعی در برابر SARS-CoV-2 مقاوم هستند، برجسته شوند، هر دو مجموعه مطالعه با استفاده از الگوریتم خوشهبندی مبتنی بر الگوی انتخاب الگوی حداکثر مکرر (MASPC) تجزیه و تحلیل شدند. MASPC به طور خاص برای تجزیه و تحلیل داده های پرونده سلامت الکترونیکی طراحی شده است که اطلاعات دموگرافیک بیمار (سن، جنس و نژاد)، کدهای تشخیص پزشکی طبقه بندی آماری بین المللی بیماری ها و مشکلات بهداشتی مرتبط (ICD) مربوط به هر مورد، دستورات دارویی سرپایی و تعداد را ترکیب می کند. بیماری های همراه (سایر بیماری ها) وجود دارد.
ما فرض کردیم که MASPC ما را قادر میسازد تا بیمارانی را با الگوهای مشابه در دادههایشان خوشهبندی کنیم تا آنها را به عنوان مقاوم و غیرمقاوم در برابر SARS-CoV-2 تعریف کنیم، و با این امید که الگوریتم با هر تحلیل یاد بگیرد که چگونه دقت را بهبود بخشد. ری می گوید و قابلیت اطمینان تکالیف آینده. این مطالعه اولیه با استفاده از دادههای JH-CROWN انجام شد تا این فرضیه را زنده کند، یک آزمایش اثبات مفهوم مدل آماری ما برای نشان دادن اینکه مقاومت در برابر COVID-19 ممکن است بر اساس مشخصات بالینی و جمعیتشناختی بیمار قابل پیشبینی باشد.»
یانگ میگوید: «در مجموعه آموزش و آزمایش، ما 56 الگوی کدهای ICD را شناسایی کردیم که به دو گروه تقسیم شدند: مرتبط با مقاومت یا غیر مرتبط. «تحلیلهای آماری از میزان تمایز این الگوها بین مقاومت و عدم مقاومت، پنج الگو را به دست آورد که بهترین کار را برای کوچک و محلی ما انجام داد. [Baltimore-Washington, D.C., metroplex] جمعیت مورد مطالعه برای تعیین اینکه چه کسی به احتمال زیاد در معرض SARS-CoV-2 قرار گرفته است.”
ری میگوید: «با جستجوی این الگوها در HHI Set – افرادی که به احتمال زیاد از نزدیک در معرض SARS-CoV-2 قرار گرفتهاند – و سپس با تجزیه و تحلیل آماری نتایج، بهترین عملکرد مدل ما 0.61 بود. ری میگوید: «از آنجایی که امتیاز 0.5 فقط ارتباط شانسی بین پیشبینی و واقعیت را نشان میدهد، و 1 ارتباط 100 درصدی است، این نشان میدهد که این مدل به عنوان ابزاری برای شناسایی افراد مبتلا به مقاومت COVID-19 که میتواند بیشتر مورد مطالعه قرار گیرد، نویدبخش است.»
ری میگوید محدودیتهای این مطالعه شامل سوگیری احتمالی ناشی از گزارش خود از قرار گرفتن در معرض COVID-19 توسط شرکتکنندگان، تعداد کمی از شرکتکنندگان در گروه HHI، احتمال اینکه شرکتکنندگان برای SARS-CoV-2 با استفاده از کیتهای خانگی یا در امکانات آزمایش کردند، میشود. خارج از سیستم جانز هاپکینز (و بنابراین، آزمایش ها در پایگاه داده JH-CROWN ثبت نشدند)، و بازه زمانی کوتاه خود مطالعه. او می افزاید که مسیرهای آتی با استفاده از داده های ملی بیمار برای اعتبارسنجی توانایی مدل مورد نیاز است.
همراه با یانگ و ری، اعضای تیم مطالعه از پزشکی جان هاپکینز و دانشگاه جانز هاپکینز، دانشجویان فارغ التحصیل و کارشناسی، ییجیا چن، ژاکوب دسمن، کوین گورمن، کلوئه پاریس، ایلیا راتسف، تونی وی و ربکا یو هستند. و جوزف گرینشتاین و کیسی اوربی تیلور از نویسندگان ارشد همکار دانشکده.
اطلاعات بیشتر:
Kai-Wen K. Yang و همکاران، عوامل مرتبط با مقاومت در برابر عفونت SARS-CoV-2 کشف شده با استفاده از داده های پرونده پزشکی در مقیاس بزرگ و یادگیری ماشین، PLOS ONE (2023). DOI: 10.1371/journal.pone.0278466
ارائه شده توسط دانشکده پزشکی دانشگاه جان هاپکینز
نقل قول: تیم تحقیقاتی مدلی آماری برای پیشبینی مقاومت COVID-19 ایجاد میکند (2023، 22 فوریه) بازیابی شده در 22 فوریه 2023 از https://medicalxpress.com/news/2023-02-team-statistical-covid-resistance.html
این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.