پروتز عصبی از فعالیت مغز برای رمزگشایی گفتار استفاده می کند


پروتز عصبی از فعالیت مغز برای رمزگشایی گفتار استفاده می کند

اعتبار: Nitish V. Thakor، پزشکی ترجمه علوم

محققان دانشگاه HSE و دانشگاه دولتی پزشکی و دندانپزشکی مسکو یک مدل یادگیری ماشینی ایجاد کرده‌اند که می‌تواند بر اساس فعالیت عصبی آن‌ها که با مجموعه کوچکی از الکترودهای کم تهاجمی ثبت شده است، کلمه‌ای را که قرار است گفته شود، پیش‌بینی کند. مقاله آنها، “رمزگشایی گفتار از مجموعه کوچکی از الکترودهای EEG کم تهاجمی داخل جمجمه ای جداسازی شده فضایی با یک شبکه عصبی فشرده و قابل تفسیر” در مجله منتشر شده است. مجله مهندسی عصبی.

میلیون ها نفر در سراسر جهان تحت تأثیر اختلالات گفتاری قرار دارند و توانایی آنها در برقراری ارتباط را محدود می کند. علل از دست دادن گفتار می تواند متفاوت باشد و شامل سکته مغزی و برخی بیماری های مادرزادی باشد.

امروزه فناوری برای بازگرداندن عملکرد ارتباطی چنین بیمارانی در دسترس است، از جمله رابط‌های «گفتار بی‌صدا» که با ردیابی حرکت ماهیچه‌های مفصلی در زمانی که فرد بدون ایجاد صدا کلمات را به زبان می‌آورد، گفتار را تشخیص می‌دهد. با این حال، چنین دستگاه هایی به برخی از بیماران کمک می کند، اما به دیگران کمک نمی کند، مانند افراد مبتلا به فلج عضلات صورت.

پروتزهای عصبی گفتاری – رابط های مغز و رایانه که قادر به رمزگشایی گفتار بر اساس فعالیت مغز هستند – می توانند راه حلی قابل دسترس و قابل اعتماد برای بازگرداندن ارتباط به چنین بیمارانی ارائه دهند.

برخلاف رایانه‌های شخصی، دستگاه‌های دارای رابط مغز و رایانه (BCI) بدون نیاز به صفحه کلید یا میکروفون، مستقیماً توسط مغز کنترل می‌شوند.

مانع اصلی برای استفاده گسترده تر از BCI در پروتز گفتار این است که این فناوری به جراحی بسیار تهاجمی برای کاشت الکترود در بافت مغز نیاز دارد.






دقیق ترین تشخیص گفتار توسط پروتزهای عصبی با الکترودهایی که سطح وسیعی از سطح قشر مغز را پوشش می دهند به دست می آید. با این حال، این راه حل ها برای خواندن فعالیت مغز برای استفاده طولانی مدت در نظر گرفته نشده است و خطرات قابل توجهی برای بیماران ایجاد می کند.

محققان مرکز HSE برای رابط‌های بیوالکتریک و دانشگاه دولتی پزشکی و دندان‌پزشکی مسکو امکان ایجاد یک پروتز عصبی کارآمد را که قادر به رمزگشایی گفتار با دقت قابل‌قبول با خواندن فعالیت مغز از مجموعه کوچکی از الکترودهای کاشته‌شده در ناحیه محدود قشر مغز است، مطالعه کرده‌اند. نویسندگان پیشنهاد می کنند که در آینده، این روش کم تهاجمی حتی می تواند تحت بی حسی موضعی انجام شود.

در مطالعه حاضر، محققان داده‌هایی را از دو بیمار مبتلا به صرع که قبلاً با الکترودهای داخل جمجمه‌ای کاشته شده بودند، جمع‌آوری کردند تا نقشه‌برداری قبل از جراحی برای تعیین مناطق شروع تشنج انجام شود.

بیمار اول به صورت دو طرفه با مجموعا پنج شفت sEEG با شش تماس در هر یک و بیمار دوم با نه نوار الکتروکورتیکوگرافی (ECoG) با هشت تماس در هر یک کاشته شد. برخلاف ECoG، الکترودهای sEEG را می توان بدون کرانیوتومی کامل از طریق سوراخ مته در جمجمه کاشت. در این مطالعه، تنها از شش تماس یک شفت sEEG در یک بیمار و هشت تماس یک نوار ECoG در دیگری برای رمزگشایی فعالیت عصبی استفاده شد.

از آزمودنی ها خواسته شد که شش جمله را با صدای بلند بخوانند که هر کدام 30 تا 60 بار به ترتیب تصادفی ارائه شده بودند. جملات از نظر ساختار متفاوت بودند و اکثر کلمات در یک جمله با همان حرف شروع می شدند. جملات در مجموع شامل 26 کلمه مختلف بودند. هنگامی که آزمودنی ها مشغول خواندن بودند، الکترودها فعالیت مغزی آنها را ثبت کردند.

سپس این داده‌ها با سیگنال‌های صوتی هم‌تراز شدند تا ۲۷ کلاس شامل ۲۶ کلمه و یک کلاس سکوت را تشکیل دهند. مجموعه داده آموزشی حاصل (شامل سیگنال های ثبت شده در 40 دقیقه اول آزمایش) به یک مدل یادگیری ماشینی با معماری مبتنی بر شبکه عصبی وارد شد. وظیفه یادگیری شبکه عصبی پیش‌بینی کلمه بعدی (کلاس) بر اساس داده‌های فعالیت عصبی قبل از بیان آن بود.

در طراحی معماری شبکه عصبی، محققان می خواستند آن را ساده، فشرده و به راحتی قابل تفسیر کنند. آنها یک معماری دو مرحله ای ارائه کردند که ابتدا بازنمایی گفتار داخلی را از داده های فعالیت مغزی ضبط شده استخراج می کرد و ضرایب طیفی log-mel را تولید می کرد و سپس یک کلاس خاص، یعنی یک کلمه یا سکوت را پیش بینی می کرد.






بدین ترتیب، شبکه عصبی با استفاده از تنها شش کانال داده ثبت شده توسط یک الکترود sEEG در بیمار اول به دقت 55 درصد و تنها با استفاده از هشت کانال داده ثبت شده توسط یک نوار ECoG در بیمار دوم، 70 درصد دقت را به دست آورد. چنین دقتی با آنچه در مطالعات دیگر با استفاده از وسایلی که نیاز به کاشت الکترود در کل سطح قشر مغز نشان داده شده است، قابل مقایسه است.

مدل قابل تفسیر به دست آمده این امکان را فراهم می‌کند که با عبارات نوروفیزیولوژیکی توضیح دهیم که کدام اطلاعات عصبی بیشترین کمک را در پیش‌بینی کلمه‌ای که قرار است گفته شود دارد. محققان سیگنال‌هایی را که از جمعیت‌های عصبی مختلف می‌آمدند، بررسی کردند تا مشخص کنند کدام یک از آنها برای کار پایین‌دستی مهم هستند. یافته‌های آن‌ها با نتایج نگاشت گفتار مطابقت داشت و نشان می‌دهد که این مدل از سیگنال‌های عصبی استفاده می‌کند که محوری هستند و بنابراین می‌توانند برای رمزگشایی گفتار خیالی استفاده شوند.

مزیت دیگر این راه حل این است که نیازی به مهندسی ویژگی های دستی ندارد. این مدل یاد گرفته است که بازنمایی گفتار را مستقیماً از داده‌های فعالیت مغز استخراج کند. تفسیرپذیری نتایج همچنین نشان می‌دهد که شبکه سیگنال‌های مغز را به جای هر فعالیت همزمان، مانند سیگنال‌های الکتریکی از ماهیچه‌های مفصلی یا ناشی از اثر میکروفون، رمزگشایی می‌کند.

محققان تاکید می‌کنند که پیش‌بینی همیشه بر اساس داده‌های فعالیت عصبی قبل از گفته بود. آنها استدلال می کنند که این تضمین می کند که قانون تصمیم گیری از پاسخ قشر شنوایی به گفتاری که قبلاً گفته شده استفاده نمی کند.

الکسی می گوید: “استفاده از چنین رابط هایی حداقل خطرات را برای بیمار به همراه دارد. اگر همه چیز درست شود، می توان گفتار خیالی را از فعالیت عصبی ضبط شده توسط تعداد کمی از الکترودهای کم تهاجمی که در یک محیط سرپایی با بی حسی موضعی کاشته شده اند رمزگشایی کرد.” Ossadtchi، نویسنده اصلی این مطالعه، مدیر مرکز رابط های بیوالکتریک موسسه HSE برای علوم اعصاب شناختی.

اطلاعات بیشتر:
آرتور پطروسیان و همکاران، رمزگشایی گفتار از مجموعه کوچکی از الکترودهای EEG داخل جمجمه ای با حداقل تهاجم فضایی با یک شبکه عصبی فشرده و قابل تفسیر، مجله مهندسی عصبی (2022). DOI: 10.1088/1741-2552/aca1e1

ارائه شده توسط دانشکده عالی اقتصاد دانشگاه تحقیقات ملی

نقل قول: پروتز عصبی از فعالیت مغز برای رمزگشایی گفتار استفاده می کند (2023، 19 ژانویه) در 19 ژانویه 2023 از https://medicalxpress.com/news/2023-01-neural-protthesis-brain-decode-speech.html بازیابی شده است.

این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.