عملکرد الگوریتم های یادگیری ماشینی برای پیش بینی پیشرفت زوال عقل در بیماران کلینیک حافظه

Mar 20, 2022


تماس: Audrey Hu Whatsapp/hp: 0086 13880143964 ایمیل:audrey.hu@wecistanche.com


شارلوت جیمز، Ph.D. جانیس ام. رانسون، دکتری؛ ریچارد اورسون، دکترا. دیوید J. Llewellyn، دکترا

خلاصه

اهمیت: الگوریتم‌های یادگیری ماشینی می‌توانند به‌عنوان پایه‌ای برای کمک‌های تصمیم‌گیری بالینی برای بهبود عملکرد بالینی استفاده شوند. هدف ارزیابی توانایی الگوریتم‌های یادگیری ماشین برای پیش‌بینی بروز زوال عقل در مدت ۲ سال در مقایسه با مدل‌های موجود و تعیین رویکرد تحلیلی بهینه و تعداد متغیرهای مورد نیاز. طراحی، تنظیم، و شرکت کنندگان: این مطالعه پیش آگهی از داده های یک گروه آینده نگر از 15 307 شرکت کننده بدون زوال عقل در ابتدا استفاده کرد تا تجزیه و تحلیل ثانویه عواملی را انجام دهد که می تواند برای پیش بینی بروز زوال عقل استفاده شود. شرکت کنندگان در مرکز ملی هماهنگی آلزایمر شرکت کردندحافظهکلینیک در سراسر ایالات متحده بین 2005 و 2015. تجزیه و تحلیل ها از مارس تا 2 می021 انجام شد. قرار گرفتن در معرض: 258 متغیر در حوزه اقدامات بالینی مرتبط با زوال عقل و عوامل خطر. پیامدها و اقدامات اصلی: پیامد اصلی، زوال عقل همه‌علتی حادثه‌ای بود که طی 2 سال پس از ارزیابی پایه تشخیص داده شد. نتایج: در نمونه‌ای از 15 307 شرکت‌کننده (میانگین [SD] سن، 72.3 [9.8] سال؛ 9129 [60 درصد ] زن و 6178 [40 درصد ] مرد) بدون زوال عقل در ابتدا، 1568 (10 درصد) تشخیص زوال عقل را طی 2 سال پس از ارزیابی اولیه دریافت کردند. در مقایسه با 2 مدل موجود برای پیش‌بینی خطر زوال عقل (یعنی عوامل خطر قلبی عروقی، پیری، و میزان خطر ابتلا به زوال عقل، و شاخص مختصر غربالگری زوال عقل)، الگوریتم‌های یادگیری ماشینی در پیش‌بینی زوال عقل همه‌علتی رخ داده در عرض 2 سال برتر بودند. الگوریتم درختان تقویت شده با گرادیان دارای دقت کلی میانگین (SD) 92 درصد (1 درصد)، حساسیت 0.45 (0.05)، ویژگی 0.97 (0.01) و سطح زیر منحنی 0.92 (0.01) با استفاده از همه 258 بود. متغیرها تجزیه و تحلیل اهمیت متغیر نشان داد که برای دستیابی به دقت 91 درصد و سطح زیر منحنی حداقل 0.89، تنها 6 متغیر برای الگوریتم های یادگیری ماشین مورد نیاز است. الگوریتم‌های یادگیری ماشینی همچنین تا 84 درصد از شرکت‌کنندگانی را شناسایی کردند که تشخیص اولیه زوال عقل را دریافت کردند که متعاقباً به اختلال شناختی خفیف یا از نظر شناختی بدون اختلال تبدیل شد، که نشان‌دهنده تشخیص اشتباه احتمالی است. نتیجه‌گیری و ارتباط: این یافته‌ها نشان می‌دهد که الگوریتم‌های یادگیری ماشینی می‌توانند به طور دقیق زوال عقل رخ داده را در طی 2 سال در بیماران تحت مراقبت در پیش‌بینی کنند.حافظهکلینیک ها فقط از 6 متغیر استفاده می کنند. این یافته‌ها می‌توانند برای اطلاع از توسعه و اعتبار سنجی کمک‌های تصمیم‌گیری مورد استفاده قرار گیرندحافظهکلینیک ها

benefit of cistanche: improve memory ability

مقدمه

بسیاری از بیماران در محیط های تخصصی ارزیابی می شوند، مانندحافظهکلینیک‌ها، زمانی که برای اولین بار مراجعه می‌کنند، دچار زوال عقل نمی‌شوند. 1 تمایز بین بیمارانی که در یک بازه زمانی مرتبط بالینی دچار زوال عقل می‌شوند و بیمارانی که عاری از دمانس هستند، مهم است، زیرا این بینش می‌تواند برای اولویت‌بندی بیماران برای تحقیقات بعدی مورد استفاده قرار گیرد. و مداخلات شناسایی بیماران در معرض خطر بالای ابتلا به زوال عقل برای پزشکان چالش برانگیز است. یکی از رویکردها این است که در هنگام ارزیابی اولیه بر روی افرادی که دارای اختلال شناختی خفیف (MCI) هستند، تمرکز کنیم و این بیماران را برای پیگیری دعوت کنیم. با این حال، این می‌تواند منجر به طبقه‌بندی اشتباه قابل توجهی برای بیمارانی شود که هدف پیگیری نیستند، اما مبتلا به زوال عقل هستند و بیمارانی که برای بررسی‌های بیشتر هدف قرار گرفته‌اند اما به زوال عقل مبتلا نمی‌شوند.

اکثرحافظهبیماران کلینیک با MCI حتی پس از 10 سال با نرخ تبدیل سالانه 9.6 درصد به زوال عقل پیشرفت نمی کنند. کمک های تصمیم گیری بالینی موجود برای تخمین بروز میان مدت و بلندمدت زوال عقل در جمعیت های مختلف موجود است. به عنوان مثال، عوامل خطر قلبی عروقی، پیری و بروز زوال عقل (CAIDE) Risk Score3 برای پیش بینی خطر ابتلا به زوال عقل در 20 سال برای افراد میانسال طراحی شده است، و شاخص مختصر غربالگری دمانس (BDSI) 4 با هدف شناسایی افراد مسن است. بیماران باید با تعیین خطر ابتلا به زوال عقل در 6 سال، غربالگری شناختی را هدف قرار دهند. با این حال، بر اساس دانش ما، هیچ کمکی برای تصمیم گیری بالینی برای پیش بینی بروز زوال عقل ایجاد نشده استحافظهکلینیک ها در یک دوره بالینی مرتبط کوتاه تر. یادگیری ماشینی (ML) امکان استفاده از اطلاعات از مجموعه داده های بزرگ و پیچیده را فراهم می کند. اخیراً برای تشخیص زوال عقل و پیش‌بینی خطر استفاده شده است.5-9

با این حال، این مدل‌ها اغلب اطلاعاتی را که معمولاً در عمل بالینی معمولی در دسترس نیستند، مانند تصویربرداری عصبی پیشرفته، آزمایش‌های ژنتیکی و بیومارکرهای مایع مغزی نخاعی ترکیب می‌کنند که کاربرد بالینی را به محیط‌های تخصصی یا تحقیقاتی محدود می‌کند. ما بررسی کردیم که آیا تکنیک‌های ML می‌توانند برای پیش‌بینی بروز زوال عقل در یک دوره 2-ساله استفاده شوند یا خیر.حافظهداده های کلینیک از مرکز ملی هماهنگی آلزایمر ایالات متحده (NACC). ما همچنین حداقل مجموعه متغیرهای مورد نیاز برای مدل‌های ML را برای رسیدن به عملکرد تشخیصی کامل بررسی کردیم.

benefit of cistanche: improve memory ability

مواد و روش ها

مطالعه NACC قبل از اینکه بتواند داده‌ها را ارائه کند، تأیید اخلاقی را از هیئت بازبینی سازمانی هر سایت دریافت کرد و همه شرکت‌کنندگان رضایت کتبی آگاهانه ارائه کردند. این مطالعه پیش آگهی از تایید اخلاقی سازمانی مستثنی تلقی شد زیرا ما از داده های شناسایی نشده قبلی جمع آوری شده استفاده کردیم. داده های مورد استفاده در این مطالعه با درخواست داده به NACC در دسترس است. این مطالعه مطابق با دستورالعمل گزارش دهی شفاف یک مدل پیش بینی چند متغیره برای پیش آگهی یا تشخیص فردی (TRIPOD) گزارش شده است. داده ها از مارس تا می 2021 تجزیه و تحلیل شدند.

نمونه مطالعه

ما از داده‌های جمع‌آوری‌شده قبلی از مجموعه داده‌های یکنواخت NACC (UDS) استفاده کردیم.10 UDS حاوی داده‌های همگروهی آینده‌نگر از برنامه مرکز بیماری آلزایمر سالمندی مؤسسه ملی ایالات متحده برای تحقیقات مشترک چند مرکزی در مورد بیماری آلزایمر و سایر اختلالات عصبی است. مجموعه داده‌های ما شامل داده های کلینیک حافظه بین سپتامبر 2005 و فوریه 2015 از 30 مرکز بیماری آلزایمر واقع در ایالات متحده جمع آوری شده است. مجموعه داده‌ها شامل ویژگی‌های جمعیت‌شناختی شرکت‌کننده و مشارکت‌کننده، سابقه خانوادگی، وضعیت عملکردی، 12 نشانه رفتاری (ارزیابی شده با نتایج پرسشنامه پرسشنامه عصبی روان‌پزشکی 13)، باتری تست عصبی روان‌شناختی، 14 و تشخیص بالینی دمانس NACC است که توسط هر مرکز بیماری آلزایمر با استفاده از معیارهای تشخیصی بالینی منتشر شده تعیین شده است. بر اساس ارزیابی بالینی استاندارد UDS. جزئیات معیارهای تشخیصی اتخاذ شده توسط پروتکل UDS و راهنمای مربوطه قبلاً منتشر شده است.

ما از UDS نسخه 1 و 2 استفاده کردیم که شامل 32 573 شرکت کنندگان کلینیک حافظه با ارزیابی پایه است. اگرچه مدل‌های ما برای پیش‌بینی بروز زوال عقل در عرض 2 سال طراحی شده‌اند، اما برای در نظر گرفتن تفاوت در زمان بین قرار ملاقات‌های پیگیری، ما پیگیری‌هایی را که در طی 29 ماه پس از بازدید اولیه انجام شده بود، لحاظ کردیم تا اطمینان حاصل کنیم که بازدید اولین یا اولین ویزیت بوده است. نوبت دوم پیگیری

متغیر نتیجه

متغیر پیامد، تشخیص زوال عقل همه‌علتی در 29 ماه (تقریباً 2 سال) از ارزیابی پایه بود. این شامل زیرگروه های زوال عقل، مانند زوال عقل آلزایمر، زوال عقل با اجسام لوی، دمانس عروقی و سایر زیرگروه های نادرتر است. دمانس آلزایمر بر اساس معیارهای NINCSD-ADRDA، 16 دمانس عروقی بر اساس معیارهای NINDS-AIREN، 17 دمانس بدن لوی (LBD) بر اساس سومین گزارش از دمانس با معیارهای کنسرسیوم Lewy Bodies تشخیص داده شد، 18 و dementiaote. بر اساس معیارهای Neary و همکاران در سال 1998 تشخیص داده شد.19

پیش بینی کنندگان نامزد

ما همه متغیرهای مرتبط بالینی جمع‌آوری‌شده در طول بازدید اولیه را در نسخه‌های 1 و 2 UDS گنجاندیم (جدول 1 در مکمل). ما متغیرهایی با مقادیر متن آزاد، مانند نام داروها، و متغیرهایی که در همه شرکت‌کنندگان ثابت بودند، مانند تعداد بازدید، حذف کردیم. چهار متغیر مصنوعی برای کمک به ارزیابی اهمیت متغیر تولید شد (این متغیرها باید در رتبه پایین قرار گیرند). 3 مورد از این متغیرها جایگشت متغیرهای موجود (1 باینری، 1 متغیر طبقه‌ای و 1 متغیر عددی) و 1 متغیر به‌طور تصادفی از یک توزیع نرمال تولید شد. در مجموع 258 متغیر به دست آمد.

متغیرهای UDS گنجانده شده در مدل‌های ما شامل ویژگی‌های دموگرافیک شرکت‌کننده (15 متغیر)، ویژگی‌های جمعیت شناختی شرکت‌کننده (7 متغیر)، سابقه خانوادگی (3 متغیر)، سابقه پزشکی (47 متغیر)، داروها (21 متغیر)، فیزیکی (12 متغیر) است. نتایج معاینه عصبی (4 متغیر)، مقیاس یکپارچه رتبه بندی بیماری پارکینسون 20 (UDPRS) (28 متغیر)، مقیاس درجه بندی دمانس بالینی (CDR) 21 (8 متغیر)، وضعیت عملکردی (10 متغیر)، باتری تست عصبی روانشناختی (50 متغیر) مقیاس افسردگی سالمندان (17 متغیر)، و ارزیابی بالینی علائم (32 متغیر). از بین این متغیرها، 239 (93 درصد) برای حداقل 1 شرکت‌کننده وجود نداشت و همه شرکت‌کنندگان حداقل 1 متغیر نداشتند.

توسعه مدل

ما 4 الگوریتم ML22 را اجرا کردیم: رگرسیون لجستیک (LR)، 23 ماشین بردار پشتیبان (SVM)، 24 جنگل تصادفی (RF)، 25،26 و درختان با گرادیان تقویت شده (XGB)27 (eMethods در مکمل). این الگوریتم‌ها یک کار طبقه‌بندی را انجام می‌دهند: آنها تعیین می‌کنند که آیا یک شرکت‌کننده در کلاس 0 قرار می‌گیرد (پیش‌بینی می‌شود 29 ماه از ابتدای شروع، بدون زوال عقل باقی بماند) یا کلاس 1 (پیش‌بینی می‌شود که زوال عقل حادثه را در 29 ماه پس از شروع مطالعه تجربه کند). طبقه بندی بر اساس متغیرهایی است که در اولین بازدید از کلینیک حافظه (خط پایه) آنها ثبت شده است. برای پیاده‌سازی الگوریتم‌های ML، از کتابخانه یادگیری کیت علمی پایتون (بنیاد نرم‌افزار پایتون)،28 با اعتبارسنجی متقاطع 5-(eMethods در مکمل) استفاده کردیم. مقادیر گمشده با نمونه‌گیری با جایگزینی از مقادیر غیر گمشده منتسب شدند. تمام پردازش و تجزیه و تحلیل داده‌ها در پایتون نسخه 3.9، NumPy نسخه 1.19.4 و نسخه علمی کیت یادگیری 0.24.0 پیاده‌سازی شد.

تحلیل آماری

ارزیابی مدل

ما عملکرد همه مدل‌ها را با مقایسه دقت کلی، حساسیت و ویژگی آن‌ها برای آستانه‌های تصمیم‌گیری از پیش تعیین‌شده در ادبیات (مدل‌های موجود) یا آستانه 0.5 (مدل‌های ML) ارزیابی کردیم، که به طور مساوی وزن مثبت کاذب را دارد. و خطاهای منفی کاذب ناحیه زیر منحنی مشخصه عملکرد گیرنده (AUC)29 برای خلاصه کردن عملکرد مدل در تمام آستانه‌های ممکن و در نتیجه وزن‌های خطای طبقه‌بندی اشتباه استفاده شد.

مقایسه با مدل های موجود

BDSI و CAIDE مدل‌های موجود پیش‌بینی خطر زوال عقل هستند که به بیماران امتیازی می‌دهند که نشان‌دهنده خطر ابتلا به زوال عقل در بازه‌های زمانی طولانی‌تر است. برای استخراج امتیازات ریسک BDSI و CAIDE، متغیرهایی را از UDS انتخاب کردیم که بیشترین مطابقت را با متغیرهایی که قبلاً استفاده می‌شدند (eTable 2 در مکمل). عملکرد مدل‌های ML ما با عملکرد BDSI و CAIDE برای پیش‌بینی بروز زوال عقل 2-سال مقایسه شد.


عملکرد مدل در میان انواع فرعی دمانس

دمانس می تواند دلایل مختلفی داشته باشد که مربوط به انواع مختلف زوال عقل است. برای ارزیابی توانایی مدل‌های ML برای شناسایی زیرگروه‌های مختلف زوال عقل، موارد زوال عقل اتفاقی را به زوال عقل آلزایمر، LBD، دمانس عروقی و سایر زیرگروه‌های زوال عقل تقسیم کردیم. با استفاده از این 4 طبقه بندی، درصد شرکت کنندگان را که به درستی طبقه بندی شده بودند (نرخ مثبت واقعی) محاسبه کردیم و منحنی های ROC را برای هر مدل ML مقایسه کردیم.


بررسی ثبات تشخیصی

تشخیص بالینی زوال عقل شامل بیمارانی است که در ابتدا به اشتباه تشخیص داده شده اند (در عمل هم خطاهای مثبت کاذب و هم خطاهای منفی کاذب). و متعاقباً طی 2 سال پس از تشخیص زوال عقل، تشخیص عدم وجود زوال عقل (اعم از MCI یا شناخت بدون اختلال) را دریافت می کند. با توجه به اینکه این برگشت‌ها تشخیص‌های ناپایدار هستند و احتمالاً نتیجه تشخیص اشتباه زوال عقل بوده‌اند، ما دقت طبقه‌بندی مدل‌های ML را در نمونه‌ای از شرکت‌کنندگان با بازگشت بررسی کردیم (روش‌های الکترونیکی در مکمل). ما از تابع توزیع تجمعی (CDF) نمرات طبقه‌بندی خروجی توسط هر مدل ML برای مقایسه شرکت‌کنندگان با برگشت با بیمارانی که دچار زوال عقل بودند و بیمارانی که عاری از دمانس باقی مانده بودند، استفاده کردیم.

benefit of cistanche: improve memory ability

نتایج

پس از حذف {{0}} شرکت‌کنندگان با تشخیص زوال عقل در ابتدا، 4557 شرکت‌کننده که هیچ داده پیگیری نداشتند، و 573 شرکت‌کننده که اولین پیگیری خود را بیش از 29 ماه پس از اولین ملاقات انجام دادند. نمونه تحلیلی نهایی شامل 15 307 شرکت‌کننده بود (میانگین [SD] سن، 72.3 [9.8] سال؛ 9129 [60 درصد] زن و 6178 [40 درصد] مرد). ویژگی های نمونه در جدول 1 نشان داده شده است. در طی 2 سال از شروع مطالعه، 1568 شرکت کننده (10 درصد) تشخیص زوال عقل را دریافت کردند. از 1568 شرکت کننده ای که تشخیص زوال عقل دریافت کردند، 273 نفر (17 درصد) توسط یک پزشک تشخیص داده شدند و 1216 (78 درصد) توسط یک پانل اجماع تشخیص داده شدند. برای 79 شرکت کننده (5 درصد)، منبع تشخیص مشخص نشد. معیارهای عملکرد کلیدی که قدرت پیش‌بینی هر مدل را ارزیابی می‌کنند در جدول 2 آورده شده است. در مقایسه با مدل‌های موجود، مدل‌های ML در توانایی خود برای پیش‌بینی اینکه آیا یک فرد در عرض 2 سال دچار زوال عقل می‌شود یا نه، برتر بودند، و در همه معیارها از مدل‌های موجود بهتر عمل کردند. همه مدل‌های ML عملکرد مشابهی داشتند، با XGB که با دقت کلی (92 درصد) و AUC (میانگین [SD]، 0.92 [0.01]) بیشترین قدرت را داشت. منحنی مشخصه عملکرد گیرنده برای هر مدل شباهت بین مدل های ML و برتری آنها را در مقایسه با 2 مدل ریسک موجود نشان می دهد (شکل 1).

Sample Characteristics

عملکرد مدل در میان انواع فرعی دمانس

برای ارزیابی عملکرد مدل ML در زیرگروه‌های مختلف زوال عقل، جمعیت را به 4 زیرگروه زوال عقل تقسیم کردیم: زوال عقل آلزایمر (1285 شرکت‌کننده)، LBD (82 شرکت‌کننده)، دمانس عروقی (21 شرکت‌کننده)، و سایر زیرگروه‌های دمانس (180 شرکت‌کننده). مدل LR در شناسایی زوال عقل آلزایمر و سایر زیرشاخه‌ها بهترین بود و به درستی 589 شرکت‌کننده (46 درصد) مبتلا به زوال عقل آلزایمر و 99 شرکت‌کننده (55 درصد) را با زیرگروه‌های دیگر طبقه‌بندی کرد. مدل SVM بهترین عملکرد را در شرکت‌کنندگان مبتلا به LBD داشت و 40 شرکت‌کننده (49 درصد) را به درستی طبقه‌بندی کرد. همه مدل ها به درستی 7 شرکت کننده (33 درصد) را با زوال عقل عروقی طبقه بندی کردند. منحنی‌های مشخصه عملکرد گیرنده نشان می‌دهد که همه مدل‌ها تقریباً به خوبی در هر زیرگروه عمل می‌کنند (شکل 1 در مکمل).

Performance Measures.

بررسی حداقل تعداد متغیرها

یکی از اشکالات احتمالی استفاده از رویکرد ML، تعداد زیاد متغیرهای درگیر است. با افزایش تعداد متغیرهای مورد نیاز یک مدل، پیاده سازی در یک محیط بالینی کمتر عملی می شود و قابلیت تفسیر مدل مختل می شود. برای ارزیابی تعداد متغیرهایی که هر مدل ML برای دستیابی به قدرت پیش‌بینی معادل با آنچه که با استفاده از تمام 258 متغیر پیدا کردیم (جدول 2) مورد نیاز است، ارزیابی کردیم که چگونه AUC با تعداد متغیرهای موجود در مدل‌ها تغییر می‌کند. به طور خاص، ما متغیرها را برای هر مدل با مرتب‌سازی آنها به ترتیب اهمیت نزولی (یعنی قدرت تمایز هر متغیر بر اساس الگوریتم؛ روش‌های e-Methods در مکمل) رتبه‌بندی کردیم. ما متعاقباً هر مدل را با تعداد فزاینده ای از متغیرها بازآموزی کردیم و از مهمترین آنها شروع کردیم. ما دریافتیم که همه مدل‌ها برای دستیابی به عملکرد تشخیصی تنها به 22 متغیر نیاز دارند که از نظر آماری قابل تشخیص از میانگین عملکرد بهینه آنها نیست (شکل 2؛ شکل 2 در مکمل). متغیرهای مصنوعی اضافه شده برای اطمینان از اعتبار ارزیابی اهمیت متغیر در 22 متغیر برتر برای هیچ مدلی قرار نگرفتند، که نشان دهنده این واقعیت است که پس از رسیدن به عملکرد تشخیصی کامل، اطلاعات کمی برای تعیین قوی رتبه بندی متغیر وجود داشت.

شناسایی عوامل خطر کلیدی

از 22 متغیر مهم برای هر مدل، تنها 5 متغیر برای همه مدل‌ها مشترک بود (یعنی قضاوت بالینی کاهش حافظه، توانایی‌های شناختی، رفتار، توانایی مدیریت امور، یا تغییرات حرکتی و حرکتی؛ زمان تکمیل تست Trail Making Test). بخش B؛ CDR: اختلال جهت گیری؛ CDR: اختلال در خانه و سرگرمی ها؛ و سطح استقلال). از بین متغیرهای باقیمانده، 10 جفت وجود داشت که همبستگی بیشتر از 0.7 داشتند، که نشان می‌دهد آنها متغیرهای مشابهی هستند (eTable 3 in Supplement). با محاسبه این همبستگی با مبادله متغیرهایی که همبستگی بالایی داشتند، دریافتیم که 6 متغیر بسیار پیش بینی کننده وجود دارد (قضاوت بالینی کاهش، زمان تکمیل تست Trail Making قسمت B، 3 جزء CDR [جهت گیری، حافظه، و خانه و سرگرمی ها اختلال]، و سطح استقلال) که در همه مدل‌های ML مشترک بود (جدول 4 در مکمل). با آموزش هر مدل فقط با استفاده از این متغیرها، متوجه شدیم که برای LR و XGB، کاهش قابل توجهی در عملکرد تشخیصی وجود ندارد: با استفاده از این مجموعه هسته‌ای 6 متغیری، این مدل‌ها دارای میانگین دقت (SD) 91 درصد بودند ({14}} درصد ) برای LR و 91 درصد (1 درصد ) برای XGB و میانگین (SD) AUC 0.89 ({18}}.01) برای LR و 0.89 (0.02) برای XGB (eجدول 5 در ضمیمه).

ثبات تشخیصی از 1568 شرکت‌کننده‌ای که طی 2 سال تشخیص زوال عقل دریافت کردند، 13{4}} (8 درصد) را به‌عنوان تجربه بازگشت شناسایی کردیم که احتمالاً در ابتدا اشتباه تشخیص داده شده بودند و بنابراین برای اهداف ML به اشتباه برچسب‌گذاری شدند. ما دریافتیم که در حالی که برگشت‌ها فقط در 0.8 درصد از شرکت‌کنندگان گزارش شده است، آنها 92 تا 109 شرکت‌کننده (7 درصد -8 درصد) از شرکت‌کنندگان طبقه‌بندی‌شده اشتباه را تشکیل می‌دهند، با مقدار کمی تفاوت بین مدل‌ها (جدول 3). مدل RF بالاترین ثبات تشخیصی را داشت و 109 نفر از 130 شرکت‌کننده را به‌درستی شناسایی کرد (84 درصد) با طبقه‌بندی آنها به عنوان پیش‌بینی‌شده بدون زوال عقل در 2 سال. برای بررسی پایداری تشخیصی مدل‌های ML، شرکت‌کنندگان را با بازگشت در طول آموزش حذف کردیم (روش‌های الکترونیکی در مکمل). پس از آموزش مجدد مدل‌ها بدون برگشت، متوجه شدیم که RF 106 شرکت‌کننده را شناسایی کرد که بازگشت‌ها را تجربه کردند (میانگین [IQR]، 82 درصد [78 درصد -82 درصد ])، SVM 93 شرکت‌کننده را شناسایی کرد که بازگشت‌ها را تجربه کردند (میانگین [IQR]، 72 درصد [69 درصد -74 درصد ])، و LR و XGB هر دو 92 شرکت‌کننده را شناسایی کردند که بازگشت‌هایی را تجربه کردند (میانگین [IQR]، 71 درصد [68 درصد -75 درصد ]). IQRها با راه‌اندازی شرکت‌کنندگانی که بازگشت را تجربه کردند، به‌دست آمد.

Area Under the Curve

برای درک تفاوت بین شرکت‌کنندگان طبقه‌بندی اشتباه، شرکت‌کنندگان با بازگشت، و شرکت‌کنندگانی که دچار زوال عقل بدون بازگشت شدند، CDF امتیازات طبقه‌بندی به‌دست‌آمده از هر مدل ML را تحلیل کردیم. ما دریافتیم که نمرات شرکت‌کنندگانی که به اشتباه طبقه‌بندی شده‌اند، و شرکت‌کنندگان خاص با بازگشت، با شرکت‌کنندگانی که به زوال عقل مبتلا شده‌اند و افرادی که دچار زوال عقل نشده‌اند، متفاوت است (شکل 3 در مکمل). CDF نمرات طبقه‌بندی برای شرکت‌کنندگانی که به زوال عقل مبتلا نشده‌اند، در سمت چپ هر طرح قرار می‌گیرد، که نشان می‌دهد که مدل‌های ML به این شرکت‌کنندگان احتمال کمی برای ابتلا به زوال عقل اختصاص می‌دهند. برعکس، برای شرکت‌کنندگانی که به زوال عقل مبتلا شدند، CDFها در سمت راست طرح‌ها قرار گرفتند: احتمال بالایی برای ابتلا به زوال عقل به آنها اختصاص داده شد. برای همه مدل‌ها، توزیع نمرات برای شرکت‌کنندگان با بازگشت به سمت چپ نسبت به شرکت‌کنندگانی که به زوال عقل مبتلا شده بودند، کاهش یافت، به این معنی که شرکت‌کنندگان با برگشت به‌عنوان احتمال کمتری برای ابتلا به زوال عقل براساس این مدل‌ها ارزیابی شدند.

Prevent Alzheimer's disease

بحث

در این مطالعه پیش آگهی، الگوریتم های ML در مقایسه با BDSI و CAIDE دقت پیش آگهی بالاتری در پیش بینی بروز زوال عقل طی 2 سال پس از اولین ارزیابی کلینیک حافظه بیمار داشتند. دو مورد از الگوریتم‌های ML برای دستیابی به دقت 91 درصد و AUC 0.89 0 تنها با 6 متغیر کلیدی ارزیابی شدند. تحلیل‌های حساسیت نشان می‌دهد که مدل‌های ML می‌توانند به درستی نسبت بالایی از شرکت‌کنندگانی را که بازگشت را تجربه کرده‌اند و به‌طور بالقوه در طی ۲ سال از بازدید اولیه‌شان به اشتباه تشخیص داده شده‌اند، طبقه‌بندی کنند. این مطالعه دارای چندین نقطه قوت است، از جمله نمونه بزرگی از بیماران مشتق شده از کلینیک های حافظه متعدد در سراسر ایالات متحده، طیف گسترده ای از تکنیک های ML مورد استفاده، معیار مقایسه با مدل های خطر موجود، و کاوش در ثبات تشخیصی و تشخیص اشتباه احتمالی.

Diagnostic Stability

مطالعات قبلی در مورد استفاده از ML برای پیش‌بینی خطر زوال عقل، بر تبدیل شناختی بدون اختلال به زوال عقل آلزایمر یا MCI، 6،8 یا تبدیل از MCI به دمانس آلزایمر تمرکز کرده‌اند. سایر انواع زوال عقل 5،6،8 یا بیمارانی که در ابتدا از نظر شناختی دچار اختلال نمی شوند. 5 داده های مورد استفاده در این مطالعات شامل اسکن توموگرافی گسیل پوزیترون، 5،8، و بیومارکرهای مایع مغزی نخاعی است که معمولاً در یک محیط کلینیک حافظه در دسترس نیستند. مطالعه‌ای توسط لین و همکاران 6 با استفاده از داده‌های NACC برای یافتن مجموعه‌ای از 15 متغیر بالینی غیرتهاجمی برای ارزیابی خطر تبدیل از شناخت بدون اختلال به MCI در یک دوره 4- ساله بر این امر غلبه کرد. با این حال، ساختار MCI تا حدودی بحث‌برانگیز باقی مانده است، و نرخ تبدیل بین MCI و زوال عقل اغلب پایین است. نتیجه زوال عقل همه علل


از بین مدل‌های موجود بررسی‌شده در مطالعه ما، مدل CAIDE کمترین دقت را در پیش‌بینی خطر زوال عقل در طول 2 سال داشت، که جای تعجب نیست، با توجه به اینکه برای پیش‌بینی خطر زوال عقل طولانی‌مدت در بزرگسالان میانسال در مدت زمان طولانی‌تری ایجاد شده است. دوره پیگیری 20 ساله BDSI بهتر از CAIDE عمل کرد، که احتمالاً نشان دهنده این است که برای استفاده در افراد مسن در یک دوره پیگیری متوسط ​​6 ساله طراحی شده است. با این حال، تمام مدل‌های ML از این مدل‌های موجود بهتر عمل کردند. با استفاده از همه متغیرها، XGB قدرتمندترین رویکرد ML در پیش‌بینی بیمارانی بود که احتمالاً در عرض 2 سال مبتلا به زوال عقل تشخیص داده می‌شوند، که نشان می‌دهد روشی که در آن درخت‌های تصمیم جدید برای تصحیح خطاهای سه مورد آخر آموزش داده می‌شوند، منجر به عملکرد حاشیه‌ای می‌شود. کسب کردن. با این حال، به نظر می‌رسد که XGB کمترین توانایی را دارد تا شرکت‌کنندگانی را که بازگشت را تجربه کرده‌اند، شناسایی کند، به‌عنوان مثال، کسانی که در ابتدا در عرض 2 سال به زوال عقل مبتلا شده‌اند و این تشخیص در عرض 2 سال پس از تشخیص اولیه معکوس شده است.


عملکرد مدل‌های ML را می‌توان به‌طور قابل‌توجهی با داده‌های آموزشی برچسب‌گذاری نادرست کاهش داد. 34 به طور متضاد، حذف داده‌های آموزشی با برچسب اشتباه همیشه عملکرد را بهبود نمی‌بخشد. همان نویز در داده های اعتبارسنجی وجود دارد. بنابراین، فیلتر کردن داده های آموزشی حتی ممکن است داده های عدم اعتبار عملکرد را کاهش دهد، همانطور که در این مطالعه یافت شد. با این حال، زمانی که سطح برچسب‌گذاری نادرست کمتر از تقریباً 20 تا 40 درصد است، حذف داده‌های دارای برچسب غلط می‌تواند دقت داده‌های اعتبارسنجی را بهبود بخشد، حتی اگر داده‌های دارای برچسب اشتباه را در خود داشته باشد. داده‌های اعتبارسنجی: حتی داده‌های استاندارد معیار شامل خطاها می‌شوند.


نرخ بازگشت مشاهده شده (8 درصد) مشابه آنچه در یک مطالعه 2019 بر اساس جمعیت متفاوت ایالات متحده یافت شد.31 در مطالعه ما، بسته به نوع شناختی، درصد مثبت کاذب از 7 درصد تا 19 درصد متفاوت بود. ارزیابی استفاده شده طبق دانش ما، این اولین تجزیه و تحلیل تشخیص اشتباه احتمالی در NACC UDS است و نشان می‌دهد که استفاده از ML به عنوان یک کمک تصمیم‌گیری بالینی می‌تواند تشخیص اشتباه مثبت کاذب را تا 84 درصد کاهش دهد. با توجه به اینکه بیمارانی که بازگشت را تجربه می کنند از نظر تشخیصی مرزی هستند، از دیدگاه بالینی، ممکن است معقول باشد که به هر حال از آنها پیروی شود، با توجه به اینکه زمینه هایی برای نگرانی بالینی وجود دارد. بنابراین، XGB ممکن است بهترین مدل برای کمک تصمیم گیری بالینی باشد. روش دیگر، یک رویکرد مجموعه‌ای که پیش‌بینی‌های ثانویه را در مورد ثبات تشخیصی احتمالی و پتانسیل طبقه‌بندی اشتباه انجام می‌دهد، ممکن است مفیدتر باشد.

benefit of cistanche: improve memory ability

محدودیت ها

این مطالعه دارای چندین محدودیت است. اول، هر دو CAIDE و BDSI با استفاده از جمعیت های مختلف به جمعیت مورد استفاده در این مطالعه توسعه یافتند. همه متغیرهای مورد استفاده برای توسعه این مدل‌ها معادل دقیقی در UDS نداشتند که ممکن است بر عملکرد آنها در این مجموعه داده تأثیر بگذارد. دوم، روشی که برای انتساب داده ها استفاده می شود ممکن است منجر به خطای انتساب شود. به طور خاص، انتساب همه مقادیر از دست رفته را با یک مقدار عددی جایگزین می‌کند، اما برخی از مقادیر به دلیل ارتباط آنها با مقدار دیگری گم شده‌اند. بنابراین، این واقعیت که یک مقدار گم شده است، آموزنده است. با این حال، در حالی که شرکت کنندگان میانگین 14 درصد داده های از دست رفته داشتند، 6 متغیر کلیدی شناسایی شده برای میانگین 1 درصد از شرکت کنندگان گم شده بودند. سوم، اگرچه مطالعه ما از نمونه بزرگی از شرکت کنندگان کلینیک حافظه در ایالات متحده استفاده کرد، که نتایج ما را به شدت در این زمینه کاربردی می کند، اما میزان تعمیم این نتایج به سایر جمعیت ها ناشناخته است.

نتیجه گیری

این مطالعه پیش‌آگهی نشان داد که مدل‌های ML از مدل‌های پیش‌بینی خطر زوال عقل فعلی بهتر عمل می‌کنند و ممکن است پتانسیل بهبود پیش‌بینی زوال عقل اتفاقی را در طی 2 سال در کلینیک‌های حافظه داشته باشند. شش عامل کلیدی برای خطر زوال عقل شناسایی‌شده در این مطالعه ممکن است پتانسیل بهبود عملکرد بالینی در کلینیک‌های حافظه را داشته باشند، اگر در کمک‌های تصمیم‌گیری بالینی آینده گنجانده شوند.



شما نیز ممکن است دوست داشته باشید