ประสิทธิภาพของอัลกอริธึมการเรียนรู้ของเครื่องเพื่อทำนายความก้าวหน้าของภาวะสมองเสื่อมในผู้ป่วยคลินิกความจำ
Mar 25, 2022
สำหรับข้อมูลเพิ่มเติม:ali.ma@wecistanche.com
เชิงนามธรรม
ความสำคัญ
อัลกอริธึมการเรียนรู้ของเครื่องสามารถใช้เป็นพื้นฐานสำหรับเครื่องมือช่วยตัดสินใจทางคลินิกเพื่อส่งเสริมการปฏิบัติทางคลินิก
วัตถุประสงค์
เพื่อประเมินความสามารถของอัลกอริธึมแมชชีนเลิร์นนิงในการทำนายอุบัติการณ์ภาวะสมองเสื่อมภายใน 2 ปี เปรียบเทียบกับแบบจำลองที่มีอยู่และกำหนดวิธีการวิเคราะห์ที่เหมาะสมที่สุดและจำนวนตัวแปรที่ต้องการ
การออกแบบ การจัดวาง และผู้เข้าร่วม
การศึกษาเชิงพยากรณ์นี้ใช้ข้อมูลจากกลุ่มที่คาดหวังของผู้เข้าร่วม 15 307 คนที่ไม่มีภาวะสมองเสื่อมที่การตรวจวัดพื้นฐาน เพื่อทำการวิเคราะห์รองของปัจจัยที่อาจใช้ในการทำนายอุบัติการณ์ภาวะสมองเสื่อม ผู้เข้าร่วมศูนย์ประสานงานโรคอัลไซเมอร์แห่งชาติหน่วยความจำคลินิกทั่วสหรัฐอเมริการะหว่างปี 2548 ถึง 2558 การวิเคราะห์ดำเนินการตั้งแต่เดือนมีนาคมถึงพฤษภาคม 2564 การเปิดรับ 258 ตัวแปรที่ครอบคลุมขอบเขตของมาตรการทางคลินิกที่เกี่ยวข้องกับภาวะสมองเสื่อมและปัจจัยเสี่ยง
ผลลัพธ์หลักและมาตรการ
ผลลัพธ์หลักคืออุบัติเหตุจากทุกสาเหตุที่ได้รับการวินิจฉัยภายใน 2 ปีของการประเมินการตรวจวัดพื้นฐาน
Charlotte James, Ph.D.; Janice M. Ranson, Ph.D.; Richard Everson, Ph.D.; David J. Llewellyn, PhD
ผลลัพธ์
ในตัวอย่างของผู้เข้าร่วม {{0}} ราย (อายุเฉลี่ย [SD], 72.3 [9.8] ปี; 9129 [6{{20}} เปอร์เซ็นต์ ] ผู้หญิงและ 6178 [4{{24] }} เปอร์เซ็นต์ ] ผู้ชาย) ที่ไม่มีภาวะสมองเสื่อมที่การตรวจวัดพื้นฐาน 1568 (10 เปอร์เซ็นต์ ) ได้รับการวินิจฉัยว่าเป็นโรคสมองเสื่อมภายใน 2 ปีนับจากการประเมินครั้งแรก เมื่อเทียบกับ 2 โมเดลที่มีอยู่สำหรับการคาดการณ์ความเสี่ยงต่อภาวะสมองเสื่อม (เช่น ปัจจัยเสี่ยงหัวใจและหลอดเลือด อายุ และอุบัติการณ์ของคะแนนความเสี่ยงภาวะสมองเสื่อม และตัวบ่งชี้การคัดกรองภาวะสมองเสื่อมโดยสรุป) อัลกอริธึมการเรียนรู้ของเครื่องดีกว่าในการทำนายภาวะสมองเสื่อมจากทุกสาเหตุภายใน 2 ปี อัลกอริธึมต้นไม้ที่มีการไล่ระดับความชันมีความแม่นยำโดยรวม (SD) ที่ 92 เปอร์เซ็นต์ (1 เปอร์เซ็นต์ ) ความไว 0.45 (0.05) ความจำเพาะ 0.97 (0.01) และ พื้นที่ใต้เส้นโค้ง 0.92 (0.01) โดยใช้ตัวแปรทั้งหมด 258 ตัว การวิเคราะห์ความสำคัญของตัวแปรพบว่าต้องใช้เพียง 6 ตัวแปรสำหรับอัลกอริธึมการเรียนรู้ของเครื่องเพื่อให้ได้ความแม่นยำถึง 91 เปอร์เซ็นต์ และพื้นที่ใต้เส้นโค้งอย่างน้อย 0.89 อัลกอริธึมแมชชีนเลิร์นนิงระบุถึง 84 เปอร์เซ็นต์ของผู้เข้าร่วมที่ได้รับการวินิจฉัยภาวะสมองเสื่อมในระยะเริ่มแรกซึ่งต่อมาเปลี่ยนกลับเป็นความบกพร่องทางสติปัญญาเล็กน้อยหรือไม่มีความบกพร่องทางสติปัญญา ซึ่งบ่งชี้ว่าอาจวินิจฉัยผิดพลาดได้
บทสรุปและความเกี่ยวข้อง
การค้นพบนี้ชี้ให้เห็นว่าอัลกอริธึมการเรียนรู้ด้วยเครื่องสามารถทำนายภาวะสมองเสื่อมได้อย่างแม่นยำภายใน 2 ปีในผู้ป่วยที่ได้รับการดูแลที่หน่วยความจำคลินิกใช้เพียง 6 ตัวแปร การค้นพบนี้สามารถนำไปใช้เพื่อแจ้งการพัฒนาและการตรวจสอบความถูกต้องของอุปกรณ์ช่วยในการตัดสินใจในหน่วยความจำคลินิก

คลิกเพื่อกำหนด DHT สำหรับหน่วยความจำ
บทนำ
ผู้ป่วยจำนวนมากได้รับการประเมินในการตั้งค่าของผู้เชี่ยวชาญ เช่นหน่วยความจำคลินิกไม่มีภาวะสมองเสื่อมเมื่อเข้าร่วมครั้งแรก1 การแยกความแตกต่างระหว่างผู้ป่วยที่เป็นโรคสมองเสื่อมภายในระยะเวลาที่เกี่ยวข้องทางคลินิกกับผู้ที่ยังไม่เป็นโรคสมองเสื่อมเป็นสิ่งสำคัญ เนื่องจากข้อมูลเชิงลึกดังกล่าวสามารถใช้จัดลำดับความสำคัญของผู้ป่วยสำหรับการสอบสวนติดตามผล และการแทรกแซง การระบุผู้ป่วยที่มีความเสี่ยงสูงที่จะเป็นโรคสมองเสื่อมเป็นสิ่งที่ท้าทายสำหรับแพทย์ แนวทางหนึ่งคือการมุ่งเน้นที่ผู้ที่มีความบกพร่องทางสติปัญญาระดับเล็กน้อย (MCI) เมื่อได้รับการประเมินในขั้นต้นและเชิญผู้ป่วยเหล่านี้มาติดตามผล อย่างไรก็ตาม การทำเช่นนี้อาจส่งผลให้มีการจัดประเภทที่ไม่ถูกต้องอย่างมากสำหรับผู้ป่วยที่ไม่ได้กำหนดเป้าหมายสำหรับการติดตาม แต่ผู้ที่พัฒนาภาวะสมองเสื่อมและผู้ป่วยที่เป็นเป้าหมายสำหรับการตรวจสอบเพิ่มเติมแต่ไม่ได้พัฒนาภาวะสมองเสื่อม ผู้ป่วยคลินิกความจำส่วนใหญ่ที่มี MCI จะไม่พัฒนาไปสู่ภาวะสมองเสื่อมแม้หลังจากผ่านไป 10 ปี โดยมีอัตราการแปลงต่อปีที่ 9.6 เปอร์เซ็นต์ .2
เครื่องช่วยตัดสินใจทางคลินิกอาจช่วยปรับปรุงความสามารถของแพทย์ในการประมาณการเริ่มมีอาการของภาวะสมองเสื่อม เครื่องช่วยตัดสินใจทางคลินิกที่มีอยู่มีไว้เพื่อประมาณอุบัติการณ์ของภาวะสมองเสื่อมในระยะกลางและระยะยาวในประชากรที่แตกต่างกัน ตัวอย่างเช่น ปัจจัยเสี่ยงโรคหัวใจและหลอดเลือด ความชรา และอุบัติการณ์ของภาวะสมองเสื่อม (CAIDE) คะแนนความเสี่ยง3 ได้รับการออกแบบมาเพื่อคาดการณ์ความเสี่ยงของการเกิดภาวะสมองเสื่อมใน 20 ปีสำหรับคนวัยกลางคน และดัชนี Brief Dementia Screening Indicator (BDSI)4 มีวัตถุประสงค์เพื่อระบุผู้สูงอายุ กำหนดเป้าหมายผู้ป่วยเพื่อคัดกรองความรู้ความเข้าใจโดยกำหนดความเสี่ยงของการเกิดภาวะสมองเสื่อมใน 6 ปี อย่างไรก็ตาม ตามความรู้ของเรา ไม่มีการพัฒนาเครื่องช่วยในการตัดสินใจทางคลินิกเพื่อคาดการณ์อุบัติการณ์ภาวะสมองเสื่อมในคลินิกความจำในช่วงเวลาที่เกี่ยวข้องทางคลินิกที่สั้นกว่า

การเรียนรู้ของเครื่อง (ML) ช่วยให้ใช้ประโยชน์จากข้อมูลจากชุดข้อมูลขนาดใหญ่และซับซ้อนได้ เมื่อเร็วๆ นี้ ได้มีการนำไปใช้กับการวินิจฉัยภาวะสมองเสื่อมและการคาดการณ์ความเสี่ยง5-9 อย่างไรก็ตาม แบบจำลองเหล่านี้มักรวมข้อมูลที่โดยปกติแล้วไม่มีในการปฏิบัติทางคลินิกตามปกติ เช่น การสร้างภาพประสาทขั้นสูง การทดสอบทางพันธุกรรม และตัวบ่งชี้ทางชีวภาพของน้ำไขสันหลัง ซึ่งจำกัดการประยุกต์ใช้ทางคลินิกกับ การตั้งค่าผู้เชี่ยวชาญหรือการวิจัย
เราตรวจสอบว่าเทคนิค ML สามารถใช้ทำนายอุบัติการณ์ของภาวะสมองเสื่อมในช่วง 2-ปีโดยใช้ข้อมูลคลินิกความจำจาก US National ได้หรือไม่อัลไซเมอร์ศูนย์ประสานงาน (ป.ป.ช.) เรายังตรวจสอบชุดตัวแปรขั้นต่ำที่จำเป็นสำหรับโมเดล ML เพื่อให้ได้ประสิทธิภาพการวินิจฉัยอย่างเต็มที่

วิธีการ
การศึกษาของ ป.ป.ช. ได้รับการอนุมัติทางจริยธรรมจากคณะกรรมการตรวจสอบสถาบันของแต่ละไซต์ก่อนที่จะสามารถให้ข้อมูลได้ และผู้เข้าร่วมทั้งหมดได้ให้ความยินยอมเป็นลายลักษณ์อักษร การศึกษาเชิงพยากรณ์นี้ถือว่าได้รับการยกเว้นจากการอนุมัติทางจริยธรรมของสถาบัน เนื่องจากเราใช้ข้อมูลที่รวบรวมไม่ได้ระบุตัวตนก่อนหน้านี้ ข้อมูลที่ใช้ในการศึกษานี้สามารถขอข้อมูลได้ต่อคณะกรรมการ ป.ป.ช. การศึกษานี้รายงานตามแนวทางการรายงานการรายงานแบบโปร่งใสของแบบจำลองการคาดการณ์หลายตัวแปรสำหรับการพยากรณ์โรคหรือการวินิจฉัยรายบุคคล (TRIPOD) ข้อมูลได้รับการวิเคราะห์ตั้งแต่เดือนมีนาคมถึงพฤษภาคม 2021
ตัวอย่างการศึกษา
เราใช้ข้อมูลที่เก็บรวบรวมก่อนหน้านี้จากชุดข้อมูลชุดข้อมูลของป.ป.ช. (UDS)10 UDS มีข้อมูลกลุ่มประชากรตามรุ่นในอนาคตจากสถาบันแห่งชาติสหรัฐฯ ด้านผู้สูงอายุอัลไซเมอร์โรคโครงการศูนย์วิจัยความร่วมมือหลายศูนย์เรื่องโรคอัลไซเมอร์โรคและความผิดปกติของระบบประสาทอื่นๆ 11 ชุดข้อมูลของเราประกอบด้วยข้อมูลคลินิกหน่วยความจำที่รวบรวมระหว่างเดือนกันยายน 2548 ถึงกุมภาพันธ์ 2558 จาก30โรคอัลไซเมอร์โรคศูนย์ที่ตั้งอยู่ในสหรัฐอเมริกา ชุดข้อมูลประกอบด้วยลักษณะทางสังคมวิทยาของผู้เข้าร่วมและผู้เข้าร่วม ประวัติครอบครัว สถานะการทำงาน อาการทางพฤติกรรม 12 อาการ (ประเมินด้วยผลแบบสอบถามเกี่ยวกับคลังประสาทจิตเวช 13) ชุดทดสอบทางระบบประสาท 14 และการวินิจฉัยภาวะสมองเสื่อมทางคลินิกของ ป.ป.ช.อัลไซเมอร์โรคศูนย์ที่ใช้เกณฑ์การวินิจฉัยทางคลินิกที่เผยแพร่ตามการประเมินทางคลินิกของ UDS ที่ได้มาตรฐาน รายละเอียดของเกณฑ์การวินิจฉัยที่นำมาใช้โดยโปรโตคอล UDS และคำแนะนำที่เกี่ยวข้องได้รับการเผยแพร่ก่อนหน้านี้15

เราใช้ UDS เวอร์ชัน 1 และ 2 ซึ่งรวมถึงผู้เข้าร่วมคลินิกหน่วยความจำ 32 573 คนด้วยการประเมินพื้นฐาน แม้ว่าแบบจำลองของเราได้รับการออกแบบมาเพื่อคาดการณ์อุบัติการณ์ภาวะสมองเสื่อมภายใน 2 ปี แต่เพื่อพิจารณาความผันแปรของเวลาระหว่างการนัดหมายเพื่อติดตามผล เราได้รวมการติดตามที่เกิดขึ้นภายใน 29 เดือนของการเข้ารับการตรวจครั้งแรกเพื่อให้แน่ใจว่าการเข้ารับการตรวจครั้งแรกหรือ นัดติดตามครั้งที่สอง
ตัวแปรผลลัพธ์
ตัวแปรผลลัพธ์คือการวินิจฉัยภาวะสมองเสื่อมจากทุกสาเหตุภายใน 29 เดือน (ประมาณ 2 ปี) ของการประเมินการตรวจวัดพื้นฐาน ซึ่งรวมถึงประเภทย่อยของภาวะสมองเสื่อม เช่น ภาวะสมองเสื่อมในสมองเสื่อม ภาวะสมองเสื่อมที่มีร่างกายแบบ Lewy ภาวะสมองเสื่อมจากหลอดเลือด และประเภทย่อยที่หายากกว่าอื่นๆ ภาวะสมองเสื่อมอัลไซเมอร์ได้รับการวินิจฉัยตามเกณฑ์ NINCSD-ADRDA, ภาวะสมองเสื่อมจากหลอดเลือด 16 ข้อได้รับการวินิจฉัยตามเกณฑ์ NINDS-AIREN, 17 ภาวะสมองเสื่อมจากร่างกาย Lewy (LBD) ได้รับการวินิจฉัยตามรายงานฉบับที่ 3 ของภาวะสมองเสื่อมด้วยเกณฑ์ Lewy Bodies Consortium, 18 และภาวะสมองเสื่อมส่วนหน้า ได้รับการวินิจฉัยตามหลักเกณฑ์ พ.ศ. 2541 ของ Neary และเพื่อนร่วมงาน19
ผู้ทำนายผู้สมัคร
เรารวมตัวแปรที่เกี่ยวข้องทางคลินิกทั้งหมดที่รวบรวมระหว่างการนัดตรวจครั้งแรกใน UDS เวอร์ชัน 1 และ 2 (eTable 1 ในส่วนเพิ่มเติม) เราไม่รวมตัวแปรที่มีค่าข้อความอิสระ เช่น ชื่อของยา และตัวแปรที่คงที่ในผู้เข้าร่วมทั้งหมด เช่น จำนวนการเข้าชม ตัวแปรสังเคราะห์สี่ตัวถูกสร้างขึ้นเพื่อช่วยในการประเมินความสำคัญของตัวแปร (ตัวแปรเหล่านี้ควรอยู่ในอันดับต่ำ) ตัวแปรเหล่านี้ 3 ตัวเป็นการเรียงสับเปลี่ยนของตัวแปรที่มีอยู่ (1 ตัวแปรไบนารี 1 ตัวแปรหมวดหมู่และ 1 ตัวแปรตัวเลข) และ 1 ตัวแปรถูกสร้างขึ้นแบบสุ่มจากการแจกแจงแบบปกติ ส่งผลให้มีตัวแปรทั้งหมด 258 ตัว
ตัวแปรจาก UDS ที่รวมอยู่ในแบบจำลองของเรา ได้แก่ ลักษณะทางประชากรของผู้เข้าร่วม (ตัวแปร 15 ตัว) ลักษณะทางประชากรร่วม (7 ตัวแปร) ประวัติครอบครัว (3 ตัวแปร) ประวัติทางการแพทย์ (47 ตัวแปร) ยา (21 ตัวแปร) ทางกายภาพ (12 ตัวแปร) ) และผลการตรวจทางระบบประสาท (4 ตัวแปร) Unified Parkinson Disease Rating Scale20 (UDPRS) (28 ตัวแปร) Clinical Dementia Rating (CDR) มาตราส่วน 21 (8 ตัวแปร) สถานะการทำงาน (10 ตัวแปร) แบตเตอรี่ทดสอบทางประสาทวิทยา (50 ตัวแปร) , Geriatric Depression Scale (17 ตัวแปร) และการประเมินทางคลินิกของอาการ (32 ตัวแปร) จากตัวแปรเหล่านี้ 239 (93 เปอร์เซ็นต์) หายไปสำหรับผู้เข้าร่วมอย่างน้อย 1 คน และผู้เข้าร่วมทั้งหมดมีอย่างน้อย 1 ตัวแปรที่ขาดหายไป
การพัฒนาแบบจำลอง
เราใช้อัลกอริธึม 4 ML22: การถดถอยโลจิสติก (LR), เครื่องเวกเตอร์สนับสนุน 23 (SVM), 24 สุ่มฟอเรสต์ (RF), 25,26 และทรีที่เพิ่มการไล่ระดับสี (XGB)27 (eMethods ในส่วนเพิ่มเติม) อัลกอริธึมเหล่านี้ทำงานเกี่ยวกับการจัดหมวดหมู่: พิจารณาว่าผู้เข้าร่วมอยู่ในคลาส 0 (คาดการณ์ว่าจะปลอดภาวะสมองเสื่อม 29 เดือนนับจากการตรวจวัดพื้นฐาน) หรือคลาส 1 (คาดการณ์ว่าจะประสบภาวะสมองเสื่อมจากเหตุการณ์ภายใน 29 เดือนนับจากการตรวจวัดพื้นฐาน) การจำแนกประเภทขึ้นอยู่กับตัวแปรที่บันทึกไว้ในการเข้ารับการตรวจคลินิกหน่วยความจำ (พื้นฐาน) ครั้งแรกของพวกเขา ในการใช้อัลกอริธึม ML เราใช้ไลบรารี่ Python sci-kit-learn (Python Software Foundation),28 กับ 5-fold cross-validation (eMethods ในส่วนเพิ่มเติม) ค่าที่หายไปถูกกำหนดโดยการสุ่มตัวอย่างด้วยการแทนที่จากค่าที่ขาดหายไป การประมวลผลและการวิเคราะห์ข้อมูลทั้งหมดถูกนำมาใช้ใน Python เวอร์ชัน 3.9, NumPy เวอร์ชัน 1.19.4 และเวอร์ชัน sci-kit-learn 0.24.0
การวิเคราะห์ทางสถิติ
การประเมินแบบจำลอง
เราประเมินประสิทธิภาพของแบบจำลองทั้งหมดโดยเปรียบเทียบความแม่นยำ ความไว และความจำเพาะโดยรวมสำหรับเกณฑ์การตัดสินใจที่กำหนดไว้ล่วงหน้าในเอกสาร (แบบจำลองที่มีอยู่) หรือเกณฑ์ของ 0.5 (แบบจำลอง ML) ซึ่งให้น้ำหนักบวกเท็จเท่ากัน และข้อผิดพลาดเชิงลบเท็จ พื้นที่ใต้เส้นโค้งลักษณะการทำงานของตัวรับ (AUC)29 ถูกใช้เพื่อสรุปประสิทธิภาพของแบบจำลองเหนือขีดจำกัดที่เป็นไปได้ทั้งหมด และทำให้การจัดประเภทข้อผิดพลาดผิดพลาด.30 การวัดประสิทธิภาพเฉลี่ยและ SD ได้มาจากการบูตสแตรปปิ้ง (eMethods ในส่วนเพิ่มเติม)
เปรียบเทียบกับรุ่นที่มีอยู่
BDSI และ CAIDE เป็นแบบจำลองการคาดการณ์ความเสี่ยงของภาวะสมองเสื่อมที่มีอยู่ซึ่งกำหนดคะแนนให้กับผู้ป่วยที่แสดงถึงความเสี่ยงในการเกิดภาวะสมองเสื่อมในช่วงเวลาที่ยาวนานขึ้น เพื่อให้ได้คะแนนความเสี่ยง BDSI และ CAIDE เราเลือกตัวแปรจาก UDS ที่สอดคล้องกับตัวแปรที่เคยใช้ก่อนหน้านี้มากที่สุด (eTable 2 ในส่วนเพิ่มเติม) ประสิทธิภาพของแบบจำลอง ML ของเราถูกนำมาเปรียบเทียบกับ BDSI และ CAIDE สำหรับการทำนายอุบัติการณ์ภาวะสมองเสื่อม 2-ปี
ประสิทธิภาพของแบบจำลองข้ามประเภทย่อยของภาวะสมองเสื่อม
ภาวะสมองเสื่อมอาจมีสาเหตุหลายประการ ซึ่งสอดคล้องกับประเภทย่อยของภาวะสมองเสื่อมที่แตกต่างกัน เพื่อประเมินความสามารถของแบบจำลอง ML เพื่อระบุประเภทย่อยของภาวะสมองเสื่อมที่แตกต่างกัน เราแบ่งกรณีของภาวะสมองเสื่อมจากเหตุการณ์เป็นภาวะสมองเสื่อมในสมองเสื่อม, LBD, ภาวะสมองเสื่อมจากหลอดเลือด และประเภทย่อยของภาวะสมองเสื่อมอื่นๆ เมื่อใช้การแบ่งชั้น 4 แบบนี้ เราคำนวณเปอร์เซ็นต์ของผู้เข้าร่วมที่จำแนกอย่างถูกต้อง (อัตราการเป็นบวกจริง) และเปรียบเทียบเส้นโค้ง ROC สำหรับแบบจำลอง ML แต่ละรุ่น
การตรวจสอบความเสถียรในการวินิจฉัย
การวินิจฉัยทางคลินิกของภาวะสมองเสื่อมเป็นที่ทราบกันดีว่ามีผู้ป่วยที่ได้รับการวินิจฉัยผิดพลาดในขั้นต้น (มีผลทั้งข้อผิดพลาดด้านบวกและลบที่ผิดพลาด)31 เราให้คำจำกัดความว่าการกลับเป็นเหมือนเดิมคือเมื่อผู้เข้าร่วมที่ได้รับการวินิจฉัยว่าเป็นโรคสมองเสื่อมภายใน 2 ปีหลังจากเข้ารับการตรวจที่คลินิกความจำครั้งแรก และต่อมาได้รับการวินิจฉัยว่าไม่มีภาวะสมองเสื่อม (ไม่ว่าจะเป็น MCI หรือความรู้ความเข้าใจที่ไม่บกพร่อง) ภายใน 2 ปีนับจากการวินิจฉัยภาวะสมองเสื่อม การให้เหตุผลว่าการกลับรายการเหล่านี้เป็นการวินิจฉัยที่ไม่เสถียรและน่าจะเป็นผลมาจากการวินิจฉัยที่ผิดพลาดของภาวะสมองเสื่อม เราจึงตรวจสอบความถูกต้องของการจัดหมวดหมู่ของแบบจำลอง ML ในตัวอย่างของผู้เข้าร่วมที่มีการกลับรายการ (eMethods ในส่วนเพิ่มเติม) เราใช้ฟังก์ชันการแจกแจงสะสม (CDF) ของคะแนนการจัดประเภทที่ส่งออกโดยแบบจำลอง ML แต่ละแบบเพื่อเปรียบเทียบผู้เข้าร่วมกับการกลับรายการกับผู้ป่วยที่เป็นโรคสมองเสื่อมและผู้ป่วยที่ยังไม่เป็นโรคสมองเสื่อม
ผลลัพธ์
หลังจากยกเว้นผู้เข้าร่วม {{0}} รายที่มีการวินิจฉัยภาวะสมองเสื่อมที่การตรวจวัดพื้นฐานแล้ว ผู้เข้าร่วม 4557 รายที่ไม่มีข้อมูลติดตามผล และผู้เข้าร่วม 573 รายที่ได้รับการติดตามผลครั้งแรกมากกว่า 29 เดือนหลังจากการเข้ารับการตรวจครั้งแรก ตัวอย่างการวิเคราะห์ขั้นสุดท้ายมีผู้เข้าร่วม 15 307 คน (อายุเฉลี่ย [SD], 72.3 [9.8] ปี; 9129 [60 เปอร์เซ็นต์ ] ผู้หญิงและ 6178 [40 เปอร์เซ็นต์] ผู้ชาย) ลักษณะตัวอย่างแสดงในตารางที่ 1 ภายใน 2 ปีของการตรวจวัดพื้นฐาน ผู้เข้าร่วม 1568 คน (10 เปอร์เซ็นต์) ได้รับการวินิจฉัยว่าเป็นโรคสมองเสื่อม จากผู้เข้าร่วม 1568 รายที่ได้รับการวินิจฉัยว่าเป็นโรคสมองเสื่อม 273 ราย (ร้อยละ 17) ได้รับการวินิจฉัยโดยแพทย์เพียงคนเดียว และ 1216 ราย (ร้อยละ 78) ได้รับการวินิจฉัยโดยคณะกรรมการร่วม สำหรับผู้เข้าร่วม 79 คน (ร้อยละ 5) ไม่ได้ระบุแหล่งที่มาของการวินิจฉัย การวัดประสิทธิภาพหลักในการประเมินพลังการทำนายของแต่ละแบบจำลองแสดงไว้ในตารางที่ 2 เมื่อเปรียบเทียบกับแบบจำลองที่มีอยู่ แบบจำลอง ML มีความสามารถที่เหนือกว่าในการทำนายว่าบุคคลจะพัฒนาภาวะสมองเสื่อมภายใน 2 ปีหรือไม่ และมีประสิทธิภาพเหนือกว่าแบบจำลองที่มีอยู่ในทุกมาตรการ โมเดล ML ทั้งหมดทำงานได้ดีเหมือนกัน โดย XGB มีกำลังสูงสุดเมื่อวัดโดยความแม่นยำโดยรวม (92 เปอร์เซ็นต์ ) และ AUC (ค่าเฉลี่ย [SD], 0.92 [0.01]) เส้นโค้งลักษณะการทำงานของตัวรับสำหรับแต่ละรุ่นแสดงให้เห็นถึงความคล้ายคลึงกันระหว่างรุ่น ML และความเหนือกว่าเมื่อเทียบกับแบบจำลองความเสี่ยง 2 แบบที่มีอยู่ (รูปที่ 1)


ประสิทธิภาพของแบบจำลองข้ามประเภทย่อยของภาวะสมองเสื่อม
เพื่อประเมินประสิทธิภาพของแบบจำลอง ML ในประเภทย่อยของภาวะสมองเสื่อมที่แตกต่างกัน เราแบ่งประชากรออกเป็น 4 ประเภทย่อยของภาวะสมองเสื่อม: ภาวะสมองเสื่อมอัลไซเมอร์ (ผู้เข้าร่วม 1285 คน) LBD (ผู้เข้าร่วม 82 คน) ภาวะสมองเสื่อมจากหลอดเลือด (ผู้เข้าร่วม 21 คน) และประเภทย่อยของภาวะสมองเสื่อมอื่นๆ (ผู้เข้าร่วม 180 คน) แบบจำลอง LR สามารถระบุภาวะสมองเสื่อมและประเภทย่อยอื่นๆ ได้ดีที่สุด โดยจำแนกผู้เข้าร่วม 589 คน (46 เปอร์เซ็นต์) ที่มีภาวะสมองเสื่อมอัลไซเมอร์ได้อย่างถูกต้อง และผู้เข้าร่วม 99 คน (55 เปอร์เซ็นต์) ร่วมกับกลุ่มย่อยอื่นๆ โมเดล SVM ทำงานได้ดีที่สุดกับผู้เข้าร่วมที่มี LBD โดยจำแนกผู้เข้าร่วมได้ถูกต้อง 40 คน (49 เปอร์เซ็นต์) โมเดลทั้งหมดจำแนกผู้เข้าร่วมได้อย่างถูกต้อง 7 คน (ร้อยละ 33 ) ที่มีภาวะสมองเสื่อมเกี่ยวกับหลอดเลือด กราฟลักษณะการทำงานของตัวรับแสดงให้เห็นว่าโมเดลทั้งหมดทำงานได้ดีพอๆ กันในแต่ละประเภทย่อย (eFigure 1 ในส่วนเพิ่มเติม)
การตรวจสอบจำนวนตัวแปรขั้นต่ำ
ข้อเสียเปรียบประการหนึ่งของการใช้แนวทาง ML คือตัวแปรจำนวนมากที่เกี่ยวข้อง เมื่อจำนวนของตัวแปรที่แบบจำลองต้องการเพิ่มขึ้น การนำไปใช้ในการตั้งค่าทางคลินิกจะในทางปฏิบัติน้อยลงและความสามารถในการตีความของแบบจำลองนั้นบกพร่อง ในการประเมินจำนวนตัวแปรแต่ละโมเดล ML ที่ต้องใช้เพื่อให้ได้พลังการทำนายที่เทียบเท่ากับสิ่งที่เราพบโดยใช้ตัวแปรทั้งหมด 258 ตัว (ตารางที่ 2) เราประเมินว่า AUC แปรผันตามจำนวนตัวแปรที่รวมอยู่ในแบบจำลองอย่างไร โดยเฉพาะอย่างยิ่ง เราจัดอันดับตัวแปรสำหรับแต่ละรุ่นโดยเรียงลำดับตามลำดับความสำคัญจากมากไปหาน้อย (กล่าวคือ อำนาจการเลือกปฏิบัติของตัวแปรแต่ละตัวตามอัลกอริทึม; eMethods ในส่วนเพิ่มเติม) ต่อมาเราได้ฝึกแบบจำลองแต่ละรุ่นด้วยตัวแปรที่เพิ่มขึ้น โดยเริ่มจากสิ่งที่สำคัญที่สุด เราพบว่าแบบจำลองทั้งหมดต้องการเพียง 22 ตัวแปรเพื่อให้ได้ประสิทธิภาพการวินิจฉัยที่แยกไม่ออกทางสถิติจากประสิทธิภาพเฉลี่ยที่เหมาะสม (รูปที่ 2; eFigure 2 ในส่วนเพิ่มเติม) ตัวแปรสังเคราะห์ที่เพิ่มเข้ามาเพื่อให้แน่ใจว่าความถูกต้องของการประเมินความสำคัญของตัวแปรไม่อยู่ในตัวแปร 22 อันดับแรกสำหรับโมเดลใดๆ ซึ่งสะท้อนถึงข้อเท็จจริงที่ว่าหลังจากถึงประสิทธิภาพการวินิจฉัยเต็มรูปแบบแล้ว มีข้อมูลเพียงเล็กน้อยที่จะระบุการจัดอันดับตัวแปรอย่างยิ่ง
การระบุปัจจัยเสี่ยงที่สำคัญ
จากตัวแปรที่สำคัญที่สุด 22 ตัวสำหรับแต่ละรุ่น มีเพียง 5 ตัวที่เหมือนกันในทุกโมเดล (เช่น การตัดสินทางคลินิกของความจำเสื่อม ความสามารถทางปัญญา พฤติกรรม ความสามารถในการจัดการเหตุการณ์ หรือการเปลี่ยนแปลงของการเคลื่อนไหวและการเคลื่อนไหว เวลาในการทำแบบทดสอบ Trail Making ส่วน B; CDR: การด้อยค่าในการปฐมนิเทศ CDR: การด้อยค่าของบ้านและงานอดิเรก และระดับความเป็นอิสระ) จากตัวแปรที่เหลือ มี 10 คู่ที่มีความสัมพันธ์มากกว่า 0.7 ซึ่งระบุว่าเป็นตัวแปรที่คล้ายกัน (eTable 3 ในภาคผนวก) เมื่อพิจารณาถึงความสัมพันธ์นี้โดยการแลกเปลี่ยนตัวแปรที่มีความสัมพันธ์กันสูง เราพบว่ามีตัวแปรที่คาดการณ์ได้สูง 6 ตัว (การประเมินทางคลินิกของการลดลง เวลาในการทำ Trail Making Test ส่วน B ส่วนประกอบ 3 ส่วนของ CDR [การวางแนว หน่วยความจำ บ้านและงานอดิเรก การด้อยค่า] และระดับความเป็นอิสระ) ที่พบได้ทั่วไปในแบบจำลอง ML ทั้งหมด (eTable 4 ในส่วนเพิ่มเติม) การฝึกอบรมแต่ละรุ่นโดยใช้ตัวแปรเหล่านี้เท่านั้น เราพบว่าสำหรับ LR และ XGB ประสิทธิภาพการวินิจฉัยไม่มีลดลงอย่างมีนัยสำคัญ: การใช้ชุดหลักที่มีตัวแปร 6 ตัว โมเดลเหล่านี้มีความแม่นยำเฉลี่ย (SD) 91 เปอร์เซ็นต์ (0 เปอร์เซ็นต์ ) สำหรับ LR และ 91 เปอร์เซ็นต์ (1 เปอร์เซ็นต์ ) สำหรับ XGB และ AUC เฉลี่ย (SD) ที่ 0.89 (0.01) สำหรับ LR และ 0.89 (0.02) สำหรับ XGB (eTable 5 ในส่วนเสริม)
ความเสถียรในการวินิจฉัย
จากผู้เข้าร่วม 1568 รายที่ได้รับการวินิจฉัยภาวะสมองเสื่อมภายใน 2 ปี เราระบุ 130 (8 เปอร์เซ็นต์) ว่ากำลังประสบกับการกลับเป็นเหมือนเดิม ซึ่งมีแนวโน้มว่าจะวินิจฉัยผิดพลาดในตอนแรก และดังนั้นจึงติดป้ายกำกับผิดสำหรับวัตถุประสงค์ของ ML เราพบว่าในขณะที่รายงานการกลับรายการในผู้เข้าร่วม 0.8 เปอร์เซ็นต์เท่านั้น พวกเขาคิดเป็นผู้เข้าร่วม 92 ถึง 109 (7 เปอร์เซ็นต์ -8 เปอร์เซ็นต์ ) ของผู้เข้าร่วมที่จำแนกผิด โดยมีความแตกต่างเล็กน้อยระหว่างแบบจำลอง (ตารางที่ 3) แบบจำลอง RF มีความเสถียรในการวินิจฉัยสูงสุด โดยระบุผู้เข้าร่วม 109 คนจาก 130 คนที่มีอาการพลิกกลับได้อย่างถูกต้อง (84 เปอร์เซ็นต์) โดยจัดประเภทตามที่คาดการณ์ว่าจะปลอดภาวะสมองเสื่อมใน 2 ปี เพื่อตรวจสอบความเสถียรในการวินิจฉัยของโมเดล ML เราลบผู้เข้าร่วมที่มีการพลิกกลับระหว่างการฝึก (eMethods ในบทเพิ่มเติม) หลังจากฝึกแบบจำลองใหม่โดยไม่มีการพลิกกลับ เราพบว่า RF ระบุผู้เข้าร่วม 106 รายที่ประสบปัญหาการกลับรายการ (มัธยฐาน [IQR], 82 เปอร์เซ็นต์ [78 เปอร์เซ็นต์ -82 เปอร์เซ็นต์ ]), SVM ระบุผู้เข้าร่วม 93 รายที่ประสบปัญหาการพลิกกลับ (ค่ามัธยฐาน [IQR], 72 เปอร์เซ็นต์ [69 เปอร์เซ็นต์ -74 เปอร์เซ็นต์ ]) และ LR และ XGB ระบุผู้เข้าร่วม 92 คนที่มีอาการพลิกกลับ (มัธยฐาน [IQR], 71 เปอร์เซ็นต์ [68 เปอร์เซ็นต์ -75 เปอร์เซ็นต์ ]) IQR ได้มาจากผู้เข้าร่วมการบูตสแตรปที่มีประสบการณ์การพลิกกลับ

เพื่อให้เข้าใจความแตกต่างระหว่างผู้เข้าร่วมที่จัดประเภทผิด ผู้เข้าร่วมที่มีการพลิกกลับ และผู้เข้าร่วมที่พัฒนาภาวะสมองเสื่อมโดยไม่มีการกลับรายการ เราได้วิเคราะห์ CDF ของคะแนนการจัดหมวดหมู่ที่ได้รับจากแบบจำลอง ML แต่ละแบบ เราพบว่าคะแนนของผู้เข้าร่วมที่จำแนกผิด และผู้เข้าร่วมที่มีการกลับรายการเฉพาะนั้น แตกต่างจากผู้เข้าร่วมที่เป็นโรคสมองเสื่อมและผู้ที่ไม่ได้เข้าร่วม (eFigure 3 ในภาคผนวก) CDF ของคะแนนการจำแนกประเภทสำหรับผู้เข้าร่วมที่ไม่พัฒนาภาวะสมองเสื่อมลดลงทางด้านซ้ายสุดของแต่ละโครงเรื่อง ซึ่งบ่งชี้ว่าแบบจำลอง ML กำหนดให้ผู้เข้าร่วมเหล่านี้มีโอกาสเกิดภาวะสมองเสื่อมต่ำ ในทางกลับกัน สำหรับผู้เข้าร่วมที่พัฒนาภาวะสมองเสื่อม CDF จะตกลงไปทางด้านขวาของแผนงาน: พวกเขาได้รับมอบหมายให้มีโอกาสสูงที่จะพัฒนาภาวะสมองเสื่อม สำหรับทุกรุ่น การกระจายคะแนนสำหรับผู้เข้าร่วมที่มีการพลิกกลับลดลงทางด้านซ้ายของคะแนนสำหรับผู้เข้าร่วมที่เป็นโรคสมองเสื่อม ซึ่งหมายความว่าผู้เข้าร่วมที่มีการพลิกกลับจะได้รับการประเมินว่ามีความน่าจะเป็นที่ต่ำกว่าที่จะพัฒนาภาวะสมองเสื่อมตามแบบจำลองเหล่านี้
การอภิปราย
ในการศึกษาเชิงพยากรณ์นี้ อัลกอริธึม ML มีความแม่นยำในการพยากรณ์ที่เหนือกว่าเมื่อเปรียบเทียบกับ BDSI และ CAIDE ในการทำนายอุบัติการณ์ภาวะสมองเสื่อมภายใน 2 ปีของการประเมินคลินิกหน่วยความจำครั้งแรกของผู้ป่วย อัลกอริธึม ML สองรายการได้รับการประเมินเพื่อให้ได้ความแม่นยำถึง 91 เปอร์เซ็นต์ และ AUC เท่ากับ 0.89 ด้วยตัวแปรหลักเพียง 6 ตัว การวิเคราะห์ความไวแนะนำว่าแบบจำลอง ML สามารถจำแนกผู้เข้าร่วมที่มีส่วนสูงที่ได้รับการพลิกกลับซึ่งอาจได้รับการวินิจฉัยผิดพลาดภายใน 2 ปีของการเข้ารับการตรวจครั้งแรกอย่างถูกต้อง การศึกษานี้มีจุดแข็งหลายประการ รวมถึงกลุ่มตัวอย่างจำนวนมากของผู้ป่วยที่ได้มาจากคลินิกความจำหลายแห่งทั่วสหรัฐอเมริกา เทคนิค ML ที่หลากหลาย การเปรียบเทียบกับแบบจำลองความเสี่ยงที่มีอยู่ และการสำรวจความเสถียรในการวินิจฉัยและการวินิจฉัยที่ผิดพลาดที่อาจเกิดขึ้น
การศึกษาก่อนหน้านี้เกี่ยวกับการใช้ ML ในการทำนายความเสี่ยงของภาวะสมองเสื่อมได้มุ่งเน้นไปที่การเปลี่ยนจากการรับรู้ที่ไม่บกพร่องไปเป็นภาวะสมองเสื่อมจากอัลไซเมอร์หรือ MCI,6,8 หรือการเปลี่ยนจาก MCI เป็นภาวะสมองเสื่อมจากโรคอัลไซเมอร์5 วิธีการเหล่านี้มีประโยชน์น้อยกว่าในสถานพยาบาล เนื่องจากไม่รวม ภาวะสมองเสื่อมประเภทอื่นๆ5,6,8 หรือผู้ป่วยที่ไม่มีความบกพร่องทางสติปัญญาในขั้นต้น5 ข้อมูลที่ใช้ในการศึกษาเหล่านี้ ได้แก่ การสแกนเอกซเรย์ปล่อยโพซิตรอน 5,8 และไบโอมาร์คเกอร์น้ำไขสันหลัง โดย 8 ในนั้นไม่มีให้บริการในคลินิกหน่วยความจำ การศึกษาโดย Lin et al6 เอาชนะสิ่งนี้โดยใช้ข้อมูล NACC เพื่อค้นหาชุดตัวแปรทางคลินิกที่ไม่รุกล้ำ 15 ตัวเพื่อประเมินความเสี่ยงของการเปลี่ยนจากการรับรู้ที่ไม่บกพร่องไปเป็น MCI ในระยะเวลา 4-ปี อย่างไรก็ตาม โครงสร้างของ MCI ยังคงค่อนข้างขัดแย้ง 32 และอัตราการแปลงระหว่าง MCI และภาวะสมองเสื่อมมักจะต่ำ32,33 แบบจำลอง ML ของเราช่วยเสริมการวิเคราะห์เหล่านี้และมีข้อได้เปรียบจากการรวมตัวแปรหลักเพียง 6 ตัวในช่วงเวลาที่เกี่ยวข้องทางคลินิกและคาดการณ์ ผลของภาวะสมองเสื่อมจากทุกสาเหตุ
จากแบบจำลองที่มีอยู่ซึ่งทำการศึกษาในการศึกษาของเรา แบบจำลอง CAIDE มีความแม่นยำน้อยที่สุดในการทำนายความเสี่ยงภาวะสมองเสื่อมในช่วง 2 ปี ซึ่งไม่น่าแปลกใจ เนื่องจากได้รับการพัฒนาขึ้นเพื่อทำนายความเสี่ยงภาวะสมองเสื่อมในระยะยาวในผู้ใหญ่วัยกลางคนได้นานกว่ามาก ระยะเวลาติดตามผล 20 ปี BDSI ทำงานได้ดีกว่า CAIDE ซึ่งอาจสะท้อนว่าได้รับการออกแบบมาเพื่อใช้ในผู้สูงอายุในช่วงติดตามผลปานกลางถึง 6 ปี อย่างไรก็ตาม โมเดล ML ทั้งหมดมีประสิทธิภาพเหนือกว่าโมเดลที่มีอยู่เหล่านี้ การใช้ตัวแปรทั้งหมด XGB เป็นแนวทาง ML ที่ทรงพลังที่สุดในการทำนายผู้ป่วยที่มีแนวโน้มว่าจะได้รับการวินิจฉัยว่าเป็นโรคสมองเสื่อมภายใน 2 ปี โดยแนะนำว่าวิธีที่ต้นไม้การตัดสินใจใหม่ได้รับการฝึกฝนเพื่อแก้ไขข้อผิดพลาดของสามข้อสุดท้ายส่งผลให้ประสิทธิภาพลดลง ได้รับ. อย่างไรก็ตาม XGB ดูเหมือนจะเป็นแนวทางที่สามารถระบุผู้เข้าร่วมที่มีการพลิกกลับได้น้อยที่สุด กล่าวคือ ผู้ที่ได้รับการวินิจฉัยว่าเป็นโรคสมองเสื่อมในขั้นต้นภายใน 2 ปี และการวินิจฉัยนั้นกลับรายการภายใน 2 ปีนับจากการวินิจฉัยครั้งแรก
ประสิทธิภาพของโมเดล ML สามารถลดลงได้อย่างมากโดยข้อมูลการฝึกที่ติดฉลากผิด34 ตรงกันข้าม การยกเว้นข้อมูลการฝึกที่ติดฉลากผิดไม่ได้ช่วยปรับปรุงประสิทธิภาพเสมอไป35 เมื่อระดับเสียงรบกวนในข้อมูลการฝึกเพิ่มขึ้น ค่าของการยกเว้นหรือลดเสียงรบกวนนั้นจะลดลงหาก มีสัญญาณรบกวนที่เหมือนกันในข้อมูลการตรวจสอบ 36 ดังนั้น ข้อมูลการฝึกกรองอาจลดข้อมูลการทำให้ประสิทธิภาพการทำงานไม่ถูกต้องตามที่พบในการศึกษานี้ อย่างไรก็ตาม เมื่อระดับของการติดฉลากผิดน้อยกว่าประมาณ 20 เปอร์เซ็นต์ถึง 40 เปอร์เซ็นต์ การลบข้อมูลที่ติดฉลากผิดสามารถปรับปรุงความถูกต้องของข้อมูลการตรวจสอบได้ แม้ว่าจะรวมข้อมูลที่ติดฉลากผิดไว้ก็ตาม 35,37,38 ซึ่งแสดงให้เห็นถึงความสำคัญของการตรวจสอบความเสถียรของการวินิจฉัยในการฝึกอบรมและ ข้อมูลการตรวจสอบความถูกต้อง: แม้แต่ข้อมูลมาตรฐานเกณฑ์ก็รวมข้อผิดพลาด
อัตราการพลิกกลับที่สังเกตได้ (8 เปอร์เซ็นต์) คล้ายกับที่พบในการศึกษาปี 2019 โดยอิงจากประชากรสหรัฐที่แตกต่างกัน31 ในการศึกษาของเรา พบว่าเปอร์เซ็นต์ของผลบวกลวงแตกต่างกันไปจาก 7 เปอร์เซ็นต์ ถึง 19 เปอร์เซ็นต์ ขึ้นอยู่กับความรู้ความเข้าใจ การประเมินที่ใช้ ตามความรู้ของเรา นี่เป็นการวิเคราะห์ครั้งแรกของการวินิจฉัยผิดพลาดที่อาจเกิดขึ้นใน NACC UDS และแสดงให้เห็นว่าการใช้ ML เป็นตัวช่วยในการตัดสินใจทางคลินิกมีศักยภาพในการลดการวินิจฉัยผิดพลาดของผลบวกที่ผิดพลาดได้มากถึง 84 เปอร์เซ็นต์ เนื่องจากผู้ป่วยที่มีอาการพลิกกลับเป็นเส้นเขตแดนในแง่ของการวินิจฉัย จากมุมมองทางคลินิก อาจสมเหตุสมผลที่พวกเขาจะปฏิบัติตามต่อไป เนื่องจากมีเหตุผลสำหรับความกังวลทางคลินิก ดังนั้น XGB อาจเป็นแบบจำลองที่ดีที่สุดสำหรับเครื่องช่วยในการตัดสินใจทางคลินิก อีกวิธีหนึ่งคือ วิธีการแบบกลุ่มที่ทำให้การคาดการณ์ทุติยภูมิเกี่ยวกับความเสถียรในการวินิจฉัยที่น่าจะเป็นไปได้และโอกาสในการจำแนกประเภทผิดอาจพิสูจน์ได้ว่ามีประโยชน์มากยิ่งขึ้น
ข้อจำกัด
การศึกษานี้มีข้อจำกัดหลายประการ ประการแรก ทั้ง CAIDE และ BDSI ได้รับการพัฒนาโดยใช้ประชากรที่ต่างกันกับกลุ่มที่ใช้ในการศึกษานี้ ไม่ใช่ตัวแปรทั้งหมดที่ใช้สำหรับการพัฒนาแบบจำลองเหล่านี้จะมีค่าเทียบเท่าที่แน่นอนใน UDS ซึ่งอาจส่งผลต่อประสิทธิภาพในชุดข้อมูลนี้ ประการที่สอง วิธีการที่ใช้ในการใส่ข้อมูลอาจส่งผลให้เกิดข้อผิดพลาดในการใส่ข้อมูล โดยเฉพาะอย่างยิ่ง การใส่แทนค่าแทนที่ค่าที่หายไปทั้งหมดด้วยค่าตัวเลข แต่ค่าบางค่าขาดหายไปเนื่องจากความสัมพันธ์กับค่าอื่น ดังนั้นการที่ค่าที่หายไปนั้นเป็นข้อมูล อย่างไรก็ตาม ในขณะที่ผู้เข้าร่วมมีข้อมูลที่ขาดหายไปเฉลี่ย 14 เปอร์เซ็นต์ ตัวแปรหลัก 6 ตัวที่ระบุหายไปสำหรับค่าเฉลี่ย 1 เปอร์เซ็นต์ของผู้เข้าร่วม ประการที่สาม แม้ว่าการศึกษาของเราจะใช้ตัวอย่างผู้เข้าร่วมคลินิกหน่วยความจำจำนวนมากในสหรัฐอเมริกา ทำให้ผลลัพธ์ของเรามีความเหมาะสมอย่างมากกับการตั้งค่านี้ ขอบเขตที่ผลลัพธ์เหล่านี้จะสรุปไปยังประชากรอื่น ๆ ไม่เป็นที่รู้จัก
บทสรุป
การศึกษาเชิงพยากรณ์นี้พบว่าแบบจำลอง ML มีประสิทธิภาพดีกว่าแบบจำลองการคาดการณ์ความเสี่ยงของภาวะสมองเสื่อมที่มีอยู่ และอาจมีศักยภาพในการปรับปรุงการทำนายภาวะสมองเสื่อมจากเหตุการณ์ที่เกิดขึ้นในช่วง 2 ปีในคลินิกหน่วยความจำ ปัจจัยสำคัญ 6 ประการสำหรับความเสี่ยงภาวะสมองเสื่อมที่ระบุในการศึกษานี้อาจมีศักยภาพในการปรับปรุงการปฏิบัติทางคลินิกในคลินิกความจำ หากรวมเข้ากับเครื่องช่วยตัดสินใจทางคลินิกในอนาคต
ข้อมูลอ้างอิง
1. Hejl A, Høgh P, Waldemar G. ภาวะที่อาจย้อนกลับได้ในผู้ป่วยคลินิกหน่วยความจำต่อเนื่อง 1,000 คน จิตเวชศาสตร์ J Neurol Neurosurg
2. Mitchell AJ, Shiri-Feshki M. อัตราความก้าวหน้าของความบกพร่องทางสติปัญญาที่ไม่รุนแรงต่อภาวะสมองเสื่อม—การวิเคราะห์เมตาของการศึกษาตามรุ่นกลุ่มเริ่มต้นที่แข็งแกร่ง 41 เรื่อง Acta Psychiatr Scand. 2009;119(4):252-265.
3. Barnes DE, Beiser AS, Lee A และอื่น ๆ การพัฒนาและตรวจสอบตัวบ่งชี้การคัดกรองภาวะสมองเสื่อมโดยย่อสำหรับการดูแลเบื้องต้น โรคอัลไซเมอร์. 2014;10(6):656-665.e1. ดอย:10.1016/j.jalz.2013.11.06
4. Kivipelto M, Ngandu T, Laatikainen T, Winblad B, Soininen H, Tuomilehto J. คะแนนความเสี่ยงสำหรับการทำนายความเสี่ยงภาวะสมองเสื่อมใน 20 ปีในคนวัยกลางคน: การศึกษาตามยาวตามประชากร มีดหมอนิวโรล. 2006;5(9):735-741 ดอย:10.1016/ส1474-4422(06)70537-3
5. Cui Y, Liu B, Luo S, และคณะ; โรคอัลไซเมอร์ความคิดริเริ่ม Neuroimaging การระบุการเปลี่ยนจากความบกพร่องทางสติปัญญาเล็กน้อยไปสู่โรคอัลไซเมอร์โดยใช้ตัวทำนายหลายตัวแปร ป.ล. หนึ่ง
6. Lin M, Gong P, Yang T, Ye J, Albin RL, Dodge HH. แนวทางการวิเคราะห์บิ๊กดาต้าในชุดข้อมูล ป.ป.ช.: การช่วยเหลือเสริมคุณค่าการทดลองพรีคลินิก อัลไซเมอร์ ดิส แอสโซค ดิสคอร์ด. 2018;32(1):18-27.
7. Park JH, Cho HE, Kim JH และอื่น ๆ การทำนายด้วยแมชชีนเลิร์นนิงของอุบัติการณ์ของโรคอัลไซเมอร์โดยใช้ข้อมูลด้านสุขภาพในการบริหารขนาดใหญ่ NPJ หลัก Med. 2020;3(1):46.
8. Zhan Y, Chen K, Wu X, และคณะ; โรคอัลไซเมอร์ความคิดริเริ่ม Neuroimaging การระบุการเปลี่ยนจากการรับรู้ของผู้สูงอายุปกติเป็นโรคอัลไซเมอร์โดยใช้เครื่องสนับสนุนหลายรูปแบบJ Alzheimers Dis. 2558; 47(4):1057-1067.
9. Burgos N, Colliot O. Machine Learning สำหรับการจำแนกและการทำนายโรคทางสมอง: ความก้าวหน้าล่าสุดและความท้าทายที่จะเกิดขึ้น Curr Opin Neurol. 2020;33(4):439-450.
10. Beekly DL, Ramos EM, Lee WW, และคณะ; ศูนย์โรคอัลไซเมอร์ของ NIA ฐานข้อมูลศูนย์ประสานงานโรคอัลไซเมอร์แห่งชาติ (NACC): ชุดข้อมูลสม่ำเสมอ อัลไซเมอร์ ดิส แอสโซค ดิสคอร์ด. 2007;21(3):249-258.
11.สถาบันผู้สูงอายุแห่งชาติ. ศูนย์วิจัยโรคอัลไซเมอร์. เข้าถึงเมื่อ 21 พฤษภาคม 2021.
12. Pfeffer RI, Kurosaki TT, Harrah CH Jr, Chance JM, Filos S. การวัดกิจกรรมการทำงานในผู้สูงอายุในชุมชน เจ เจอรอนทอล. 1982;37(3):323-329.
13. Kaufer DI, Cummings JL, Ketchel P และอื่น ๆ การตรวจสอบความถูกต้องของ NPI-Q ซึ่งเป็นรูปแบบทางคลินิกโดยสังเขปของ Neuropsychiatric Inventory เจ คลินิกประสาทจิตเวช. 2000;12(2):233-239.
14. Weintraub S, ปลาแซลมอน D, Mercaldo N และอื่น ๆ ชุดข้อมูลยูนิฟอร์มของศูนย์โรคอัลไซเมอร์ (UDS): แบตเตอรี่ทดสอบทางระบบประสาท อัลไซเมอร์ ดิส แอสโซค ดิสคอร์ด. 2009;23(2):91-101.
15. Morris JC, Weintraub S, Chui HC และอื่น ๆ ชุดข้อมูลสม่ำเสมอ (UDS): ตัวแปรทางคลินิกและความรู้ความเข้าใจและข้อมูลเชิงพรรณนาจากศูนย์โรคอัลไซเมอร์ อัลไซเมอร์ ดิส แอสโซค ดิสคอร์ด. 2006;20(4):210-216.
16. McKhann G, Drachman D, Folstein M, Katzman R, ราคา D, Stadlan EM การวินิจฉัยทางคลินิกของโรคอัลไซเมอร์: รายงานของคณะทำงาน NINCDS-ADRDA ภายใต้การอุปถัมภ์ของคณะทำงานเฉพาะกิจกรมอนามัยและบริการมนุษย์เกี่ยวกับโรคอัลไซเมอร์ ประสาทวิทยา. 1984;34(7):939-944.
17. Román GC, Tateichi TK, Erkinjuntti T, และคณะ ภาวะสมองเสื่อมจากหลอดเลือด: เกณฑ์การวินิจฉัยสำหรับการศึกษาวิจัย: รายงานการประชุมเชิงปฏิบัติการนานาชาติ NINDS-AIREN ประสาทวิทยา. 1993;43(2):250-260.
18. McKeith IG, Dickson DW, Lowe J และอื่น ๆ ; Consortium บน DLB การวินิจฉัยและการจัดการภาวะสมองเสื่อมด้วยร่างกายของ Lewy: รายงานฉบับที่สามของ DLB Consortium ประสาทวิทยา.
19. Neary D, Snowden JS, Gustafson L และอื่น ๆ การเสื่อมสภาพของกลีบหน้าขมับ: ฉันทามติเกี่ยวกับเกณฑ์การวินิจฉัยทางคลินิก ประสาทวิทยา. 1998;51(6):1546-1554.
20. Martínez-Martín P, Gil-Nagel A, Gracia LM, Gómez JB, Martínez-Sarriés J, Bermejo F; กลุ่มสหกรณ์พหุศูนย์กลาง. ลักษณะและโครงสร้างมาตราส่วนการให้คะแนนโรคของ Unified Parkinson มูฟ ดิสคอร์ด. 1994;9 (1):76-83.
21. มอร์ริส เจซี. Clinical Dementia Rating: การวัดระยะและการวินิจฉัยที่เชื่อถือได้และถูกต้องสำหรับภาวะสมองเสื่อมในประเภทอัลไซเมอร์ Int Psychogeriatr. 1997;9(S1)(แทนที่ 1):173-176
22. Hastie T, Tibshirani R, Friedman J. องค์ประกอบของการเรียนรู้ทางสถิติ: การทำเหมืองข้อมูล การอนุมาน และการทำนาย สื่อวิทยาศาสตร์และธุรกิจของสปริงเกอร์; 2552.
23. Hosmer Jr DW, Lemeshow S, Sturdivant RX การถดถอยโลจิสติกประยุกต์ จอห์น ไวลีย์ แอนด์ ซันส์; 2013.
24. Cortes C, Vapnik V. เครือข่ายสนับสนุนเวกเตอร์ มัคเรียนรู้ 1995;20(3):273-97. ดอย:10.1007/BF00994018
25. Breiman L. ป่าสุ่ม. มัคเรียนรู้ 2001;45(1):5-32. ดอย:10.1023/A:1010933404324
26. โฮ ทีเค. ป่าตัดสินใจสุ่ม ใน: การดำเนินการของการประชุมนานาชาติครั้งที่ 3 เกี่ยวกับการวิเคราะห์และการรับรู้เอกสาร อีอีอี; 1995:278-282.
27. ฟรีดแมน เจเอช. การเร่งการไล่ระดับสีแบบสุ่ม การวิเคราะห์ข้อมูลสถิติทางคอมพิวเตอร์ 2002; 38(4):367-78.
28. Pedregosa F, Varoquaux G, Gramfort A, et al, Scikit-learn: การเรียนรู้ด้วยเครื่องใน Python J Mach เรียนรู้ Res. 2554; 12:2825-2830.
29. Krzanowski WJ ดีเจมือ ROC Curves สำหรับข้อมูลต่อเนื่อง ซีอาร์ซีกด; 2552.
30. Fawcett, T. บทนำสู่การวิเคราะห์ ROC การจดจำรูปแบบ Lett 2006;27(8):861-874. ดอย:10.1016/จ. Patric.2005.10.010
31. Ranson JM, Kuźma E, Hamilton W, Muniz-Terrera G, Langa KM, Llewellyn DJ. ตัวทำนายของการจำแนกประเภทภาวะสมองเสื่อมผิดเมื่อใช้การประเมินความรู้ความเข้าใจสั้น ๆ คลินิก Neurol 2019;9(2):109-117.
32. Bruscoli M, Lovestone S. MCI เป็นเพียงภาวะสมองเสื่อมในระยะแรกเท่านั้น: การทบทวนการศึกษาการเปลี่ยนแปลงอย่างเป็นระบบ Int Psychogeriatr. 2004;16(2):129-140.
33 Farias ST, Mungas D, Reed BR, Harvey D, DeCarli C. ความก้าวหน้าของความบกพร่องทางสติปัญญาเล็กน้อยต่อภาวะสมองเสื่อมในกลุ่มผู้ป่วยในคลินิกและชุมชน อาร์ค นิวโรล 2009;66(9):1151-1157
34. Guan D, Yuan W, Ma T, Khattak AM, Chow F. การกำจัดข้อมูลการฝึกอบรมที่ติดฉลากผิดด้านต้นทุนที่อ่อนไหว Inf วิทย์ 2017; 402:170-81.
35. Brodley CE, Friedl MA การระบุข้อมูลการฝึกอบรมที่ติดฉลากผิดJ Artif Intelligence Res
36. ควินแลน เจอาร์ การเหนี่ยวนำของต้นไม้ตัดสินใจ มัคเรียนรู้ 1986;1(1):81-106.
37. Brodley CE, Friedl MA การระบุและกำจัดอินสแตนซ์การฝึกอบรมที่ติดฉลากผิด ใน: AAAI '96: Proceedings of the 13th National Conference on Artificial Intelligence. เอเอไอ; 1996:799-805.
38. Brodley CE, Friedl MA ปรับปรุงการทำแผนที่คลุมดินโดยอัตโนมัติโดยระบุและกำจัดการสังเกตที่ติดฉลากผิดจากข้อมูลการฝึกอบรม ใน: IGARSS '96: 1996 International Geoscience and Remote Sensing Symposium IEEE; 1996:1379-1381.
