Konten di situs ini telah diterjemahkan menggunakan kecerdasan buatan (AI) atau teknologi penerjemahan mesin, dan mungkin terdapat kesalahan.

Skip to content
Data Science

Deteksi Otomatis Peluang Inferensi Kausal: Penemuan Subkelompok Diskontinuitas Regresi

Author

Tony Liu (Universitas Pennsylvania dan Roblox), Patrick Lawlor (Rumah Sakit Anak Philadelphia), Lyle Ungar (Universitas Pennsylvania), Konrad Kording (Universitas Pennsylvania), Rahul Ladhania (Universitas Michigan)

Venue

ICML IMLH (non-arsip), TMLR

Abstract

Standar emas untuk mengidentifikasi efek kausal adalah uji coba terkontrol secara acak (RCT), tetapi RCT mungkin tidak selalu bisa dilakukan. Namun, ketika pengobatan bergantung pada ambang batas, seperti ambang batas gula darah untuk diagnosis diabetes, kita terkadang masih bisa memperkirakan efek kausal dengan diskontinuitas regresi (RD). RD valid ketika unit di atas dan di bawah ambang batas memiliki distribusi kovariat yang sama dan oleh karena itu tidak ada faktor pengganggu dalam kehadiran noise, sehingga menciptakan randomisasi "seolah-olah". Namun, dalam praktiknya, melaksanakan studi RD dapat sulit karena mengidentifikasi ambang batas perlakuan memerlukan keahlian domain yang signifikan — selain itu, ambang batas tersebut mungkin berbeda antar subkelompok (misalnya, ambang batas gula darah untuk diabetes mungkin berbeda antar demografi), dan mengabaikan perbedaan ini dapat menurunkan daya statistik. Menemukan ambang batas dan kepada siapa ambang batas tersebut berlaku merupakan masalah penting yang saat ini diselesaikan secara manual oleh ahli bidang, dan pendekatan berbasis data diperlukan ketika keahlian bidang tidak mencukupi. Di sini, kami memperkenalkan Regression Discontinuity SubGroup Discovery (RDSGD), metode pembelajaran mesin yang mengidentifikasi subkelompok yang kuat secara statistik dan dapat diinterpretasikan untuk ambang batas RD. Dengan menggunakan dataset klaim medis yang mencakup lebih dari 60 juta pasien, kami menerapkan RDSGD pada berbagai konteks klinis dan mengidentifikasi subkelompok dengan kepatuhan yang lebih tinggi terhadap ambang batas penugasan pengobatan. Karena ambang batas pengobatan penting bagi banyak penyakit dan keputusan kebijakan, RDSGD dapat menjadi alat yang kuat untuk menemukan jalur baru dalam estimasi kausal.