Nedensel Çıkarım Fırsatlarının Otomatik Tespiti: Regresyon Kesintisi Alt Grubu Keşfi
Author
Venue
ICML IMLH (arşiv dışı), TMLR
Abstract
Nedensel etkilerin belirlenmesi için altın standart, randomize kontrollü çalışmalar (RCT)dır, ancak RCT'lerin yürütülmesi her zaman mümkün olmayabilir. Bununla birlikte, tedaviler bir eşik değerine bağlı olduğunda, örneğin diyabet tanısı için kan şekeri eşik değeri gibi, bazen regresyon süreksizlikleri (RD'ler) ile nedensel etkileri tahmin edebiliriz. RD'ler, eşiğin hemen üstündeki ve altındaki birimlerin aynı ortak değişken dağılımına sahip olması ve dolayısıyla gürültünün varlığında karıştırıcı faktörlerin olmaması durumunda geçerlidir; bu da "sanki" randomizasyon oluşturur. Ancak pratikte, RD çalışmalarını uygulamak zor olabilir, çünkü tedavi eşiklerini belirlemek önemli ölçüde alan uzmanlığı gerektirir; ayrıca, eşikler alt gruplar arasında farklılık gösterebilir (örneğin, diyabet için kan şekeri eşiği demografik gruplara göre farklılık gösterebilir) ve bu farklılıkları göz ardı etmek istatistiksel gücü düşürebilir. Eşik değerlerini ve bunların kime uygulanacağını bulmak, şu anda alan uzmanları tarafından manuel olarak çözülen önemli bir sorundur ve alan uzmanlığı yeterli olmadığında veriye dayalı yaklaşımlara ihtiyaç duyulur. Burada, RD eşik değerleri için istatistiksel olarak güçlü ve yorumlanabilir alt grupları belirleyen bir makine öğrenimi yöntemi olan Regresyon Kesintisi Alt Grup Keşfi'ni (RDSGD) tanıtıyoruz. 60 milyondan fazla hastayı içeren bir tıbbi talep veri setini kullanarak, RDSGD'yi çeşitli klinik bağlamlara uyguluyor ve tedavi atama eşiklerine uyumu artmış alt grupları belirliyoruz. Tedavi eşikleri birçok hastalık ve politika kararı için önemli olduğundan, RDSGD nedensel tahmin için yeni yollar keşfetmek amacıyla güçlü bir araç olabilir.
