Treści na tej stronie zostały przetłumaczone przy użyciu sztucznej inteligencji (AI) lub technologii tłumaczenia maszynowego i mogą zawierać błędy.

Skip to content
Data Science

Automatyczne wykrywanie możliwości wnioskowania przyczynowego: wykrywanie podgrup w analizie regresji nieciągłej

Author

Tony Liu (Uniwersytet Pensylwanii i Roblox), Patrick Lawlor (Szpital Dziecięcy w Filadelfii), Lyle Ungar (Uniwersytet Pensylwanii), Konrad Kording (Uniwersytet Pensylwanii), Rahul Ladhania (Uniwersytet Michigan)

Venue

ICML IMLH (niearchiwalne), TMLR

Abstract

Złotym standardem w identyfikacji skutków przyczynowych są randomizowane badania kontrolowane (RCT), ale ich przeprowadzenie nie zawsze jest możliwe. Gdy jednak leczenie zależy od pewnego progu, jak np. poziom cukru we krwi w diagnozie cukrzycy, czasami nadal możemy oszacować skutki przyczynowe za pomocą regresji nieciągłości (RD). RD są ważne, gdy jednostki tuż powyżej i poniżej progu mają taki sam rozkład zmiennych towarzyszących, a więc nie ma czynników zakłócających w obecności szumu, co tworzy coś w rodzaju randomizacji. W praktyce jednak wdrożenie badań RD może być trudne, bo określenie progów leczenia wymaga sporej wiedzy specjalistycznej – co więcej, progi mogą się różnić w różnych podgrupach (np. próg poziomu cukru we krwi dla cukrzycy może się różnić w zależności od grupy demograficznej), a ignorowanie tych różnic może obniżyć moc statystyczną. Określenie progów i grup, do których mają one zastosowanie, jest ważnym problemem, który obecnie rozwiązywany jest ręcznie przez ekspertów w danej dziedzinie, a gdy wiedza specjalistyczna jest niewystarczająca, potrzebne są podejścia oparte na danych. W niniejszym artykule przedstawiamy metodę Regression Discontinuity SubGroup Discovery (RDSGD), metodę uczenia maszynowego, która identyfikuje statystycznie istotne i interpretowalne podgrupy dla progów RD. Korzystając z zbioru danych dotyczących roszczeń medycznych obejmującego ponad 60 milionów pacjentów, stosujemy RDSGD w wielu kontekstach klinicznych i identyfikujemy podgrupy o zwiększonej zgodności z progami przypisania leczenia. Ponieważ progi leczenia mają znaczenie dla wielu chorób i decyzji politycznych, RDSGD może być potężnym narzędziem do odkrywania nowych dróg szacowania związków przyczynowych.