ఈ సైట్‌లోని విషయాలు కృత్రిమ మేధస్సు (AI) లేదా యంత్ర అనువాద సాంకేతికత ఉపయోగించి అనువదించబడ్డాయి మరియు లోపాలు ఉండవచ్చు.

Skip to content
Data Science

కారణ గ్రహణ అవకాశాల స్వయంచాలక గుర్తింపు: రీగ్రెషన్ డిస్కంటిన్యుటీ ఉపసమూహ ఆవిష్కరణ

Author

టోనీ లియు (యు. పెన్ మరియు రాబ్లాక్స్), పాట్రిక్ లాఫ్లర్ (చిల్డ్రన్స్ హాస్పిటల్ ఆఫ్ ఫిలడెల్ఫియా), లైల్ ఉంగర్ (యు. పెన్), కోన్రాడ్ కోర్డింగ్ (యు. పెన్), రాహుల్ లాధనియా (యు. మిచ్)

Venue

ICML IMLH (నాన్-ఆర్కైవల్), TMLR

Abstract

కారణ ప్రభావాలను గుర్తించడానికి గోల్డ్ స్టాండర్డ్ యాదృచ్ఛిక నియంత్రిత ప్రయోగాలు (RCTలు), కానీ RCTలను నిర్వహించడం ఎల్లప్పుడూ సాధ్యం కాకపోవచ్చు. అయితే, చికిత్సలు ఒక థ్రెషోల్డ్‌పై ఆధారపడినప్పుడు, ఉదాహరణకు మధుమేహ నిర్ధారణ కోసం రక్తంలో చక్కెర థ్రెషోల్డ్ వంటివి, మనం ఇప్పటికీ రిగ్రెషన్ డిస్కంటిన్యుటీస్ (RDs)తో కారణ ప్రభావాలను అంచనా వేయవచ్చు. తెలివిపరీక్షలో రక్తంలో చక్కెర స్థాయిని నిర్ధారించడానికి అవసరమైన కనీస పరిమితి వంటి, పరిమితికి కొంచెం పైన మరియు కింద ఉన్న యూనిట్లలో సహచర చరాలు (కోవేరియేట్స్) ఒకే విధంగా పంపిణీ చేయబడినప్పుడు, అనగా శబ్దం (నోయిస్) ఉన్నప్పటికీ ఎటువంటి గందరగోళం (కన్‌ఫౌండింగ్) లేనప్పుడు RDలు చెల్లుబాటు అవుతాయి, ఇది యాదృచ్ఛికం చేసినట్లుగా (యాజ్-ఇఫ్ రాండమైజేషన్) పరిగణించబడుతుంది. అయితే, ఆచరణలో RD అధ్యయనాలను అమలు చేయడం కష్టం కావచ్చు, ఎందుకంటే చికిత్స పరిమితులను గుర్తించడానికి గణనీయమైన డొమైన్ నైపుణ్యం అవసరం -- అంతేకాకుండా, ఈ పరిమితులు ఉప-సమూహాలలో (ఉదా., డయాబెటిస్ కోసం రక్తంలో చక్కెర పరిమితి జనాభా వివరాల్లో తేడా ఉండవచ్చు) భిన్నంగా ఉండవచ్చు, మరియు ఈ తేడాలను విస్మరించడం వలన గణాంక శక్తి తగ్గవచ్చు. థ్రెషోల్డ్‌లను కనుగొనడం మరియు అవి ఎవరికి వర్తిస్తాయో తెలుసుకోవడం అనేది ప్రస్తుతం డొమైన్ నిపుణులచే మాన్యువల్‌గా పరిష్కరించబడుతున్న ఒక ముఖ్యమైన సమస్య, మరియు డొమైన్ నైపుణ్యం సరిపోనిప్పుడు డేటా-ఆధారిత విధానాలు అవసరం. ఇక్కడ, మేము రిగ్రెషన్ డిస్‌కంటిన్యూటీ సబ్‌గ్రూప్ డిస్కవరీ (RDSGD)ని పరిచయం చేస్తున్నాము, ఇది RD థ్రెషోల్డ్‌ల కోసం గణాంకపరంగా శక్తివంతమైన మరియు వివరించదగిన సబ్‌గ్రూప్‌లను గుర్తించే ఒక మెషిన్-లెర్నింగ్ పద్ధతి. 60 మిలియన్లకు పైగా రోగులతో కూడిన వైద్య క్లెయిమ్‌ల డేటాసెట్‌ను ఉపయోగించి, మేము బహుళ క్లినికల్ సందర్భాలలో RDSGDని వర్తింపజేసి, చికిత్స కేటాయింపు పరిమితులకు ఎక్కువగా కట్టుబడి ఉండే ఉప సమూహాలను గుర్తించాము. అనేక వ్యాధులు మరియు విధాన నిర్ణయాలకు చికిత్స పరిమితులు ముఖ్యమైనవి కాబట్టి, కారణ అంచనా కోసం కొత్త మార్గాలను కనుగొనడానికి RDSGD ఒక శక్తివంతమైన సాధనంగా ఉపయోగపడుతుంది.