এই সাইটের বিষয়বস্তু কৃত্রিম বুদ্ধিমত্তা (AI) বা মেশিন অনুবাদ প্রযুক্তি ব্যবহার করে অনুবাদ করা হয়েছে এবং ত্রুটি থাকতে পারে।

Skip to content
Data Science

কারণগত অনুমানের সুযোগের স্বয়ংক্রিয় সনাক্তকরণ: রিগ্রেশন বিচ্ছিন্নতা উপগোষ্ঠী আবিষ্কার

Author

টনি লিউ (ইউ. পেন এবং রোবলোক্স), প্যাট্রিক ললর (ফিলাডেলফিয়া শিশু হাসপাতাল), লাইল উঙ্গার (ইউ. পেন), কনরাড কর্ডিং (ইউ. পেন), রাহুল লাধানিয়া (ইউ. মিশিগান)

Venue

আইসিএমএল আইএমএলএইচ (অ-আর্কাইভাল), টিএমএলআর

Abstract

কারণগত প্রভাব শনাক্ত করার স্বর্ণমানদণ্ড হল র‌্যান্ডমাইজড কন্ট্রোলড ট্রায়াল (RCT), তবে সবসময় RCT পরিচালনা করা সম্ভব নাও হতে পারে। যখন চিকিৎসা কোনো থ্রেশহোল্ডের ওপর নির্ভর করে, যেমন ডায়াবেটিস নির্ণয়ের জন্য রক্তে শর্করার মাত্রার থ্রেশহোল্ড, তখনও আমরা রিগ্রেশন ডিসকন্টিনিউইটিজ (RDs) ব্যবহার করে কখনও কখনও কারণগত প্রভাব অনুমান করতে পারি। RDs বৈধ তখনই যখন থ্রেশহোল্ডের ঠিক উপরে এবং নিচে থাকা ইউনিটগুলোর সহবৈশিষ্ট্য (covariates) এর বণ্টন একই থাকে এবং তাই নয়েজের উপস্থিতিতে কোনো বিভ্রান্তি (confounding) থাকে না, যা এক ধরনের এ-জাস্ট-র‍্যান্ডমাইজেশন (as-if randomization) প্রতিষ্ঠা করে। তবে বাস্তবে RD স্টাডি বাস্তবায়ন করা কঠিন হতে পারে, কারণ চিকিৎসা থ্রেশহোল্ড শনাক্ত করতে যথেষ্ট ডোমেইন দক্ষতার প্রয়োজন—এছাড়া, থ্রেশহোল্ড সাবগ্রুপ অনুযায়ী ভিন্ন হতে পারে (যেমন, ডায়াবেটিসের জন্য রক্তের শর্করার থ্রেশহোল্ড জনসংখ্যাতাত্ত্বিক বৈশিষ্ট্যের ওপর ভিত্তি করে ভিন্ন হতে পারে), এবং এই পার্থক্যগুলো উপেক্ষা করলে পরিসংখ্যানগত ক্ষমতা কমে যেতে পারে। সীমাগুলো নির্ধারণ করা এবং সেগুলো কার ক্ষেত্রে প্রযোজ্য তা খুঁজে বের করা একটি গুরুত্বপূর্ণ সমস্যা, যা বর্তমানে ডোমেইন বিশেষজ্ঞরা ম্যানুয়ালি সমাধান করেন, এবং যখন ডোমেইন দক্ষতা যথেষ্ট নয় তখন ডেটা-চালিত পদ্ধতির প্রয়োজন। এখানে, আমরা রিগ্রেশন ডিসকন্টিনিউইটি সাবগ্রুপ ডিসকভারি (RDSGD) উপস্থাপন করছি, একটি মেশিন-লার্নিং পদ্ধতি যা RD সীমাগুলোর জন্য পরিসংখ্যানগতভাবে শক্তিশালী এবং ব্যাখ্যাযোগ্য সাবগ্রুপ সনাক্ত করে। ৬০ মিলিয়নেরও বেশি রোগীর মেডিক্যাল ক্লেইম ডেটাসেট ব্যবহার করে, আমরা বিভিন্ন ক্লিনিকাল প্রেক্ষাপটে RDSGD প্রয়োগ করি এবং চিকিৎসা বরাদ্দ থ্রেশহোল্ডের সাথে সম্মতি বৃদ্ধি পাওয়া সাবগ্রুপগুলো সনাক্ত করি। যেহেতু অনেক রোগ এবং নীতিগত সিদ্ধান্তের জন্য চিকিৎসা থ্রেশহোল্ড গুরুত্বপূর্ণ, RDSGD কারণগত অনুমানের নতুন পথ আবিষ্কারের জন্য একটি শক্তিশালী হাতিয়ার হতে পারে।