पायथन में बड़े डेटासेट में एक बूलियन की पहचान करें

[ad_1]

कृपया क्या बड़े डेटासेट में बूलियन की पहचान करने के लिए कोई पायथन फ़ंक्शन है? 30+ कॉलम के साथ?

लाभार्थी सारांश फ़ाइल में प्रत्येक सदस्य के लिए कई पुरानी बीमारी के कॉलम हैं। ये बूलियन फ़ील्ड हैं.
1) इन स्तंभों को एक एकल श्रेणीगत चर में परिवर्तित करें, जो कई सही निदानों को जोड़ता है।
2) यदि किसी सदस्य को 3 या अधिक पुरानी बीमारियाँ हैं, तो उन्हें “एकाधिक” के रूप में वर्गीकृत करें

मैंने क्या प्रयास किया है:

यह डेटा सेट का लिंक है

https://www.cms.gov/Research-Statistics-Data-and-Systems/Downloadable-Public-Use-Files/SynPUFs/Downloads/DE1_0_2009_Beneficiary_Summary_File_Sample_20.zip

यह कई पुरानी बीमारी के कॉलम हैं
SP_ALZHDMTA
SP_CHF
SP_CHRNKIDN
SP_CNCR
एसपी_सीओपीडी
SP_DEPRESSN
SP_मधुमेह
SP_ISCHMCHT
SP_OSTEOPRS
एसपी_आरए_ओए
SP_STRKETIA

समाधान 1

क्या कोई ऐसा फ़ंक्शन है जो डेटासेट को खंगालेगा और कॉलम मानों के आधार पर स्वचालित रूप से आपके लिए डेटा जोड़ देगा?

नहीं।

आपको कार्यक्षमता स्वयं लिखनी होगी.

[ad_2]

समाधान 1

コメント