[ad_1]
من فضلك هل هناك وظيفة بيثون لتحديد قيمة منطقية في مجموعة البيانات الكبيرة؟ مع 30+ عمود؟
يحتوي ملف ملخص المستفيد على عدة أعمدة للأمراض المزمنة لكل عضو. هذه هي الحقول المنطقية.
1) قم بتحويل هذه الأعمدة إلى متغير فئة واحد، لربط عدة تشخيصات حقيقية.
2) إذا كان العضو يعاني من 3 حالات مزمنة أو أكثر، قم بتصنيفها على أنها “متعددة”
ما حاولت:
وهذا هو الرابط لمجموعة البيانات
https://www.cms.gov/Research-Statistics-Data-and-Systems/Downloadable-Public-Use-Files/SynPUFs/Downloads/DE1_0_2009_Beneficiary_Summary_File_Sample_20.zip
هذه هي أعمدة الأمراض المزمنة العديدة
SP_ALZHDMTA
SP_CHF
SP_CHRNKIDN
SP_CNCR
SP_COPD
SP_DEPRESSN
SP_DIABETES
SP_ISCHMCHT
SP_OSTEOPRS
SP_RA_OA
SP_STRKETIA
الحل 1
هل هناك وظيفة تقوم بتمشيط مجموعة البيانات وإلحاق البيانات تلقائيًا لك بناءً على قيم الأعمدة؟
لا.
عليك أن تكتب الوظيفة بنفسك.
[ad_2]
コメント