[ad_1]
请问有没有一个Python函数可以识别大数据集中的布尔值? 有 30 多个列?
受益人摘要文件为每个成员提供了几个慢性疾病栏。 这些是布尔字段。
1)将这些列转换为单个分类变量,连接多个 True 诊断。
2) 如果会员患有 3 种或以上慢性病,请将其归类为“多种”
我尝试过的:
这是数据集的链接
https://www.cms.gov/Research-Statistics-Data-and-Systems/Downloadable-Public-Use-Files/SynPUFs/Downloads/DE1_0_2009_Beneficiary_Summary_File_Sample_20.zip
这是几个慢性病栏目
SP_ALZHDMTA
瑞士法郎
SP_CHRNKIDN
SP_CNCR
慢阻肺
SP_DEPRESSN
SP_糖尿病
SP_ISCHMCHT
SP_OSTEOPRS
SP_RA_OA
SP_STRKETIA
解决方案1
是否有一个函数可以梳理数据集并根据列值自动为您附加数据?
不。
您必须自己编写功能。
[ad_2]
コメント