在 Python 中识别大型数据集中的布尔值

编程


请问有没有一个Python函数可以识别大数据集中的布尔值? 有 30 多个列?

受益人摘要文件为每个成员提供了几个慢性疾病栏。 这些是布尔字段。
1)将这些列转换为单个分类变量,连接多个 True 诊断。
2) 如果会员患有 3 种或以上慢性病,请将其归类为“多种”

我尝试过的:

这是数据集的链接

https://www.cms.gov/Research-Statistics-Data-and-Systems/Downloadable-Public-Use-Files/SynPUFs/Downloads/DE1_0_2009_Beneficiary_Summary_File_Sample_20.zip

这是几个慢性病栏目
SP_ALZHDMTA
瑞士法郎
SP_CHRNKIDN
SP_CNCR
慢阻肺
SP_DEPRESSN
SP_糖尿病
SP_ISCHMCHT
SP_OSTEOPRS
SP_RA_OA
SP_STRKETIA

解决方案1

是否有一个函数可以梳理数据集并根据列值自动为您附加数据?

不。

您必须自己编写功能。

コメント

タイトルとURLをコピーしました