Identifier un booléen dans de grands ensembles de données en Python

[ad_1]

S’il vous plaît, existe-t-il une fonction python pour identifier un booléen dans un grand ensemble de données ? avec plus de 30 colonnes ?

Le fichier sommaire des bénéficiaires comporte plusieurs colonnes de maladies chroniques pour chaque membre. Ce sont des champs booléens.
1) Convertissez ces colonnes en une seule variable catégorielle, concaténant plusieurs vrais diagnostics.
2) Si un membre souffre de 3 maladies chroniques ou plus, catégorisez-les comme « multiples ».

Ce que j’ai essayé :

Ceci est le lien vers l’ensemble de données

https://www.cms.gov/Research-Statistics-Data-and-Systems/Downloadable-Public-Use-Files/SynPUFs/Downloads/DE1_0_2009_Beneficiary_Summary_File_Sample_20.zip

Voici les différentes colonnes sur les maladies chroniques
SP_ALZHDMTA
SP_CHF
SP_CHRNKIDN
SP_CNCR
SP_COPD
SP_DEPRESSN
SP_DIABETE
SP_ISCHMCHT
SP_OSTEOPRS
SP_RA_OA
SP_STRKETIA

Solution 1

Existe-t-il une fonction qui parcourra un ensemble de données et ajoutera automatiquement des données pour vous en fonction des valeurs des colonnes ?

Non.

Vous devez écrire la fonctionnalité vous-même.

[ad_2]