Identificar un valor booleano en grandes conjuntos de datos en Python

programación


¿Existe una función de Python para identificar un valor booleano en un conjunto de datos grande? ¿Con más de 30 columnas?

El expediente de resumen de beneficiarios tiene varias columnas de enfermedades crónicas para cada afiliado. Estos son campos booleanos.
1)Convierta estas columnas en una única variable categórica, concatenando múltiples diagnósticos verdaderos.
2) Si un miembro tiene 3 o más afecciones crónicas, categorícelas como “Múltiples”

Lo que he probado:

Este es el enlace al conjunto de datos.

https://www.cms.gov/Research-Statistics-Data-and-Systems/Downloadable-Public-Use-Files/SynPUFs/Downloads/DE1_0_2009_Beneficiary_Summary_File_Sample_20.zip

Estas son las diversas columnas de enfermedades crónicas.
SP_ALZHDMTA
SP_CHF
SP_CHRNKIDN
SP_CNCR
SP_EPOC
SP_DEPRESSN
SP_DIABETES
SP_ISCHMCHT
SP_OSTEOPRS
SP_RA_OA
SP_STRKETIA

Solución 1

¿Existe alguna función que revise un conjunto de datos y agregue datos automáticamente en función de los valores de las columnas?

No.

Tienes que escribir la funcionalidad tú mismo.

コメント

タイトルとURLをコピーしました