[ad_1]
Xin vui lòng có chức năng python để xác định boolean trong tập dữ liệu lớn? với hơn 30 cột?
Tệp tóm tắt người thụ hưởng có một số cột bệnh mãn tính cho mỗi thành viên. Đây là các trường Boolean.
1) Chuyển đổi các cột này thành một biến phân loại duy nhất, nối nhiều chẩn đoán Đúng.
2)Nếu thành viên mắc 3 bệnh mãn tính trở lên, hãy phân loại chúng là “Nhiều bệnh”
Những gì tôi đã thử:
Đây là liên kết đến tập dữ liệu
https://www.cms.gov/Research-Statistics-Data-and-Systems/Downloadable-Public-Use-Files/SynPUFs/Downloads/DE1_0_2009_Beneficiary_Summary_File_Sample_20.zip
Đây là một số cột bệnh mãn tính
SP_ALZHDMTA
SP_CHF
SP_CHRNKIDN
SP_CNCR
SP_COPD
SP_DEPRESSN
SP_BỆ ĐÁI ĐƯỜNG
SP_ISCHMCHT
SP_OSTEOPRS
SP_RA_OA
SP_STRKETIA
Giải pháp 1
Có chức năng nào sẽ duyệt qua tập dữ liệu và tự động thêm dữ liệu cho bạn dựa trên các giá trị cột không?
KHÔNG.
Bạn phải tự viết chức năng.
[ad_2]
コメント