[ad_1]
こんにちは、みんな、
ファイル名のバージョンを含む列を持つ pdf df をロードし、バージョンを抽出する (文字を削除する) 必要があります。
桁:
ファイル名
ファイル名vs2.0
ファイル名 vs2.1.1
ファイル名vs2.2.1
ファイル名vs2.3.3
希望:
2.0
2.1.1
2.2.1
2.3.3
ありがとう!
私が試したこと:
I tried: df['VS'] = df['VS'].str.extract('(\d+\.\d+)', expand=False) but I get the first 2 digits of the version, and not the thirds.
解決策 1
解決策 2
あなたの式は、1 つ以上の数字をキャプチャし、その後にピリオドを付けることを示しています。 その後に 1 つ以上の数字が続きます。 したがって、2.0、2.1 などのみをキャプチャします。
これを試して:
(\d+(\.\d+)*) ^ ^ ^ ^ ^ 1 2 a b c 1. One or more digits followed by 2. A group containing a. A single period (dot) followed by b. One or more digits c. Repeated any number of times
[ad_2]
コメント