【解決方法】pd 列からこのパターンを抽出します。 "2.0.1"


こんにちは、みんな、

ファイル名のバージョンを含む列を持つ pdf df をロードし、バージョンを抽出する (文字を削除する) 必要があります。
桁:
ファイル名
ファイル名vs2.0
ファイル名 vs2.1.1
ファイル名vs2.2.1
ファイル名vs2.3.3

希望:
2.0
2.1.1
2.2.1
2.3.3

ありがとう!

私が試したこと:

I tried:
df['VS'] = df['VS'].str.extract('(\d+\.\d+)', expand=False) 
but I get the first 2 digits of the version, and not the thirds.

解決策 1

これを試して:

正規表現
(\d+(\.\d+)+)

正規表現を使用する場合は、ヘルパー ツールが必要です。 のコピーを入手する 特急[^] – 無料で、正規表現を調べて生成します。

解決策 2

あなたの式は、1 つ以上の数字をキャプチャし、その後にピリオドを付けることを示しています。 その後に 1 つ以上の数字が続きます。 したがって、2.0、2.1 などのみをキャプチャします。

これを試して:

    (\d+(\.\d+)*)
      ^ ^ ^  ^ ^
      1 2 a  b c
1. One or more digits followed by
2. A group containing
  a. A single period (dot) followed by
  b. One or more digits
  c. Repeated any number of times

コメント

タイトルとURLをコピーしました