チャットボット用の訓練データをクリーニングするために、正規表現を使ってルビを削除する方法をメモしておきます。
1 2 3 4 5 6 7 |
import re s = 'ペガサス【ぺがさす】に乗って、空【そら】を飛翔【ひしょう】する英雄【えいゆう】ペルセウス' print(s) s = re.sub('【[^】]+】', '', s) print(s) |
詳しくは↓↓↓
The following two tabs change content below.
Keita N
最新記事 by Keita N (全て見る)
- ANOGAN 第一話 - 2023年6月16日
- DDPG by gymnasium 17日目 - 2023年6月7日
- DDPG by gymnasium 16日目 - 2023年6月5日