チャットボット用の訓練データをクリーニングするために、正規表現を使ってルビを削除する方法をメモしておきます。
1 2 3 4 5 6 7 |
import re s = 'ペガサス【ぺがさす】に乗って、空【そら】を飛翔【ひしょう】する英雄【えいゆう】ペルセウス' print(s) s = re.sub('【[^】]+】', '', s) print(s) |
詳しくは↓↓↓
The following two tabs change content below.
Keita N
最新記事 by Keita N (全て見る)
- PySimpleGUI のメモ - 2022年12月15日
- dezeroでニューラルネットワーク2 model, optimizer, MSEをフル活用 - 2022年11月27日
- dezeroでニューラルネットワークを使った回帰をやってみる - 2022年11月26日