チャットボット用の訓練データをクリーニングするために、正規表現を使ってルビを削除する方法をメモしておきます。
1 2 3 4 5 6 7 |
import re s = 'ペガサス【ぺがさす】に乗って、空【そら】を飛翔【ひしょう】する英雄【えいゆう】ペルセウス' print(s) s = re.sub('【[^】]+】', '', s) print(s) |
詳しくは↓↓↓
The following two tabs change content below.
Keita N
最新記事 by Keita N (全て見る)
- 2024/1/13 ビットコインETFの取引開始:新たな時代の幕開け - 2024年1月13日
- 2024/1/5 日本ビジネスにおける変革の必要性とその方向性 - 2024年1月6日
- 2024/1/3 アメリカ債権ETFの見通しと最新動向 - 2024年1月3日