チャットボット用の訓練データをクリーニングするために、正規表現を使ってルビを削除する方法をメモしておきます。
1 2 3 4 5 6 7 |
import re s = 'ペガサス【ぺがさす】に乗って、空【そら】を飛翔【ひしょう】する英雄【えいゆう】ペルセウス' print(s) s = re.sub('【[^】]+】', '', s) print(s) |
詳しくは↓↓↓
The following two tabs change content below.
Keita N
こんにちは すうがく を こよなくあいする
”二代目 圧倒的 かず まなぶ (´・ω・`)” です
心が豊かになる方法について 引き続き考えていきたいです。
最新記事 by Keita N (全て見る)
- python : pyscript - 2022年5月16日
- python : logging モジュールの使い方 - 2022年5月16日
- 機械名:号機:顧客番号 - 2022年2月17日