JTalk での英文字列のローマ字式読み付与
JTalk ではアルファベット文字列にローマ字式の読み付与を行うために、 テキスト解析の辞書にローマ字らしい読みを与えて文字列の断片を登録しています。 しかし本来の英単語の解析に悪影響が出ることが多いので、 この方式をやめる方向性で現在は作業をしています。
そのかわりに、テキスト解析の結果でアルファベット文字列が未知語になった場合に、 ローマ字的な読み付与を行うアルゴリズムを実装したいと考えています。
作業場所: https://github.com/nvdajp/nvdajpmiscdep/issues/12
つぎの日本語ベータ版でリリースしてみます。
2016.1jp-beta-151214 では 2kana のように数字に後続する英文字列で期待通りに読み付与していなかったので、 次のベータ版で修正する予定。
151217 で git が「ギット」と読めるようになった。 なぜか UI Automation がちゃんと読めていない。 nvaccess は「エヌブイアクセス」と辞書登録したほうがよいか。。
JTalk ではアルファベット文字列にローマ字式の読み付与を行うために、 テキスト解析の辞書にローマ字らしい読みを与えて文字列の断片を登録しています。 しかし本来の英単語の解析に悪影響が出ることが多いので、 この方式をやめる方向性で現在は作業をしています。
そのかわりに、テキスト解析の結果でアルファベット文字列が未知語になった場合に、 ローマ字的な読み付与を行うアルゴリズムを実装したいと考えています。