Tíquete #20302

Zの読みが変?

: 2010-01-16 00:09 Última Atualização: 2010-01-16 00:13

Relator:
Dono:
(Nenhum)
Tipo:
Estado:
Aberto
Componente:
(Nenhum)
Marcos:
(Nenhum)
Prioridade:
5 - Medium
Gravidade:
5 - Medium
Resolução:
Nenhum
Arquivo:
Nenhum

Details

マーチンです。

Zの読み上げ方が変です。

半角・小文字「z」は、「ゼット」ではなく「ゼッド」と読み上げる。
全角・小文字「z」は、「ゼット」ではなく「ゼッド」と読み上げる。
半角・大文字「Z」は、<PRON SYM="ゼ’ット">Z</PRON>に置き換えられ、「ゼット」と読み上げる。
全角・大文字「Z」は、読んでくれない。
  * Unknown KANA ... ズィ と表示される

galatea4win-istc-2009-02.zip
  + chaone-win-1.3.2-091201.zip
  + DATE: NO TIME: NO
  + unidic-chasen1312_sjis
で確認しています。

Ticket History (2/2 Histories)

2010-01-16 00:09 Updated by: masakjm
  • New Ticket "Zの読みが変?" created
2010-01-16 00:13 Updated by: masakjm
Comentário

山田です。

半角・大文字「Z」がPRONタグに置き換わるのが
なぜかはよくわからないのですが,それ以外は,
UniDicの出力に起因するもののようです。
UniDicの解析結果がそれぞれ,

z
<cha:W1 orth="z" kana="ゼット" pron="{ゼッド/ゼット}" pos="記号-文字" lForm="ゼット" lemma="Z" orthBase="z" pronBase="{ゼッド/ゼット}" kanaBase="ゼット" formBase="ゼット" goshu="記号" aType="1">z</cha:W1>
Z
<cha:W1 orth="Z" kana="{ゼット/ゼット/ズィー}" pron="{ゼッド/ゼット /ズィー}" pos="記号-文字" lForm="ゼット" lemma="Z" orthBase="Z" pronBase="{ゼッド/ゼット/ズィー}" kanaBase="{ゼット/ゼット/ズィー}" formBase="{ゼット/ゼット/ズィー}" goshu="記号" aType="1">Z</cha:W1>

<cha:W1 orth="z" kana="ゼット" pron="{ゼット/ゼッド}" pos="記号-文字" lForm="ゼット" lemma="Z" orthBase="z" pronBase="{ゼット/ゼッド}" kanaBase="ゼット" formBase="ゼット" goshu="記号" aType="1">z</cha:W1>

<cha:W1 orth="Z" kana="{ズィー/ゼット/ゼット}" pron="{ズィー/ゼット /ゼッド}" pos="記号-文字" lForm="ゼット" lemma="Z" orthBase="Z" pronBase="{ズィー/ゼット/ゼッド}" kanaBase="{ズィー/ゼット/ゼット}" formBase="{ズィー/ゼット/ゼット}" goshu="記号" aType="1">Z</cha:W1>

のようになっており,デフォルトで先頭のものが
選ばれるとご指摘のような結果になります。
国語研の人に聞いてみないとわかりませんが,
「ゼッド」の代表形が「ゼット」になっています
ので,これは誤りではなく,実際にコーパスにこ
のような例があったのではないかと思われます。

解決方法としては,本来ならば,語形選択ルーチ
ンが存在して,適切な発音形を選択すべきなので
すが,少なくともゼッドのような特殊なものが先
頭にこないようにできないか,UniDicプロジェク
トに打診してみます。

Attachment File List

No attachments

Editar

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » Login