[mecab-users 182] Re: フォーマットで出力するとき、文字長さの制限ありますか?( mecab 0.91 )

Back to archive index

chris zhang chris****@yahoo*****
2006年 10月 27日 (金) 15:23:28 JST


工藤さん
返事ありがとうございます。

このエラーは辞書定義の問題ではなく、別にあると思います。

もう一度説明します

環境:
mecab  0.91
mecab-ipadic-2.7.0-20060408
linux

mecab -Ochasen  -d /dicpathで解析します。

辞書には
工藤工藤,1223,1223,6058,名詞,固有名詞,人名,名,*,*,くどう,
クドウ,クドウ
というレコード一行を追加して解析してみると
結果OKでした。

辞書には
工藤工藤,1223,1223,6058,名詞,固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固有名詞固
有名詞固有名詞,人名,名,*,*,くどう,クドウ,クドウ
というレコードを追加して解析してみると
結果はエラーが出てきました。
tagger.cpp(273): writer.cpp(306): given index is out of
range

まとめ:
二回辞書に追加したレコードのフォーマットは一緒で
違いは固有名詞をたくさんコピーしてレコードを長くしただけ
です。

ですので、このエラーがでた理由は
【このエラーは、辞書の CSV のフィールドに対し、範囲外の
領域を
アクセスしたときに発生します。】ではなく、レコードの長さ
と関係あるではないかと思っています。

ちなみに
mecab  -d /dicpathで解析すると問題ありませんでした。

ご回答よろしくお願いします






--- Taku Kudo <taku****@chase*****> wrote:

> 工藤です
> 
> 
> > mecab
> デフォルトの出力で解析すると、ちゃんと解析してくれ
> >
> るんですが、自分が定義したフォーマットや、chasenフォー
マ
> > ットでやるとエラーがでます。
> > 「tagger.cpp(273): writer.cpp(306): given index is
> out of
> > range
> > 」
> 
> このエラーは、辞書の CSV
> のフィールドに対し、範囲外の領域を
> アクセスしたときに発生します。chasen フォーマットは
> 
> 品詞1,品詞2,品詞3,品詞4,原型,活用型,活用形,読み,発音
> 
> の9フィールドを定義しておく必要があります。
> 
> - taku
> 




mecab-users メーリングリストの案内
Back to archive index