指定するオプションです.そのファイル名に書かれた対データをもとに学習を行い
ます.対データのフォーマットは2つの文字列をタブ(\t)区切りにし,各文字列の
文字間または部分文字列間に空白を入れたフォーマットでなければなりません.
部分文字列は学習によって文字に分割されることがなく,部分文字列を使うことで
アライメントに制約を与えることができます.以下にフォーマットの例を示します. 東 京 ト ウ キョ ウ
京 都 キョ ウ ト
i P h o n e ア イ フォ ン
i P a d ア イ パッ ド また以下のように部分的にアライメントの正解を与えることが可能です. 東|京 ト ウ|キョ ウ
京 都 キョ:ウ ト
i P h o n|e ア イ フォ ン|_
i P a d ア:イ パッ ド ここで,「_」は削除文字です.また,区切り文字「|」は表記と読みにおいて
同じ数でなければいけません.