nkf next version
2003-10-21 19:53 (by rei_furukawa)

nkf 2.0.4 は、こんな感じにしようと思います。
コードとしては、既に CVS 上のソースには入っています。

これで少し様子を見て、リリースとしたいと思います。


(1) 機種依存文字もテーブルを持つ

2.0.2 では、euc の「機種依存文字」といわれていた部分は、意図的
にテーブルから除いていたのですが、そこらへんもテーブルに入れる
ようにしました。


(2) Shift_JIS の、EUC-JP に変換できない範囲を同値な文字に変換

Shift_JIS の FAxx-FCxx の範囲の文字は、普通の変換式では変換で
きないので、CP932.TXT のテーブル上で同じ値をとる文字に読み換え
ます。

デフォルトでこの動作をします。
無効にするには、--no-cp932 を付けます。


(3) UTF-16 の BOM を自動判別

BOM が付いた入力ならば、-W16 を付けなくても自動判別して変換する
ようにしました。


(4) --numchar-input オプション

mhonarc など、日本語を UTF-16 の &#....; のパターンで出力する
ものを変換します。


(5) --exec-in --exec-out

nkf -e --exec-in cmd args...

とやると、cmd の出力を nkf の入力とします。

nkf -e --exec-out cmd args...

とやると、nkf の出力を cmd の入力とします。


(6) perl module
     nkf_continue: オプション、自動判別の状態などを引き継いで変換
     inputcode: 自動判別結果の文字コードを返す
を追加します。

(7) MIME decode

charset の値で指定されるコードを判定時に優先するようにしました


nkf Network Kanji Filter project news list