[morogram-users] Re: utf8 テキストのソート

Back to archive index

Shigeki Moro s-mor****@hanaz*****
2004年 1月 6日 (火) 23:47:19 JST


もろです。あけましておめでとうございます。

今年こそ、morogram のバージョンアップにとりかかりたいです。

とりあえずやりたいこと:

・メイン部分の完全C化
・メモリ上でのNグラム処理(現在はディスク上での処理)
・make 一発でビルド
・CHISEとの連携
・その他、要望の出ていることを取り込んでみる

あと、morogram以外ですが、

・Rでクラスタ分析ができるようにする

てなところでしょうか。

On Fri, 02 Jan 2004 05:11:04 +0900
dune <FZH01****@nifty*****> san wrote:

> 早速ですが、utf8 に対応した fsort(フィールドソート)相当の
> プログラムをどなたかご存知ないでしょうか。

うーん、知らないです。

Unix的発想だと、なんかのプログラム、スクリプトでUCS-4かなんかに
変換して、パイプでfsortなどに渡し、またUTF-8に戻すという感じなん
でしょうけどね。

Shigeki Moro

Hanazono University
s-mor****@hanaz*****
http://www.ya.sakura.ne.jp/~moro/

/bb|[^b]{2}/ that is the question.





morogram-users メーリングリストの案内
Back to archive index