[LE-talk-ja 104] Re: ISO-2022-JP-MS について

Back to archive index

Tadamasa Teranishi yw3t-****@asahi*****
2006年 5月 2日 (火) 12:41:29 JST


寺西です。

Tomoyuki Asakawa wrote:
> 
> もともと、SJISも初代EUCも、X0208のマッピングの
> 違いだけです。
> この場合、X0208の、空きエリアの使い方(いわゆる機種依
> 存文字問題)を、どう考えるかの問題
> しかし、この問題は、空きエリアに対して、積極的な対応(エ
> ラーにするなど)をしなければ
> 8bit環境では、透過的に扱えるので問題をアプリケーション側にゆだね
> ることができます。

空きエリアの字形が違うわけですから、何らかの対策をアプリケーションが
行わなければなりません。
問題をアプリケーション側にゆだねられた結果、
 
> ところが、主流の実装では、X0208の未定義を積極的にエラーに
> するので始末が悪い。

アプリケーションがエラーとして処理しているに過ぎません。
別に始末が悪いことではないでしょう。
何もしないと文字化けする環境も多々ありましたから。

> わたしは、この問題は、昔からPC9801にあわせりゃいいと思って
> いました。

それは

 > 15年くらいUNIX系をつかってますが、クライアントマシンは
 > Windowsでしたから

といった環境だったからそう思うのでしょう。

> PC9801がデファクトスタンダードなのは、否定しようがなかったはず。

はい。
しかし、一方で少数派ではあっても、無視できない Mac の存在も
(少なくとも当時は)ありましたし、UNIX の各ベンダーはベンダー固有の
機種依存文字を持っていましたし、PC-9801に合わせるというのは
無理だったわけです。各社の思惑もありますから。

# 今なら事情は違うと思いますが...。

> SJISを、採用していたUNIXマシン、SONYのNEWSは、
> ちゃんと98文字がフォントファイルにあった。
> なので、javaの、エイリアス問題は、問題にする方がおかしいと
> 思っていました。

既に忘れてしまっていますが、これを見ると HP は違っていたかもしれま
せん。(HP はデフォルトが EUC-JP ではなく、Shift_JIS でした。)

http://www.opengroup.or.jp/jvc/cde/sjis.html

また、NEWS はそれなりに売れた(私も使っていたけど)と思いますが、当時は
Sun が主流でしたので、NEWS がこうだったからというのは、あまり重要では
ないと思います。

> また、初代のEUCは、SJISと同じく、スクリーンエディタ
> の、処理を楽にする為につくられた様なものです。
...
> ところが、半角カナを導入し、バイト数=文字長 ではなくなった時点
> で、内部コード(処理コード)と外部コードを区別するべき
> だったのです。

後学のためにお聞きしたいのですが、では、内部コードはどのようなもの
で、外部コードはどのようなもので、どう区別するべきだったのでしょう。

> ここできちんと区別していなかったので、X0212拡張で、
> SJIS同様の、ご都合コードになってしまった。
> X0212拡張は、ISO2022で拡張すればよかった。

これはどういう意味でしょう。

> しかし、euc-jp-msを決めた人たちは、なんで、cp932との
> 互換をとらず、
> NEC選定IBM拡張漢字をはずしておいて、msなんてサフィッ
> クスをつけたのでしょう?

NEC選定IBM拡張文字よりIBM拡張文字が優先的に使われる
Microsoft Windows 3.51 式の変換だからでしょう。

http://www.opengroup.or.jp/jvc/cde/appendix.html

NEC選定IBM拡張漢字をはずすのは、「マイクロソフトのマニュアルでも、
NEC選定IBM拡張文字は使わないように指導している」らしいですから。
その他、詳細は下記を参考に。

http://www.opengroup.or.jp/jvc/cde/sjis-euc.html#cp6

> X0212とNEC選定IBM拡張漢字と重なるから、X0212を
> 優先したというのでしょうが
> ここでまたもや、混乱を増幅させている。

様々な背景はここに書かれています。
http://www.opengroup.or.jp/jvc/cde/ucs-conv.html#ch4_1

これは私も混乱を増幅させていると思います。
eucJP-ms, eucJP-0201, eucJP-ascii と3通りのコード変換を規定して、
用途によって使い分けるということになってますから。
 
> euc-jp-msというエンコーディングで書かれた、ファイルは、この世に
> どのくらいあるのでしょう?

ファイルとして存在するかどうかは重要でしょうか?
euc-jp-ms は、eucJP-open のコード変換規則のひとつに過ぎません。
変換に使われているかどうかが重要なのではないでしょうか?
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-****@asahi*****
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index