[LE-talk-ja 158] Re: LE-talk-ja での議論のまとめ

Back to archive index

NARUSE, Yui narus****@airem*****
2006年 5月 19日 (金) 08:04:22 JST


成瀬です。

Tomoyuki Asakawa wrote:
> SJIS(CR) -> SJIS(LF)
> と言った場合、
> MAC系SJIS -> UNIX系SJIS
> という様に、単純に字集合が決まるわけではないです。
相違点を探すのでなく、共通点を探して欲しいです。
相違点が大きいのは承知ですので。
もっとも、¬や∵も検討に入れると、
色々味わい深い例えにしてたりもするんですが。

> CRとCRLF,LFなどの改行の変換は、
> (略)
> この時点では、改行コードの変換が必要かどうかは
> 場合によってことなる。
> 
> すくなくとも、同一環境上では、通常改行の変換は必要ない
> 改行の変換が必要なのは、異なる環境との交換の時だけです。
> 
> UNIXから WINDOWSという変換のとき
> EUC(LF) -> SJIS(CRLF)
> と、セットで切り替えると便利なのは確かですが
> 
> UNIX上で、ハンドリングする場合には、
> EUC(LF) -> SJIS(LF)
> の方がいいに決まってる。
> 
> なので、改行コードは次元が違う。
デフォルトでは改行コードはいじらず、必要なら別途、LF->CRLF変換する。
セットでCRLF変換できれば便利だろうけど。

デフォルトでは \x81\x60 -> U+FF5E、必要なら別途U+301Cに。
セットで変換できれば便利だろうけど。

共通項はありますよね。

-- 
NARUSE, Yui  <narus****@airem*****>
DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA



Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index