in out name description o o iso8859-1 ascii + iso-8859-1 (latin-1) o o iso8859-2 ascii + iso-8859-2 (latin-2) o o iso8859-3 ascii + iso-8859-3 (latin-3) o o iso8859-4 ascii + iso-8859-4 (latin-4) o o iso8859-5 ascii + iso-8859-5 (Cyrillic) o o iso8859-6 ascii + iso-8859-6 (Arabic) o o iso8859-7 ascii + iso-8859-7 (Greek) o o iso8859-8 ascii + iso-8859-8 (Hebrew) o o iso8859-9 ascii + iso-8859-9 (latin-5) o o iso8859-10 ascii + iso-8859-10 (latin-6) o o iso8859-11 ascii + iso-8859-11 (Thai) o o iso8859-13 ascii + iso-8859-13 (Baltic Rim) o o iso8859-14 ascii + iso-8859-14 (Celtic) o o iso8859-15 ascii + iso-8859-15 (Latin-9) o o iso8859-16 ascii + iso-8859-16 o o koi-8r koi-8r (Russian) o o cp1251 Cyrillic latin MS cp1251 o o jis iso-2022-jp (rfc1496 7bit JIS) o o iso-2022-jp-x0213 iso-2022-jp-3 (JIS X 0213:2000). a.k.a. jis X 0213 o o jis-x0213-strict iso-2022-jp-3-strict o o iso-2022-jp-2004 iso-2022-jp-2004(JIS X 0213:2004/2012) a.k.a. jis-x0213-2004 o o oldjis iso-2022-jp (JIS X 0208:1978 いわゆる旧 JIS) o o euc-jp EUC エンコード JIS X 0208:1997 日本語 o o euc-x0213 EUC エンコード JIS X 0213:2000 o o euc-jis-2004 EUC エンコード JIS X 0213:2004 o o euc-kr EUC エンコード KS X 1001 韓国語 o o euc7-kr 7bitEUC エンコード KS X 1001 韓国語 o o uhc Windows 統合ハングルコード (Windows cp949) o o johab KS X 1001-johab 韓国語 o o euc-cn EUC エンコード簡体字中国語 o o euc7-cn 7bitEUC エンコード簡体字中国語 o o hz HZ エンコード簡体字中国語 o o euc-tw EUC エンコード CNS11643 伝統字中国語 o o gb12345 EUC エンコード GB12345 伝統字中国語 o o gbk GBK エンコード簡体字中国語 o o gb18030 GB18030 エンコード簡体字中国語 o o big5 BIG5 (倚天方式, Euro つき) o o big5-cp950 BIG5 (Microsoft cp950, Euro つき) o o big5-hkscs BIG5 with HKSCS o o big5-2003 BIG5-2003 o o big5-uao BIG5 Unicode 補完計画拡張コード o o sjis Shiftjis (IBM cp943) o o shiftjis-x0213 Shiftjis-エンコード JIS X 0213:2000 o o shiftjis-2004 Shiftjis-エンコード JIS X 0213:2004 o x sjis-cellular Shiftjis-エンコード JIS X 0208:1997 NTT Docomo, Vodafone 携帯絵文字対応 o o cp932 Shift-jis-エンコード MS cp932 o o cp932w Shift-jis-encoded MS cp932 (Windows 互換) o o cp50220 Microsoft codepage 50220 o o cp50221 Microsoft codepage 50221 o o cp50222 Microsoft codepage 50222 o o cp51932 Microsoft codepage 51932 (EUC 類似) o o oldsjis Shift-jis (JIS X 0208:1978 文字集合) o o viscii VISCII (rfc1456) ベトナム語 o o viqr VISCII (VIQR-rfc1456) ベトナム語 o o keis 日立 KEIS83/90 o x jef 富士通 JEF (基本コードのみ) o x ibm930 IBM EBCDIC DBCS 日本語 o x ibm931 IBM EBCDIC DBCS ラテン文字日本語 o x ibm933 IBM EBCDIC DBCS 韓国語 o x ibm935 IBM EBCDIC DBCS 簡体字中国語 o x ibm937 IBM EBCDIC DBCS 伝統字中国語 o o unicode Unicode(TM) UCS-2/UTF-16(LE) o o utf7 Unicode(TM) UTF-7 o o utf8 Unicode(TM) UTF-8 x o nyukan-utf-8 日本国入管文字集合(UTF-8) x o nyukan-utf-16 日本国入管文字集合(UTF-16) o x arib-b24 ARIB B24 8単位符号 o x arib-b24-sjis ARIB B24 シフト符号化表現 o x transparent 透過モード (下記参照)
jis, iso-2022-jp iso-2022-jp-2 エンコーディングで、JIS X 0208:1997 コードを出力する。 G0 = GL は JIS X 0201 Roman、 G1 は JIS X 0201 かな、G2 は iso-8859-1、G3 は X 0212 補助漢 字となる。
jis-x0213, iso-2022-jp-3, iso-2022-jp-2000 iso-2022-jp-3 エンコーディングである。入力では自動判定される。 出力時、G0 = GL は JIS X 0201 Roman、 G1 は JIS X 0201 かな、G2 は iso-8859-1、G3 は X 0213:2000 第二面となる。
jis-x0213-strict iso-2022-jp-3-strict エンコーディングであり、X 0208 範囲の文字は X 0208 として出 力される。入力では自動判定される。 出力時、G0 = GL は JIS X 0201 Roman、 G1 は JIS X 0201 かな、G2 は iso-8859-1、G3 は X 0213:2000 第二面となる。
jis-x0213-2004, iso-2022-jp-2004 iso-2022-jp-3(2004) の十文字追加対応。Unicode 文字対応は変更していない。 出力 時、G0 = GL は JIS X 0201 Roman、 G1 は JIS X 0201 かな、G2 は iso-8859-1、G3 は X 0213:2004 第二面となる。
oldjis iso-2022-jp エンコーディングの、JIS X 0208:1978 (いわゆる旧 JIS) である。 入力で は --input-detect-jis78 指定時のみ自動判定される。G0 = GL は JIS X 0201 Roman、G1 は JIS X 0201 かな、G2 は iso-8859-1、G3 は X 0212 補助漢字となる。
euc-jp, euc EUC エンコーディングで、JIS X 0208:1997 コードである。 G0 = GL は ASCII、G1 は JIS X 0208、 G2 は JIS X 0201 かな、G3 は X 0212 補助漢字となる。
euc-x0213, euc-jis-2000 EUC エンコーディングで、JIS X 0213:2000 コードである。 G0 = GL は ASCII、G1 は JIS X 0213:2000 第一面 G2 は JIS X 0201 かな、G3 は X 0213 第二面となる。
euc-jis-2004 EUC エンコーディングで、JIS X 0213:2004 コードである。 十文字追加対応。Unicode 文字対応は変更せず。G0 = GL は ASCII、G1 は JIS X 0213:2004 第一面、G2 は JIS X 0201 かな、G3 は X 0213 第二面となる。
sjis シフト符号化エンコーディングで、JIS X 0208:1997 コードである。 いわゆるシフト JIS である。cp932 では無いことに注意。入力側では NEC/ IBM 拡張漢字部を認識し、出 力では使用しない。 また、ユーザ定義外字はすべて未定義とする。 Latin 部は JIS X 0201 Roman を用いる。
sjis-x0213, shift_jis-2003 シフト符号化エンコーディングで、JIS X 0213:2000 コードである。 Latin 部は JIS X 0201 Roman を用いる。
sjis-x0213-2004, shift_jis-2004 シフト符号化エンコーディングで、JIS X 0213:2004 コードである。 十文字追加対 応。Unicode 文字対応は変更せず。 Latin 部は JIS X 0201 Roman を用いる。
sjis-cellular (experimental) シフト符号化エンコーディングで、JIS X 0208 に NTT Docomo/Vodafone(SoftBank) 携帯 絵文字対応マッピングを追加したもの。vodafone 絵文字入力は自動判定される。 Latin 部は JIS X 0201 Roman を用いる。出力はサポートしていない。携帯向けの URI表現も自 動的には有効にはならない。
sjis-docomo シフト符号化エンコーディングで、JIS X 0208 に NTT Docomo 携帯絵文字対応マッピン グを追加したもの。 Latin 部は JIS X 0201 Roman を用いる。
sjis-au シフト符号化エンコーディングで、JIS X 0208 に AU 携帯絵文字対応マッピングを追加 したもの。 Latin 部は JIS X 0201 Roman を用いる。
sjis-softbank シフト符号化エンコーディングで、JIS X 0208 に SoftBank 携帯絵文字対応マッピング を追加したもの。 Latin 部は JIS X 0201 Roman を用いる。
cp932 cp932w Microsoft 社 cp932 マッピングされたシフト符号化エンコーディングである。 Latin 部 は ASCII を用いる。kana_enbl が自動的に有効になる。
g0 g1 g2 g3 キャラクタセット名 説明 o o o o ascii ANSI X3.4 ASCII o o o o x0201 JIS X 0201 (latin part) x o o o iso8859-1 ISO 8859-1 latin x o o o iso8859-2 ISO 8859-2 latin x o o o iso8859-3 ISO 8859-3 latin x o o o iso8859-4 ISO 8859-4 latin x o o o iso8859-5 ISO 8859-5 Cyrillic x o o o iso8859-6 ISO 8859-6 Arabic x o o o iso8859-7 ISO 8859-7 Greek-latin x o o o iso8859-8 ISO 8859-8 Hebrew x o o o iso8859-9 ISO 8859-9 latin x o o o iso8859-10 ISO 8859-10 latin x o o o iso8859-11 ISO 8859-11 (TIS 620 (Thai)) x o o o iso8859-13 ISO 8859-13 latin x o o o iso8859-14 ISO 8859-14 latin x o o o iso8859-15 ISO 8859-15 latin x o o o iso8859-16 ISO 8859-16 latin x o o o tcvn5712 TCVN 5712 (Vietnamese) x o o o ecma113 ECMA 113 Cyrillic o o o o x0212 JIS X 0212:1990 補助漢字 o o o o x0208 JIS X 0208:1997 o o o o x0213 JIS X 0213:2000 Plane 1 o o o o x0213-2 JIS X 0213:2000 Plane 2 o o o o x0213n JIS X 0213:2004 Plane 1 o o o o gb2312 Simplified Chinese GB2312 o o o o gb1988 Chinese GB1988(latin) o o o o gb12345 Traditional Chinese GB12345 o o o o ksx1003 Korian KS X 1003(latin) o o o o ksx1001 Korian KS X 1001 x o o o koi8-r Cyrillic KOI-8R x o o o koi8-u Ukrainean Cyrillic KOI-8U o o o o cns11643-1 伝統字中国語 CNS11643-1 x o o o viscii-r RFC1496 VISCII (右半面) o o o o viscii-l RFC1496 VISCII (左半面) x o o o cp437 Microsoft cp437 (US latin) x o o o cp737 Microsoft cp737 x o o o cp775 Microsoft cp775 x o o o cp850 Microsoft cp850 x o o o cp852 Microsoft cp852 x o o o cp855 Microsoft cp855 x o o o cp857 Microsoft cp857 x o o o cp860 Microsoft cp860 x o o o cp861 Microsoft cp861 x o o o cp862 Microsoft cp862 x o o o cp863 Microsoft cp863 x o o o cp864 Microsoft cp864 x o o o cp865 Microsoft cp865 x o o o cp866 Microsoft cp866 x o o o cp869 Microsoft cp869 x o o o cp874 Microsoft cp874 x o o o cp932 Microsoft cp932 (Japanese) x o o o cp1250 Microsoft cp1250 (中欧) x o o o cp1251 Microsoft cp1251 (Cyrillic) x o o o cp1252 Microsoft cp1252 (Latin-1) x o o o cp1253 Microsoft cp1253 (Greek) x o o o cp1254 Microsoft cp1254 (Turkish) x o o o cp1255 Microsoft cp1255 x o o o cp1256 Microsoft cp1256 x o o o cp1257 Microsoft cp1257 x o o o cp1258 Microsoft cp1258
--input-detect-jis78 コードセット自動検出時、JIS X 0208:1978 (C6226:1978) と JIS X 0208:1983/1990 を 区別する。 既定値は、この二つのコードセットとも JIS X 0208:1983/1990 と見なされ る。 JIS 入力時のみ有効。 入力コードセットに JIS X 0208:1978 を明示指定した場合 はこのオプションの有無にかかわらず指定されたコードセットが使用される。
(7) JIS X 0207:1979 は未サポート。同仕様に沿った制御コードを含む場合は何が起きるかわか らない。 JIS X 0211:1987 はサポートしているが、 --invis-strip 未指定時の端末制御シーケ ンスの透過性は端末に依存する。 vt100 の主要なものは透過だが、一般端末については未確認で あるため、telnet 等からの標準入力のフィルタとして利用する場合は注意されたい。
(15) Windows-31J (cp932) では仕様上 latin 部は JIS X 0201 Roman ということになっている はずであるが、現実の Windows の動きは ASCII と X-0201 Roman との区別がないため、skf で は ASCII を使っている。 2.1x ではこれを変更するオプションは提供しない。
Notice Unicode is a registered trademark of Unicode, Inc. Microsoft and Windows are registered trademarks of Microsoft corporation. Apple and Macintosh are registered trademarks of Apple Inc. Vodafone is a trademark of Vodafone K.K.