OSDN > Pesquisar Software > Text Editors > Text Processing > nkf Network Kanji Filter > Ticket List/Search > Tíquete #42654

nkf Network Kanji Filter
Fork

Tíquete #42654
Ticket List Submit New Ticket RSS

UTF-8 without BOM「日本語①」の自動判定

: 2021-07-21 20:37 Última Atualização: 2021-07-21 20:40

monitor

Relator:

aminophen

Dono:

(Nenhum)

Tipo:

Bugs

Estado:

Fechado

Componente:

(Nenhum)

Marcos:

(Nenhum)

Prioridade:

5 - Medium

Gravidade:

5 - Medium

Resolução:

Nenhum

Arquivo:

Nenhum

Details

こんにちは，日本語 TeX の開発関係者です。既に報告があるのかもしれませんが，過去チケットを検索しても見つけられませんでしたので報告します。

現在，Windows 版の pTeX（日本語 TeX）では nkf をライブラリとして組み込んで文字コード推定に使わせて頂いております。その中で，nkf が文字コード推定を誤る例が（ずいぶん前から）指摘されていることに今更気づきました。

https://texwiki.texjp.org/?upTeX%2CupLaTeX#zb472e1c

確かに nkf 単体で「日本語①」を test.txt として UTF-8 without BOM で保存しても，nkf --guess test.txt で Shift_JIS と返ってきます。ところが

「日」だけ → UTF-8
「日本」まで → UTF-8
「日本語」まで → UTF-8
「日本語①」まで → Shift_JIS
「日本語①あ」まで → UTF-8

となり「日本語①」の時だけ判定を誤るのを不思議に思っています。100%判定が当たるとは思っていませんが，不思議なので理由だけでも分かるとありがたいです。よろしくお願いします。

Ticket History (2/2 Histories)

2021-07-21 20:37 Updated by: aminophen

New Ticket "UTF-8 without BOM「日本語①」の自動判定" created

2021-07-21 20:40 Updated by: aminophen

Estado Update from Aberto to Fechado

Comentário

申し訳ありません，なぜか2個オープンしてしまいました。 https://osdn.net/projects/nkf/ticket/42653 に統一します。

Attachment File List

No attachments

nkf Network Kanji Filter Fork

Tíquete #42654 Ticket List Submit New Ticket RSS

UTF-8 without BOM「日本語①」の自動判定 : 2021-07-21 20:37 Última Atualização: 2021-07-21 20:40 monitor ON OFF

Details Responder

Ticket History (2/2 Histories)

2021-07-21 20:37 Updated by: aminophen

2021-07-21 20:40 Updated by: aminophen

Comentário Responder

Attachment File List

Editar

nkf Network Kanji Filter
Fork

Tíquete #42654
Ticket List Submit New Ticket RSS

UTF-8 without BOM「日本語①」の自動判定

: 2021-07-21 20:37 Última Atualização: 2021-07-21 20:40

monitor

Details

Comentário