Download List

Projeto Descrição

HanDicは,現代韓国語テキストを形態素に分割し,形態素情報を付与するための解析用辞書です.

HanDicは形態素解析器MeCabで利用することができます.

System Requirements

System requirement is not defined

Liberado: 2015-07-03 10:54
tools k2jamo (3 files Esconder)

Release Notes

UTF-8エンコーディングの韓国語テキストのうち,完成型ハングル(U+AC00〜U+D7A3)を字母(U+1100~U+11F9)に分解するためのスクリプトです. 入力例として,完成型ハングルで記述したinput.txtも合わせて配布します.内容は韓国・国立国語院の『標準国語大辞典』(ウェブ版)から,「말01」(ことば)の定義1を引用したものです.

  1. perl k2jamo.pl input.txt

あるいは

  1. echo "한국어 문장" | perl k2jamo.pl
のように使います. Pythonの場合,上記のperl部分を適宜書き換えてください.

UTF-8로 인코딩된 텍스트 중 완성형 한글(U+AC00-U+D7A3)을 자모(U+1100-U+11F9)로 나누어서 출력해 주는 스크립트입니다. 입력의 예로서 완성형 한글로 기술한 input.txt을 함께 배포합니다. 내용은 "표준국어대사전"에서 '말01'의 정의 1을 인용한 것입니다.

  1. perl k2jamo.pl input.txt

혹은

  1. echo "한국어 문장" | perl k2jamo.pl
처럼 사용합니다. Python으로 처리할 경우 위의 perl 부분을 바꾸면 됩니다.

Changelog

[2015/07/04] 最初の公開

[2015/12/14] 標準入力,および引数で指定したファイルのいずれも入力として受け取ることができるように改善.

[2018/05/13] Python3用のスクリプトを追加(Python初心者のため,誤りがあるかもしれません).

[2015/07/04] 첫 공개

[2015/12/14] 표준입력 및 지정된 파일을 입력으로 처리할 수 있도록 개선했음.

[2018/05/13] Python3을 위한 스크립트를 추가했습니다(Python 초보자이기 때문에 오류가 있을 수 있습니다).