Últimas Arquivo Comunicados

handic-mecab (0.7)2020-03-24 22:43
mkhandic-mecab (0.1)2019-10-03 21:27
tools (mecab-k2alpha)2019-10-03 21:38

初めての方へ

関連情報

한국어 문서

最近の更新 (Recent Changes)

2020-03-24
2020-02-08
2019-10-03
2018-05-13
2018-05-01
2018-04-30

HanDicの変更履歴

200324 - 0.7

handic-mecab-0.7_bin.zip / handic-mecab-0.7_src.tar.gz

  • 現況:項目数 115,285,学習用データ 3,811文
  • 学習用データ追加
    • 須賀井義教『確認しながらおぼえる 韓国語基本単語帳』(朝日出版社,2019年)に掲載の例文(初級レベル,513文)
    • 연세대학교 한국어학당 편『연세한국어 읽기 1』(연세대학교 대학출판문화원,2007年)に掲載の本文(初級レベル,タイトル除く,365文)
    • 서울대학교 언어교육원『한국어 1(제2판)』(문진미디어,2005年)に掲載の本文(初級レベル,タイトル除く,233文)
  • 項目を削除
    • Modifier.csv: 가상적, 모방적, 보바리적, 부상적, 제삼, 태곳적, 팬터마임식
    • Noun.C.csv: 수도권(首都圈), 신제품(新製品)
    • Noun.misc.csv: 년생(年生, 여고 2~), 년생80(年生, 80~)
    • Noun.supplement.csv: 맨몸, 고금리(高金利), 월별01(月別), 수익률(收益率), 역외국(域外國), 신개발(新開發), 신공법(新工法), 신공업(新工業), 신과학(新科學), 신국제(新國際), 신군부(新軍部), 신그래픽(新그래픽), 신농정(新農政), 신노정(新勞政), 신모델(新모델), 신물질(新物質), 신무용(新舞踊), 신무용사(新舞踊史), 신미술(新美術), 신민속(新民俗), 신사고(新思考), 신산업(新産業), 신사회(新社會), 신세대형(新世代型), 신시장(新市場), 신인사(新人事), 신재벌(新財閥), 신정치(新政治), 신질서(新秩序), 신축비(新築費), 신풍속(新風俗), 신항만(新港灣)
    • Noun.supplement.org.csv: 정동극장(貞洞劇場)
    • Noun.supplement.place.csv: 종로1가など,数字+街を含む地名を削除(途中)
    • Verb.B.csv: 말씀드리다
    • Verb.C.csv: 낮아지다
    • Verb.supplement_1.over5.csv: 부탁드리다
  • 項目を追加
    • Adjective.csv: 요상하다02, 사사롭다, 길길다랗다, 노오랗다(노랗다)
    • Adverb.csv: 조붓이, 게슴치레(게슴츠레), 둥글둥글, 보아하니, 일찌기(일찍이)
    • Ending.csv: -너라, -나이다
    • Interjection.csv: 워리, 워어리, 저어(저05)
    • Noun.C.csv: 다소01(多少)
    • Noun.supplement.csv: 도래솔, 친소(親疏), 은원(恩怨), 증조모(曾祖母), 증조부(曾祖父), 녹음방초(綠陰芳草), 조락03(凋落), 시계열(時系列), 층운(層雲), 여노80(女奴), 재배국(栽培國), 역외01(域外), 현물환(現物換), 환차손(換差損), 선물환(先物換), 스왑(swap), 식품업(食品業), 장비업(裝備業), 관광업(觀光業), 교부금(交付金), 세입02(歲入), 갯바위, 가상적(假想敵), 모방적(毛紡績), 팬터마임, 디브이디(DVD), 영어학(英語學), 순두부찌개(순豆腐찌개), 털모자(털帽子), 별표01(별票), 정자05(井字), 기차표(汽車票), 비행기표(飛行機票), 특구(特區), 명신(名臣), 량(量), 엽기(獵奇), 유의(留意), 유향(乳香), 주화(鑄貨), 진법(進法), 집산(集散), 집체(集體), 초식(草食), 총람(總覽), 추상(秋霜), 타방(他方), 특목고(特目高), 통례(通例), 포유(哺乳), 한국사(韓國史), 해소(咳嗽▽), 향불(香불), 현전(現前), 혈류(血流), 확집(確執), 회갑연(回甲宴), 회교국(回敎國), 획분(劃分), 강대(强大), 부조리(不條理), 도시(圖示), 되새김, 등하교(登下校), 봉헌(奉獻), 신접(新接), 오용(誤用), 전신(轉身), 중언부언(重言復言), 퇴락(頹落), 항해사(航海士), 현전(現前), 태아기(胎兒期), 초혼제(招魂祭), 첫손, 가역(可逆), 결구(結句), 결미(結尾), 고자(告者), 관보(官報), 국학(國學), 균체(菌體), 극찬(極讚), 금줄(禁줄), 기득(旣得), 기정(旣定), 농학(農學), 다의(多義), 단백(蛋白), 대두박(大豆粕), 대청마루(大廳마루), 드래곤, 드레서미싱, 러닝메이트, 레지스탕스, 로마인(로마人), 르네쌍스, 리엔지니어링, 무의(無意), 무협(武俠), 물범, 배송(配送), 변전(變轉), 병졸(兵卒), 부르조아지, 북극(北極), 분망(奔忙), 불감(不感), 불호령(불號令), 비오리, 빈털털이, 사술(詐術), 사익(私益), 사훈(社訓), 삼극(三極), 삼불(三不), 서광(曙光), 서품(敍品), 세레모니, 식자(識者), 액세스, 쉬트, 인디언, 인프린팅, 시너리, 엘리뜨, 외뿔소, 세포질(細胞質), 소화관(消化管), 일시납(一時納), 월납(月納), 캐슬, 컬처, 큰며느리, 키즈, 툼, 팀웍, 파아트너, 파트론, 팰리스, 포스트마르크시즘, 프로젝터, 피그미침팬지, 필하아모니, 하이틴, 패로디, 카운트, 코디언, 주야간(晝夜間), 버라이어티(variety), 소관사(所關事), 소송법(訴訟法), 왕세자빈(王世子嬪)
    • Noun.supplement.name.csv: 스잔, 보바리, 토모미, 마이클, 유키(「姓」ではなく「名」として), 웨이, 제임스, 마리아, 스티븐, 그라스, 다운즈, 데비도우, 뒤샹, 드골, 드럭커, 라이프니쯔, 로렌츠, 맨더, 머로우, 멀룬, 멕퀘일, 모리스, 모차르트, 몬드리안, 바니, 바비지, 반즈, 벨지, 부시만, 부어스틴, 브란트, 비스마르크, 슈베르트, 슈월츠, 시라, 오펜하이머, 윌슨, 윌킨슨, 잭슨, 처칠, 츠월킨, 칼더, 케네디, 크로프트, 클라크, 타피에스, 텔러, 토플러, 파바로티, 파바로티, 페스타, 폴로, 프랭클, 프레지, 프로이트, 하워드, 하케, 해밀턴, 헤링, 헨체, 헬드, 귄터, 다니엘, 라라, 로버트, 루네, 루치아노, 리처드, 마르셀, 마르코, 매튜, 버얼, 베르너, 벤, 보리슬라프, 빌리, 샤를르, 안토니, 알렉산더, 앨빈, 에드워드, 윈스턴, 윌리엄, 제리, 조안, 죤, 줄리란, 줄리안, 찰스, 콘라드, 클라우스, 토니, 프레드릭, 프리, 피터, 한스, 헬렌, 건희, 기심, 나루히토, 낙원, 남선, 도철, 만태, 맹국, 몽헌, 병해, 보고, 본무, 봉원, 부용, 삼국, 세득, 영묵, 완서, 우복, 우중, 월례, 은상, 응문, 이국, 인직, 인탁, 일국, 자원, 재서, 주범, 중건, 지풍, 철곤, 항섭, 혜순, 강전탁야, 걸리버, 꼭또, 노아, 노자(老子), 다산(茶山), 대하전웅, 데카르트, 도미, 루이지, 릴리스, 마르크스, 마이더스, 매천(梅泉), 모하메트, 베드로, 베케트, 비틀즈, 빠스깔, 사뮤엘, 석가모니(釋迦牟尼), 셰익스피어, 스칼파로, 신라사부로(新羅三郞), 아담, 아랑, 아리스트텔레스, 아퀴나스, 알라딘, 야누스, 연암(燕巖), 예수, 오스카르, 외젠느, 이브, 이오네스꼬, 이오네스꼬나, 칭기즈칸, 칸트, 콜롬보, 프로메테우스, 헤겔, 마리, 앙리
    • Noun.supplement.org.csv: 미래통합당(未來統合黨), 미래한국당(未來韓國黨), 열린민주당(열린民主黨), 자유공화당(自由共和黨), 우리공화당(우리共和黨), 이대(梨大), 문화체육부(文化體育部), 식량청(食糧廳), 흥사단(興士團), 경북중학교(慶北中學校), 교보(敎保), 국립국어연구원(國立國語硏究院), 금호미술관(錦湖美術館), 기아써비스(起亞써비스), 나침반(羅針盤), 농수성(農水省), 닐슨사(닐슨社), 닛세, 대림그룹(大林그룹), 대림요업(大林窯業), 대우그룹(大宇그룹), 대한교육보험(大韓敎育保險), 대한항공(大韓航空), 덴츠, 동방문화진흥회(東方文化振興會), 동아출판사(東亞出版社), 동양그룹(東洋그룹), 동양제과(東洋製菓), 동연, 라인정밀(라인精密), 럭키개발(럭키開發), 럭키금성그룹(럭키金星그룹), 롯데그룹, 마이크로소프트, 명성서커스단(명성서커스團), 미주전자(美洲電子), 사법연수원(司法硏修院), 산요, 삼성그룹(三星구릅), 삼성그룹(三星그룹), 삼성물산(三星物産), 삼성사관학교(三星士官學校), 삼성전자(三星電子), 삼성중공업(三星重工業), 서울셀렉션, 서울지하철(서울地下鐵), 선경건설(鮮京建設), 세계교회협의회(世界敎會協議會), 소니, 수미다전기, 쌍용그룹(雙龍그룹), 쌍용양회(雙龍洋灰), 안국화재(安國火災), 알라딘, 예일대학교(예일大學校), 오스카, 웅진닷컴, 육군대학(陸軍大學), 일본광고주협회(日本廣告主協會), 전경련(全經聯), 전자신문사(電子新聞社), 전통(電通), 제록스사(제록스社), 제일제당(第一製糖), 중앙국민학교(中央國民學校), 탠디, 포드, 하버드대학교(하버드大學校), 한국동경전자(韓國東京電子), 한국동광(韓國銅鑛), 한국소니사(韓國소니社), 한국언론학회(韓國言論學會), 한국와카사(韓國와카사), 현대상선(現代商船), 혜지원, 명덕국민학교(명덕國民學校), 제록스(Xerox)
    • Noun.supplement.place.csv: 남산타워(南山타워), 대한극장(大韓劇場), 충무로(忠武路), 태릉사격장(泰陵射擊場), 신촌(新村), 정동극장(貞洞劇場), 동해안(東海岸), 해운대(海雲臺), 당나라(唐나라), 백제국(百濟國), 백제왕국(百濟王國), 스키타이, 아메리카02, 유고09, 유고슬라비아, 보문단지(普門團地), 선재미술관(선재美術館), 코엑스(COEX), 마산항(馬山港), 파주군(坡州郡), 진해(鎭海), 창녕(昌寧), 합천(陜川)
    • Noun.supplement.proper.csv: 독립신문(獨立新聞), 매천야록(梅泉野錄), 몽유도원도(夢遊桃源圖), 서편제(西便制/영화 제목), 쉬리(영화 제목), 오아시스(영화 제목), 주역02(周易), 창세기(創世記)
    • Prefinal.csv: 〈謙譲〉の接尾辞(-삽-, -옵-, -잡-)
    • Root.csv: 무쌍(無雙), 드라마틱, 떠들석, 무결(無缺), 뻑적지근
    • Suffix.csv: 드리다80(差し上げる:同士派生接尾辞)
    • Symbol.csv: -(マイナス記号:世宗タグSW)
    • Verb.supplement_3.std.csv: 헤매이다(헤매다)
  • 項目を修正
    • Noun.C.csv: 근거の品詞3を「動作」に修正
    • Noun.supplement.csv: 정확01の品詞3を「状態」に,수발01/수발02(受發)の品詞3を「動作」に修正.제삼の漢字を修正
    • Noun.supplement.org.csv: デパート名の漢字表記が統合型ハングルで記述されていたのを修正
    • Noun.supplement.place.csv: 인사동(仁寺洞)がソウルの観光地としての「地名」と慶尚南道昌原市の行政区画としての「都市名」とで重複していたのを,「都市名」に単一化し,漢字表記を追加
    • Noun.supplement.proper.csv: 新聞名の漢字表記が統合型ハングルで記述されていたのを修正

180428 - 0.6

handic-mecab-0.6_bin.zip / handic-mecab-0.6_src.tar.gz

  • 現況:項目数 114,863,学習用データ 2,700文
  • 学習用データ追加(冒頭の100文)
    • BTHO0129.txt: 삶의 결 살림의 질
  • 項目を削除
    • Verb.supplement_1.over5.csv: 모아지다
    • Noun.supplement.csv: 홀짝이다, 대보름, 대보름날, 생솔가지, 운동권, 다듬이질, 장꾼, 마다02(XRと重複), 공산권, 충전식, 심부전증, 침해죄, 최첨단(最尖端), 마취과(痲醉科), 재승격(再昇格), 성장률(成長率), 바닥권, 미신고자(未申告者), 대주주(大株主), 증가율(增加率), 총학생회(總學生會), 재구성(再構成)
    • Adjective.csv:
    • Modifier.csv:
    • Verb.B.csv: 세워지다, 느껴지다, 알려지다, 높아지다
    • Noun.B.csv: 대도시(大都市), 대기업(大企業)
    • Noun.C.csv: 성적01(性的), 신세대(新世代)
    • Noun.supplement.place.csv: 종로1가など,数字+街を含む地名を削除(途中)
  • 項目を追加
    • Ending.csv: 모(사투리 "면"), 키(하기)
    • Noun.A.csv: 월02(月)
    • Noun.misc.csv: 인조80(人組)
    • Noun.supplement.csv: 3·1절, 절후02(節候), 나발통, 함석, 달집01, 방화죄(放火罪), 산림법(山林法), 원뿔통(圓뿔통), 장터거리(場터거리), 피붙이, 뜸마을, 아랫동, 비손, 짚불, 딱총(딱銃), 불꽃놀이, 액02(厄), 꽃샘, 연녹색/연록색(軟綠色), 연록(軟綠), 만산02(滿山), 정한02(情恨), 개여울, 재취02(再娶), 의붓딸, 의붓아들, 의붓아범, 의붓아비, 의붓어머니, 의붓어멈, 의붓어미, 의붓자식(의붓子息), 선병질(腺病質), 위채, 마소, 반타작(半打作), 청상07(廳上), 標準国語大辞典の〈동물〉カテゴリから968項目, 여필종부(女必從夫), 인종05(忍從), 모티브, 곡마단(曲馬團), 고깔모자, 재주넘기, 읍민(邑民), 곡예사(曲藝師), 명견(名犬), 외발, 요절03(腰折/腰絕), 선전원(宣傳員), 장27(場/시장), 애조02(哀調), 공중그네, 정인04(情人), 제설차(除雪車), 적십자(赤十字), 심부전(心不全), 화기06(花器), 요식02(料食), 시약03(試藥), 팔모정(八모亭), 국교80(國校=국민학교), 구름사다리, 늑목(肋木), 간이링(簡易링), 제당03(製糖), 니켈(nickel), 밀감(蜜柑), 경81(經=경제), 도크(dock), 신고자(申告者), 구주10(舊株), 장세03(場勢), 내강01(內剛), 외유내강(外柔內剛), 외유02(外柔), 첨가제02(添加劑), 활석분(滑石粉), 거래소(去來所), 유종80(油種), 국고국장(國庫局長), 인두세(人頭稅), 광공업체(鑛工業體), 주세법(酒稅法), 청주03(淸酒), 과실주(果實酒), 백송01(白松), 엽록소(葉綠素), 신부전(腎不全), 한계선(限界線), 분단국가(分斷國家), 국고금(國庫金), 일평균(日平均), 당행, 국공채(國公債), 동월02(同月), 하회02(下廻), 전월02(前月)
    • Noun.supplement.name.csv: 소월03(素月), 윤섭, 범직, 칼, 립켄, 마크, 맥과이어, 파이잘, 아브다오, 세달, 대처(Thatcher), 국병, 연란, 숀, 팬
    • Noun.supplement.place.csv: 호서02(湖西), 기호05(畿湖), 해서01(海西), 선달바우산, 레닌그라드, 수안보(水安堡), 코리아(Korea), 서독01(西獨), 엑셀
    • Verb.supplement_1.over5.csv: 신나다
    • Verb.supplement_3.std.csv: 홀짝이다, 맹글다(사투리 "만들다"), 찌다06(솔가지를 ~), 킬킬대다
    • Noun.supplement.proper.csv: 진달래꽃02, 산유화01(山有花),접동새01, 마그레비, 천황배(天皇杯), 우루과이라운드(Uruguay Round), 데미렐, 태릉사격장(泰陵射擊場)
    • Noun.supplement.org.csv: 행정안전부/행안부, 중소벤처기업부/중기부, 과학기술정보통신부/과기정통부, 韓国の政党名72項目, 적십자(赤十字), 행림대(杏林大), 롯데리아, 사조참치, 동신떡갈비, 중대(중앙대 약칭), 대명레저산업, 한국소비자보호원, 소보원(한국소비자보호원 약칭), 유니세프(UNICEF), 유러펀드(Euro Fund), 상공부(商工部), 메츠(Mets), 미국프로테니스협회, 삼성(三星), 현대(現代), 국제테니스연맹, 프뤼겔스, 전일공 (全日空), 경단협(經團協), 해태, 고합, 대우(大宇), 한라(漢拏), 배명, 현대자동차(現代自動車), 교통부(交通部), 안전국(安全局), 企業グループ名38項目, 재무부(財務部), 동자부(動資部), 롯데칠성, 문화방송, 한국방송, 에스비에스(SBS)
    • Noun.numeral.csv: 시오(십리고 시오리고...)
    • Prefix.csv: 먹03(구름)
    • Suffix.csv: 급06(級)
    • Adjective.supplement.csv: 다숩다, 다습다, 애운하다
    • Adverb.csv: 휘뚜루마뚜루, 천상(天常)
    • Symbol.csv: 単位記号などを追加, ▴
  • 項目の修正
    • Noun.supplement.csv, Noun.supplement.place.csv: 관서03(關西)/관북(關北)/관동04(關東)/영서05(嶺西)を固有名詞に修正
    • Noun.supplement.csv: 의붓동생の漢字表記を修正,길쌈の品詞情報を修正(品詞3を「動作」に), 요절01(夭折)の同音異義番号を修正
    • Noun.supplement.place.csv: 경기02(京畿)の同音異義番号を追加
    • Noun.C.csv, Noun.proper.csv: 호남02(湖南)を固有名詞に修正
    • Noun.supplement.org.csv: 간월사지/감산사지の漢字表記を修正
    • Verb.supplement_1.over5.csv: 깁다の活用情報と項目を修正
    • Verb.supplement_3.std.csv: 덧깁다/짜깁다の活用情報と項目を修正.설다の同音異義番号01を追加
    • Adjective.csv: 설다01の同音異義番号を02に修正し,第Ⅱ語基の形に설으を追加(낯설고 물 설은 땅)
    • Adjective.supplement.csv: 물설다の第Ⅱ語基の形に물설으を追加
    • Suffix.csv: 질11(가위, 손가락...)の品詞情報を修正(品詞3を「動作」に)
    • rewrite.def: -률04/-율04(率)を一つの項目としてみなすよう記述

170529 - 0.5

handic-mecab-0.5_bin.zip / handic-mecab-0.5_src.tar.gz

本バージョンより,ソースを公開しました.インストールについてはHanDicのインストールを参照してください.

  • 現況:項目数 113,471,学習用データ 2,600文
  • 学習用データ追加(冒頭の100文)
    • BTEO0081.txt: 시간속의 도적
    • BTBE0237.txt: 금융 97년 1월호(雑誌)
  • 項目を削除
    • Verb.supplement_1.over5.csv: 붙여지다, 유명해지다, 따뜻해지다
    • Noun.supplement.csv: 무중력, 불성실, 불필요, 재편성, 지향점, 결정권, 통제권, 중요시
    • Adjective.csv: 에로틱하다
    • Modifier.csv: 독점화
    • Verb.C.csv: 여겨지다
    • Noun.C.csv: 소규모, 국제화
  • 項目を追加
    • Ending.csv: ㄹ테니까/EC, 리만큼/EC, 토록/EC
    • Noun.supplement.csv: 에로틱, 의총05, 극대01, 부제09(部制), 업적주의(業績主義), 불식04(拂拭), 공동선01(共同善)
    • Root.csv: 획일(劃一)
    • Verb.supplement_3.std.csv: 끝내주다/VV
    • Noun.supplement.org.csv: 조선노동당, 조선로동당, 노동당, 로동당, 세계무역기구, 경제협력개발기구, 스탭(staff)
    • Symbol.csv: +/SW, ■/SW
  • 項目の修正
    • Noun.supplement.csv: 살색に漢字表記を追加, 성실02(誠實)の品詞3を「状態」に修正
    • Noun.supplement.csv, Noun.supplement.place.csv: 영동03(嶺東)を固有名詞に修正
    • Noun.B.csv: 수염04の同音異義番号を03に修正
    • Noun.C.csv, Noun.proper.csv: 영남(嶺南)を固有名詞に修正

160508 - 0.4

handic-mecab-0.4_bin.zip

  • 現況:項目数 113,474,学習用データ 2,400文
  • 学習用データ追加(冒頭の100文)
    • BTEO0088.txt: 해남 가는 길
  • 単語を追加
    • Noun.supplement.csv: 동파05, 이동01, 이서03
    • Noun.supplement.place.csv: 충청(忠淸),韓国の空港(Wikipedia 분류:대한민국의 공항),北朝鮮の地名(북한네트/북한 지리を参照,漢字表記含む)
    • Noun.misc.csv: 터02に指定詞がついた形を「指定詞融合」として追加
    • Verb.supplement_3.std.csv: 어떡하다(어떡하/어떡해/어떡하여/어떡허) をVVとして追加
    • Ending.csv: -ㄴ데다, -는데다, -는데다가, -자니を追加
  • 項目の修正
    • Root.csv, Noun.supplement.csv: 다정01(多情)を語根から普通名詞に修正
    • Verb.B.csv: 머무르다の活用情報を修正
    • Noun.B.csv: 배구06の同音異義語番号を05に修正
    • Adverb.csv, Modifier.csv: 그만01を副詞から冠形詞に修正
    • Adjective.supplement.csv: 一部の項目で「表層形」(単語の項目そのもの)が統合型ハングルで,「出現形」が字母で記述されていたのを修正
    • Noun.supplement.place.csv: 外国の河川名などの漢字表記が統合型ハングルで記述されていたのを修正
    • Ending.csv, Ending.Particle.csv, Suffix.csv, Verb.supplement_3.std.csv: 一部の項目で「表層形」が統合型ハングルで記述されていたのを修正
  • 項目の削除
    • Noun.supplement.csv: 농사꾼, 추억거리, 동일계
    • Noun.supplement.place.csv: 都市の一部(市)で重複を削除
    • Verb.supplement_1.over5.csv: 맑아지다を削除

151216 - 0.3

handic-mecab-0.3_bin.zip

151104 - 0.2

handic-mecab-0.2_bin.zip

  • 外来語の追加(国語院外来語資料から一部のみ)
  • 接頭辞を含む語を分析して削除
  • 誤記の修正
  • 項目数 106,823

150518 - 0.1

handic-mecab-0.1_bin.zip