Skip to content

Commit

Permalink
Merge pull request #16 from bab2min/develop
Browse files Browse the repository at this point in the history
* URL, 이메일, 해시태그를 검출하는 기능이 추가되었습니다. analyze 메소드의 match_options 파라미터로 이 기능의 사용 유무를 설정할 수 있습니다.
* 치(하지), 컨대(하건대), 토록(하도록), 케(하게) 축약형이 포함된 동사 활용형을 제대로 분석하지 못하는 문제를 해결했습니다.
* 사용자 사전에 알파벳이나 숫자, 특수 기호가 포함된 단어가 있을 때, 형태소 분석시 알파벳, 숫자, 특수 기호가 포함된 문장이 제대로 분석되지 않는 문제를 수정했습니다.
* 사용자 사전에 형태는 같으나 품사가 다른 단어를 등록할 수 없는 제한을 해제하였습니다.
  • Loading branch information
bab2min authored Mar 29, 2020
2 parents 2fc9d8a + b1b28a7 commit 4a911e9
Show file tree
Hide file tree
Showing 24 changed files with 1,339 additions and 20,033 deletions.
4 changes: 3 additions & 1 deletion .gitignore
Original file line number Diff line number Diff line change
Expand Up @@ -345,4 +345,6 @@ __pycache__/
/CMakeCache.txt
/cmake_install.cmake
/CMakeFiles/
/Makefile
/Makefile
/My Advisor Results - evaluator
/ModelGenerator/compositeHangul.py
7 changes: 7 additions & 0 deletions ModelGenerator/README.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,7 @@
모델 빌드

1. 코퍼스에서 형태소 추출 (fullModelV2.txt 생성)

2. 결합 형태 생성: combinerV2.py 실행 (combinedV2.txt 생성)

3. 사전 결합 형태 생성 : pmgV2.py 실행 (precombinedV2.txt 생성)
Loading

0 comments on commit 4a911e9

Please sign in to comment.