|
|
한/중/일 파이썬 한국어, 중국어, 일본어 환경을 위한 파이썬 모듈 |
|
|
|
|||
CJKCodecs는 파이썬 2.4에 포함되었기 때문에, 2.4에서는 따로 설치하실 필요가 없습니다.
CJKCodecs는 한,중,일 인코딩들을 위한 통합 유니코드 코덱입니다. CJKCodecs는 파이썬 유니코드 코덱의 모든 기능을 지원하며, 파이썬 2.3에서는 PEP293 에러 콜백도 지원합니다.
iconvcodec은 POSIX iconv(3) 기능을 이용한 파이썬 유니코드 환경을
제공해 줍니다. 또한, freeze나 py2exe같은 독립적인
파이썬 환경에서는 표준 encodings패키지를 대체하여 유니코드 환경을
제공해 줄 수도 있습니다.
참고로, iconvcodec은 iconv(3)의 자체적인 설계상의 한계점으로
인해 코덱 에러 콜백에서 UnicodeDecodeError를 발생시킬 때
end 속성의 값이 제대로 보고되지 않습니다. 결국 "replace"
옵션을 이용하여 디코드를 하면 CJKCodecs나 JapaneseCodecs같은 자체 디코딩
루틴을 갖고 있는 코덱과는 다르게 동작할 수도 있습니다.
윈도우용 배포본들은 GNU libiconv 1.9.1의 DLL 파일들을 포함하고 있습니다. 이에 따라 윈도우 환경에서는 300개 이상의 인코딩을 iconvcodec만으로도 사용하실 수 있습니다.
CJKPython은 윈도우를 사용하는 한/중/일 사용자들을 위한 지역화 파이썬 배포본입니다. CJKPython에는 CJKCodecs, hangul 모듈, pykf 모듈과 같은 많은 써드-파티 지역 소프트웨어들이 포함되어 있습니다. 또한, 기본적으로 로켈을 인식하도록 하는 패치나 아츠오 이시모토씨의 Shift-JIS를 위한 패치를 선택적으로 설치할 수도 있습니다. CJKPython은 표준 파이썬에서 많은 모듈을 추가로 배포하고 있음에도 불구하고 표준 파이썬보다 작습니다.
이 모듈은 한글을 조작하기 위한 여러 함수들을 제공합니다. 이 모듈을 사용하면 음절 조합, 음절 분리, 자소 분리나 어미에 따른 자동 조사 선택 포매팅같은 기능을 쓸 수 있습니다.
이 패키지는 순수 파이썬으로 작성된 파이썬 유니코드 코덱입니다. 이 패키지는 C 컴파일러를 쉽게 사용할 수 없어서 CJKCodecs을 설치하기 힘든 환경이나 Jython이나 Python.NET같은 가상 기계 환경을 위해 제공되고 있습니다.
이 모듈을 BSD들, MacOS X, 리눅스, 윈도우같은 통상적인 환경에서 사용하는 것은 추천되지 않습니다. CJKCodecs를 사용하시면 보다 최적화된 속도로 작동하며 더 적은 메모리를 소비합니다.