본문 바로가기

인코딩2

[Node.js] iconv-lite 이용하여 한글(여러 언어) utf-8 에서 hex, mbcs 로 변환하기 Node.js로 긴급하게 스크립트를 짜다가 인코딩 관련 문제에 부딪혔습니다. 아무래도 문자열 관련 작업이다 보니, 필연적이었겠지만.. 또한, 한글 뿐만 아니라 여러 언어에서도 인코딩이 가능해야 해서 열심히 구글링을 하였습니다. 아무래도 euc-kr 문자열에서 utf-8 문자열로 변경하는 코드는 많았지만, 반대 상황은 찾기가 힘들었습니다. 그러던 도중에 방법을 찾게 되어 포스팅합니다. 혹시나, 한글(여러 언어)에서 hex 또는 utf-8로, hex에서 utf-8 또는 한글(여러 언어)로 변환하는 방법이 궁금하시면 아래 글을 읽어주세요. [프로그래밍/Node.js] - [Node.js] iconv-lite 이용하여 한글(여러 언어)에서 hex, utf-8로, hex에서 utf-8, 한글(여러 언어) 로 변환.. 2019. 4. 17.
[Linux|Unix] 리눅스 일본어 인코딩 Shift_JIS 정리 리눅스를 하다보면 인코딩 작업을 할 떄가 많다. 특히, 다국어를 처리할 때 각각의 나라마다 언어의 인코딩이 필요하다. 오늘은 일본어 인코딩에 대해서 정리하려고 한다. 일본어는 흔히, Shift_JIS 라는 문자 인코딩을 사용한다. 보통, SJIS로 줄여 부른다고 한다. Shift_JIS 인코딩은 구조는 다음과 같다. [위키백과 참조] Shift_JIS는 두 바이트로 한 문자를 구성한다. 때문에, 인코딩 작업을 해본 사람을 겪어봤겠지만, 두 번째 바이트로 인해서 오류가 발생하는 경우가 있다. 그럼 이럴 때, 문제를 어떻게 해결해야 할까. 예를 들어보겠다. 일본어에서 藹 문자는 부호로 E55C이다. 'E5', '5C' 두 바이트로 구성되는 데, 이것은 '\xE5', '\x5C'로도 표현할 수 있다. 따라서 .. 2017. 9. 1.