Shift-JIS1 [Linux|Unix] 리눅스 일본어 인코딩 Shift_JIS 정리 리눅스를 하다보면 인코딩 작업을 할 떄가 많다. 특히, 다국어를 처리할 때 각각의 나라마다 언어의 인코딩이 필요하다. 오늘은 일본어 인코딩에 대해서 정리하려고 한다. 일본어는 흔히, Shift_JIS 라는 문자 인코딩을 사용한다. 보통, SJIS로 줄여 부른다고 한다. Shift_JIS 인코딩은 구조는 다음과 같다. [위키백과 참조] Shift_JIS는 두 바이트로 한 문자를 구성한다. 때문에, 인코딩 작업을 해본 사람을 겪어봤겠지만, 두 번째 바이트로 인해서 오류가 발생하는 경우가 있다. 그럼 이럴 때, 문제를 어떻게 해결해야 할까. 예를 들어보겠다. 일본어에서 藹 문자는 부호로 E55C이다. 'E5', '5C' 두 바이트로 구성되는 데, 이것은 '\xE5', '\x5C'로도 표현할 수 있다. 따라서 .. 2017. 9. 1. 이전 1 다음