2017/01/28 (1) 썸네일형 리스트형 [C#] UTF-16의 캐릭터 크기에 대한 간단한 탐구 안녕하세요,러시아에 살고 있는 개발자 윤진입니다. C#을 비롯한 .Net 플랫폼에서는 문자를 인코딩하는 방식으로,Unicode Transformation Format인 UTF-16을 사용합니다. UTF-16은 기본적으로 16비트-2바이트를 취하지만, 항상 2바이트는 아닙니다.사상되는 문자의 종류에 따라 4바이트로 확장되기도 합니다. 2바이트로 표현되는 영역은 U+0000부터 U+FFFF까지입니다.U+0000은 제어 문자와 라틴 기본 영역에 속해있죠.U+0000 ~ U+007F128자제어 문자와 라틴 기본 U+FFFF는 특수 제어 문자 영역에 속해있습니다.U+FFF0 ~ U+FFFF16자특수 제어 문자 그렇다면, 4바이트 사상되는 U+000000~ 코드 이상의 문자는 무엇을 보고 4바이트 문자인지 판별할 .. 이전 1 다음