검색
색인
문자 집합, 文字集合, character set
컴퓨터에서 문자를 어떠한 코드로 저장할 것인가에 대한 정의를 의미하는 약속된 문자의 표현 방법. 모든 컴퓨터는 그 구성상 가능한 최대 문자에 한도가 있으며, 각각 상이한 문자의 집합과 부호 구성을 갖고 있다. SBCS(Single Byte Character Set)의 예로서 아스키(ASCII) 코드는 26개의 알파벳과 확장 문자 및 기호를 포함해서 총 128개의 문자(확장시 256개)가 정의되고, 8 비트로 표현하며, 프로그램에서는 1 바이트의 크기인 char형를 사용하여 표현한다. WBCS(Wide Byte Character Set), 즉 유니코드(Unicode)는 영어가 아닌 모든 문자들을 표현할 수 있는 문자 코드 체계이며 그 중에서 UTF-8은 표현하고자하는 코드에 따라 여러 바이트를 사용하는 인코딩 방식이다. 그 밖에 바이트 수가 다양한 MBSC(Multi Byte Character Set)도 있다.