본문 바로가기
[개발] Info/용어

유니코드(Unicode)

by Devsong26 2022. 3. 24.

유니코드(Unicode)는 컴퓨터에서 문자를 표현하기 위한 표준입니다. 이 표준은 전 세계의 모든 문자 시스템을 일관되게 표현하고, 전송하며, 처리할 수 있도록 설계되었습니다. 

 

 

유니코드의 주요 특징

  • 범용성
    • 유니코드는 세계의 거의 모든 문자 시스템을 포함합니다. 이는 라틴 알파벳, 키릴 문자, 아랍 문자, 한글, 일본어 가나 및 한자, 힌디어, 타밀어 등을 포함하며, 심지어 역사적인 문자와 상징, 이모티콘까지도 포함합니다.
  • 유니코드 코드 포인트
    • 각 문자는 고유한 "코드 포인트"에 할당됩니다. 이는 일반적으로 U+ 뒤에 16진수로 표현됩니다. 예를 들어, 영문 대문자 A는 U+0041로 표현됩니다.
  • 인코딩 방식
    • 유니코드 문자는 다양한 방식으로 인코딩될 수 있습니다. 가장 널리 사용되는 인코딩 방식에는 UTF-8, UTF-16, UTF-32가 있습니다. UTF-8은 가변 길이 인코딩으로, 많은 웹사이트와 시스템에서 사용됩니다.
  • 호환성과 표준화
    • 유니코드는 기존의 여러 문자 인코딩 시스템과의 호환성을 유지하기 위해 설계되었습니다. 이로 인해 다양한 언어와 시스템 간의 데이터 교환을 용이하게 합니다.
  • 확장성
    • 유니코드는 지속적으로 발전하고 있으며, 새로운 문자, 기호, 이모티콘 등이 정기적으로 추가됩니다.

 


유니코드의 도입으로 인해, 전 세계적으로 다양한 언어의 텍스트를 동일한 방식으로 처리하고 표시할 수 있게 되었습니다. 이는 국제화와 지역화가 중요한 현대 컴퓨팅 환경에서 매우 중요한 역할을 합니다.

 

 

 

'[개발] Info > 용어' 카테고리의 다른 글

OSI 7 Layer  (0) 2023.10.24
gRPC  (0) 2023.10.22
[Network] HTTP 통신  (0) 2021.05.31
Locale  (0) 2018.03.25
Character Set과 인코딩  (0) 2018.02.05