Computer Science/Common

아스키 코드 Vs 유니코드 Vs UTF-8

JunOnJuly 2023. 10. 31. 23:13
728x90

아스키 코드


 

아스키코드(ASCII)128개의 문자로 이루어진 7비트 부호입니다. 알파벳, 숫자, 특수기호와 컴퓨터에 필요한 몇 가지 문자만 정의되어 있습니다.

출처 - https://velog.io/@exploit017/%EC%95%84%EC%8A%A4%ED%82%A4-%EC%BD%94%EB%93%9C%ED%91%9C


유니코드


점점 여러 나라에서 컴퓨터를 사용하다 보니 아스키코드만으로는 문자들을 표현하기 부족해져서 만들어진 코드 체계입니다. 숫자와 글자가 1:1 로 매핑되는 형태를 가지고 있습니다. 16비트를 표현해 최대 65536자를 표현 가능하며 영문, 숫자, 한글, 한자 등 모든 글자는 이론적으로 2 바이트를 띄고 있습니다. 다만 일부 문자는 2바이트를 초과할수도 있습니다.


UTF-8


유니코드를 사용하는 인코딩 방식의 일부입니다. 영문, 숫자, 기호는 1바이트로 한글, 한자는 3바이트로 표현합니다. 또 전 세계 모든 글자를 한번에 표현할 수 있습니다.유니코드의 한 문자를 나타내기 위해 1~4 바이트까지 사용합니다. 또한 UTF-8 로 작성된 문서와 유니코드로 작성된 문서가 영문과 숫자로만 이루어져 있다면, 이는 아스키코드와 동일합니다. 즉 영문과 숫자 영역에서 이 세 가지 체계는 일치합니다.

728x90

'Computer Science > Common' 카테고리의 다른 글

CI/CD  (0) 2023.11.05
동기 Vs 비동기  (1) 2023.11.01
Call By Value Vs Call By Reference  (0) 2023.10.30
메모리 구조  (0) 2023.10.29
RESTful api  (0) 2023.10.28