본문 바로가기
개념정리

인코딩과 디코딩이란?

by 카뮤 2021. 1. 6.

인코딩과 디코딩

사람이  이해할수 있는 텍스트(문자열)데이터들은 컴퓨터가 이해하기 위해서 이진수로 변환해야되는데 이때 변환시키는 작업을 인코딩이라고 한다.  이때 저장단위는 바이트라고한다.

 

인코딩 (encoding): 문자열을 바이트로 변환하는 과정

디코딩 (decoding) : 바이트를 문자열로 변환하는 과정

바이트(byte) 컴퓨터 기본 저장단위

  • 1바이트(1byte)는 8bit
  • 1바이트에는 2의 8승, 즉 256개의 값을 저장할수 있다

 

유니코드

유니코드란 국제표준기구(ISO : International Standards Organization)에서 제정한 전세계 문자에 대한 표준코드

UTF-8, UTF16을 유니코드와 같을 것이라 생각하는데,이것들은 유니코드로 정의 텍스트를 메모리에 인코딩하는 방식이다.

 

 

유니코드와 UTF-8 

 

Unicode와 UTF-8 간단히 이해하기

유니코드(Unicode)

jeongdowon.medium.com

UTF-8, UTF-16차이

 

UTF-8, UTF-16 차이

UTF-8과 UTF-16은 Unicode를 표현하는 Encoding 방식이다. UTF-8과 UTF-16의 기본 차이는 문자 하나를 표현할 때 사용할 최소 byte를 의미한다고 볼 수 있다. UTF-8로 문자를 표현할 때 1~4bytes만큼 필요하다. UT..

pickykang.tistory.com

 

 

 

 

  • 파이썬 2에서는 인코딩을 한 후에도 아스키(ascii) → 유니코드(unicode) 변환 작업을 해야한다.
  • 파이썬 3부터는 문자열은 다른작업 없이 유니코드의 인코딩 or 디코딩 여부만 판단하면된다.

 

 

 

파이썬 내장함수 ord()와 chr()

ord()  #해당 문자에 대응하는 유니코드 숫자를 반환합니다.
chr()  #해당 유니코드 숫자에 대응하는 문자를 반환합니다.

'개념정리' 카테고리의 다른 글

[퍼옴]리눅스 디렉토리 구조  (0) 2021.01.06
[파이썬]파일관련 함수  (0) 2021.01.06
JSON파일, XML파일, CSV 파일  (0) 2021.01.06
문자열 함수들  (0) 2021.01.06
터미널이란 무엇인가?  (0) 2021.01.02

댓글