인코딩과 디코딩
사람이 이해할수 있는 텍스트(문자열)데이터들은 컴퓨터가 이해하기 위해서 이진수로 변환해야되는데 이때 변환시키는 작업을 인코딩이라고 한다. 이때 저장단위는 바이트라고한다.
인코딩 (encoding): 문자열을 바이트로 변환하는 과정
디코딩 (decoding) : 바이트를 문자열로 변환하는 과정
바이트(byte) 컴퓨터 기본 저장단위
- 1바이트(1byte)는 8bit
- 1바이트에는 2의 8승, 즉 256개의 값을 저장할수 있다
유니코드
유니코드란 국제표준기구(ISO : International Standards Organization)에서 제정한 전세계 문자에 대한 표준코드
UTF-8, UTF16을 유니코드와 같을 것이라 생각하는데,이것들은 유니코드로 정의 텍스트를 메모리에 인코딩하는 방식이다.
- 파이썬 2에서는 인코딩을 한 후에도 아스키(ascii) → 유니코드(unicode) 변환 작업을 해야한다.
- 파이썬 3부터는 문자열은 다른작업 없이 유니코드의 인코딩 or 디코딩 여부만 판단하면된다.
파이썬 내장함수 ord()와 chr()
ord() #해당 문자에 대응하는 유니코드 숫자를 반환합니다.
chr() #해당 유니코드 숫자에 대응하는 문자를 반환합니다.
'개념정리' 카테고리의 다른 글
[퍼옴]리눅스 디렉토리 구조 (0) | 2021.01.06 |
---|---|
[파이썬]파일관련 함수 (0) | 2021.01.06 |
JSON파일, XML파일, CSV 파일 (0) | 2021.01.06 |
문자열 함수들 (0) | 2021.01.06 |
터미널이란 무엇인가? (0) | 2021.01.02 |
댓글