[혼공컴운] CH02 데이터
CH02 데이터
02-1. 0과 1로 숫자를 표현하는 방법
비트 bit
0과 1을 표현하는 가장 작은 정보 단위, n 비트로 2^n 가지의 정보 표현이 가능하다
워드
CPU 가 한 번에 처리할 수 있는 정보의 크기 단위
하프 워드 Half Word - 워드의 절반 크기
풀 워드 Full Word - 워드 크기
더블 워드 Double Word - 워드의 두 배 크기
이진법 Binary
0과 1로 수를 표현하는 방법, 숫자가 1을 넘어가는 시점에 자리 올림
2의 보수
0과 1로 음수 표현하기, 어떤 수를 그보다 큰 2^n 에서 뺀 값
모든 0과 1을 뒤집고 1 더한 값이 2의 보수이다
십육진법
숫자가 15를 넘어가는 시점에 자리 올림
02-2 0과 1로 문자를 표현하는 방법
문자 집합 Character Set
컴퓨터가 이해할 수 있는 문자의 모음
아스키 코드
초창기 문자 집합 중 하나
알파벳, 아라비아 숫자, 일부 특수 문자 및 제어 문자
7비트로 하나의 문자 표현
8비트 중 1비트는 오류 검출을 위해 사용되는 패리티 비트 (Parity Bit)
그래서 아스키 코드로 만들 수 있는 문자의 개수는 2^7, 128개
한글 인코딩
1) 완성형 - 글자 하나 자체에 고유한 코드를 부여
2) 조합형 - 초성, 중성, 종성에 해당하는 자음, 모음에 고유한 코드를 부여
EUC-KR
완성형 인코딩, 글자 하나 하나에 2바이트 크기의 코드 부여
2300여개의 한글만 표현 가능하기 때문에 여전히 수가 부족
유니코드
통일된 문자 집합
한글, 영어, 화살표와 같은 특수 문자와 이모티콘까지 표현 가능
유니코드의 인코딩 방식
utf-8, utf-16, 등등
utf-8 인코딩
UTF Unicode Transformation Format == 유니코드 인코딩 방법
가변 길이 인코딩 - 인코딩 결과가 1바이트 ~ 4바이트
인코딩 결과가 몇 바이트가 될지는 유니코드에 부여된 값에 따라 다름 (아래 사진 참고)
인코딩 Encoding
코드화하는 과정
문자를 0과 1로 이루어진 문자 코드로 변환하는 과정
디코딩 Decoding
코드를 해석하는 과정
0과 1로 표현된 문자 코드로 문자를 변환하는 과정