크래프톤정글/혼공컴운

[혼공컴운] CH02 데이터

아람2 2024. 10. 2. 16:40
반응형

CH02 데이터 

02-1. 0과 1로 숫자를 표현하는 방법 

 

비트 bit

0과 1을 표현하는 가장 작은 정보 단위, n 비트로 2^n 가지의 정보 표현이 가능하다 

출처 https://youtu.be/peg8c6Gn-zc?si=ErYJc77Kx3wYrKNg

워드

CPU 가 한 번에 처리할 수 있는 정보의 크기 단위

하프 워드 Half Word - 워드의 절반 크기

풀 워드 Full Word - 워드 크기

더블 워드 Double Word - 워드의 두 배 크기 

이진법 Binary

0과 1로 수를 표현하는 방법, 숫자가 1을 넘어가는 시점에 자리 올림 

 

 

2의 보수

0과 1로 음수 표현하기, 어떤 수를 그보다 큰 2^n 에서 뺀 값

모든 0과 1을 뒤집고 1 더한 값이 2의 보수이다 

십육진법

숫자가 15를 넘어가는 시점에 자리 올림 

 

02-2 0과 1로 문자를 표현하는 방법 

문자 집합 Character Set

컴퓨터가 이해할 수 있는 문자의 모음

 

아스키 코드 

초창기 문자 집합 중 하나

알파벳, 아라비아 숫자, 일부 특수 문자 및 제어 문자

7비트로 하나의 문자 표현

 8비트 중 1비트는 오류 검출을 위해 사용되는 패리티 비트 (Parity Bit) 

그래서 아스키 코드로 만들 수 있는 문자의 개수는 2^7, 128개 

 

한글 인코딩

1) 완성형 - 글자 하나 자체에 고유한 코드를 부여 

2) 조합형 - 초성, 중성, 종성에 해당하는 자음, 모음에 고유한 코드를 부여 

EUC-KR 

완성형 인코딩, 글자 하나 하나에 2바이트 크기의 코드 부여 

2300여개의 한글만 표현 가능하기 때문에 여전히 수가 부족 

 

유니코드

통일된 문자 집합

한글, 영어, 화살표와 같은 특수 문자와 이모티콘까지 표현 가능 

유니코드의 인코딩 방식

utf-8, utf-16, 등등 

 

utf-8 인코딩

UTF Unicode Transformation Format == 유니코드 인코딩 방법

가변 길이 인코딩 - 인코딩 결과가 1바이트 ~ 4바이트

인코딩 결과가 몇 바이트가 될지는 유니코드에 부여된 값에 따라 다름 (아래 사진 참고)

참고 https://onlinetools.com/utf8/convert-utf8-to-binary

 

인코딩 Encoding

코드화하는 과정

문자를 0과 1로 이루어진 문자 코드로 변환하는 과정

디코딩 Decoding

코드를 해석하는 과정

0과 1로 표현된 문자 코드로 문자를 변환하는 과정 

반응형