본문 바로가기
IT/기초

bit, byte, BCD, ASCII(아스키코드), EBCDIC

by for-learn 2024. 7. 18.

 

bit와 byte
1byte = 8bit

 

bit(자료) => 가공되지 않은 값

byte(정보) => 의미를 가진 값

bit와 byte로 보는 표현범위
bit (0,1 두가지를 표현하는 단위)
(정보를 표현하는 최소단위) byte
         
BCD
ASCII
EBCDIC
1
2
3
4
5
6
7
8
2^1 = 2
2^2 = 4
2^3 = 8
16
32
64
128
256

0 off
00
000
0~9 10개
 
a~z 26개
+기호
+부호
1 on
01
001
0000 = 0
 
A~Z 26개
 
(0:양수)
 
10
010
...
 
0~9 10개
 
(1:음수)
 
11
011
1001 = 9
 
총 62개
   
   
100
...
       
   
101
1111=16
       
   
110
         
   
111
       

 

 

BCD
binary-coded decimal 2진화 10진수

 

[네이버 지식백과]

0~9까지의 10진수 1자리를 4비트의 2진수로 표현한 것이다.

 

 

ASCII
American Standard Code for Information Interchange

 

[네이버 지식백과]

1962년 안시(ANSI)가 정의한 미국 표준 정보 교환 코드.

ASCII는 각 문자를 7비트로 표현하므로 총 128(= 27)개의 문자를 표현할 수 있다.

아스키코드의 처음 32개(0-31)는 프린터나 전송 제어용으로 사용되고 나머지는 숫자와 로마글자 및 도량형 기호와 문장 기호를 나타낸다.

아스키(ASCII)는 7자리의 2진 코드인데 1비트의 패리티 비트를 추가하여 8개의 비트로 많은 컴퓨터에 사용되고 있다. 아스키(ASCII)코드의 비트 번호는 오른쪽에서 왼쪽으로 부여한다.

 

7bit(2진수)
10진수
해당(제어)문자
7bit(2진수)
10진수
해당(제어)문자
0000000
0
NUL
0010000
16
DLE (Data Link Escape)
0000001
1
SOH (Start of Heading)
0010001
17
DC1 (Device Control 1)
0000010
2
STX (Start of Text)
0010010
18
DC2 (Device Control 2)
0000011
3
ETX (End of Text)
0010011
19
DC3 (Device Control 3)
0000100
4
EOT (End of Transmission)
0010100
20
DC4 (Device Control 4)
0000101
5
ENQ (Enquiry)
0010101
21
NAK (Negative Acknowledge)
0000110
6
ACK (Acknowledge)
0010110
22
SYN (Synchronous Idle)
0000111
7
BEL (Bell)
0010111
23
ETB (End of Transmission Block)
0001000
8
BS (Backspace)
0011000
24
CAN (Cancel)
0001001
9
HT (Horizontal Tabulation)
0011001
25
EM (End of Medium)
0001010
10
LF (Line Feed)
0011010
26
SUB (Substitute)
0001011
11
VT (Vertical Tabulation)
0011011
27
ESC (Escape)
0001100
12
FF (Form Feed)
0011100
28
FS (File Separator)
0001101
13
CR (Carriage Return)
0011101
29
GS (Group Separator)
0001110
14
SO (Shift Out)
0011110
30
RS (Record Separator)
0001111
15
SI (Shift In)
0011111
31
US (Unit Separator)

 

10진수
16진수
해당문자
10진수
16진수
해당문자
10진수
16진수
해당문자
0~31
00~1F
제어문자
64
40
@
97
61
a
32
20
Space
65
41
A
98
62
b
33
21
!
66
42
B
99
63
c
34
22
"
67
43
C
100
64
d
35
23
#
68
44
D
101
65
e
36
24
$
69
45
E
102
66
f
37
25
%
70
46
F
103
67
g
38
26
&
71
47
G
104
68
h
39
27
72
48
H
105
69
i
40
28
(
73
49
I
106
6A
j
41
29
)
74
4A
J
107
6B
k
42
2A
*
75
4B
K
108
6C
l
43
2B
+
76
4C
L
109
6D
m
44
2C
,
77
4D
M
110
6E
n
45
2D
-
78
4E
N
111
6F
o
46
2E
.
79
4F
O
112
70
p
47
2F
/
80
50
P
113
71
q
48
30
0
81
51
Q
114
72
r
49
31
1
82
52
R
115
73
s
50
32
2
83
53
S
116
74
t
51
33
3
84
54
T
117
75
u
52
34
4
85
55
U
118
76
v
53
35
5
86
56
V
119
77
w
54
36
6
87
57
W
120
78
x
55
37
7
88
58
X
121
79
y
56
38
8
89
59
Y
122
7A
z
57
39
9
90
5A
Z
123
7B
{
58
3A
:
91
5B
[
124
7C
|
59
3B
;
92
5C
125
7D
}
60
3C
<
93
5D
]
126
7E
~
61
3D
=
94
5E
127
7F
del(삭제)
62
3E
>
95
5F
_

63
3F
?
96
60
`

 

ASCII로 표현할 수 있는 문자들 외에 추가적인 문자를 지원해야 할 필요성이 있어 기존 7비트에 1비트를 추가하여 8비트를 사용한 코드가 정의되었다. 이런 코드를 확장(extended) ASCII라 하는데, 256(= 28)개의 문자를 표현할 수 있다. 기존 7비트 ASCII 코드에는 가장 왼쪽에 0을 추가하여 8비트 형식이 되게 했다.

EBCDIC
extended binary coded decimal interchange code 확장 2진화 10진 부호

 

[네이버 지식백과]

주로 컴퓨터 내부에서 문자를 2진수로 표현하기 위해 사용하는 부호의 하나. 이는 8비트 부호로 256개의 다른 문자를 나타낼 수 있으며 주로 IBM 대형 컴퓨터에서 기본 부호로 사용되고 있다. 초창기에는 주도적인 내부 부호로 사용되었으나 근래에는 아스키 부호가 압도적인 위치를 차지함에 따라 잘 사용되지 않는다.

 

'IT > 기초' 카테고리의 다른 글

BYTE, WORD, DWORD, QWORD (Data type)  (1) 2024.09.25
HEX(16), DEC(10), OCT(8), BIN(2)  (0) 2024.07.16