Bits & Bytes
Zoals daarnet reeds aangehaald werd maken computers gebruik van het binaire talstelel om gegevens te verwerken, waaronder letters, cijfers en symbolen. Om character encoding goed te begrijpen, moeten we daarom eerst weten wat bits en bytes zijn en hoe ze zich verhouden tot het binaire talstelsel.
Wat is een bit?
Een bit is de kleinste eenheid van digitale informatie en kan twee waarden hebben:
0 (uit)
1 (aan)
Computers gebruiken bits om alles op te slaan en te verwerken, inclusief tekst, afbeeldingen en geluid.
Wat is een byte?
Een byte bestaat uit 8 bits en kan 256 verschillende waarden aannemen ($2^8$ = 256).
00000000
0
00000001
1
00000010
2
...
...
11111111
255
💡 Waarom 8 bits? Omdat een byte precies genoeg ruimte biedt voor ASCII-karakters (0-127 past in 7 bits, maar we gebruiken meestal 8 bits).
Voorbeeld: De letter A in ASCII wordt opgeslagen als 01000001 (65 in decimaal). De spatie ( ) is 00100000 (32 in decimaal).
Hoe verhouden bits en bytes zich tot elkaar?
1 bit
0 of 1
1 byte
8 bits
1 kilobyte (KB)
1024 bytes
1 megabyte (MB)
1024 KB (1.048.576 bytes)
1 gigabyte (GB)
1024 MB (1.073.741.824 bytes)
1 terabyte (TB)
1024 GB (1.099.511.627.776 bytes)
Waarom 1024 en niet 1000? Omdat computers werken met binaire machten van 2, en 1024 is $2^{10}$.
Waarom is dit relevant voor character encoding?
Omdat verschillende encodings een verschillend aantal bits en bytes per karakter gebruiken:
ASCII
7 bits (gebruikt meestal 8 bits)
1 byte
Extended ASCII
8 bits
1 byte
UTF-8
8-32 bits
1-4 bytes
UTF-16
16-32 bits
2-4 bytes
UTF-32
32 bits
4 bytes
Last updated