Labo-04
Leerstof
Hulpbronnen
Oefening 1: ASCII opzoeken
Zoek de ASCII-code op voor de letter Z.
In de ASCII-tabel heeft
Zde code: 90 (decimaal) of0x5A(hexadecimaal)
Zoek het karakter op dat hoort bij ASCII-code 64.
ASCII-code 64 komt overeen met het karakter:
@
Oefening 2: Unicode codepoint naar UTF-8
Zet de codepoint U+00A9 (Β©) om naar UTF-8.
U+00A9in binair:0000 0000 1010 1001Valt in het 2-byte bereik (
U+0080 β U+07FF):110xxxxx 10xxxxxxInvullen van het patroon:
11000010 10101001
UTF-8 representatie =
C2 A9
Zet de codepoint U+03C0 (Ο) om naar UTF-8.
U+03C0in binair:0000 0011 1100 0000Valt in het 2-byte bereik (
U+0080 β U+07FF):110xxxxx 10xxxxxxInvullen van het patroon:
11001111 10000000
UTF-8 representatie =
CF 80
Zet de codepoint U+1F600 (π) om naar UTF-8.
U+1F600in binair:0001 1111 0110 0000 0000Valt in het 4-byte bereik (
U+10000 β U+10FFFF):11110xxx 10xxxxxx 10xxxxxx 10xxxxxxInvullen van het patroon:
11110000 10011111 10011000 10000000
UTF-8 representatie =
F0 9F 98 80
Oefening 3: UTF-8 naar Unicode codepoint
Zet de UTF-8 bytevolgorde C3 A9 om naar een Unicode codepoint.
C3 A9in binair:C3β11000011A9β10101001
Identificeer het patroon en verwijder de headers:
UTF-8 gebruikt het patroon
110xxxxx 10xxxxxxvoor 2-byte karakters.De eerste byte begint met
110β Dit betekent dat het een 2-byte UTF-8 karakter is.We verwijderen de headers (
110en10) en combineren de resterende bits:0000 0000 1110 1001.
Omgezet naar hexadecimaal:
0000 0000 1110 1001(binair) is00E9(hex)Resultaat is Unicode U+00E9 (Γ©)
Zet de UTF-8 bytevolgorde E2 98 83 om naar een Unicode codepoint.
E2 98 83in binair:E2β1110001098β1001100083β10000011
Identificeer het patroon en verwijder de headers:
UTF-8 gebruikt het patroon
1110xxxx 10xxxxxx 10xxxxxxvoor 3-byte karakters.De eerste byte begint met
1110β Dit betekent dat het een 3-byte UTF-8 karakter is.We verwijderen de headers (
1110,10,10) en combineren de resterende bits:0010 0110 0000 0011.
Omgezet naar hexadecimaal:
0010 0110 0000 0011(binair) is2603(hex)Resultaat is Unicode U+2603 (β sneeuwpop)
Zet de UTF-8 bytevolgorde F0 9F 92 A9 om naar een Unicode codepoint.
F0 9F 92 A9in binair:F0β111100009Fβ1001111192β10010010A9β10101001
Identificeer het patroon en verwijder de headers:
UTF-8 gebruikt het patroon
11110xxx 10xxxxxx 10xxxxxx 10xxxxxxvoor 4-byte karakters.De eerste byte begint met
11110β Dit betekent dat het een 4-byte UTF-8 karakter is.We verwijderen de headers (
11110,10,10,10) en combineren de resterende bits:0001 1111 1001 0010 1010 1001.
Omgezet naar hexadecimaal:
0001 1111 1001 0010 1010 1001(binair) is1F4A9(hex)Resultaat is Unicode U+1F4A9 (π©)
Last updated