Labo-04
Leerstof
Hulpbronnen
Oefening 1: ASCII opzoeken
Zoek de ASCII-code op voor de letter Z.
In de ASCII-tabel heeft
Zde code: 90 (decimaal) of0x5A(hexadecimaal)
Zoek het karakter op dat hoort bij ASCII-code 64.
ASCII-code 64 komt overeen met het karakter:
@
Oefening 2: Unicode codepoint naar UTF-8
Zet de codepoint U+00A9 (©) om naar UTF-8.
U+00A9in binair:0000 0000 1010 1001Valt in het 2-byte bereik (
U+0080 – U+07FF):110xxxxx 10xxxxxxInvullen van het patroon:
11000010 10101001
UTF-8 representatie =
C2 A9
Zet de codepoint U+03C0 (π) om naar UTF-8.
U+03C0in binair:0000 0011 1100 0000Valt in het 2-byte bereik (
U+0080 – U+07FF):110xxxxx 10xxxxxxInvullen van het patroon:
11001111 10000000
UTF-8 representatie =
CF 80
Zet de codepoint U+1F600 (😀) om naar UTF-8.
U+1F600in binair:0001 1111 0110 0000 0000Valt in het 4-byte bereik (
U+10000 – U+10FFFF):11110xxx 10xxxxxx 10xxxxxx 10xxxxxxInvullen van het patroon:
11110000 10011111 10011000 10000000
UTF-8 representatie =
F0 9F 98 80
Oefening 3: UTF-8 naar Unicode codepoint
Zet de UTF-8 bytevolgorde C3 A9 om naar een Unicode codepoint.
C3 A9in binair:C3→11000011A9→10101001
Identificeer het patroon en verwijder de headers:
UTF-8 gebruikt het patroon
110xxxxx 10xxxxxxvoor 2-byte karakters.De eerste byte begint met
110→ Dit betekent dat het een 2-byte UTF-8 karakter is.We verwijderen de headers (
110en10) en combineren de resterende bits:0000 0000 1110 1001.
Omgezet naar hexadecimaal:
0000 0000 1110 1001(binair) is00E9(hex)Resultaat is Unicode U+00E9 (é)
Zet de UTF-8 bytevolgorde E2 98 83 om naar een Unicode codepoint.
E2 98 83in binair:E2→1110001098→1001100083→10000011
Identificeer het patroon en verwijder de headers:
UTF-8 gebruikt het patroon
1110xxxx 10xxxxxx 10xxxxxxvoor 3-byte karakters.De eerste byte begint met
1110→ Dit betekent dat het een 3-byte UTF-8 karakter is.We verwijderen de headers (
1110,10,10) en combineren de resterende bits:0010 0110 0000 0011.
Omgezet naar hexadecimaal:
0010 0110 0000 0011(binair) is2603(hex)Resultaat is Unicode U+2603 (☃ sneeuwpop)
Zet de UTF-8 bytevolgorde F0 9F 92 A9 om naar een Unicode codepoint.
F0 9F 92 A9in binair:F0→111100009F→1001111192→10010010A9→10101001
Identificeer het patroon en verwijder de headers:
UTF-8 gebruikt het patroon
11110xxx 10xxxxxx 10xxxxxx 10xxxxxxvoor 4-byte karakters.De eerste byte begint met
11110→ Dit betekent dat het een 4-byte UTF-8 karakter is.We verwijderen de headers (
11110,10,10,10) en combineren de resterende bits:0001 1111 1001 0010 1010 1001.
Omgezet naar hexadecimaal:
0001 1111 1001 0010 1010 1001(binair) is1F4A9(hex)Resultaat is Unicode U+1F4A9 (💩)
Last updated