İyi ama hiragana harflerimiz nerede?
Bir de UNICODE tablosuna bakalım:
Tabii gördüğümüz sadece bir kısmı. Bir karakteri artık 16 bit içinde tutarsak bu da bize iki üzeri 16 karakteri daha tutabilme imkânı verir.
Hadi bir de java kodumuza bakalım:
public class Karakter {
public static void main(String[] args) {
System.out.println(Character.toChars(65)); // A
System.out.print("'");
System.out.print(Character.toChars(0)); // ' '
System.out.println("'");
System.out.println(Character.toChars(53532)); // 턜
// UNICODE karakterler
System.out.println(Character.toChars(0x401)); // Ё 0x401 = 1025
System.out.println(Character.toChars(0x402)); // Ђ 0x402 = 1026
System.out.println(Character.toChars(0x403)); // Ѓ 0x403 = 1027
System.out.println(Character.toChars(1028)); // Є 0x404 = 1028
}
}
Hadi birde resim halinde kodumuzu görelim (daha derli toplu olsun diye):
Buradan da javanın neden bir karakteri 16 bit olarak tanımladığını hızlıca anlıyoruz.
UTF-8 Tablosu: http://doc.infosnel.nl/extreme_utf-8.html
Jeol Spolsky' den: http://turkish.joelonsoftware.com/Articles/Unicode.html
Sahiplerinden: http://www.cs.bell-labs.com/sys/doc/utf.pdf
Hiç yorum yok:
Yorum Gönder