ASCII (Bilgi Alışverişi için Amerikan Standart Kodu) Nedir ?
ASCII (American Standard Code for Information Interchange), bilgisayarlardaki ve internetteki metin verileri için en yaygın karakter kodlama biçimidir. Standart ASCII kodlu verilerde, 128 alfabetik, sayısal veya özel ek karakter ve kontrol kodları için benzersiz değerler vardır.
ASCII kodlaması, telgraf verileri için kullanılan karakter kodlamasını temel alır. Amerikan Ulusal Standartlar Enstitüsü bunu ilk olarak 1963'te hesaplama için bir standart olarak yayınladı.
ASCII kodlamasındaki karakterler arasında A'dan Z'ye kadar büyük ve küçük harfler, 0'dan 9'a kadar rakamlar ve temel noktalama işaretleri bulunur. Ayrıca başlangıçta teletip yazdırma terminalleriyle kullanılması amaçlanan yazdırılmayan bazı kontrol karakterlerini de kullanır.
ASCII karakterleri aşağıdaki şekillerde temsil edilebilir:
- onaltılık basamak çiftleri olarak -- 10-15 arasındaki ondalık değerler için 0'dan 9'a ve A'dan F'ye kadar temsil edilen 16 tabanlı sayılar;
- üç basamaklı sekizlik (8 tabanlı) sayılar olarak;
- 0'dan 127'ye kadar ondalık sayılar olarak; veya
- 7 bit veya 8 bit ikili olarak
Örneğin, küçük harf "m" için ASCII kodlaması aşağıdaki şekillerde temsil edilir:
Karakter | onaltılık | Sekizli | Ondalık | İkili (7 bit) | İkili (8 bit) |
m | 0x6D | /155 | 109 | 110 1101 | 0110 1101 |
ASCII karakterleri başlangıçta 7 bit olarak kodlandı ve en önemli bit - genellikle en soldaki bit - 0 olarak ayarlanan 8 bitlik karakterler olarak saklandı .
ASCII neden önemlidir?
ASCII, veri işleme için ilk ana karakter kodlama standardıydı. Çoğu modern bilgisayar sistemi Unicode Dünya Çapında Karakter Standardı olarak da bilinen Unicode'u kullanır. ASCII kodlamalarını içeren bir karakter kodlama standardıdır.
İnternet Mühendisliği Görev Gücü ( IETF ), 1969'da RFC 20 olarak "Ağ Değişimi için ASCII formatı"nı yayınladığında ASCII'yi internet verileri için bir standart olarak kabul etti . Bu yorum talebi ( RFC ) belgesi, ASCII'nin internet verileri için kullanımını standartlaştırdı ve 2015 yılında tam standart olarak kabul edilmiştir.
ASCII kodlaması, Unicode ile değiştirildiği için teknik olarak eskidir. Yine de ASCII karakterleri, Unicode Transformation Format 8'in ilk 128 karakteriyle aynı kodlamayı kullanır, dolayısıyla ASCII metni UTF-8 ile uyumludur.
2003 yılında IETF, RFC 3629'daki tüm web içeriği için UTF-8 kodlamasının kullanımını standartlaştırdı .
Hemen hemen tüm bilgisayarlar artık ASCII veya Unicode kodlamasını kullanıyor. İstisnalar, Genişletilmiş İkili Kodlu Ondalık Değişim Kodu ( EBCDIC ) adı verilen tescilli 8 bitlik kodu kullanan bazı IBM anabilgisayarlarıdır .
ASCII nasıl çalışır?
ASCII, temel veri iletişimleri için evrensel olarak kabul edilen ve anlaşılan bir karakter seti sunar. Geliştiricilerin hem insanların hem de bilgisayarların anlayabileceği arayüzler tasarlamasını sağlar. ASCII, bir veri dizisini insanlar için okunabilir düz metin ve bilgisayarlar için veri olarak yorumlanabilen ve görüntülenebilen ASCII karakterleri olarak kodlar.
Programcılar, belirli görevleri basitleştirmek için ASCII karakter kümesinin tasarımını kullanır. Örneğin, ASCII karakter kodlarını kullanarak tek bir biti değiştirmek, metni kolayca büyük harften küçük harfe dönüştürür.
Büyük harf "A", ikili değerle temsil edilir:
0100 0001
Küçük harf "a", ikili değerle temsil edilir:
0110 0001
Fark, üçüncü en önemli bittir. Ondalık ve onaltılık olarak bu şuna karşılık gelir:
Karakter | İkili | Ondalık | onaltılık |
A | 01 0 0 0001 | 65 | 0x41 |
a | 01 1 0 0001 | 97 | 0x61 |
Büyük ve küçük harfler arasındaki fark her zaman 32'dir (onaltılık olarak 0x20), bu nedenle büyük harften küçük harfe ve geri dönüştürme, ASCII karakter kodundan 32 ekleme veya çıkarma meselesidir.
Benzer şekilde, 0'dan 9'a kadar olan rakamlar için onaltılık karakterler aşağıdaki gibidir:
Karakter | İkili | Ondalık | onaltılık |
0 | 0011 0000 | 48 | 0x30 |
1 | 0011 0001 | 49 | 0x31 |
2 | 0011 0010 | 50 | 0x32 |
3 | 0011 0011 | 51 | 0x33 |
4 | 0011 0100 | 52 | 0x34 |
5 | 0011 0101 | 53 | 0x35 |
6 | 0011 0110 | 54 | 0x36 |
7 | 0011 0111 | 55 | 0x37 |
8 | 0011 1000 | 56 | 0x38 |
9 | 0011 1001 | 57 | 0x39 |
Bu kodlamayı kullanan geliştiriciler, ikili ASCII değerlerinin (0011) en önemli dört bitini çıkararak ASCII basamaklarını kolayca sayısal değerlere dönüştürebilir. Bu hesaplama, ilk onaltılık basamak atlanarak veya ondalık ASCII kodundan 48 çıkarılarak da yapılabilir.
Geliştiriciler ayrıca bir veri akışının, dizenin veya dosyanın ASCII değerleri içerdiğini doğrulamak için bir dizideki en önemli karakter bitini kontrol edebilir. Temel ASCII karakterlerinin en önemli biti her zaman 0 olacaktır; bu bit 1 ise, karakter ASCII kodlu bir karakter değildir.
-
0 Yorum
-
19 Görüntülenme