Aralık | altıgen | Sembol | Aralık | altıgen | Sembol | |
000 | 00 | uzman. NOP | 128 | 80 | Ђ | |
001 | 01 | uzman. SOH | 129 | 81 | Ѓ | |
002 | 02 | uzman. STX | 130 | 82 | ‚ | |
003 | 03 | uzman. ETX | 131 | 83 | ѓ | |
004 | 04 | uzman. EOT | 132 | 84 | „ | |
005 | 05 | uzman. ENQ | 133 | 85 | … | |
006 | 06 | uzman. ACK | 134 | 86 | † | |
007 | 07 | uzman. BEL | 135 | 87 | ‡ | |
008 | 08 | uzman. BS | 136 | 88 | € | |
009 | 09 | uzman. SEKME | 137 | 89 | ‰ | |
010 | 0A | uzman. LF | 138 | 8A | Љ | |
011 | 0B | uzman. VT | 139 | 8B | ‹ ‹ | |
012 | 0C | uzman. FF | 140 | 8C | Њ | |
013 | 0D | uzman. CR | 141 | 8D | Ќ | |
014 | 0E | uzman. BÖYLE | 142 | 8E | Ћ | |
015 | 0F | uzman. Sİ | 143 | 8F | Џ | |
016 | 10 | uzman. DLE | 144 | 90 | ђ | |
017 | 11 | uzman. DC1 | 145 | 91 | ‘ | |
018 | 12 | uzman. DC2 | 146 | 92 | ’ | |
019 | 13 | uzman. DC3 | 147 | 93 | “ | |
020 | 14 | uzman. DC4 | 148 | 94 | ” | |
021 | 15 | uzman. NAK | 149 | 95 | ||
022 | 16 | uzman. SYN | 150 | 96 | – | |
023 | 17 | uzman. ETB | 151 | 97 | — | |
024 | 18 | uzman. YAPABİLMEK | 152 | 98 | ||
025 | 19 | uzman. EM | 153 | 99 | ™ | |
026 | 1 A | uzman. ALT | 154 | 9A | љ | |
027 | 1B | uzman. ESC | 155 | 9B | › | |
028 | 1C | uzman. FS | 156 | 9C | њ | |
029 | 1B | uzman. GS | 157 | 9D | ќ | |
030 | 1E | uzman. RS | 158 | 9E | ћ | |
031 | 1F | uzman. BİZ | 159 | 9F | џ | |
032 | 20 | debriyaj SP (Boşluk) | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | " | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | " | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | sen | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | AA | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | AC | ¬ | |
045 | 2B | - | 173 | AD | | |
046 | 2E | . | 174 | AE | ® | |
047 | 2F | / | 175 | AF | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | sen | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3 A | : | 186 | BA | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | M.Ö | ј | |
061 | 3 boyutlu | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | OLMAK | ѕ | |
063 | 3F | ? | 191 | sevgili | ї | |
064 | 40 | @ | 192 | C0 | ANCAK | |
065 | 41 | A | 193 | C1 | B | |
066 | 42 | B | 194 | C2 | AT | |
067 | 43 | C | 195 | C3 | G | |
068 | 44 | D | 196 | C4 | D | |
069 | 45 | E | 197 | C5 | E | |
070 | 46 | F | 198 | C6 | VE | |
071 | 47 | G | 199 | C7 | W | |
072 | 48 | H | 200 | C8 | Ve | |
073 | 49 | ben | 201 | C9 | Y | |
074 | 4A | J | 202 | CA | İle | |
075 | 4B | K | 203 | CB | L | |
076 | 4C | L | 204 | CC | M | |
077 | 4D | M | 205 | CD | H | |
078 | 4E | N | 206 | CE | Ö | |
079 | 4F | Ö | 207 | CF | P | |
080 | 50 | P | 208 | D0 | R | |
081 | 51 | Q | 209 | D1 | İTİBAREN | |
082 | 52 | R | 210 | D2 | T | |
083 | 53 | S | 211 | D3 | saat | |
084 | 54 | T | 212 | D4 | F | |
085 | 55 | sen | 213 | D5 | X | |
086 | 56 | V | 214 | D6 | C | |
087 | 57 | W | 215 | D7 | H | |
088 | 58 | X | 216 | D8 | W | |
089 | 59 | Y | 217 | D9 | SCH | |
090 | 5A | Z | 218 | DA | Kommersant | |
091 | 5B | [ | 219 | D.B. | S | |
092 | 5C | \ | 220 | DC | b | |
093 | 5D | ] | 221 | DD | E | |
094 | 5E | ^ | 222 | DE | YU | |
095 | 5F | _ | 223 | D.F. | ben | |
096 | 60 | ` | 224 | E0 | a | |
097 | 61 | a | 225 | E1 | b | |
098 | 62 | b | 226 | E2 | içinde | |
099 | 63 | c | 227 | E3 | G | |
100 | 64 | d | 228 | E 4 | d | |
101 | 65 | e | 229 | E5 | e | |
102 | 66 | f | 230 | E6 | ve | |
103 | 67 | g | 231 | E7 | h | |
104 | 68 | h | 232 | E8 | ve | |
105 | 69 | i | 233 | E9 | inci | |
106 | 6A | j | 234 | EA | ile | |
107 | 6B | k | 235 | EB | ben | |
108 | 6C | ben | 236 | AB | m | |
109 | 6D | m | 237 | ED | n | |
110 | 6E | n | 238 | EE | hakkında | |
111 | 6F | Ö | 239 | EF | P | |
112 | 70 | p | 240 | F0 | R | |
113 | 71 | q | 241 | F1 | İle birlikte | |
114 | 72 | r | 242 | F2 | t | |
115 | 73 | s | 243 | F3 | de | |
116 | 74 | t | 244 | F4 | f | |
117 | 75 | sen | 245 | F5 | X | |
118 | 76 | v | 246 | F6 | c | |
119 | 77 | w | 247 | F7 | h | |
120 | 78 | x | 248 | F8 | ş | |
121 | 79 | y | 249 | F9 | sch | |
122 | 7A | z | 250 | FA | b | |
123 | 7B | { | 251 | s | ||
124 | 7C | | | 252 | FC | b | |
125 | 7D | } | 253 | FD | uh | |
126 | 7E | ~ | 254 | F.E. | Yu | |
127 | 7F | Uzman. DEL | 255 | FF | ben |
Windows karakter kodlarının ASCII tablosu.
Özel (kontrol) karakterlerin açıklaması
Başlangıçta ASCII tablosunun kontrol karakterlerinin teletip yoluyla veri alışverişi, delikli bir banttan veri girişi ve harici cihazların en basit kontrolü için kullanıldığına dikkat edilmelidir. Şu anda, tablonun ASCII kontrol karakterlerinin çoğu artık bu yükü taşımamaktadır ve başka amaçlar için kullanılabilir.
kod | Tanım |
---|---|
SIFIR, 00 | boş, boş |
SO-01 | Başlama Başlangıcı |
STX 02 | TeXt'in başlangıcı, metnin başlangıcı. |
ETX 03 | Metin Sonu |
EOT, 04 | İletimin Sonu |
ENQ, 05 | Sormak. Lütfen onaylayın |
ACK, 06 | teşekkür. onaylıyorum |
B.E.L.07 | Çan, ara |
Lisans 08 | Geri al, bir karakter geri git |
SEKME, 09 | Sekme, yatay sekme |
LF, 0A | Satır Besleme, satır besleme. Artık çoğu programlama dilinde \n olarak gösterilir. |
VT, 0B | Dikey Sekme, dikey tablolama. |
FF, 0C | Form beslemesi, sayfa beslemesi, yeni sayfa |
CR, 0D | Satırbaşı Artık çoğu programlama dilinde \r olarak gösterilir. |
SO, 0E | Shift Out, yazıcıdaki mürekkep şeridinin rengini değiştirin |
SI, 0F | Shift In, yazdırma aygıtındaki mürekkep şeridinin rengini geri döndürün |
10 | Data Link Escape, veri iletimine kanal geçişi |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Cihaz Kontrolü, cihaz kontrol sembolleri |
NAK 15 | Olumsuz Onay, onaylamıyorum. |
SYN, 16 | senkronizasyon. senkronizasyon sembolü |
ETB, 17 | Metin Bloğunun Sonu, metin bloğunun sonu |
CAN, 18 | İptal, daha önce geçmiş bir işlemi iptal etme |
EM, 19 | Orta Sonu |
ALT, 1A | Yerine koymak, ikame etmek. İletim sırasında değeri kaybolan veya bozulan bir karakterin yerine yerleştirilir |
ESC, 1B | kaçış kaçış dizisi |
FS, 1C | Dosya Ayırıcı, dosya ayırıcı |
GS, 1D | Grup Ayırıcı, grup ayırıcı |
RS, 1E | Kayıt Ayırıcı |
ABD, 1F | Birim Ayırıcı, birim ayırıcı |
DEL, 7F | Sil, son karakteri sil. |
Sembol yerleşimi
BS (back step) karakteri sayesinde yazıcı bir karakteri diğerinin üzerine yazdırabilir. ASCII, harflere bu şekilde aksan eklemek için sağlanmıştır, örneğin:
- bir BS " → bir
- bir BS ` → bir
- bir BS ^ → â
- o BS / → ø
- c BS , → ç
- n BS ~ → ñ
Not: eski yazı tiplerinde kesme işareti " sola eğik ve tilde ~ yukarı kaydırıldı, bu yüzden sadece vurgu ve tilde rolüne uyuyorlar.
Aynı karakter bir karakterin üzerine bindirilirse, efekt kalın olur ve karakterin üzerine bir alt çizgi bindirilirse, altı çizili metin elde edilir.
- bir BS bir → a
- bir BS_ → a
Not: bu, örneğin man yardım sisteminde kullanılır.
ASCII'nin ulusal varyantları
ISO 646 (ECMA-6) standardı, ulusal sembolleri yerine yerleştirme imkanı sağlar. @ [ \ ] ^ ` { | } ~ . Bunun yanında yerinde # yerleştirilebilir £ , ve yerinde $ - ¤ . Bu sistem, yalnızca birkaç ek karakterin gerekli olduğu Avrupa dilleri için çok uygundur. ASCII'nin ulusal karakterler içermeyen bir çeşidi, US-ASCII veya "Uluslararası Referans Sürümü" olarak adlandırılır.
Daha sonra, kod tablosunun alt yarısının (0-127) US-ASCII karakterleri ve üst yarısının (128-255) işgal edildiği 8 bitlik kodlamaların (kod sayfaları) kullanılması daha uygun olduğu ortaya çıktı. bir dizi ulusal karakter de dahil olmak üzere ek karakterler tarafından işgal edilir. Bu nedenle, Unicode'un yaygın olarak benimsenmesinden önce ASCII tablosunun üst yarısı, yerel dilin harflerini, yerelleştirilmiş karakterleri temsil etmek için yoğun bir şekilde kullanılıyordu. Kiril karakterlerini ASCII tablosuna yerleştirmek için tek bir standardın olmaması, kodlamalarla ilgili birçok soruna neden oldu (KOI-8, Windows-1251 ve diğerleri). Latin alfabesi olmayan diğer diller de birkaç farklı kodlamanın varlığından dolayı zarar gördü.
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0. | NUL | SOM | EOA | EOM | EQT | WRU | TR | ZİL | BKSP | HT | LF | VT | FF | CR | BÖYLE | Sİ |
1. | DC 0 | DC1 | DC 2 | DC 3 | DC 4 | HATA | SENKRON | LEM | S0 | S1 | S2 | S3 | S4 | S5 | S6 | S7 |
2. | ||||||||||||||||
3. | ||||||||||||||||
4. | BOŞLUK | ! | " | # | $ | % | & | " | ( | ) | * | + | , | - | . | / |
5. | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
6. | ||||||||||||||||
7. | ||||||||||||||||
8. | ||||||||||||||||
9. | ||||||||||||||||
A. | @ | A | B | C | D | E | F | G | H | ben | J | K | L | M | N | Ö |
b. | P | Q | R | S | T | sen | V | W | X | Y | Z | [ | \ | ] | ← | |
C. | ||||||||||||||||
D. | ||||||||||||||||
E. | a | b | c | d | e | f | g | h | i | j | k | ben | m | n | Ö | |
F. | p | q | r | s | t | sen | v | w | x | y | z | ESC | DEL |
Adreslenebilir minimum bellek biriminin 36 bitlik bir kelime olduğu bilgisayarlarda, ilk başta 6 bitlik karakterler kullanıldı (1 kelime = 6 karakter). ASCII'ye geçişten sonra, bu tür bilgisayarlar ya bir kelimeye 5 yedi bit karakter (1 bit gereksiz kaldı) veya 4 dokuz bit karakter yerleştirmeye başladı.
ASCII kodları ayrıca programlama yapılırken hangi tuşa basıldığını belirlemek için kullanılır. Standart bir QWERTY klavye için kod tablosu şöyle görünür:
Uluslararası Telekomünikasyon Birliği'ne göre, 2016'da üç buçuk milyar insan interneti değişen düzenliliklerle kullandı. Çoğu, PC veya mobil cihazlar aracılığıyla gönderdikleri mesajların yanı sıra her türlü monitörde görüntülenen metinlerin aslında 0 ve 1 kombinasyonları olduğu gerçeğini bile düşünmüyorlar. Bu bilgi temsiline kodlama denir. Depolama, işleme ve iletiminin uygulanmasını sağlar ve büyük ölçüde kolaylaştırır. 1963 yılında bu yazının konusu olan Amerikan ASCII kodlaması geliştirildi. Bilgisayarda bilginin temsiliHerhangi bir elektronik bilgisayarın bakış açısından, metin bir dizi bireysel karakterdir. Bunlar, yalnızca büyük harfler dahil olmak üzere harfleri değil, aynı zamanda noktalama işaretlerini, sayıları da içerir. Ayrıca özel karakterler "=", "&", "(" ve boşluklar kullanılır. Metni oluşturan karakter kümesine alfabe denir ve sayılarına güç denir (N ile gösterilir). Bunu belirlemek için, N = 2^b ifadesi kullanılır; burada b, belirli bir karakterin bit sayısı veya bilgi ağırlığıdır. 256 karakter kapasiteli alfabenin, gerekli tüm karakterleri temsil etmenize izin verdiği kanıtlanmıştır. 256, 2'nin 8. kuvveti olduğundan, her karakterin ağırlığı 8 bittir. 8 bitlik bir ölçü birimine 1 bayt denir, bu nedenle bir bilgisayarda depolanan metindeki herhangi bir karakterin bir bayt bellek kapladığını söylemek gelenekseldir. kodlama nasıl yapılırHerhangi bir metin, kişisel bilgisayarın hafızasına sayılar, harfler, noktalama işaretleri ve diğer sembollerin yazıldığı klavye tuşları vasıtasıyla girilir. İkili kodda RAM'e aktarılırlar, yani, her karaktere, 0 ila 255 arasında, ikili bir koda karşılık gelen, 00000000 ila 11111111 arasında, insanlara tanıdık bir ondalık kod atanır. Bayt bayt karakter kodlaması, bir metin işlemcisinin her bir karaktere ayrı ayrı erişmesini sağlar. Aynı zamanda, herhangi bir karakter bilgisini temsil etmek için 256 karakter yeterlidir. ASCII karakter kodlamasıİngilizce'deki bu kısaltma, bilgi alışverişi için kod anlamına gelir. Bilgisayarlaşmanın şafağında bile, bilgiyi kodlamak için çeşitli yollar bulabileceğin aşikar hale geldi. Ancak bir bilgisayardan diğerine bilgi aktarmak için tek bir standart geliştirmek gerekiyordu. Böylece, 1963'te Amerika Birleşik Devletleri'nde bir ASCII kodlama tablosu ortaya çıktı. İçinde, bilgisayar alfabesinin herhangi bir sembolü, ikili gösterimde sıra numarasına atanır. Başlangıçta, ASCII kodlaması yalnızca Amerika Birleşik Devletleri'nde kullanıldı ve daha sonra PC'ler için uluslararası standart haline geldi. ASCII kodları 2 bölüme ayrılmıştır. Bu tablonun yalnızca ilk yarısı Uluslararası Standart olarak kabul edilir. 0'dan (00000000 olarak kodlanmıştır) 127'ye (kod 01111111) kadar seri numaralarına sahip karakterleri içerir.
Tabloda kodlamalar büyük harf olup alfabetik sırayla birbirini takip eder ve sayılar artan sıradadır. Bu ilke Rus alfabesi için korunmuştur. Kontrol karakterleriASCII kodlama tablosu aslında teletype gibi uzun süredir kullanılmayan bir cihaz üzerinden bilgi almak ve iletmek için oluşturulmuştur. Bu bağlamda, bu cihazı kontrol etmek için komutlar olarak kullanılan karakter setine yazdırılamayan karakterler dahil edildi. Mors kodu vb. gibi bilgisayar öncesi mesajlaşma yöntemlerinde benzer komutlar kullanıldı. En yaygın "teletype" karakteri NUL'dur (00, "sıfır"). Bu güne kadar çoğu programlama dilinde hala kullanılmaktadır ve bir satırın sonunun işaretini ifade etmektedir. ASCII kodlaması nerede kullanılır?Amerikan Standart Kodu, klavyede metinsel bilgi girmekten daha fazlası için gereklidir. Grafiklerde de kullanılır. Özellikle, ASCII Art Maker programında, çeşitli uzantıların görüntüleri, bir ASCII karakter yelpazesini temsil eder. Bu tür ürünler iki türdür: bir görüntüyü metne dönüştürerek ve "çizimleri" ASCII grafiklerine dönüştürerek grafik düzenleyicilerin işlevini yerine getirenler. Örneğin, iyi bilinen ifade, kodlama karakterinin başlıca örneğidir. ASCII, bir HTML belgesi oluştururken de kullanılabilir. Bu durumda belirli bir karakter kümesi girebilirsiniz ve sayfayı görüntülerken ekranda bu koda karşılık gelen bir karakter belirecektir. ASCII ayrıca çok dilli siteler oluşturmak için de gereklidir, çünkü belirli bir ulusal tabloya dahil olmayan karakterler ASCII kodları ile değiştirilir. Bazı özelliklerMetinsel bilgileri ASCII kodlamasında kodlamak için başlangıçta 7 bit kullanıldı (biri boş kaldı), ancak bugün 8 bit gibi çalışıyor. Üstte ve altta yer alan sütunlarda yer alan harfler birbirinden sadece bir bit farklıdır. Bu, doğrulamanın karmaşıklığını büyük ölçüde azaltır. ASCII'yi Microsoft Office'te KullanmaGerekirse, bu tür metinsel bilgi kodlaması, Not Defteri ve Office Word gibi Microsoft metin düzenleyicilerinde kullanılabilir. Ancak böyle bir durumda yazarken bazı fonksiyonları kullanmak mümkün olmayacaktır. Örneğin, ASCII genel görünümünü ve biçimini göz ardı ederek yalnızca bilginin anlamını koruduğu için onu kalın yapamazsınız. StandardizasyonISO organizasyonu, ISO 8859 standartlarını benimsemiştir.Bu grup, farklı dil grupları için sekiz bitlik kodlamalar tanımlar. Özellikle ISO 8859-1, Amerika Birleşik Devletleri ve Batı Avrupa ülkeleri için bir tablo olan Genişletilmiş ASCII'dir. ISO 8859-5, Rusça dahil Kiril alfabesi için kullanılan bir tablodur. Bir dizi tarihsel nedenden dolayı, ISO 8859-5 standardı çok kısa bir süre kullanıldı. Rus dili için şu anda kodlamalar kullanılmaktadır:
İlk CP866 standardının ana avantajı, psödografik karakterlerin Genişletilmiş ASCII ile aynı konumlarda korunmasıydı. Bu, iyi bilinen Norton Commander gibi yabancı kaynaklı metin programlarının değiştirilmeden çalıştırılmasına izin verdi. Şu anda, CP866, Windows altında geliştirilen ve FAR Manager dahil olmak üzere tam ekran metin modunda veya metin pencerelerinde çalışan programlar için kullanılmaktadır. CP866 kodlamasıyla yazılan bilgisayar metinleri son zamanlarda oldukça nadirdir, ancak Windows'ta Rusça dosya adları için kullanılan budur. "Unicode"Şu anda, bu kodlama en yaygın kullanılanıdır. Unicode kodları bölgelere ayrılmıştır. İlki (U+0000 - U+007F), kodlu ASCII karakterlerini içerir. Bunu, çeşitli ulusal yazıların karakterlerinin yanı sıra noktalama işaretleri ve teknik sembollerin alanları takip eder. Ayrıca, bazı "Unicode" kodları, gelecekte yeni karakterlerin eklenmesi için ayrılmıştır. Artık ASCII kodlamasında her karakterin 8 sıfır ve bir kombinasyonu olarak temsil edildiğini biliyorsunuz. Uzman olmayanlar için bu bilgi gereksiz ve ilgisiz görünebilir, ancak bilgisayarınızın "beyninde" neler olduğunu bilmek istemez misiniz?! [8 bit kodlamalar: ASCII, KOI-8R ve CP1251] ABD'de oluşturulan ilk kodlama tabloları bir bayttaki sekizinci biti kullanmıyordu. Metin bir bayt dizisi olarak sunuldu, ancak sekizinci bit dikkate alınmadı (resmi amaçlar için kullanıldı). Tablo kabul edilen standart haline geldi. ASCII(Bilgi değişimi için Amerikan Standart kodu). ASCII tablosunun ilk 32 karakteri (00 - 1F) yazdırılmayan karakterler için kullanılmıştır. Bir baskı cihazını ve benzerlerini kontrol etmek için tasarlandılar. Gerisi - 20'den 7F'ye - normal (yazdırılabilir) karakterlerdir. Tablo 1 - ASCII kodlaması
Kolayca görebileceğiniz gibi, bu kodlamada sadece Latin harfleri ve İngilizce'de kullanılanlar temsil edilmektedir. Aritmetik ve diğer hizmet sembolleri de vardır. Ancak Rusça harfler, hatta Almanca veya Fransızca için özel Latin harfleri yoktur. Bunu açıklamak kolaydır - kodlama bir Amerikan standardı olarak geliştirilmiştir. Bilgisayarlar dünya çapında kullanılmaya başladığından, diğer karakterlerin kodlanması gerekiyordu. Bunu yapmak için her baytta sekizinci bitin kullanılmasına karar verildi. Böylece karakterleri kodlamak için kullanılabilecek 128 değer daha (80'den FF'ye) mevcuttu. Sekiz bitlik tablolardan ilki “genişletilmiş ASCII”dir ( genişletilmiş ASCII) - Batı Avrupa'nın bazı dillerinde kullanılan Latin karakterlerinin çeşitli türevlerini içeriyordu. Ayrıca, sözde grafikler de dahil olmak üzere başka ek karakterlere de sahipti. Sözde grafik karakterler, yalnızca metin karakterlerini görüntüleyerek, bir miktar grafik benzerliği sağlamaya izin verir. Sözde grafikleri kullanarak, örneğin, FAR Manager dosya yönetimi programı çalışır. Genişletilmiş ASCII tablosunda Rusça harfler yoktu. Rusya'da (eski adıyla SSCB) ve diğer eyaletlerde, 8 bitlik metin dosyalarında belirli “ulusal” karakterleri temsil etmeyi mümkün kılan kendi kodlamaları oluşturuldu - Lehçe ve Çek dillerinin Latin harfleri, Kiril (Rus harfleri dahil) ve diğer alfabeler. Yaygınlaşan tüm kodlamalarda ilk 127 karakter (yani sekizinci bitin 0'a eşit olduğu bayt değerleri) ASCII ile aynıdır. Dolayısıyla bir ASCII dosyası bu kodlamalardan herhangi birinde çalışır; İngiliz dilinin harfleri aynı şekilde temsil edilir. organizasyon ISO(Uluslararası Standardizasyon Örgütü - Uluslararası Standartlar Örgütü) bir grup standardı benimsemiştir. ISO 8859. Farklı dil grupları için 8 bitlik kodlamaları tanımlar. Bu nedenle, ISO 8859-1, ABD ve Batı Avrupa için bir tablo olan Genişletilmiş ASCII'dir. Ve ISO 8859-5, Kiril (Rusça dahil) için bir tablodur. Ancak, tarihsel nedenlerden dolayı ISO 8859-5 kodlaması tutmadı. Gerçekte, Rus dili için aşağıdaki kodlamalar kullanılır: Kod Sayfa 866 ( CP866), aynı zamanda “DOS”, aynı zamanda “alternatif GOST kodlaması”. 1990'ların ortalarına kadar yaygın olarak kullanılan; şimdi sınırlı kullanımda. İnternette metinlerin dağıtımı için pratik olarak kullanılmaz. CP866'nın ana avantajı, Genişletilmiş ASCII ile aynı yerlerde psödografik karakterlerin korunmasıydı; bu nedenle, yabancı metin programları, örneğin ünlü Norton Commander, değişiklik yapmadan çalışabilir. CP866 şu anda metin pencerelerinde veya FAR Yöneticisi de dahil olmak üzere tam ekran metin modunda çalışan Windows programları için kullanılmaktadır. CP866'daki metinler son yıllarda oldukça nadirdir (ancak Windows'ta Rusça dosya adlarını kodlamak için kullanılır). Bu nedenle, diğer iki kodlama üzerinde duracağız - KOI-8R ve CP1251. Gördüğünüz gibi, CP1251 kodlama tablosunda, Rusça harfler alfabetik sıraya göre düzenlenmiştir (ancak YO harfi hariç). Bu düzenleme, bilgisayar programlarının alfabetik olarak sıralanmasını çok kolaylaştırır. Ancak KOI-8R'de Rus harflerinin sırası rastgele görünüyor. Ama aslında öyle değil. Birçok eski programda, metin işlenirken veya iletilirken 8. bit kayboldu. (Artık bu tür programlar pratik olarak “soyu tükenmiştir”, ancak 80'lerin sonunda ve 90'ların başında yaygındı). 8 bitlik bir değerden 7 bitlik bir değer elde etmek için, yüksek sıralı basamaktan 8 çıkarmak yeterlidir; örneğin, E1 61 olur. Şimdi KOI-8R'yi ASCII tablosuyla karşılaştırın (Tablo 1). Rus harflerinin Latin harfleriyle tam bir uyum içinde olduğunu göreceksiniz. Sekizinci bit kaybolursa, küçük Rus harfleri büyük Latin harflerine ve büyük Rus harfleri küçük Latin harflerine dönüşür. Yani, KOI-8'deki E1 Rusça "A" iken, ASCII'deki 61 Latince "a"dır. Böylece KOI-8, 8. bit kaybıyla Rusça metnin okunabilirliğini korumanıza izin verir. "Herkese merhaba", "pRIWET WSEM" olur. Son zamanlarda hem kodlama tablosundaki karakterlerin alfabetik sırası hem de 8. bitin kaybolmasıyla okunabilirlik belirleyici önemini yitirmiştir. Modern bilgisayarlarda sekizinci bit, aktarım sırasında veya işleme sırasında kaybolmaz. Alfabetik sıralama, basit bir kod karşılaştırması değil, kodlama dikkate alınarak yapılır. (Bu arada, CP1251 kodları tamamen alfabetik olarak sıralanmamıştır - Y harfi yerinde değildir). İki yaygın kodlama olduğu için, İnternet ile çalışırken (posta, Web sitelerinde gezinme), bazen Rusça metin yerine anlamsız bir dizi harf görebilirsiniz. Örneğin, "Ben SBYFEMHEL'im". Sadece "saygılarımla" kelimeleri; ancak bunlar CP1251 kodlamasında kodlanmıştır ve bilgisayar metnin kodunu KOI-8 tablosuna göre çözmüştür. Aynı kelimeler KOI-8'de kodlanmış olsaydı ve bilgisayar metnin kodunu CP1251 tablosuna göre çözseydi, sonuç “U HCHBTSEOEN” olurdu. Bazen bir bilgisayar Rusça harflerin şifresini çözer ve hatta Rus dili için tasarlanmamış bir tabloya göre olur. Ardından, Rusça harfler yerine anlamsız bir dizi karakter belirir (örneğin, Doğu Avrupa dillerinin Latin harfleri); genellikle "timsah" olarak adlandırılırlar. Çoğu durumda, modern programlar İnternet belgelerinin (e-postalar ve Web sayfaları) kodlamalarını kendi başlarına belirlemeyi başarır. Ama bazen "yanlış ateş ederler" ve sonra garip Rus harfleri veya "timsah" dizileri görebilirsiniz. Kural olarak, böyle bir durumda gerçek metni görüntülemek için, program menüsünde kodlamayı manuel olarak seçmek yeterlidir. Makale için http://open-office.edusite.ru/TextProcessor/p5aa1.html sayfasındaki bilgiler kullanılmıştır. Siteden alınan malzeme: Her bilgisayarın uyguladığı kendi karakter seti vardır. Böyle bir küme 26 büyük ve küçük harf, sayı ve özel karakter (nokta, boşluk vb.) içerir. Tam sayılara çevrilen sembollere kod denir. Standartlar, bilgisayarların aynı kod setlerine sahip olması için geliştirildi. ASCII standardıASCII (Inmormation Interchange için Amerikan Standart Kodu), bilgi değişimi için Amerikan standart kodudur. Her ASCII karakterinin 7 biti vardır, bu nedenle maksimum karakter sayısı 128'dir (Tablo 1). 0 ila 1F arasındaki kodlar, yazdırılmayan kontrol karakterleridir. Verileri aktarmak için birçok yazdırılamayan ASCII karakteri gerekir. Örneğin, bir mesaj başlık başlangıç karakteri SOH, başlığın kendisi ve metin başlangıç karakteri STX, metnin kendisi ve metin bitiş karakteri ETX ve iletim bitiş karakteri EOT'den oluşabilir. Bununla birlikte, veriler ağ üzerinden, aktarımın başlangıcından ve sonundan kendileri sorumlu olan paketler halinde iletilir. Yani yazdırılamayan karakterler neredeyse hiç kullanılmaz. Tablo 1 - ASCII kod tablosu
Unicode standardıÖnceki kodlama İngilizce için harikadır, ancak diğer diller için uygun değildir. Örneğin, Almanca'da noktalı harfler bulunurken, Fransızca'da aksan vardır. Bazı dillerin tamamen farklı alfabeleri vardır. ASCII'yi genişletmeye yönelik ilk girişim, önceki kodlamayı 128 karakter daha genişleten IS646 idi. Latin harfleri, vuruşlar ve aksanlarla eklendi ve Latince 1 olarak adlandırıldı. Bir sonraki girişim, bir kod sayfası içeren IS 8859 idi. Hala genişleme girişimleri vardı, ancak bu evrensel değildi. UNICODE kodlaması (10646'dır) oluşturuldu. Kodlama fikri, her karaktere 16 bitlik tek bir sabit değer atamaktır, buna − kod işaretçisi. Toplamda 65536 işaretçi elde edilir. Yer kazanmak için, 0-255 kodları için Latin-1'i kullandık, ASII'yi kolayca UNICODE'a değiştirdik. Bu standart birçok sorunu çözdü, ancak hepsini değil. Örneğin Japonca için yeni kelimelerin gelişiyle bağlantılı olarak, terim sayısını yaklaşık 20 bin artırmanız gerekiyor, ayrıca Braille'i etkinleştirmeniz gerekiyor. |
Altın Numaralar Güzel bir telefon numarası nasıl satılır
Kripto para madenciliği: basit kelimelerle nedir
En iyi dizüstü bilgisayar işletim sistemi: Eksiksiz inceleme
Sınıf arkadaşlarından müzik indirmek için programlar Sosyal ağ sınıf arkadaşlarından üzücü bir şarkı indirin
Yandex tarayıcısının mobil versiyonu