Alfabenin sıralı kodlama ilkesi nedir? Bilgi kodlama, anisimov vladimir viktorovich'in eğitici ve bilimsel bir faaliyetidir. Semboller nelerdir

  • 31.10.2019

Metin bilgisi sembollerden oluşur: harfler, sayılar, noktalama işaretleri, vb. 256 farklı değeri saklamak için bir bayt yeterlidir, bu da içine alfanümerik karakterlerden herhangi birini yerleştirmenize izin verir. İlk 128 karakter (en az önemli yedi biti kaplar) ASCII (Bilgi Değişimi için Amerikan Standart Kodu) kodlaması kullanılarak standartlaştırılmıştır. Kodlamanın özü, her karaktere 00000000 ila 11111111 arasında bir ikili kod veya 0 ila 255 arasında karşılık gelen ondalık kodun atanmasıdır. Rus harflerini kodlamak için çeşitli kod tabloları kullanılır (KOI-8R, CP1251, CP10007, ISO-8859- 5):

KOI8R - Kiril harflerini kodlamak için sekiz bitlik bir standart (UNIX işletim sistemi için). Geliştiriciler KOI8R Rus alfabesinin karakterlerini genişletilmiş ASCII tablosunun en üstüne, Kiril karakterlerinin pozisyonları tablonun altındaki İngilizce alfabesindeki fonetik karşılıklarına karşılık gelecek şekilde yerleştirdi. Bu, yazılmış metinden anlamına gelir KOI8RLatin karakterlerle yazılmış bir metin alırsınız. Örneğin, "yüksek ev" kelimeleri "dom vysokiy" biçimini alır;

CP1251 - Windows işletim sisteminde kullanılan sekiz bitlik kodlama standardı;

CP10007- Macintosh işletim sisteminin Kiril alfabesinde kullanılan sekiz bitlik kodlama standardı (Apple bilgisayarlar);

ISO-8859-5 - Rus dilini kodlamak için standart olarak onaylanmış sekiz bitlik bir kod.

Grafik bilgi kodlaması

Grafik bilgiler iki biçimde sunulabilir: analog ve ayrık. Tuval boyamasanatçı tarafından yaratıldı analog gösterim örneğive görüntü, bir yazıcıyla basılmışfarklı renklerde ayrı (elemanlar) noktalardan oluşan, ayrık gösterim.

Grafik görüntüyü bölerek (örnekleme), grafik bilgileri analog bir formdan ayrı bir formata dönüştürülür. Bu durumda, kodlama gerçekleştirilir - grafik görüntünün her bir öğesinin bir kod biçiminde belirli bir değere atanması. Grafik nesnelerinin oluşturulması ve depolanması çeşitli şekillerde mümkündür - formda vektör, fraktal veya raster Görüntüler. Ayrı konu 3D (üç boyutlu) grafikler olarak kabul edildi, vektör ve raster görüntüleme yöntemlerini birleştiren.

Vektör grafikleri resimler, çizimler, diyagramlar gibi grafik görüntüleri temsil etmek için kullanılır.

Nesnelerden oluşurlar - örneğin çizgi kalınlığı, dolgu rengi gibi bazı özellikler atanan bir dizi geometrik ilkel (noktalar, çizgiler, daireler, dikdörtgenler).

Vektör formatında bir görüntü, görüntü kayıpsız ölçeklenebildiği, döndürülebildiği ve deforme edilebildiği için düzenleme sürecini basitleştirir. Dahası, her dönüşüm eski görüntüyü (veya parçayı) yok eder ve onun yerine yenisi inşa edilir. Bu sunum, çizelgeler ve iş grafikleri için iyidir. Bir vektör görüntüsünü kodlarken, nesne görüntüsünün kendisi değil, noktaların koordinatları saklanır, hangi programın görüntüyü her seferinde yeniden oluşturduğunu kullanarak.

Ana dezavantaj vektör grafikleri fotoğraf kalitesinin imkansızlığı... Vektör formatında, görüntü her zaman bir çizime benzeyecektir.

Raster grafikler. Herhangi bir resim karelere bölünebilir, böylece elde edilir raster - iki boyutlu kareler dizisi. Karelerin kendileri - raster öğeler veya pikseller (resmin öğesi) - resmin öğeleri. Her pikselin rengi, resmin açıklamasının renk numaralarının sırasını (soldan sağa veya yukarıdan aşağıya) ayarlamasına olanak tanıyan bir sayı ile kodlanır. .) Pikselin depolandığı her bir hücrenin numarası belleğe kaydedilir.

Bitmap çizimi

Her piksel parlaklık, renk ve şeffaflık değerleriyle veya bu değerlerin bir kombinasyonuyla eşlenir. Bir bit eşlemin birkaç satırı ve sütunu vardır. Bu depolama yönteminin dezavantajları vardır: görüntülerle çalışmak için daha fazla bellek gerekir.

Bir bitmap görüntüsünün hacmi, piksel sayısının olası renk sayısına bağlı olan bir noktanın bilgi hacmiyle çarpılmasıyla belirlenir. Modern bilgisayarlarda esas olarak aşağıdaki ekran çözünürlükleri kullanılır: 640 x 480, 800 x 600, 1024 x 768 ve 1280 x 1024 piksel. Her noktanın parlaklığı ve koordinatları, grafik verilerini işlemek için ikili kod kullanımına izin veren tamsayılar kullanılarak ifade edilebilir.

En basit durumda (gri tonlamasız siyah beyaz bir görüntü), ekrandaki her nokta iki durumdan birine sahip olabilir - "siyah" veya "beyaz", yani durumunu saklamak için 1 bit gerekir. Renkli görüntüler, video belleğinde depolanan her noktanın renginin ikili koduna göre oluşturulur. Renkli görüntüler, bir noktanın rengini kodlamak için kullanılan bit sayısı ile belirlenen farklı renk derinliklerine sahip olabilir. En yaygın renk derinliği değerleri 8, 16, 24, 32, 64 bittir.

Renkli grafik görüntüleri kodlamak için rastgele bir renk bileşenlerine bölünür. Aşağıdaki kodlama sistemleri kullanılmaktadır:

HSB (H - ton, S - doygunluk, B - parlaklık),

RGB (Kırmızı - kırmızı, Yeşil - yeşil, Mavi - mavi) ve

CMYK ( Cmavi için yan, macenta için Macenta, sarı için Sarı ve siyah için Siyah).

İlk sistem aşağıdakiler için uygundur: insanikincisi için bilgisayar işlemeve ikincisi için matbaalar... Bu renk sistemlerinin kullanımı, ışık akısının "saf" spektral renklerin (kırmızı, yeşil, mavi veya bunların türevlerinin) bir kombinasyonu olan radyasyonla oluşturulabilmesinden kaynaklanmaktadır.

Fraktal Bireysel öğeleri üst yapıların özelliklerini devralan bir nesnedir. Daha küçük ölçekli elemanların daha ayrıntılı bir açıklaması basit bir algoritmaya göre gerçekleştirildiğinden, böyle bir nesne sadece birkaç matematiksel denklem ile tanımlanabilir. Fraktallar, ayrıntılı olarak temsil etmek için nispeten az bellek gerektiren görüntüleri tanımlamanıza izin verir.

Fraktal formatta çizim

3B grafikler (3D) üç boyutlu uzayda nesnelerle çalışır. Üç boyutlu bilgisayar grafikleri, tüm nesnelerin bir yüzeyler veya parçacıklar topluluğu olarak temsil edildiği filmlerde, bilgisayar oyunlarında yaygın olarak kullanılır. 3B grafiklerdeki tüm görsel dönüşümler tarafından kontrol edilir matris gösterimine sahip operatörler.

Ses kodlama

Müzik, herhangi bir ses gibi, ses titreşimlerinden başka bir şey değildir, hangisinin yeterince doğru bir şekilde yeniden üretilebileceğini kaydeder. Ses sinyalini bilgisayar belleğinde temsil etmek için, alınan akustik titreşimleri dijital biçimde temsil etmek, yani onu bir sıfırlar ve birler dizisine dönüştürmek gerekir. Bir mikrofon yardımıyla, ses elektriksel titreşimlere dönüştürülür, ardından titreşimlerin genliği, özel bir cihaz kullanılarak düzenli aralıklarla (saniyede onbinlerce kez) ölçülebilir - analogtan dijitale dönüştürücü (ADC). Sesi yeniden üretmek için dijital sinyal, kullanılarak analoga dönüştürülmelidir. dijitalden analoğa dönüştürücü (DAC). Bu cihazların her ikisi de yerleşiktir ses kartı bilgisayar. Belirtilen dönüşüm dizisi Şekil 1'de gösterilmektedir. 2.6 ..

Analog bir sinyali dijitale ve tersini dönüştürme

Her ses ölçümü ikili kodda yazılır. Bu sürece denir örnekleme (örnekleme),bir ADC kullanılarak gerçekleştirilir.

Örneklem (örnek), bir analog sinyalin genliğinin iki ölçümü arasındaki zaman aralığıdır. Bir süreye ek olarak, bir numuneye analogdan dijitale dönüştürme ile elde edilen herhangi bir dijital veri dizisi de denir. Önemli bir parametre örneklemefrekans - saniyede analog sinyalin genliğinin ölçüm sayısı. Ses örnekleme hızı, saniyede 8000 ila 48000 ölçüm arasındadır.

Örnekleme sürecinin grafik temsili

Oynatma kalitesi etkilenir örnekleme hızı ve çözünürlüğü(genlik değerinin kaydedilmesi için ayrılan hücre boyutu). Örneğin, CD'lere müzik kaydederken, 16 bit değerler ve 44032 Hz örnekleme hızı kullanılır.

Kulakla, kişi 16 Hz ila 20 kHz (1 Hz - saniyede 1 titreşim) arasında değişen bir frekansa sahip ses dalgalarını algılar.

Audio DVD formatında, sinyal bir saniyede 96.000 kez ölçülür. 96 kHz örnekleme hızı kullanın. Multimedya uygulamalarında sabit diskte yer kazanmak için genellikle daha düşük frekanslar kullanılır: 11, 22, 32 kHz. Bu, işitilebilir frekans aralığında bir azalmaya ve dolayısıyla duyulanların bozulmasına yol açar.

Yakma

I. Bilgi kodlamasının tarihçesi ……………………………… ..3

II. Bilgi kodlama ………………………………………… 4

III. Metin bilgilerinin kodlanması …………………………… .4

IV. Kodlama tablosu türleri ………………………………………… ... 6

V. Metin bilgisi miktarının hesaplanması ……………………… 14

Kullanılan literatür listesi ………………………………… ..16

ben . Bilgi kodlama geçmişi

İnsanlık, ilk gizli bilginin ortaya çıktığı andan itibaren metnin şifrelemesini (kodlamasını) kullanıyor. Önünüzde, insan düşüncesinin gelişiminin çeşitli aşamalarında icat edilen birkaç metin kodlama yöntemi vardır:

Kriptografi gizli yazıdır, metni inisiye olmayanlar için anlaşılmaz hale getirmek amacıyla bir mektubu değiştirme sistemidir;

Mors kodu veya düzensiz telgraf kodu; burada her harf veya karakter, kısa elektrik akımı yongaları (noktalar) ve üç süreli yongaların (çizgiler) kendi kombinasyonuyla temsil edilir;

Surdogesty, işitme engelli kişiler tarafından kullanılan bir işaret dilidir.

Bilinen en eski şifreleme yöntemlerinden biri, adını Roma imparatoru Julius Caesar'dan (MÖ 1. yüzyıl) almıştır. Bu yöntem, şifrelenmiş metnin her bir harfini, alfabeyi orijinal harften sabit sayıda karakter ile değiştirerek değiştirmeye dayanır ve alfabe bir daire içinde, yani i harfinden sonra, düşünülen. Yani "bayt" sözcüğü sağa iki karakter kaydırıldığında "gvlf" sözcüğü ile kodlanır. Belirli bir kelimeyi çözmenin tersi süreci - şifrelenmiş her harfi, solundaki ikincisi ile değiştirmek gerekir.

II. Bilgi kodlama

Bir kod, önceden tanımlanmış bazı kavramların kaydedilmesi (veya iletilmesi) için bir dizi kuraldır (veya sinyaller).

Bilgi kodlama, bilginin belirli bir temsilini oluşturma sürecidir. Daha dar bir anlamda, "kodlama" terimi genellikle bir bilgi sunum biçiminden diğerine, depolama, iletim veya işleme için daha uygun bir geçiş olarak anlaşılır.

Genellikle, kodlandığında (bazen şifrelenmiş derler) her görüntü ayrı bir işaretle temsil edilir.

Bir işaret, birbirinden farklı sonlu bir dizi elemanın bir öğesidir.

Daha dar bir anlamda, "kodlama" terimi genellikle bir bilgi sunum biçiminden diğerine, depolama, iletim veya işleme için daha uygun bir geçiş olarak anlaşılır.

Bilgisayar metin bilgilerini işleyebilir. Bir bilgisayara girildiğinde, her harf belirli bir sayı ile kodlanır ve harici cihazlara (ekran veya baskı) çıktığında, bu sayılar kullanılarak insan algısı için harf görüntüleri oluşturulur. Bir dizi harf ve sayı arasındaki yazışmaya karakter kodlaması denir.

Kural olarak, bir bilgisayardaki tüm sayılar sıfırlar ve birler kullanılarak temsil edilir (insanlar için geleneksel olduğu gibi on basamak değil). Başka bir deyişle, bilgisayarlar genellikle bir ikili sayı sisteminde çalışır, çünkü onları işlemek için cihazlar çok daha basittir. Bir bilgisayara sayıların girilmesi ve bunların insan okuması için görüntülenmesi olağan ondalık formda gerçekleştirilebilir ve gerekli tüm dönüştürmeler bilgisayarda çalışan programlar tarafından gerçekleştirilir.

III. Metin bilgisini kodlama

Aynı bilgiler çeşitli şekillerde sunulabilir (kodlanabilir). Bilgisayarların gelişiyle, hem bireyin hem de insanlığın bir bütün olarak anlaştığı her türlü bilgiyi kodlamak gerekli hale geldi. Ancak insanlık, bilgisayarların ortaya çıkmasından çok önce bilgi kodlama sorununu çözmeye başladı. İnsanoğlunun muazzam başarıları - yazma ve aritmetik - konuşma ve sayısal bilgiyi kodlamak için bir sistemden başka bir şey değildir. Bilgi asla saf haliyle görünmez, her nasılsa bir şekilde sunulur, bir şekilde kodlanır.

İkili kodlama, bilgiyi temsil etmenin yaygın yollarından biridir. Bilgisayarlarda, robotlarda ve sayısal olarak kontrol edilen takım tezgahlarında, kural olarak, bir cihazın ele aldığı tüm bilgiler, ikili bir alfabedeki kelimeler biçiminde kodlanır.

60'ların sonlarından bu yana, bilgisayarlar metinsel bilgileri işlemek için giderek daha fazla kullanılmaktadır ve şu anda, dünyadaki kişisel bilgisayarların çoğu (ve çoğu zaman) metinsel bilgilerin işlenmesiyle uğraşmaktadır. Bir bilgisayardaki tüm bu tür bilgiler ikili kodla temsil edilir, yani iki kuvvetli bir alfabe kullanılır (yalnızca iki karakter 0 ve 1). Bunun nedeni, bilgiyi bir dizi elektriksel dürtü biçiminde temsil etmenin uygun olmasıdır: dürtü (0) yoktur, bir dürtü (1) vardır.

Bu tür kodlamaya genellikle ikili denir ve sıfırların ve birlerin mantıksal dizilerine makine dili denir.

Bilgisayar açısından bakıldığında, metin ayrı karakterlerden oluşur. Semboller yalnızca harfleri (büyük veya küçük harf, Latin veya Rusça) değil, aynı zamanda sayıları, noktalama işaretlerini, "\u003d", "(", "&" vb. Gibi özel karakterleri ve hatta (özellikle dikkat edin!) kelimeler.

Metinler, klavye kullanılarak bilgisayar belleğine girilir. Tuşlar normal harfler, sayılar, noktalama işaretleri ve diğer sembollerle yazılmıştır. RAM'i ikili kodla girerler. Bu, her karakterin 8 bitlik bir ikili kodla temsil edildiği anlamına gelir.

Geleneksel olarak bir karakteri kodlamak için 1 bayta eşit miktarda bilgi kullanılır, yani I \u003d 1 bayt \u003d 8 bit. Olası olay sayısı K ile bilgi miktarını I bağlayan bir formül kullanarak, kaç farklı simgenin kodlanabileceğini hesaplayabilirsiniz (simgelerin olası olaylar olduğunu varsayarak): K \u003d 2 I \u003d 2 8 \u003d 256, yani, Metinsel bilgilerin gösterimi için 256 karakter kapasiteli alfabeyi kullanabilir.

Bu sayıda karakter, Rusça ve Latin alfabelerinin büyük ve küçük harfleri, sayılar, işaretler, grafik sembolleri vb. Dahil olmak üzere metinsel bilgileri temsil etmek için oldukça yeterlidir.

Kodlama, her karaktere 0 ile 255 arasında benzersiz bir ondalık kod veya 00000000 ile 11111111 arasında karşılık gelen ikili kod atanması anlamına gelir. Böylece, bir kişi karakterleri stillerine ve bir bilgisayarı kodlarına göre ayırt eder.

Bir bayt belleğin adreslenebilir en küçük parçası olduğundan ve bu nedenle işlemci her bir karaktere ayrı ayrı erişerek metin işlemeyi gerçekleştirebildiğinden, karakterlerin bayt kodlamasının rahatlığı açıktır. Öte yandan, 256 karakter, çok çeşitli karakter bilgilerini temsil etmek için oldukça yeterli bir sayıdır.

Bilgisayar ekranında bir karakter görüntüleme sürecinde, ters işlem gerçekleştirilir - kod çözme, yani karakter kodunun görüntüsüne dönüştürülmesi. Belirli bir kodun bir sembole atanmasının, kod tablosunda sabitlenmiş bir konvansiyon meselesi olması önemlidir.

Şimdi şu soru ortaya çıkıyor, her karakterle ne tür sekiz bitlik ikili kod ilişkilendirilecek. Bunun şartlı bir konu olduğu açıktır, birçok kodlama yöntemi ile karşılaşabilirsiniz.

Bilgisayar alfabesindeki tüm karakterler 0 ile 255 arasında numaralandırılmıştır. Her sayı 00000000 ile 11111111 arasında sekiz basamaklı bir ikili koda karşılık gelir. Bu kod, ikili sistemdeki bir karakterin sıra numarasıdır.

IV ... Kodlama tablosu türleri

Bilgisayar alfabesinin tüm karakterlerinin seri numaralarının atandığı tabloya kodlama tablosu denir.

Farklı bilgisayar türleri için farklı kodlama tabloları kullanılır.

ASCII kod tablosu (American Standard Code for Information Interchange), 0'dan 127'ye kadar sayısal kodlarla karakterlerin ilk yarısını kodlayan uluslararası bir standart olarak benimsenmiştir (0'dan 32'ye kadar olan kodlar karakterlere değil işlev tuşlarına atanır ).

ASCII tablosu iki bölüme ayrılmıştır.

Uluslararası standart, tablonun yalnızca ilk yarısıdır, yani 0 (00000000) ile 127 (01111111) arası sayılara sahip karakterler.

ASCII tablo yapısı

Seri numarası Kod Sembol
0 - 31 00000000 - 00011111

0-31 arası sayılara sahip semboller genellikle kontrol karakterleri olarak adlandırılır.

İşlevleri, ekranda metin görüntüleme veya yazdırma, ses sinyali verme, metni işaretleme vb. Süreçleri kontrol etmektir.

32 - 127 0100000 - 01111111

Tablonun standart kısmı (İngilizce). Bu, Latin alfabesinin küçük ve büyük harflerini, ondalık sayıları, noktalama işaretlerini, her türden parantezleri, ticari ve diğer sembolleri içerir.

Karakter 32 bir boşluktur, yani metinde boş konum.

Diğerleri belirli işaretlerle yansıtılır.

128 - 255 10000000 - 11111111

Tablonun alternatif kısmı (Rusça).

ASCII kod tablosunun kod sayfası olarak adlandırılan ikinci yarısı (10000000'den başlayıp 11111111 ile biten 128 kod) farklı varyantlara sahip olabilir, her varyantın kendi numarası vardır.

Kod sayfası öncelikle Latin dışındaki ulusal alfabeleri barındırmak için kullanılır. Rus ulusal kodlamalarında, tablonun bu bölümü Rus alfabesinin sembollerini içerir.

ASCII tablosunun ilk yarısı

Kodlama tablosunda, harflerin (büyük ve küçük harf) alfabetik sırayla ve sayıların değerlerin artan sırasına göre sıralandığına dikkat çekilir. Karakterlerin düzenlenmesindeki bu sözlüksel düzene uyulmasına, alfabenin sıralı kodlanması ilkesi denir.

Rus alfabesinin harfleri için sıralı kodlama ilkesi de gözetilir.

ASCII tablosunun ikinci yarısı

Ne yazık ki, şu anda beş farklı Kiril kodlaması var (KOI8-R, Windows. MS-DOS, Macintosh ve ISO). Bu nedenle, Rusça metnin bir bilgisayardan diğerine, bir yazılım sisteminden diğerine aktarılmasında sıklıkla sorunlar ortaya çıkar.

Kronolojik olarak, bilgisayarlarda Rus harflerini kodlamanın ilk standartlarından biri KOI8 idi ("Bilgi değişim kodu, 8 bit"). Bu kodlama, 70'lerde ES bilgisayar serisinin bilgisayarlarında kullanıldı ve 80'lerin ortalarından itibaren UNIX işletim sisteminin ilk Russified sürümlerinde kullanılmaya başlandı.

MS DOS işletim sisteminin hakim olduğu 90'ların başından itibaren CP866 kodlaması kalır ("CP" "Kod Sayfası", "kod sayfası" anlamına gelir).

Mac OS çalıştıran Apple bilgisayarlar kendi Mac kodlamalarını kullanır.

Ek olarak, Uluslararası Standardizasyon Örgütü (Uluslararası Standartlar Organizasyonu, ISO), Rusça için bir standart olarak ISO 8859-5 adlı başka bir kodlamayı onayladı.

Şu anda kullanılan en yaygın kodlama, CP1251 olarak kısaltılan Microsoft Windows'tur. Microsoft tarafından sunulan; Rusya Federasyonu'ndaki bu şirketin işletim sistemlerinin (OS) ve diğer yazılım ürünlerinin geniş dağılımını dikkate alarak geniş dağıtım buldu.

90'ların sonlarından beri, karakter kodlama standardizasyonu sorunu, Unicode adlı yeni bir uluslararası standardın getirilmesiyle çözülmüştür.

Bu 16 bitlik bir kodlamadır, yani her karakter için 2 bayt bellek ayırır. Elbette bu, kullanılan bellek miktarını iki katına çıkarır. Ancak öte yandan, böyle bir kod tablosu 65536 karaktere kadar eklenmesine izin verir. Unicode standardının eksiksiz özellikleri, dünyadaki tüm mevcut, soyu tükenmiş ve yapay olarak oluşturulmuş alfabelerin yanı sıra birçok matematiksel, müzikal, kimyasal ve diğer sembolleri içerir.

Bilgisayar belleğindeki kelimelerin dahili temsili

aSCII tablosu kullanarak

Bazen, başka bir bilgisayardan alınan Rus alfabesinin harflerinden oluşan bir metin okunamaz - monitör ekranında bir tür "abrakadabra" görünür. Bunun nedeni, bilgisayarların farklı Rusça karakter kodlamaları kullanmasıdır.

Böylece her kodlama kendi kod tablosu ile tanımlanır. Tablodan da görebileceğiniz gibi, farklı kodlamalarda aynı ikili koda farklı semboller atanmıştır.

Örneğin, CP1251 kodlamasında 221, 194, 204 nümerik kodlardan oluşan bir dizi "bilgisayar" kelimesini oluştururken, diğer kodlamalarda anlamsız bir karakter dizisi olacaktır.

Neyse ki, çoğu durumda kullanıcının metin belgelerini dönüştürme konusunda endişelenmesine gerek yoktur, çünkü bu, uygulamalara yerleştirilmiş özel dönüştürme programları tarafından yapılır.

V ... Metin bilgisi miktarını hesaplama

Hedef 1: KOI8-R ve CP1251 kodlama tablolarını kullanarak "Roma" kelimesini kodlayın.

Karar:

Görev 2: Her karakterin bir bayt olarak kodlandığını varsayarak, aşağıdaki cümlenin bilgi hacmini tahmin edin:

"Amcam en dürüst kurallara sahip.

Ağır hasta olduğunda

Kendine saygı duydu

Ve daha iyi hayal edemezdim. "

Karar: Bu cümlenin noktalama işaretleri, tırnak işaretleri ve boşluklar dahil olmak üzere 108 karakteri vardır. Bu sayıyı 8 bit ile çarpıyoruz. 108 * 8 \u003d 864 bit alıyoruz.

Hedef 3: İki metin aynı sayıda karakter içeriyor. İlk metin Rusça, ikincisi alfabesi 16 karakterden oluşan Naguri kabilesinin dilinde yazılmıştır. Kimin metni daha fazla bilgi taşır?

Karar:

1) I \u003d K * a (metnin bilgi hacmi, bir karakterin bilgi ağırlığı ile karakter sayısının çarpımına eşittir).

2) Çünkü her iki metin de aynı sayıda karaktere (K) sahiptir, fark alfabenin (a) bir karakterinin bilgi içeriğine bağlıdır.

3) 2 a1 \u003d 32, yani bir 1 \u003d 5 bit, 2 a2 \u003d 16, yani bir 2 \u003d 4 bit.

4) I 1 \u003d K * 5 bit, I 2 \u003d K * 4 bit.

5) Bu, Rusça yazılan metnin 5/4 kat daha fazla bilgi olduğu anlamına gelir.

Görev 4: 2048 karakter içeren mesajın boyutu MB'nin 1 / 512'siydi. Alfabenin önemini belirleyin.

Karar:

1) I \u003d 1/512 * 1024 * 1024 * 8 \u003d 16384 bit - mesajın bilgi hacmi bitlere dönüştürüldü.

2) a \u003d I / K \u003d 16384/1024 \u003d 16 bit - alfabenin bir karakterine denk gelir.

3) 2 * 16 * 2048 \u003d 65536 karakter - kullanılan alfabenin gücü.

Görev 5: Canon LBP lazer yazıcı ortalama 6,3 Kbps hızında yazdırır. Bir sayfada ortalama 45 satır, satır başına 70 karakter (1 karakter - 1 bayt) olduğu biliniyorsa, 8 sayfalık bir belgeyi yazdırmak ne kadar sürer?

Karar:

1) 1 sayfada bulunan bilgi miktarını bulun: 45 * 70 * 8 bit \u003d 25200 bit

2) 8 sayfadaki bilgi miktarını bulun: 25200 * 8 \u003d 201600 bit

3) Tek tip ölçü birimlerine getiriyoruz. Bunu yapmak için, Mbit'leri bitlere dönüştürün: 6,3 * 1024 \u003d 6451,2 bit / sn.

4) Baskı süresini bulun: 201600: 6451,2 \u003d 31 saniye.

Kaynakça

1. Ageev V.M. Bilgi ve kodlama teorisi: ölçüm bilgilerinin ayrıklaştırılması ve kodlanması. - M: MAI, 1977.

2. Kuzmin I.V., Kedrus V.A. Bilgi teorisi ve kodlamanın temelleri. - Kiev, Vishcha okulu, 1986.

3. En basit metin şifreleme yöntemleri / D.М. Zlatopolsky. - M .: Chistye prudy, 2007 - 32 s.

4. Ugrinovich N.D. Bilişim ve bilgi teknolojisi. 10-11. Sınıflar için ders kitabı / N.D. Ugrinovich. - M: BINOM. Bilgi Laboratuvarı, 2003. - 512 s.

5. http://school497.spb.edu.ru/uchint002/les10/les.html#n

Yakma

I. Bilgi kodlamasının tarihçesi ……………………………… ..3

II. Bilgi kodlama ………………………………………… 4

III. Metin bilgilerinin kodlanması …………………………… .4

IV. Kodlama tablosu türleri ………………………………………… ... 6

V. Metin bilgisi miktarının hesaplanması ……………………… 14

Kullanılan literatür listesi ………………………………… ..16

ben . Bilgi kodlama geçmişi

İnsanlık, ilk gizli bilginin ortaya çıktığı andan itibaren metnin şifrelemesini (kodlamasını) kullanıyor. Önünüzde, insan düşüncesinin gelişiminin çeşitli aşamalarında icat edilen birkaç metin kodlama yöntemi vardır:

Kriptografi gizli yazıdır, metni inisiye olmayanlar için anlaşılmaz hale getirmek amacıyla bir mektubu değiştirme sistemidir;

Mors kodu veya düzensiz telgraf kodu; burada her harf veya karakter, kısa elektrik akımı yongaları (noktalar) ve üç süreli yongaların (çizgiler) kendi kombinasyonuyla temsil edilir;


işaret dili, işitme engelli kişiler tarafından kullanılan bir işaret dilidir.

Bilinen en eski şifreleme yöntemlerinden biri, adını Roma imparatoru Julius Caesar'dan (MÖ 1. yüzyıl) almıştır. Bu yöntem, şifrelenmiş metnin her bir harfini, alfabeyi orijinal harften sabit sayıda karakter ile değiştirerek değiştirmeye dayanır ve alfabe bir daire içinde, yani i harfinden sonra, düşünülen. Yani "bayt" sözcüğü sağa iki karakter kaydırıldığında "gvlf" sözcüğü ile kodlanır. Belirli bir kelimeyi çözmenin tersi süreci - şifrelenmiş her harfi, solundaki ikincisi ile değiştirmek gerekir.

II. Bilgi kodlama

Bir kod, önceden tanımlanmış bazı kavramların kaydedilmesi (veya iletilmesi) için bir dizi kuraldır (veya sinyaller).

Bilgi kodlama, bilginin belirli bir temsilini oluşturma sürecidir. Daha dar bir anlamda, "kodlama" terimi genellikle bir bilgi sunum biçiminden diğerine, depolama, iletim veya işleme için daha uygun bir geçiş olarak anlaşılır.

Genellikle, kodlandığında (bazen şifrelenmiş derler) her görüntü ayrı bir işaretle temsil edilir.

Bir işaret, birbirinden farklı sonlu bir dizi elemanın bir öğesidir.

Daha dar bir anlamda, "kodlama" terimi genellikle bir bilgi sunum biçiminden diğerine, depolama, iletim veya işleme için daha uygun bir geçiş olarak anlaşılır.

Bilgisayar metin bilgilerini işleyebilir. Bir bilgisayara girildiğinde, her harf belirli bir sayı ile kodlanır ve harici cihazlara (ekran veya baskı) çıktığında, bu sayılar kullanılarak insan algısı için harf görüntüleri oluşturulur. Bir dizi harf ve sayı arasındaki yazışmaya karakter kodlaması denir.

Kural olarak, bir bilgisayardaki tüm sayılar sıfırlar ve birler kullanılarak temsil edilir (insanlar için geleneksel olduğu gibi on basamak değil). Başka bir deyişle, bilgisayarlar genellikle bir ikili sayı sisteminde çalışır, çünkü onları işlemek için cihazlar çok daha basittir. Bir bilgisayara sayıların girilmesi ve bunların insan okuması için görüntülenmesi olağan ondalık formda gerçekleştirilebilir ve gerekli tüm dönüştürmeler bilgisayarda çalışan programlar tarafından gerçekleştirilir.

III. Metin bilgisini kodlama

Aynı bilgiler çeşitli şekillerde sunulabilir (kodlanabilir). Bilgisayarların gelişiyle, hem bireyin hem de insanlığın bir bütün olarak anlaştığı her türlü bilgiyi kodlamak gerekli hale geldi. Ancak insanlık, bilgisayarların ortaya çıkmasından çok önce bilgi kodlama sorununu çözmeye başladı. İnsanoğlunun muazzam başarıları - yazma ve aritmetik - konuşma ve sayısal bilgiyi kodlamak için bir sistemden başka bir şey değildir. Bilgi asla saf haliyle görünmez, her nasılsa bir şekilde sunulur, bir şekilde kodlanır.

İkili kodlama, bilgiyi temsil etmenin yaygın yollarından biridir. Bilgisayarlarda, robotlarda ve sayısal olarak kontrol edilen takım tezgahlarında, kural olarak, bir cihazın ele aldığı tüm bilgiler, ikili bir alfabedeki kelimeler biçiminde kodlanır.

60'ların sonlarından bu yana, bilgisayarlar metinsel bilgileri işlemek için giderek daha fazla kullanılmaktadır ve şu anda, dünyadaki kişisel bilgisayarların çoğu (ve çoğu zaman) metinsel bilgilerin işlenmesiyle uğraşmaktadır. Bir bilgisayardaki tüm bu tür bilgiler ikili kodla temsil edilir, yani iki kuvvetli bir alfabe kullanılır (yalnızca iki karakter 0 ve 1). Bunun nedeni, bilgiyi bir dizi elektriksel dürtü biçiminde temsil etmenin uygun olmasıdır: dürtü (0) yoktur, bir dürtü (1) vardır.

Bu tür kodlamaya genellikle ikili denir ve sıfırların ve birlerin mantıksal dizilerine makine dili denir.

Bilgisayar açısından bakıldığında, metin ayrı karakterlerden oluşur. Semboller yalnızca harfleri (büyük veya küçük harf, Latin veya Rusça) değil, aynı zamanda sayıları, noktalama işaretlerini, "\u003d", "(", "&" vb. Gibi özel karakterleri ve hatta (özellikle dikkat edin!) kelimeler.

Metinler, klavye kullanılarak bilgisayar belleğine girilir. Tuşlar normal harfler, sayılar, noktalama işaretleri ve diğer sembollerle yazılmıştır. RAM'i ikili kodla girerler. Bu, her karakterin 8 bitlik bir ikili kodla temsil edildiği anlamına gelir.

Geleneksel olarak bir karakteri kodlamak için 1 bayta eşit miktarda bilgi kullanılır, yani I \u003d 1 bayt \u003d 8 bit. Olası olay sayısı K ile bilgi miktarını I bağlayan bir formül kullanarak, kaç farklı simgenin kodlanabileceğini hesaplayabilirsiniz (simgelerin olası olaylar olduğunu varsayarak): K \u003d 2 I \u003d 2 8 \u003d 256, yani, Metinsel bilgilerin gösterimi için 256 karakter kapasiteli alfabeyi kullanabilir.

Bu sayıda karakter, Rusça ve Latin alfabelerinin büyük ve küçük harfleri, sayılar, işaretler, grafik sembolleri vb. Dahil olmak üzere metinsel bilgileri temsil etmek için oldukça yeterlidir.

Kodlama, her karaktere 0 ile 255 arasında benzersiz bir ondalık kod veya 00000000 ile 11111111 arasında karşılık gelen ikili kod atanması anlamına gelir. Böylece, bir kişi karakterleri stillerine ve bir bilgisayarı kodlarına göre ayırt eder.

Bir bayt belleğin adreslenebilir en küçük parçası olduğundan ve bu nedenle işlemci her bir karaktere ayrı ayrı erişerek metin işlemeyi gerçekleştirebildiğinden, karakterlerin bayt kodlamasının rahatlığı açıktır. Öte yandan, 256 karakter, çok çeşitli karakter bilgilerini temsil etmek için oldukça yeterli bir sayıdır.

Bilgisayar ekranında bir karakter görüntüleme sürecinde, ters işlem gerçekleştirilir - kod çözme, yani karakter kodunun görüntüsüne dönüştürülmesi. Belirli bir kodun bir sembole atanmasının, kod tablosunda sabitlenmiş bir konvansiyon meselesi olması önemlidir.

Şimdi şu soru ortaya çıkıyor, her karakterle ne tür sekiz bitlik ikili kod ilişkilendirilecek. Bunun şartlı bir konu olduğu açıktır, birçok kodlama yöntemi ile karşılaşabilirsiniz.

Bilgisayar alfabesindeki tüm karakterler 0 ile 255 arasında numaralandırılmıştır. Her sayı 00000000 ile 11111111 arasında sekiz basamaklı bir ikili koda karşılık gelir. Bu kod, ikili sistemdeki bir karakterin sıra numarasıdır.

IV ... Kodlama tablosu türleri

Bilgisayar alfabesinin tüm karakterlerinin seri numaralarının atandığı tabloya kodlama tablosu denir.

Farklı bilgisayar türleri için farklı kodlama tabloları kullanılır.

ASCII kod tablosu (American Standard Code for Information Interchange), 0'dan 127'ye kadar sayısal kodlarla karakterlerin ilk yarısını kodlayan uluslararası bir standart olarak benimsenmiştir (0'dan 32'ye kadar olan kodlar karakterlere değil işlev tuşlarına atanır ).

ASCII tablosu iki bölüme ayrılmıştır.

Uluslararası standart, tablonun yalnızca ilk yarısıdır, yani 0 (00000000) ile 127 (01111111) arası sayılara sahip karakterler.

ASCII tablo yapısı

Seri numarası Kod Sembol
0 - 31 00000000 - 00011111 0'dan 31'e kadar sayılara sahip semboller genellikle kontrol karakterleri olarak adlandırılır. İşlevleri, ekranda metin görüntüleme veya yazdırma, ses sinyali verme, metni işaretleme vb. Süreçleri kontrol etmektir.
32 - 127 0100000 - 01111111 Tablonun standart kısmı (İngilizce). Bu, Latin alfabesinin küçük ve büyük harflerini, ondalık sayıları, noktalama işaretlerini, her türden parantezleri, ticari ve diğer sembolleri içerir. Karakter 32 bir boşluktur, yani metinde boş konum. Diğerleri belirli işaretlerle yansıtılır.
128 - 255 10000000 - 11111111 Tablonun alternatif kısmı (Rusça). ASCII kod tablosunun kod sayfası olarak adlandırılan ikinci yarısı (10000000'den başlayıp 11111111 ile biten 128 kod) farklı varyantlara sahip olabilir, her varyantın kendi numarası vardır. Kod sayfası öncelikle Latin dışındaki ulusal alfabeleri barındırmak için kullanılır. Rus ulusal kodlamalarında, tablonun bu bölümü Rus alfabesinin sembollerini içerir.

ASCII tablosunun ilk yarısı

Kodlama tablosunda, harflerin (büyük ve küçük harf) alfabetik sırayla ve sayıların değerlerin artan sırasına göre sıralandığına dikkat çekilir. Karakterlerin düzenlenmesindeki bu sözlüksel düzene uyulmasına, alfabenin sıralı kodlanması ilkesi denir.

Bir bilgisayarın temel avantajlarından biri, inanılmaz derecede çok yönlü bir makine olmasıdır. Onunla karşılaşmış olan herhangi biri, aritmetik hesaplamalar yapmanın bir bilgisayar kullanmanın ana yöntemi olmadığını bilir. Bilgisayarlar, müzik ve video filmlerini mükemmel bir şekilde yeniden üretir, onların yardımıyla İnternette konuşma ve video konferans düzenlemek, grafik görüntüler oluşturmak ve işlemek mümkündür ve ilk bakışta bilgisayar oyunları alanında bilgisayar kullanma olasılığı ile tamamen uyumsuz görünüyor. Saniyede yüz milyonlarca basamağı öğüten bir süperaritmometrenin görüntüsü.

Bir nesne veya fenomenin bilgi modelini oluştururken, belirli tanımları nasıl anlayacağımız konusunda anlaşmalıyız. Yani, bilginin sunum türü üzerinde anlaşmak.

Kişi düşüncelerini kelimelerden oluşan cümleler şeklinde ifade eder. Bilginin alfabetik bir temsilidirler. Herhangi bir dilin temeli bir alfabedir - bir mesajın oluşturulduğu herhangi bir doğanın çeşitli işaretlerinden (sembollerinden) oluşan sonlu bir set.

Bir ve aynı giriş farklı anlamlar taşıyabilir. Örneğin, 251299 sayıları şu anlama gelebilir: nesnenin kütlesi; nesnenin uzunluğu; nesneler arasındaki mesafe; telefon numarası; kayıt tarihi 25 Aralık 1999.

Bilgileri temsil etmek için farklı kodlar kullanılabilir ve buna göre belirli kuralları bilmeniz gerekir - bu kodları yazma yasaları, yani. kodlayabilme.

Kod - bilgiyi temsil etmek için bir dizi sembol.

Kodlama - bilgileri bir kod biçiminde sunma süreci.

Birbirimizle iletişim kurmak için bir kod kullanıyoruz - Rusça. Konuşurken, bu kod yazarken seslerle iletilir - harflerle. Sürücü, bip sesi veya yanıp sönen farlarla bir sinyal iletir. Trafik sinyalleri şeklinde karşıdan karşıya geçerken bilgilerin kodlanması ile karşı karşıyasınız. Böylece, kodlama, kesin olarak tanımlanmış kurallara göre bir karakter koleksiyonunu kullanmaya indirgenmiştir.

Bilgi çeşitli şekillerde kodlanabilir: sözlü olarak; yazılı olarak; başka herhangi bir nitelikteki jestler veya sinyaller.

Verilerin ikili kodlaması.

Teknoloji geliştikçe, bilgiyi kodlamanın farklı yolları ortaya çıktı. 19. yüzyılın ikinci yarısında Amerikalı mucit Samuel Morse, bugün hala insanlığa hizmet eden harika bir kod icat etti. Bilgi üç karakterle kodlanmıştır: uzun sinyal (kısa çizgi), kısa sinyal (nokta), sinyal yok (duraklama) - harfleri ayırmak için.

Sistem aynı zamanda hesaplamada da var - buna ikili kodlamave verilerin yalnızca iki karakterden oluşan bir diziyle temsiline dayanmaktadır: 0 ve 1. Bu karakterlere ikili rakamlar, İngilizce - ikili basamak veya kısaltılmış bit (bit).

Bir bit ile iki kavram ifade edilebilir: 0 veya 1 ( evetveya değil, siyahveya beyaz, doğruveya yalanvb.). Bit sayısı ikiye çıkarılırsa, dört farklı kavram zaten ifade edilebilir:

Üç bit ile sekiz farklı değer kodlanabilir:

000 001 010 011 100 101 110 111

İkili kodlama sistemindeki bit sayısını bir artırarak, bu sistemde ifade edilebilecek değerlerin sayısını ikiye katlıyoruz, yani genel formül:

burada N, bağımsız kodlanmış değerlerin sayısıdır;

bu sistemde benimsenen ikili kodlamanın m - bit genişliği.

Kodlama - bir kod biçiminde bilgi sunma süreci, yani bilgiyi temsil etmek için bir dizi sembol.
Kişi düşüncelerini kelimelerden oluşan cümleler şeklinde ifade eder. Bilginin alfabetik bir temsilidirler. Herhangi bir dilin temeli bir alfabedir - bir mesajın oluşturulduğu herhangi bir doğanın çeşitli işaretlerinden (sembollerinden) oluşan sonlu bir set.
Kodlama, kesin olarak tanımlanmış kurallara göre bir dizi karakter kullanmaya indirgenir ve iki ana anlamı vardır:
■ Bir nesne tarafından kabul edilebilir ve anlaşılabilir bir biçimde bilgi sunmanın bir yolu (örneğin, bir bilgisayar),
■ Bilgileri istenmeyen erişim veya dağıtıma karşı korumanın bir yolu.
Kolaylığın evrenselliği ve / veya bir grup insanın bulunduğu yerin (belirli bir kişinin dili) doğal özelliklerinden dolayı bu işlevleri birleştirmek mümkündür.

Menşe tarihi
David Kahn'ın 1967'de yazdığı ancak kriptografi konusunda en zengin bilgi kaynağı olan "The Codebreackers" adlı kitabında elde ettiği ve aktardığı verilere göre, Mısırlıların bilinen ilk "şifreleyicileri" gezegen, MÖ 1900'de. e. evlerinin duvarlarını garip hiyerogliflerle boyamaya başlayanlar. Onların takipçileri, kil tabakları belirli bir anlam taşıyan tuhaf resimlerle süslenmiş Mezopotamyalılardı. MÖ 1500 civarında dekorasyon sanatını incelemeye başladılar. e. Bin yıl sonra, Yahuda Krallığı sakinleri, ilkesi alfabeye dayanan, ancak ters sırayla kitap yazmak için bir tür en basit şifre olan ATBASH'ı icat etti. Bu "dil" ile eski Yahudiler bazı kitaplar yazdılar. Ve daha sonra, kaydedilen bilgileri kodlamak için birkaç yöntem daha icat ettiler.
MÖ 487'de. e. Bazı kaynaklara göre, Yunanlılar, üzerine ince bir deri bantın sarıldığı belirsiz bir şey olan verileri şifrelemek için ilk "cihazı" yarattılar (çalışma prensibi henüz açıklanmadı). Daha sonra, yazılı malzeme şeridi, göreceli olarak, "tambur" dan çıkarıldı ve bir kemer gibi kendi üzerine yerleştirildi. Kodlanmış "mesaj" ın alıcısının "kod çözücüyü" her zaman yanında taşıdığı ve mesajın metnini herhangi bir yerde okuyabileceği varsayılır. Ancak bu özel hikayenin gerçekliği 1998'de tartışıldı ve şimdi birçok kişi bunun sadece bir efsane olduğuna inanıyor.
Yeni ortaya çıkan kriptografinin bir sonraki hayranı Jül Sezar'dı (MÖ 100-44). Yaklaşık M.Ö. ellinci yılında, normal alfabenin bazı harflerini değiştirerek önemli belgeleri kodlama yönteminde ustalaştı ve bunu gizli hükümet yazışmaları için kullandı. Sezar'ın şifresi ATBASH'tan daha basitti, ancak o zamanlar çoğu insanın okuma yazma bilmediği ve gerçekten okumayı bilmediği gerçeğini hesaba katarsak, değerli verileri iletmek için doğru olanıydı. Alfabenin "kendi" harflerini değiştirmeye ek olarak, meraklı davetsiz misafirlerin kafasını tamamen karıştırmak için Sezar'ın Latince ve bazıları Yunanca yazdığı bazı sözcükler.
MS 200'de bir yerlerde. e. Kahn'ın verilerine göre, şifre bazı "Leyden papirüsleri" üzerine "sihirli" tarifler yazmak için kullanıldı. 70'lerin ortalarında. Kriptografi üzerine ilk kitap, Bizans imparatoru için Yunanca kelimeleri kodlamak için bir sistem oluştururken kendisine verilen karardan esinlenerek bir Arap tarafından, yazarının adının uzunluğuna bakılarak yayınlandı, yazıldı. Ve MS 855'te. e. meslektaşı, her türden büyücü ve büyücünün daha sonra notlarını oluşturduğu işaretlerden aynı anda birkaç yeni alfabe sundu.
1226'da Venedik hükümetinden gelen birçok mesaj oldukça orijinal bir şekilde şifrelenmişti - birçok kelimenin ünlüleri nokta ve çarpılarla değiştirildi. Alıcılarının yazılanları nasıl okumayı başardıkları hala belirsiz. Ama yine kriptografiden bahsettiğimiz gerçeği ortada.
1412, oldukça etkileyici bölümlerinden biri kriptografi ve kriptolojiye ayrılmış olan on dört ciltlik Arapça ansiklopediye tarihlenmektedir. Metin mesajlarının kodlanması ve kodunun çözülmesi ilkesine ilişkin veriler sağladı ve ayrıca yazılanları doğru şekilde nasıl yorumlayacağına dair açıklamalarla birlikte ilk bilgilendirici "anahtar tabloları" açıkladı. O zaman bile, bir kelimedeki aynı harfin iki veya daha fazla kullanıldığı durumlar öngörüldü. Şifrelenmiş mektubun olası hırsızını şaşırtmak için, onun yerine geçen işaretler her seferinde farklı şekilde kullanılmıştır.
On altıncı yüzyılın 18. yılında, Johannes Tritemius kriptoloji üzerine ilk basılı baskıyı yayınladı. Her kelimeyi bir sütun dizisinden alınan tek bir harfle değiştirmek için bir yöntem icat etti. Ayrıca alfabenin tüm harfleri yerine tek bir karakteri aynı anda temsil etme fikrini ortaya koydu.
Takip eden yıllarda ve yüzyıllarda, farklı ülkelerden kriptograflar becerilerini geliştirdiler, etraflarındakileri yeni şifreler ve tüm çalışmaları kodlama yöntemleriyle periyodik olarak şaşırttılar. Sadece 1917'de, belki de gerçekten dikkate değer bir olay gerçekleşti. İlk kriptanalist Amerika'da ortaya çıktı. "Amerikan kriptanalizinin babası" William Frederick Friedman'dı. İlk başta eşi ile birlikte Friedman, ABD hükümetine bağlı özel bir laboratuvarda çalıştı ve bir süre sonra Riverbank'ta kendi okulunu açtı. İlk kriptanalistin işlevleri, bilgileri kırmak amacıyla çeşitli kodlama seçeneklerinin incelenmesini içeriyordu. Sistemlerin bazen kusurlu olduğu biliniyor ve William'ın görevi bu eksiklikleri tespit etmekti.
Aynı 1917'de, AT & T'nin bir çalışanı olan Gilbert S. Vernam, verileri kodlamak için ilk gerçekten çalışan ve maksimum "güvenli" cihazı sundu. Anahtar veriler (sıralı olarak yazılan şifre çözme talimatlarının tabloları) rasgele alındı \u200b\u200bve bir daha asla kullanılmadı. Anahtar, tek kullanımlık bir film kasetiydi. Cihaz Birinci Dünya Savaşı sırasında kullanılacaktı, ancak "makine" yalnızca yirmili yıllarda yaygın olarak kullanıldı.

Kodlama, bir bilgisayardaki bilgileri temsil etmek için kullanılır.
Bilgisayar yalnızca sayısal biçimde sunulan bilgileri işleyebilir. Bir bilgisayarda işlenecek diğer tüm bilgiler (örneğin, sesler, görüntüler, enstrüman okumaları vb.) Sayısal forma dönüştürülmelidir. Örneğin, bir müzik sesini sayısallaştırmak için, sesin yoğunluğunu kısa aralıklarla belirli frekanslarda ölçebilir ve her ölçümün sonuçlarını sayısal biçimde sunabilirsiniz. Bilgisayar programları yardımıyla, alınan bilgileri dönüştürebilirsiniz, örneğin, farklı kaynaklardan gelen sesleri birbirinin üzerine "bindirebilirsiniz". Benzer şekilde, metin bilgileri bir bilgisayarda işlenebilir. Bir bilgisayara girildiğinde, her harf belirli bir sayı ile kodlanır ve harici cihazlara (ekran veya baskı) çıktı alınırken, bu sayılar ile insan algısı için harf görüntüleri oluşturulur. Bir dizi harf ve sayı arasındaki yazışmaya karakter kodlaması denir.
Tipik olarak, bir bilgisayardaki tüm sayılar sıfırlar ve birler kullanılarak temsil edilir. Diğer bir deyişle, bilgisayarlar genellikle bir ikili sayı sisteminde çalışır, çünkü işlenmeleri için cihazlar çok daha basittir. Sayıların bir bilgisayara girilmesi ve bunların insan okuması için görüntülenmesi olağan ondalık formda gerçekleştirilebilir ve gerekli tüm dönüştürmeler bilgisayarda çalışan programlar tarafından gerçekleştirilir.
Sayı sistemi, sayıları adlandırmak ve yazmak için bir dizi tekniktir.
Herhangi bir sayı sisteminde, sayıları temsil etmek için bazı semboller seçilir (bunlara sayı denir) ve sayıların geri kalanı, bu sayı sisteminin sayıları üzerindeki herhangi bir işlemin bir sonucu olarak elde edilir.
Herhangi bir konumsal sayı sistemindeki sayılar üzerindeki aritmetik işlemler, ondalık sistemdekiyle aynı kurallara göre gerçekleştirilir, çünkü bunların tümü, karşılık gelen polinomlar üzerinde eylem gerçekleştirme kurallarına dayalıdır. Bu durumda, yalnızca sayı sisteminin verilen P tabanına karşılık gelen toplama ve çarpma tablolarını kullanmanız gerekir.
1. Sayıları ondalık sayı sisteminden P\u003e 1 tabanlı sisteme dönüştürürken, genellikle aşağıdaki algoritma kullanılır:
sayının tamsayı kısmı çevrilirse, P'ye bölünür, ardından bölümün geri kalanı hatırlanır. Ortaya çıkan bölüm tekrar P'ye bölünür, geri kalanı hatırlanır. Prosedür, bölüm sıfıra eşit olana kadar devam eder. P'ye göre bölünmeden kalanlar, alındıkları sıranın tersine yazılır;
sayının kesirli kısmı çevrilirse, o zaman P ile çarpılır, ardından tamsayı kısmı hatırlanır ve atılır. Yeni elde edilen kesirli kısım P, vb. İle çarpılır. Prosedür, kesirli kısım sıfıra eşit olana kadar devam eder. Tüm parçalar, alındıkları sırayla ikili noktadan sonra yazılır. Sonuç, sonlu veya periyodik bir ikili kesir olabilir. Bu nedenle, kesir periyodik olduğunda, kişi çarpma işlemini bir adımda kesmeli ve P tabanına sahip bir sistemde orijinal sayının yaklaşık bir gösterimiyle yetinmelidir.
, .
2. Sayıları P tabanından ondalık gösterime dönüştürürken, tamsayı kısmının basamaklarını sağdan sola, sıfırdan başlayarak ve kesirli kısımda, ondalık noktadan hemen sonraki basamaktan soldan sağa doğru numaralandırmak gerekir. sağ (başlangıç \u200b\u200bnumarası -1). Daha sonra basamakların karşılık gelen değerlerinin çarpımlarının toplamını, basamak sayısına eşit güçteki sayı sisteminin tabanına göre hesaplayın. Bu, orijinal sayının ondalık gösterimidir.


Teknoloji geliştikçe, bilgiyi kodlamanın farklı yolları ortaya çıktı. XIX yüzyılın ikinci yarısında. Amerikalı mucit Samuel Morse, bugün hala kullanılan kodu icat etti. Bilgi üç karakterle kodlanmıştır: uzun sinyal (kısa çizgi), kısa sinyal (nokta), sinyal yok (duraklama) - harfleri ayırmak için.
Bilgisayar teknolojisinin kendi sistemi vardır - buna ikili kodlama denir ve verilerin yalnızca iki karakterden oluşan bir dizi olarak temsil edilmesine dayanır: 0 ve 1. Bu karakterlere İngilizce'de ikili rakamlar denir - ikili rakam veya kısaltılmış bit (bit) .
Bir bit iki kavramı ifade edebilir: 0 veya 1 (evet veya hayır, siyah veya beyaz, doğru veya yanlış, vb.). Bit sayısı ikiye çıkarılırsa, dört farklı kavram zaten ifade edilebilir: 00 01 10 11. Üç - sırasıyla sekiz.
İkili kodlama sistemindeki bit sayısını bir artırarak, bu sistemde ifade edilebilecek değerlerin sayısı N \u003d 2 formülüyle iki katına çıkar ve m üssüne, burada N bağımsız kodlanmış değerlerin sayısıdır, m, ikili kodlamanın bit genişliğidir.

Verilerin ikili kodlaması.
Bilgisayar belleğindeki sayıları temsil etmek için iki ana format vardır. Bunlardan biri tam sayıları kodlamak için kullanılır, ikincisi (sözde kayan nokta gösterimi) gerçek sayıların bir alt kümesini belirtmek için kullanılır.
Bilgisayar belleğinde gösterilebilen tamsayılar kümesi sınırlıdır. Değerlerin aralığı, sayıları tutmak için kullanılan hafıza alanının boyutuna bağlıdır. Bir k-bit hücre, 2k farklı tamsayı değeri depolayabilir.
Bir k-bit makine kelimesinde saklanan pozitif bir N tamsayısının dahili bir temsilini elde etmek için, N sayısını bir ikili sayı sistemine dönüştürmek ve sonuçta ortaya çıkan sonucu, önemsiz sıfırlar ile k bitlere eklemek gerekir.
Örneğin, 2 baytlık bir hücrede 1607 tamsayısının dahili temsilini elde etmek için, sayıyı ikili sisteme dönüştürmeniz gerekir: 160710 \u003d 11001000111 (2). Bu sayının hücredeki dahili temsili aşağıdaki gibi olacaktır: 0000 0110 0100 0111.
Negatif bir tamsayının (-N) dahili temsilini yazmak için, pozitif bir N sayısının dahili temsilini almanız, 0'ı 1 ile 1'i 0 ile değiştirerek bu sayının ters kodunu almanız ve elde edilen sonuca 1 eklemeniz gerekir. numara.
Gerçek bir sayının kayan nokta kodlaması, farklı algoritmalar kullanır.

Metin kodlaması.
Metin yazarken kullanılan semboller setine alfabe denir. Alfabedeki karakterlerin sayısı onun kardinalitesi olarak adlandırılır.
Bilgisayardaki metinsel bilgileri temsil etmek için en çok 256 karakter kapasiteli bir alfabe kullanılır. Böyle bir alfabeden bir karakter, 28 \u003d 256 olduğundan, 8 bit bilgi taşır. Her karakterin ikili kodu (8 bit), bilgisayar belleğinin 1 baytını kaplar.
Bu alfabenin tüm karakterleri 0 ile 255 arasında numaralandırılmıştır ve her sayı 00000000 ile 11111111 arasında 8 bitlik bir ikili koda karşılık gelir. Bu kod, ikili sayı sistemindeki karakterin sıra numarasıdır.
Farklı bilgisayar türleri ve işletim sistemleri için, kod tablosundaki alfabe karakterlerinin yerleştirilme sırasına göre farklılık gösteren farklı kodlama tabloları kullanılır. Daha önce bahsedilen ASCII kodlama tablosu, kişisel bilgisayarlar için uluslararası standarttır.
Alfabenin sıralı kodlama ilkesi, ASCII kod tablosunda Latin harflerinin (büyük ve küçük harf) alfabetik sırada düzenlenmesidir. Sayıların konumu da artan değer sırasına göre sıralanır.
Bu tabloda sadece ilk 128 karakter standarttır, yani sıfırdan (ikili kod 00000000) 127'ye (01111111) kadar sayıları olan karakterler. Bu, Latin harflerini, sayıları, noktalama işaretlerini, köşeli parantezleri ve diğer bazı sembolleri içerir. 128 (ikili kod 10000000) ile başlayan ve 255 (11111111) ile biten kalan 128 kod, ulusal alfabelerin harflerini, sözde grafik sembolleri ve bilimsel sembolleri kodlamak için kullanılır.

Grafik bilgi kodlaması.
Video belleği, ekranda görüntülenen görüntü hakkında ikili bilgiler içerir. Bir bilgisayarda oluşturulan, işlenen veya görüntülenen hemen hemen tüm görüntüler iki büyük bölüme ayrılabilir - raster ve vektör grafikler.
görüntüler, piksel adı verilen tek katmanlı bir nokta ızgaradır (İngilizce resim öğesinden piksel). Piksel kodu, rengiyle ilgili bilgileri içerir. Siyah beyaz bir görüntü için (yarı tonlar olmadan), bir piksel yalnızca iki değer alabilir: beyaz ve siyah (yanık - yanmaz) ve onu kodlamak için bir bit bellek yeterlidir: 1 - beyaz, 0 - siyah.
Renkli bir ekrandaki bir piksel farklı renklere sahip olabilir, 2'yi n renkli görüntünün gücüne kodlamak için piksel başına t bit gerekir, çünkü bunlar 2'nin n farklı durumun gücüne sahip olabilir. Temel renklerin ışıltısının yoğunluğunu (parlaklığını) kontrol edebiliyorsanız, çeşitli tonlara yol açan kombinasyonlarının farklı varyantlarının sayısı artar. Örnek olarak, aşağıdaki renk kodlama seçeneği kullanılabilir: 00 - siyah, 10 - yeşil, 01 - kırmızı, 11 - kahverengi.
RGB monitörlerde, temel renkler - kırmızı (Kırmızı), yeşil (Yeşil), mavi (Mavi), bunlardan 8 kombinasyon elde edilebilen çeşitli renkler elde edilir.
- model. - model.
Bit sayısına bağlı olarak renk tabloları da vardır.
Bir vektör görüntüsü, temel çizgiler ve yaylardan oluşan bir grafik nesnedir. Tarama grafiklerinin aksine, bir vektör görüntüsü katmanlıdır. Bir vektör görüntüsünün her bir öğesi - bir çizgi, dikdörtgen, daire veya metin parçası - pikselleri diğer katmanlardan bağımsız olarak ayarlanmış kendi katmanında bulunur. Bir vektör görüntüsünün her bir öğesi, özel bir dil (çizgi, yay, daire vb. Matematiksel denklemleri) kullanılarak tanımlanan bir nesnedir. Karmaşık nesneler (kesik çizgiler, çeşitli geometrik şekiller), temel grafik nesnelerinin bir koleksiyonu olarak temsil edilir. Bir vektör görüntüsünün nesneleri, raster grafiklerin aksine, boyutlarını kalite kaybı olmadan değiştirebilir (bir tarama görüntüsünü artırırken, grenlilik artar). Görüntünün temel öğesi bir çizgidir. Herhangi bir nesne gibi, özellikleri vardır: şekil (düz, eğri), kalınlık, Renk, stil (kesikli, düz). Kapalı çizgiler, doldurma özelliğine sahiptir (başka nesnelerle veya seçilen bir renkle). Diğer tüm vektör grafik nesneleri çizgilerden oluşur.
Vektör grafikleri gibi matematiksel hesaplamalara dayalı fraktal grafikler de vardır. Ancak vektörün aksine, temel öğesi matematiksel formülün kendisidir. Bu, bilgisayarın belleğinde hiçbir nesnenin depolanmamasına ve görüntünün yalnızca denklemlerle oluşturulmasına yol açar. Bu yöntemi kullanarak, en basit normal yapıları ve manzaraları taklit eden karmaşık çizimleri oluşturabilirsiniz.

Ses kodlaması.
Ses, havanın titreşimleridir. Sesi bir elektrik sinyaline dönüştürürseniz (örneğin, bir mikrofon kullanarak), voltajın zaman içinde yumuşak bir şekilde değiştiğini görebilirsiniz. Bilgisayar işleme için, böyle bir analog sinyal, bir ikili sayılar dizisine dönüştürülür.
Voltaj düzenli aralıklarla ölçülür ve elde edilen değerler bilgisayar belleğine kaydedilir. Bu işleme örnekleme (veya sayısallaştırma) adı verilir ve bunu gerçekleştiren cihaz, analogdan dijitale dönüştürücüdür (ADC).
Bu şekilde kodlanan sesi yeniden üretmek için, ters dönüşümü (bunun için dijitalden analoğa dönüştürücü - DAC kullanılır) gerçekleştirmeniz ve ardından elde edilen adım sinyalini yumuşatmanız gerekir.
Örnekleme oranı ne kadar yüksekse (yani, saniyedeki örnek sayısı) ve her örnek için ne kadar fazla rakam tahsis edilirse, ses o kadar doğru temsil edilecektir. Ancak bu aynı zamanda ses dosyasının boyutunu da artırır. Bu nedenle, sesin doğasına, kalitesi için gerekliliklere ve kullanılan bellek miktarına bağlı olarak bazı uzlaşma değerleri seçilir. Ses bilgisini kodlamanın bu yöntemi oldukça çok yönlüdür, herhangi bir sesi temsil etmenize ve çeşitli şekillerde dönüştürmenize olanak tanır.
İnsan uzun zamandır müziği sunmanın oldukça kompakt bir yolunu kullanıyor - müzik notasyonu. İçinde, özel semboller sesin ne kadar yüksek olduğunu, hangi enstrümanın ve nasıl çalınacağını gösterir. Özel bir resmi dilde yazılmış bir müzisyenin algoritması olarak düşünülebilir. 1983'te, önde gelen bilgisayar ve müzikal sentezleyici üreticileri, böyle bir kodlama sistemini tanımlayan bir standart geliştirdiler. MIDI adını aldı.
Böyle bir kodlama sistemi tüm seslerin kaydedilmesine izin vermez, yalnızca enstrümantal müzik için uygundur, ancak avantajları vardır: son derece kompakt kayıt, bir müzisyen için doğallık (hemen hemen her MIDI editörü, müzikle sıradan notalar şeklinde çalışmanıza izin verir) , enstrüman değiştirme kolaylığı, tempoyu değiştirme vb. melodinin anahtarı.
Müzik kaydetmek için başka tamamen bilgisayar formatları da vardır. Bunların arasında, müziğin çok yüksek kalitede ve sıkıştırma oranıyla kodlanmasına izin veren MP3 formatı not edilmelidir. Aynı zamanda, 18-20 müzik bestesi yerine, standart bir kompakt disk (CDROM) yaklaşık 200'e sığar. Bir şarkı yaklaşık 3,5 Mb alır, bu da İnternet kullanıcılarının müzik bestelerini kolayca değiş tokuş etmesine olanak tanır.