Bilgi miktarı. Bilimsel inceleme. teknik bilim

  • 24.04.2019

Bilgiyi ölçmek için çeşitli yaklaşımlar vardır.

kombinatoryal ölçü

Daha iyi anlamak için birkaç basit örneğe bakalım.

Örnek vermek 1 . Hadi bir deney yapalım. Bir zar alalım. Her birinde birden altıya kadar sayılar bulunan altı kenarı vardır.

Hadi yukarı fırlatalım. Bir zar atıldığında, zarın kenarlarındaki sayılardan biri gelir. Bu şekilde elde edilen sayı, deneyimlerimizin sonucudur.

Kalıbı herhangi bir sayıda atarak, yalnızca altı olası sayı elde edebiliriz. Bunu N = 6 olarak gösterelim.

Bu örnek, bir kombinatoryal bilgi ölçüsü kavramına geçmemize ve aşağıdaki tanımı vermemize izin verir:

Bilginin birleşimsel ölçüsü N, olası kombinasyonların sayısını tahmin ederek bilgi miktarını ölçmenin bir yoludur. bilgi öğeleri.

Zarlı örnekte deneyin sonucu için yalnızca altı seçenek, başka bir deyişle altı kombinasyon olduğundan, birleşim ölçüsüne göre bilgi miktarı N = 6 kombinasyondur.

Aşağıdaki örneği düşünün.

Örnek vermek 2. Ondalık basamaklardan biri, örneğin 8 sayısı ve onaltılık basamaklardan biri, örneğin 6 sayısı (başka bir onaltılık - 8, B, F, vb. Alabilirsiniz) verilsin. Şimdi, bir kombinatoryal ölçü tanımına göre, bu rakamların her birinde bulunan bilgi miktarını belirliyoruz. 8 sayısı ondalık olduğundan ve bu nedenle on karakterden birini temsil ettiğinden, N 8 = 10 kombinasyon. Benzer şekilde, 6 sayısı on altı karakterden birini temsil eder ve bu nedenle N 6 = 16 kombinasyon. Bu nedenle, onaltılık bir basamak, ondalık bir basamaktan daha fazla bilgi içerir.

Ele alınan örnekten, sayı sisteminin tabanında ne kadar az basamak varsa, öğelerinden birinin o kadar az bilgi taşıdığı sonucuna varabiliriz.

İkili logaritmik ölçü

İngiliz mühendis R. Hartley, bilgi miktarını ikili bir logaritmik ölçü ile ölçmeyi önerdi:

burada N, bilgi öğelerinin farklı kombinasyonlarının sayısıdır. Bu ölçümde bilgi ölçü birimi birazdır.

R. Hartley tarafından türetilen formül, olası N kombinasyonlarının sayısını hesaba kattığından, yukarıda ele alınan örnekler için hangi bilgi miktarı tahmininin ikili bir logaritmik ölçü verdiğini bilmek ilginçtir.

Hesaplama aşağıdaki sonuçları verir:

küp örneğinde I = log 2 6 = 2.585 bit;

ile örnekte ondalık sistem hesap I = log 2 10 = 3.322 bit;

onaltılık örnekte, I = log 2 16 = 4 bit;

ikili örnekte, I = log 2 2 = 1 bit.

Son hane, her hanede İkili sistem hesap bir bit bilgi içerir. Genel olarak, teknik sistemlerde, iki olası durumu kodlamak için ikili sayı sistemi kullanılır, örneğin, 1 ağda elektrik akımının varlığını gösterir, 0 - yokluğunu.

Yukarıda ele alınan tüm örneklerde, deneylerin sonuçları eşit derecede muhtemel ve karşılıklı olarak bağımsızdı. Bu, bir zar atıldığında, altı yüzün her birinin aynı başarılı sonuç olasılığına sahip olduğu anlamına gelir. Ayrıca bir sonraki atışın sonucu bir önceki atışın sonucuna bağlı değildir.

Gerçek hayatta eşit derecede olası ve birbirinden bağımsız olaylar oldukça nadirdir. Rusça gibi konuşulan dillere dikkat ederseniz, ilginç sonuçlar çıkarabilirsiniz. Bilgisayar bilimindeki teorik çalışmaları basitleştirmek için, genellikle Rus alfabesinin 32 karakterden oluştuğu kabul edilir (e ve ё ile ь ve ъ birbirinden farklı değildir, ancak kelimeler arasına boşluk karakteri eklenir). Rus dilinin her harfinin mesajda eşit sıklıkta göründüğünü ve her harften sonra başka herhangi bir karakterin olabileceğini varsayarsak, o zaman Rus dilinin her bir karakterindeki bilgi miktarını şu şekilde belirleyebiliriz:

ben = günlük 2 32 = 5.

Ancak, aslında, her şey öyle değil. Tüm konuşulan dillerde, bazı harfler diğerlerinden daha yaygındır. Araştırmalar, 1000 harf başına aşağıdaki sayıda tekrar olduğunu söylüyor:

Ayrıca, tek tek harflerin görünme olasılığı, hangi harflerin onlardan önce geldiğine bağlıdır. Yani, Rusça'da yumuşak bir işaret bir sesli harfi takip edemez, arka arkaya dört sesli harf duramaz vb. Herhangi bir konuşma dilinin kendine has özellikleri ve kalıpları vardır. Bu nedenle, herhangi bir karakterden oluşturulan mesajlardaki bilgi miktarı konuşulan dil, kombinatoryal veya ikili logaritmik ölçümlerle tahmin edilemez.

Bilginin yapısal ölçüsü

Yapısal bilgi ölçütlerini kullanırken, yalnızca mesajın ayrık yapısı, içerdiği bilgi öğelerinin sayısı ve bunlar arasındaki bağlantılar dikkate alınır.

saat yapısal yaklaşım farklılık:

1) Geometrik ölçü - bir geometrik modelin parametresinin ölçülmesini içerir bilgi mesajı(uzunluk, alan, hacim…) ayrık birimlerde.

Modelin bilgi kapasitesi - mümkün olan maksimum bilgi miktarı - tüm ölçümler (koordinatlar) için ayrık değerlerin toplamı olarak tanımlanır.

2) Kombinatoryal ölçü - elemanların kombinasyonlarının sayısı olarak tanımlanan bilgi miktarı.

3) Toplamsal ölçü - (Hartley ölçüsü) - bilgi miktarı ikili birimler - bit olarak ölçülür.

Kullanılan kavramlar:

Derinlik q sayı - bilgiyi temsil etmek için kabul edilen karakter sayısı. Herhangi bir zamanda sadece bir sembol gerçekleştirilir.

Bir sayının uzunluğu n, belirli bir değerin sayılarını temsil etmek için gerekli ve yeterli olan konumların sayısıdır.

Bir sayının derinliği ve uzunluğu verildiğinde, temsil edilebilecek sayıların sayısı N = qn'dir.

Logaritmik değer: I = log2N =n log2q (bit) - Hartley ölçüsü.

Böylece işaret sistemi ile kodlanmış bir mesajın içerdiği bilgi miktarı, bir karakterin taşıdığı bilgi miktarının karakter sayısı ile çarpımına eşittir.

Bilgi miktarının bir birimi, belirsizliği yarı yarıya azaltan bir mesajı içeren bilgi miktarı olarak alınır. Bu vuruş.

Yapısal- bilgi dizilerinin ayrık yapısını ve bilgi öğelerinin basit sayımıyla ölçümlerini dikkate alır. (En basit dizi kodlaması kombinatoryal yöntemdir.)

Bilginin yapısal önlemleri

Yapısal önlemler yalnızca bilginin ayrık yapısını dikkate alır. Elementler bilgi kompleksi kuantum - bölünmez bilgi parçalarıdır. Ayırmak geometrik, kombinatoryal Ve katkı miktar.

bilgi tanımı geometrik Yöntem, kuanta sayısındaki bilgi kompleksinin geometrik modelinin çizgi uzunluğunun, alanının veya hacminin bir ölçümüdür. Verilen yapısal boyutlardaki olası maksimum kuantum sayısı, sistemin bilgi kapasitesi. Bilgi kapasitesi, eksiksiz bir bilgi dizisindeki niceliklerin sayısını gösteren bir sayıdır. Şek. 1.2 G, Bilgi miktarı m karmaşık x(T,N) tanımlı geometrik yöntem, eşittir

X, T,N- ayrık okumaların yapıldığı aralıklar.

İÇİNDE kombinatoryal en azından bilgi miktarı, eleman kombinasyonlarının sayısı olarak hesaplanır. Olası veya uygulanmış kombinasyonlar burada dikkate alınır.

Birçok durumda, ayrı bir mesaj belirli sayıda öğeden oluşan bir kelime olarak görülebilir. n, tarafından alfabetik T harf öğeleri. Verilen alfabeden oluşturulabilecek farklı mesaj sayısını belirleyelim. Mesaj iki öğeden oluşuyorsa ( n= 2), toplamda farklı mesajlar olabilir. Örneğin, on basamak (0, 1, 2, ..., 9) yüz tane oluşturabilir. çeşitli sayılar 0'dan 99'a. Elemanların sayısı üç ise, farklı mesajların sayısı eşittir vb.

yani sayı olası mesajlar tanımlı:

nerede L- mesaj sayısı; P bir kelimedeki eleman sayısıdır; T- alfabe.

Daha fazla L, her mesaj diğerlerinden o kadar farklı olabilir. Değer L bilgi miktarının bir ölçüsü olarak alınabilir. Ancak, seçim L bilgi miktarının bir ölçüsü olarak uygunsuzluklarla ilişkilidir: ilk olarak, ne zaman L=1 mesajın doğası önceden bilindiği için bilgi sıfıra eşittir (yani bir mesaj vardır, ancak bilgi sıfıra eşittir); ikincisi, bilgi miktarının doğrusal olarak eklenmesi koşulu karşılanmaz, yani. katkı durumu. Örneğin, ilk kaynak farklı mesajlarla ve ikincisi - ile karakterize edilirse, iki kaynak için toplam farklı mesaj sayısı ürün tarafından belirlenir.

1

Makale, logaritmik bilgi ölçüsünü belirlemek için bir model sunmaktadır. yapıdan teknik sistem bir nesne seçilir ve olasılıksal hatası ve çalışma durumları göz önünde bulundurulur. Durumlar eşit derecede olası olduğunda, Hartley ölçüsünün ve denk olmayan durumlar için, eğer karşılıklı olarak bağımsızlarsa, bir ve birçok nesne için Shannon ölçüsünün kullanılması önerilir. Model, yalnızca bir nesne için bilgi ölçüsü belirleme olasılığını hesaba katar. Tüm nesne durumları iki sınıfa ayrılır. Seçilen sınıfların her biri, eşit derecede olası olmayan olayların akışına ilişkin veriler temelinde oluşturulur. Her nesne durumu sınıfı için, toplam ve genelleştirilmiş işlerlik ve başarısızlık olasılıkları belirlenir. Bu olasılıklar, elde edilen matematiksel ifadeler bilgi belirsizliğinin ölçüsünü belirlemek için. Elde edilen formüllerin hem toplam olasılık hem de genelleştirilmiş olasılık kullanıldığında aynı ve uygulanabilir olduğu gösterilmiştir.

teknik nesnenin durumu

entropi

logaritmik bilgi ölçüsü

1. Vilchinskaya O.O., Gataullin I.N., Golovinov S.O. ve diğerleri Teknik bir sistemin yapısındaki bilgi miktarının belirlenmesi // Bilişim teknolojisi: gelişmenin öncelikli yönleri. Kitap. 5: monografi. - Novosibirsk: CRNS - Sibprint Yayınevi, 2010. - 261 s.

2. Dulesov A.Ş., Semenova M.Yu., Khrustalev V.I. Teknik bir sistemin entropisinin özellikleri // Basit Araştırma. - 2011. - No. 8 (bölüm 3). - S. 631-636.

3. Dulesov A.Ş., Uskova E.A. Hartley ve Shannon yaklaşımlarının teknik sistemlerde bilgi miktarını belirleme sorunlarına uygulanması // Sorular modern bilim ve uygulamalar. Üniversite. VE. Vernadsky. - 2009. - No. 2 (16). - S. 46-50.

4. Dulesov A.Ş., Uskova E.A. Tahmin için Hartley formülünün uygulanması yapısal bağlar teknik sistemlerin güvenilir işleyişini sağlama görevindeki unsurlar // Modern bilim ve uygulama soruları. Üniversite. VE. Vernadsky. - 2009. - No. 6 (20). - S. 37-41.

5. Kuznetsov N.A. Teknik ve canlı sistemlerde bilgi etkileşimi // bilgi süreçleri. - 2001. - T. 1. - Hayır. 1. - S. 1-9.

Tanıtım. Karmaşık teknik sistemler, aralarında bakım da bulunan bir dizi gereksinime tabidir. yüksek seviye güvenilirlik (işlerlik). Son derece güvenilir sistemler, kural olarak, zamanında ortadan kaldırmak için izleme ve teşhise tabidir. olası problemler, oluşumu olasılıklı bir yapıya sahiptir. Genel olarak, sistematik izleme, sistemin durumuna ilişkin genel bir resim elde etmenizi sağlar. Elinde bulundurarak, sistemin istikrarlı davranışını sürdürmeyi, güvenilirlik seviyesini korumayı ve böylece sibernetik sorununu çözmeyi amaçlayan çözümler geliştirmek mümkündür. Ek olarak, sistemin zaman ve mekandaki "hareketini" izleyerek, evrimini veya yaşlanmasını yargılayabilir, ancak zaten sinerji açısından.

Teknik sistemlerde doğal bir süreç, "belirsizlik" gibi bir kavramla ayrılmaz bir şekilde bağlantılı olan yaşlanmadır. Süreç analizi ve sistem bakımı için birçok metodolojik yaklaşım vardır. Bunlardan biri bilgi teorisinin kullanımına dayanmaktadır ve bir bilgi belirsizliği ölçüsü (entropi) elde etme probleminin çözümü ile ilgilidir. Buna karşılık, değer bilgi entropisi olası alternatifler arasında bir seçim ölçüsü olarak hizmet eder.

Bilgi teorisinde kendi buldu pratik kullanım Sonlu uzunluktaki deterministik süreçlerin ölçülmesine izin veren Hartley ölçüsü ve analizi olasılıksal-istatistiksel yöntemleri kullanan herhangi bir sürenin süreçleri olan Shannon ölçüsü. Her iki önlem de bilgi teorisinin yapısal ve istatistiksel yönlerine dahil edilmiştir.

Teknik bir nesnenin çalışması sırasında, kontrol alt sistemi, bir dizi istatistiksel verinin oluşturulduğu sistemin durumu hakkında sinyaller veya mesajlar iletir. Bilgi teorisindeki uygulamaları ve eğilimleri, bilgi analizinin temelini oluşturabilir.

Bilgi ölçüsünü belirleme modeli. Teknik bir sistem, elemanların ve aralarındaki bağlantıların bulunduğu bir blok diyagram olarak temsil edilebilir. Güvenilirliğin değerlendirilmesi açısından, yapıya göstergeler eklenir: elemanın restorasyon süresi, arızaların sıklığı, vb. Bunlara dayanarak, elemanın arıza olasılığı ve arızasız çalışması belirlenir. Göstergelerin çoğu, sistemin davranışındaki belirsizliğin varlığından dolayı doğaları gereği olasılıklıdır. Bir bilgi belirsizliği ölçüsünün uygulanması, etkili araç teknik sistemin durumunu, unsurlarını ve yapısını değerlendirmek. Bu önlemi teknik sistemlerde kullanma olanakları eserlerde bulunabilir. Durumdaki bir değişiklik, biri sistemdeki enerjinin (kaynakların) transferi ile ilgili olan fonksiyonların performansını etkiler. Temelli fonksiyonel özellikler sistem, durumu değerlendirmek için en az iki seçenek (yapıdaki değişiklikler) mümkündür. Birincisi akış süreci ile ilgili değildir, ikincisi ise akışların yönünü dikkate alır. blok diyagram sistemler. Ayrıca, bir model oluştururken ilk seçeneği dikkate alacağız.

Bir sistemin yapısal içeriğini ölçmek için en basit model, bir mesajda bulunan bilgi miktarının hesaplanmasını öneren Hartley'in yaklaşımıdır. Bizim durumumuz için, sistemin ve öğelerinin her birinin iki bağımsız ayrık durumdan birinde olabileceğini varsayacağız: çalışabilir ve çalışamaz. Daha sonra elemanlardan gelen bilgilerin sinyaller şeklinde izleme ve kontrol sistemine girdiği varsayılabilir. ayrık form: 0 - sistem öğesi çalışmıyor (çalışamaz durumda); 1 - eleman çalışıyor (çalışır durumda). Öğenin şu veya bu durumda geçirdiği zamanla ilgilenmediğimizi varsayarsak, toplam sayının tamamı olası durumlar elemanlar aşağıdaki formülle ifade edilecektir:

burada: k = 2 - bir elemanın veya sistemin olası durumlarının sayısı; n, incelenen sistemdeki eleman sayısıdır.

Formül (1)'de toplam durum sayısı (kombinasyonlar) N, elemanlardan gelen eşit derecede olası ve bağımsız sinyallerden oluşan mesaj sayısıdır. n elementlerinin sayısı arttıkça, N kombinasyonlarının sayısı da artar. Bu nedenle, N Hartley değeri, bilgi miktarının ölçüsünün belirlenmesinde temel olarak kullanılmıştır. (1)'e göre belirlenir en yüksek miktar sistem durumları. Gerçek bir durumda (belirli bir süre için, örneğin bir yıl için), durum sayısı her zaman N'den az olacaktır. Sistemin durumuyla ayrı zaman aralıklarında ilgilenebileceğimiz için, böyle bir (1)'e göre bilgi miktarı, aşağıdakiler için uygun değildir: pratik kullanım. Hartley, mesajlarda içerdiğim bilgi miktarının N'nin bir fonksiyonu olması gerektiğini, yani I = f(N) olduğunu varsayarak bir çözüm buldu. n öğelerinin sayısı bir üs olduğundan, I'yi belirlemek için logaritmik işlev kullanılır:

Durum sayısı k ve logaritmanın tabanı 2'ye eşit alındığından, bu koşullar altındaki bilgi miktarı bir birim olarak alınır ve buna "bit" (ikili birim) denir.

Sistemdeki faktörlerin ortaya çıkması, karşıt durumdan bağımsız olan durumlarından birinin veya diğerinin ortaya çıkmasına neden olur. Devletin bağımsızlık koşulu şunu gösterir: Genel bilgi, (2)'ye göre, bireysel bilgilerin toplamına eşit olacaktır ve . Burada ve sırasıyla sistem elemanlarının çalışması ve arızası ile ilgili durum sayılarıdır. toplam sayısı

Örneğin, sistemde her biri iki durumdan herhangi birinde olabilen iki öğeyi ele alırsak, o zaman 3 öğe için - N = 8.

(3) ifadesinin logaritmasını alarak, şunu elde ederiz:

bu, Hartley bilgi ölçüsünün toplamsallık özelliğini kanıtlar. Bu önlem sistemin sonlu bir küme oluşturan eş olasılıklı durumlara sahip olması koşuluyla geçerlidir .

Başlangıç ​​kümesinin sonlu olması koşuluyla, sistem yapısının ayrık içeriğini arama problemleriyle ilgili olarak Hartley ölçüsünün olanaklarını genişletelim.

Sistemin sadece iki durumu dikkate alındığından - operasyonel ve arızalı, bunlar iki sınıf denkliği oluştururlar (bkz. ifade (4)). Ayrıca, teknik sistemin öğelerinin her birinin yalnızca iki denklik sınıfıyla ilgili durumlar ürettiğini varsayıyoruz.

Eleman sayısını hesaba katarsak , o zaman (1)'e göre elde edilen ölçü logaritmik Hartley ölçüsü ile çakışacaktır:

(5)'ten bit cinsinden bilgi miktarının sistem elemanlarının sayısına eşit olduğu görülebilir. Bu nedenle, eşit olasılıklı ve karşılıklı olarak bağımsız element durumları için, bilgi miktarı aşağıdaki formülle ifade edilebilir:

Bu nedenle, sistemdeki öğelerin varlığında ve eşit olasılıklı durumlarda (6) ifadesi, Hartley bilgisinin logaritmik bir ölçüsüdür.

(6)'da durumlar (çalışma ve arıza) birleştirilir. Bununla birlikte, karşıt durumları ayırmak arzu edilir, çünkü birleştiklerinde, bir bilgi ölçüsü aracılığıyla güvenilirlik düzeyini değerlendirmenin anlamı kaybolur. Ayrıca durumların her birinde bir eleman bulma olasılıkları eşdeğer değildir. En önemli görev, bir elemanın veya sistemin yüksek düzeyde güvenilirliğini korumak olduğundan, pratikte sağlıklı bir durum olasılığı her zaman karşı olasılıktan daha yüksek olacaktır. Bilgilerin birleştirilmesini önlemek için (sistemin güvenilirliği değerlendirilirken özünde zıt), her bir denklik sınıfı ayrı ayrı ele alınmalıdır.

Bir öğe veya sistem için durumların varlığının tekdüze olmaması, bizi Shannon'ın formülünü kullanmaya zorlar. İkincisi, belirli bir denklik sınıfındaki bir öğenin durumunun mevcudiyetinin veya olasılıksal mevcudiyetinin belirsizliğinin bir ölçüsüdür. Aşağıdaki örnekte bir formül elde etmeyi düşünün.

Örneğin, bir teknik sistemin güvenilirliği değerlendirilirken, elemanlarının durumları uzun zaman aralıklarında (bir yıl veya daha fazla) dikkate alınır. Seçilen bir zaman aralığında, durumlar birbirini takip ederek bir olaylar akışı oluşturarak değişir. Bu akışta, olayların her biri türü (arıza veya çalışma), meydana gelme ve bitiş zamanı ve ayrıca diğer göstergelerle karakterize edilir. Bu durumlar, görevlerinden biri yüksek düzeyde sistem performansını korumak olan kontrol gövdesine kaydedilir. Bu sorunu çözerken (bizim durumumuzda, bilgi miktarını belirleyerek), mevcut olay akışı, olaylar belirli bir i-inci öğeye veya sistemin kendisine atıfta bulunularak sınıflandırılır. Bu nedenle, bir olay akışına sahip olan öğelerden biri için, her birinin ortaya çıkma olasılıklarını belirlemek mümkündür: pi ve qi - i-inci öğeyi çalışabilir ve çalışamaz bir durumda bulma olasılığı. Aynı türden olayların meydana gelme olasılıkları, toplam olasılığı, pi + qi = 1'i oluşturur. Daha sonra, bir öğede yer alan denk olmayan ve karşılıklı olarak bağımsız olaylar için bilgi miktarı Shannon formülü ile belirlenir:

Sistemin elemanlarının birbirinden bağımsız çalıştığını düşünürsek, Shannon formülüne göre bilgi şu şekilde tanımlanabilir:

(8)

(8)'deki olasılıklar logaritmadan önceki logaritmanın kendisinin değerinin ortalamasıdır. Durumları türlerine göre ayırmazsak, bu ifade şu şekilde yeniden yazılabilir:

(9)

koşul altında В (9) - tüm n elementin olaylarının meydana gelme olasılığının ortalama değeri.

Ancak (8), elemanlar arasındaki ilişkilerin varlığından dolayı çok az kullanışlıdır ve bu nedenle, elemanların durumları sistemin kendisinin durumlarını belirleyecektir. Görev, sistemde bulunan bilgi miktarını belirlemekse, belirli koşulların yerine getirilmesini gerektirecektir: 1) uzun bir süre boyunca sistemin durumları hakkında toplu verilere sahip olunmalıdır; 2) öğelerin her biri hakkında veriye sahip olmak. Örneğin ikinci koşuldan yola çıkılarak, çalışmada sunulan sonuçlara dayalı olarak problemin çözümü elde edilebilir. Ayrıca, sistemi değerlendirme dışı bırakarak, yalnızca bir öğe için bilgi ölçüsü belirleme olanaklarını ele alacağız.

Daha sonra, yalnızca bir öğe (nesne) için bilgi ölçüsünü belirleme olasılıklarını ele alıyoruz. İÇİNDE bu durum p + q = 1 koşulu altında (7) ifadesini kullanmak adil olacaktır. O zaman maksimum bilgi p = q'da elde edilir ve 1'e eşit olur.

Bilgi ölçüsünü belirleme ifadelerinde, 2 tabanına logaritmanın uygulanmasının geçerliliği, tüm eleman durumları kümesinin iki denklik sınıfına bölünmesiyle açıklanır: sağlıklı durumlar ve olasılıkları birinci sınıf k1'e, çalışmaz - ikinci sınıf k2'ye atfedilecektir. Her iki denklik sınıfı, m = G + L durumlarının tamsayısını içerir; burada G, sağlık durumlarının sayısıdır, L, bir sistem öğesinin çalışamazlığıdır. Birinci sınıfta, toplam olasılığa sahip bir G durumu kümesi vardır, ikinci - L toplam olasılığa sahip.Böylece, her sınıf ayrı eşit olmayan durumlara bölünür.

Her birinin kendi eşit olmayan olası durumlar kümesine sahip olduğu 2 eşdeğer sınıfı seçtikten sonra, (7)'ye göre bilgiler şu ifadeyle belirlenebilir:

şartıyla , (11)

pg ve ql, sırasıyla g-th çalışabilir ve l-th çalışamaz durumlarının olasılığıdır, (m = G + L), elemanın toplam durum sayısıdır. İfadeler (7) ve (10) aynıdır ve olayların akışı veya önceden genelleştirilmiş istatistiksel veriler izlenerek veriler elde edildiğinde uygulanabilir. Elemanın durumlarının olasılıkları eşitse - pg = ql, (örneğin, pg = ql = 0.125 ve G = L = 4) ifadeye (10) göre ve (11) koşuluna bağlı olarak, elde ederiz. maksimum değer bilgi I* = 1, oysa (8) - I = 3'e göre, eğer olasılıklar eşitse, ilk değer bir elemanda bulunan bilginin maksimum değeri anlamına gelir, ikincisi - bağımsız olarak çalışan 3 elemanda. İkinci durumda, (8)'in kullanımı yasa dışıdır.

Güvenilirlik düzeyini hesaplama pratiğinde genellikle analist, istatistiksel verilerin mevcudiyetine güvenir. Aynı zamanda, hazır genelleştirilmiş değerler alabilir veya çalışma deneyimi biriktirerek olayların akışını dikkate alabilir, böylece bir dizi olasılık elde edebilir ve olasılık toplama teoremine dayanarak toplam değeri bulur ve buna göre , toplam q. Bu değerleri (7) ile değiştirerek, bir elemanda bulunan bilgi miktarını belirleyebilir.

Bu nedenle, ifade (10), çalışabilir ve çalışamaz durumlara bölünmeyi hesaba katarak, bir öğede bulunan bilgilerin belirsizliğinin logaritmik bir ölçüsüdür.

Bir belirsizlik ölçüsü elde etmede bir özelliğe daha dikkat ediyoruz. Bu, Shannon'ın formülünün, eş olasılı olaylar için Hartley'nin (3)-(6) formülleriyle tutarlı olmasıyla ilgilidir. Eşit olmayan durumların (olayların) akışını düşünürsek, o zaman (3)'ü hesaba katarak, sınıfların her birinin genelleştirilmiş olasılıkları Shannon'a göre şu şekilde bulunur:

ve (12)

Onlarla tanım olasılık çarpma teoremi çalışır, çünkü bir elemanın güvenilirlik seviyesinin ardışık bağımsız olaylar şeklinde temsil edilebileceği varsayılır. (12)'ye göre genelleştirilmiş olasılıklara sahip olarak, denklik sınıflarının her biri için bilgi ölçüsünün toplama özelliğine sahip olduğu sonucuna varabiliriz. Daha sonra bilgi ölçüsü aşağıdaki formülle belirlenebilir:

(13)'te, pav ve qav değerleri, bilgi değerinin ortalamasıdır.

eğer verilen ifade pav ve qav biliniyorsa, formül (10)'a karşılık gelecektir. Özünde, ortalama değerlerin belirlenmesine yönelik ifadelerde, her eşdeğer sınıftaki olayların meydana gelme niteliği ve bunlara yol açan nedenlerin içeriği bakımından homojen olmadığı gerçeği dikkate alınmalıdır. Bu nedenle, bir olay sınıfı için bilgi belirlemedeki logaritmanın tabanı, halihazırda kabul edilen 2 tabanından farklı olmalıdır.

Logaritma teorisinde, ifade bilinmektedir. bizim durumumuzda (örneğin, k1 sınıfı için)

İfade (14) aşağıdakileri ima eder:

(15)

(15)'deki oran, bilgi yoğunluğu olarak kabul edilebilir. Sonra (örneğin, k1 sınıfı için) şu ilişkiyi yazabiliriz:

nerede

O halde (13), ortalama değerler dikkate alınarak aşağıdaki gibi yazılabilir:

(17)

Şu koşulu kabul ediyoruz: G = L = 4; pg = ql = 0.125. Daha sonra, (17) numaralı ifadeye göre ve (11) koşuluna bağlı olarak, (10) ifadesine uygunluğu teyit eden bilgi ölçüsünün maksimum değeri.

Çözüm. Yukarıdakilerden, elemanlardan ve aralarındaki bağlantılardan oluşan teknik bir sistemin yapısının aşağıdakilere tabi olduğu takip edilir. bilgi analizi ve güvenilirlik açısından değerlendirilmesi. Öğelerin her biri iki durumdan birinde olabilir: çalışma veya başarısızlık. Durumların sayısı, eşit olasılığa sahiplerse, (6)'ya göre Hartley ölçüsünün değerini belirler ve iki denklik sınıfına ayrılır: sistem öğesinin çalışabilir sınıfı ve çalışamaz durumları sınıfı. Olaylar eşit derecede olası değilse, o zaman bir eleman için bilgi ölçüsü formül (7) ile belirlenebilir. Öğeler karşılıklı olarak bağımsız olduğunda, o zaman Shannon formülüne (8) ve (9) göre bir bütün olarak sistem için bilgi ölçüsünü belirlemek mümkündür.

Yalnızca bir öğe veya nesne için durumlar göz önüne alındığında, seçilen sınıfların her biri, eşit olasılığa sahip olmayan olayların akışına ilişkin veriler temelinde oluşturulur. Eşdeğerlik sınıflarının her biri için, elemanın çalışabilirliği ve başarısızlığının toplam ve genelleştirilmiş olasılıklarını belirlemek mümkündür. Bu göstergeler, çalıştırılabilir ve çalıştırılamaz durumlar sınıfına bölünerek elde edilen ifadelere (10) ve (17) göre eleman bilgisi belirsizliğinin ölçüsünü belirlemek için geçerlidir. (10) ve (17)'nin aynı ve uygulanabilir olduğu gösterilmiştir: ilk ifade - toplam olasılığın varlığında, ikincisi - genelleştirilmiş bir olasılığın varlığında.

Yukarıdaki formüllerin kullanımına dayanarak, aynı tip elemanlar için belirsizlik ölçüsünü belirlemek ve elde edilen değerlere dayanarak bunlardan daha az güvenilir olanı seçmek mümkündür.

İnceleyenler:

Nagruzova Lyubov Petrovna, Teknik Bilimler Doktoru, Khakassia İnşaat Bölümü Profesörü teknik enstitü- Yüksek Mesleki Eğitim Federal Devlet Özerk Eğitim Kurumu "Sibirya Federal Üniversitesi", Abakan şubesi.

Bulakina Elena Nikolaevna, Teknik Bilimler Doktoru, Khakass Teknik Enstitüsü'nün "Otomobil ve Otomotiv Endüstrisi" Bölümü Profesörü - Federal Devlet Özerk Yüksek Mesleki Eğitim Kurumu "Sibirya Federal Üniversitesi", Abakan'ın bir şubesi.

bibliyografik bağlantı

Dulesov A.S., Kabaeva E.V. TEKNİK BİR NESNE DURUMU BİLGİLERİNİN LOGAritmik ÖLÇÜ // Günümüze ait sorunlar bilim ve eğitim. - 2013. - No. 1.;
URL: http://science-education.ru/ru/article/view?id=8210 (erişim tarihi: 04/06/2019). "Doğa Tarihi Akademisi" yayınevinin yayınladığı dergileri dikkatinize sunuyoruz.

Depolanabilecek bilgi miktarının sezgisel olarak açıktır. fiziksel sistem, çevrilebileceği ayırt edilebilir durumların sayısı ile artar. Sistem, aynı sayıda olası duruma sahip n hücreden (eleman) oluşuyorsa, bu sayı N = m n olacaktır. Daha fazlası zor durum, sistem m1 olası durumları olan n1 hücrelerden, m2 olası durumları olan n2 hücrelerden vb. oluşuyorsa, bu sayı N = m1n1 m2n2 olacaktır....

Pratikte karşılaşılan durumlar için N istisnai olarak büyüktür. Bu nedenle, örneğin, 2,125,000 farklı iki dereceli görüntüden herhangi biri, 50 cm2 boyutlarında ve 1 cm başına 50 öğe çözünürlüğünde küçük bir fototelgrafik formda saklanabilir (şimdilik bunların büyük çoğunluğunun gerçeğinden sapıyoruz). resimler bir anlam ifade etmeyecektir). Bu sayı düşünülemez, çok büyük.

Olası durumların sayısı N, yeteneği karşılaştırmak için nicel bir ölçü olarak almak için uygun değildir. çeşitli sistemler bilgileri depolar veya iletir. Ancak bunun nedeni, kişinin bu kadar büyük sayılarla uğraşmak zorunda kalması değildir. Böyle bir önlem pratik olarak elverişsiz olur ve sezgilerimize uymaz. Örneğin, boş bir fotoğraf telgrafının alanını ikiye katlamanın, orada depolanabilecek bilgi miktarını iki katına çıkaracağı açık görünüyor. Bu arada, bu durumda olası görüntü sayısı iki kat değil, ikinci dereceye kadar artar.

Hartley, belirtilen çalışmada, farklı sistemlerin bilgi depolama veya iletme yeteneklerini karşılaştırmak için nicel bir ölçü olarak, ayırt edilebilir durumların sayısının logaritmasını seçmeyi önerdi.

Logaritmaların tabanı, bilgi kapasitesinin ifade edildiği birimleri belirler. Bu durumlarda en yaygın olarak kullanılan ikili logaritmalardır. Değer

ikili birimlerde ifade edilecektir.*
Açıkçası, eğer N = mn ise, o zaman

m farklı duruma sahip bir hücrenin bilgi kapasitesi log 2 m dv olacaktır. birimler (29)'dan n hücreden oluşan bir sistemin bilgi kapasitesinin, bu hücrelerin temel bilgi kapasitelerinin toplamına eşit olduğu görülebilir. Özellikle, daha önce ele alınan örnek için, log 2 2n = n formunun bilgi kapasitesinin, iki yarısının bilgi kapasitelerinin toplamına eşit olduğu ortaya çıkıyor,

Yani logaritmik ölçü bilgi kapasitesi sezgimizle uyuşuyor.

Formül (29)'dan, bilgi kapasitesinin, depolama hücrelerinin sayısındaki artışla hızla - doğrusal olarak - arttığı ve çok daha yavaş - logaritmik bir yasaya göre - ayırt edilebilir durumların sayısındaki artışla arttığı görülebilir ( derecelendirmeler) her hücrenin m'si.

Aynı bilgi kapasitesini elde etmek için az sayıda ayırt edilebilir duruma sahip çok sayıda hücreye sahip depolar oluşturmanın, daha az sayıda hücreye sahip, ancak buna karşılık olarak daha fazla sayıda ayırt edilebilir duruma sahip depolardan daha kolay olduğu ortaya çıktı. Diğer bir deyişle, birikim hücrelerinin sayısı için derecelendirme sayısının değiştirilmesi genellikle avantajlıdır. Dört elemanlı iki dereceli bir görüntünün bilgi kapasitesi C=41og 2 2=4 16 dereceli bir elemanın bilgi kapasitesine eşittir, C=1log 2 16=4. Ancak, 16 ayırt edilebilir duruma sahip hücrelerle bir akümülatör yapmak, her biri yalnızca iki ayırt edilebilir duruma sahip olan dört kat daha fazla hücreye sahip bir akümülatörden çok daha zordur.

* Bazen "ikili birim" yerine "bit" yazarlar (İngiliz ikili hanesinden - bir ikili birimden).


11
Kurs: "Bilgi teorisi ve kodlama"
Konu: "MATEMATİKSEL BİLGİ TEORİSİ"

1. BİLGİ MİKTARI VE ÖLÇÜMÜ

Bir mesajlar topluluğundan seçilen bir dizi mesaj (Şekil 1) bilgi kaynağından bilgi iletim sisteminin (ITS) girişine beslenir.

Parazit yapmak

x 1 y 1

x 2 y 2

… …

x n y n

Şekil 1. Bilgi iletim sistemi

Mesaj Topluluğu - olasılık özelliklerine sahip olası mesajlar seti - (X, p (x) } . burada: X=(x 1 , X 2 , …, X m } - olası kaynak mesajları kümesi; ben = 1, 2, ..., m, nerede m- alfabenin hacmi; P (x i) - mesajların meydana gelme olasılığı ve P (x i) 0 ve mesaj olasılıkları olduğundan tam grup olaylar, o zaman toplam olasılıkları bire eşittir

.

Her mesaj taşır belli bir miktar bilgi. Mesajda yer alan bilgi miktarını belirleyin x i kaynak mesajlar grubundan seçilmiş (X, p (x) } . karakterize eden parametrelerden biri verilen mesaj, oluşma olasılığı - P (x i), Bu nedenle, bilgi miktarının olduğunu varsaymak doğaldır. i (x i) mesajda x i bir fonksiyondur P (x i). İki bağımsız mesaj olasılığı x 1 Ve x 2 olasılıkların çarpımına eşittir P (x 1 , x 2 ) =p (x 1 ). P (x 2 ), ve bunların içerdiği bilgiler, toplama özelliğine sahip olmalıdır, yani:

i (x 1 , x 2 ) = ben (x 1 ) +ben (x 2 ). ( 1)

Bu nedenle, bilgi miktarını değerlendirmek için logaritmik bir ölçü önerilmektedir:

. (2)

Aynı zamanda, en az olası mesajlar en fazla miktarda bilgi içerir ve belirli bir olayla ilgili bir mesajdaki bilgi miktarı sıfıra eşittir. Çünkü Tüm logaritmalar orantılı olduğundan, taban seçimi bilgi birimini belirler:

kayıt ax = günlük Bx/günlük Ba.

Logaritmanın tabanına bağlı olarak, aşağıdaki bilgi birimleri kullanılır:

2 - [bit] ( ikili basamak- ikili birim), ikili sayı sistemi temelinde çalışan bilgisayarlarda ve diğer cihazlarda bilgi süreçlerinin analizinde kullanılır;

e - [nit] ( doğal dijital- doğal birim), iletişim teorisinin matematiksel yöntemlerinde kullanılır;

10 - [aynı] ( ondalık basamak- ondalık birim), ondalık sayı sistemi ile çalışan cihazlarda süreçlerin analizinde kullanılır.

vurmak (ikili bilgi birimi) - eşit derecede olası, bağımsız iki olaydan birinin meydana gelmesiyle ilgili belirsizliği ortadan kaldıran bilgi miktarıdır.

Tüm mesajlar için ortalama bilgi miktarı, tüm olayların ortalaması alınarak elde edilebilir:

. (3)

Aşağıdakilerden oluşan bir mesajdaki bilgi miktarı n denk olmayan unsurları eşittir (bu ölçü 1948'de K. Shannon tarafından önerilmiştir):

. (4)

Bağımsız eşit derecede olası olaylar için, bilgi miktarı belirlenir (bu önlem 1928'de R. Hartley tarafından önerilmiştir):

. ( 5)

2. BİLGİ MİKTARININ ÖZELLİKLERİ

1. Bir mesajdaki bilgi miktarı, bu mesajın ortaya çıkma olasılığı ile ters orantılıdır.

2. Toplamsallık özelliği - iki kaynaktan gelen toplam bilgi miktarı, kaynaklardan gelen bilgilerin toplamına eşittir.

3. Tek sonucu olan bir olay için bilgi miktarı sıfırdır.

4. Ayrık bir mesajdaki bilgi miktarı, alfabenin hacmindeki artışa bağlı olarak büyür - m.