Çok boyutlu veritabanlarının teknolojisi. Çok boyutlu kayıplı sistemler

  • 12.05.2019

Çok boyutlu durağan rastgele süreç, durağan ve durağan ilişkili bir dizi olarak tanımlanır. rastgele süreçler . Böyle bir süreç genellikle zamana bağlı olarak rastgele bir sütun vektörü olarak gösterilir:

.

Çok boyutlu (çok kanallı) sistemlerin tanımlanmasında çok boyutlu rastgele süreçler kullanılmaktadır. Bu bölümde, normal çok boyutlu durağan rastgele süreçlerin sayısal modellemesi problemini ele alıyoruz. Bu problemi çözmenin sonucu, tek boyutlu durumda olduğu gibi, dijital bir bilgisayarda belirli bir işlemin çok boyutlu ayrık gerçekleşmelerini oluşturmayı mümkün kılan bir algoritmadır. -boyutlu sürekli normal durağan rastgele süreç genellikle ya korelasyon matrisi şeklinde belirtilir

veya bir spektral matris şeklinde

nerede - rastgele süreçlerin otokorelasyon (için) ve çapraz korelasyon (için) fonksiyonları - Fourier dönüşümü. Aynı zamanda, beri , elemanlar ve spektral matris karmaşık eşleniktir,

.

Ayrık çok boyutlu normal rastgele süreçler, korelasyon ve spektral matrisler kullanılarak sürekli süreçlere benzer şekilde tanımlanır (35, 70]

nerede , ve .

Çok boyutlu normal rastgele bir sürecin sayısal modellemesi problemi aşağıdaki gibi formüle edilmelidir. Rastgele bir sürecin korelasyonu veya spektral matrisi verilir. Belirli bir korelasyon (spektral) özellikleri ile rastgele bir sürecin ayrık gerçekleşmelerinin sayısal bir bilgisayarda oluşturulması için bir algoritma bulmak gerekir.

Bu sorunu çözmek için, daha önce olduğu gibi, doğrusal bir filtre şekillendirme fikrini kullanıyoruz. İncelenen durumda, çok boyutlu bir şekillendirme filtresinin sentezinden bahsediyoruz.

Boyutlu bir doğrusal filtre, girdileri ve çıktıları olan doğrusal bir dinamik sistem olarak tanımlanır. Eğer bir - giriş eylemi ve sistemin cevabı ise, daha sonra -boyutlu lineer sürekli filtrenin girişi ve çıkışı arasındaki ilişki, formdaki transfer matrisi kullanılarak açıklanır.

nerede ve - Laplace dönüşümü anlamında sırasıyla giriş ve çıkış sinyallerinin görüntüleri; - elemanları -th girdi - -th çıktı kanallarının transfer fonksiyonları olan -boyutlu filtrenin transfer matrisi.

Ayrık boyutlu doğrusal filtrelerdeki giriş-çıkış bağlantısı benzer şekilde tanımlanır:

,

Nerede ve - giriş ve çıkış sinyallerinin ayrık Laplace dönüşümü anlamında görüntüler; ayrık boyutlu filtrenin transfer matrisidir.

İki boyutlu bir filtre örneğinde çok boyutlu bir filtrenin yapısal diyagramı, Şek. 2.9, buna göre

(2.107)

Çıkış sinyallerinin her birinin ve toplamının olduğunu görüyoruz. lineer operatörler giriş sinyallerinden ve . Benzer ilişkiler genel durumda da geçerlidir. Bu, transfer matrislerinin tanımlanmasıdır.

Bir -boyutlu lineer filtrenin girişindeki eylem -boyutlu olsun Beyaz gürültü, yani, formun bir korelasyon matrisi ile rastgele bir süreç

sürekli zaman ve

ayrık zaman için, nerede - delta işlevi. -boyutlu beyaz gürültü burada bir dizi bağımsız -ilişkili rastgele süreç olarak tanımlanır.

Beyaz gürültünün etkisi altında, sırasıyla sürekli ve ayrık zaman için çıktı boyutlu filtredeki işlemin spektral matrisinin, filtrenin transfer matrisi ile ilişkili olduğu gösterilebilir (örneğin, bkz.), ilişkiler

(2.108)

burada sembol, transpoze edilmiş matrisi gösterir.

Bu nedenle, belirli bir spektral matris ile boyutlu bir rastgele süreç elde etmek için, boyutlu beyaz gürültüyü, transfer matrisi denklemleri (2.108) karşılayan bir boyutlu şekillendirme filtresinden geçirmek gerekir. Belirli bir spektral matristen transfer matrisini bulmak için, ikincisini (2.108) şeklinde iki faktöre bölmek gerekir. Bu prosedüre spektral matris çarpanlarına ayırma denir. Bilinen algoritmalara göre uygulanabilir.

Beyaz gürültünün çok boyutlu filtrelenmesi oldukça basittir: her bileşen Bir transfer matrisi ile bir boyutlu filtrenin çıkışında rastgele işlem, bileşenlerin toplanmasıyla elde edilir. transfer fonksiyonlarına sahip tek boyutlu filtreler tarafından filtrelenen girdi süreci [bkz. formül (2.107)]. Tek boyutlu filtreleme algoritmaları yukarıda tartışılmıştır.

Bu modelleme yöntemi ile iki yol mümkündür: 1) sürekli boyutlu bir rastgele işlemin verilen spektral matrisi, bir sürekli şekillendirme filtresinin transfer matrisini elde etmek için doğrudan çarpanlara ayrılabilir ve ardından, tam veya yaklaşık ayrıklaştırma yöntemlerini kullanarak. sürekli beyaz gürültünün çok boyutlu filtrelemesini gerçekleştirmek için yukarıda açıklanan sürekli filtreler; 2) sürekli boyutlu bir sürecin spektral matrisi verildiğinde, -dönüşümünü kullanarak, karşılık gelen ayrık rastgele sürecin spektral matrisini bulabilir (bkz. § 2.3), ardından ayrık şekillendirme filtresinin transfer fonksiyonunu çarpanlara ayırarak bulabilirsiniz ve sonra ayrık beyaz gürültünün çok boyutlu filtrelemesini gerçekleştirin.

Spektral matrislerin çarpanlarına ayrılmasında en büyük zorluklarla karşılaşılır. Şu anda, çarpanlara ayırma algoritmaları yalnızca rasyonel spektral matrisler için geliştirilmiştir, yani elemanları argümanların kesirli rasyonel fonksiyonları olan matrisler veya .

Kanıtları atlayarak rasyonel spektral matrislerin çarpanlarına ayırma algoritmalarından birini tanımlayalım.

Rasyonel bir spektral matris verilsin

.

Matris forma indirgenebilir

aşağıdaki dönüşümler yoluyla.

1. Matrisin sırası belirlenir, ardından ana sıradaki küçüklerden biri matrisin sol üst köşesinde bulunur.

2. Matris köşegen bir forma indirgenir. Bunu yapmak için, - ile çarpılan ilk satır matrisin -. satırına eklenir, ardından - ile çarpılan ilk sütun -th sütununa eklenir; matris

, (2.109)

matrisin elemanları nerede

gibi görünmek

(2.110)

Orijinal matris ile aynı dönüşümler matris ile gerçekleştirilir . Bu işleme beşinci adımda devam ederek bir köşegen matris elde ederiz.

öyle ki .

3. Yardımcı bir matris bulunur

kimin öğeleri şöyle görünür:

(2.111)

tekrarlama bağıntılarından nerede belirlenir

(2.112)

4. Yardımcı polinomlar bulunur

nerede - polinomların sıfırları , alt yarı düzlemde yatan, sayıları kadar sayılan maksimum çeşitlilik, ve matrisin elemanları olan kesirli rasyonel fonksiyonların paydalarıdır:

.

5. § 2.9, madde 2'de ele alınan yönteme göre, kesirli rasyonel fonksiyonlar

şeklinde sunulur

,

burada polinomlar ve alt yarı düzlemde sıfır yok.

Bu, çarpanlara ayırma işlemini tamamlar. Şekillendirme filtresinin son transfer matrisi şu şekilde yazılır:

(2.113)

Burada sürekli çok boyutlu süreçlerin rasyonel spektral matrisleri için çarpanlara ayırma algoritmasını tanımlıyoruz. Ayrık süreçlerin spektral matrislerinin çarpanlara ayrılması da benzer şekilde yapılır, ancak alt yarı düzlemde bulunan kökler yerine birim çemberde bulunan kökler alınır.

örnek 1 Korelasyon matrisi ile iki boyutlu sürekli durağan merkezli rastgele bir süreç olsun

, (2.114)

bazı pozitif sabitler nerede ve .

Spektral matrise (2.114) karşılık gelen korelasyon matrisi şu şekildedir:

, (2.115)

nerede ve - süreçlerin otokorelasyon ve çapraz korelasyon anları ve sırasıyla; - süreçlerin karşılıklı korelasyon katsayısı ve zaman içinde çakışan noktalar. Katsayılar ve bu durumda enerji spektrumunun genişliğini (0,5 düzeyinde) temsil eder. ve süreçlerin karşılıklı enerji spektrumu ve .

Şekillendirme filtresinin transfer matrisini elde etmek için spektral matrisi (2.114) çarpanlarına ayırmak gerekir.

Yukarıdaki çarpanlara ayırma algoritmasına uygun olarak çarpanlara ayırma işlemini adım adım gerçekleştireceğiz.

1. Bu durumda spektral matrisin rankı .

2. Bir matrisi köşegen yapmak için bir adım gereklidir. Formüller (2.109) ve (2.110) ile elde ederiz

.

3. (2.111) ve (2.112) ifadelerine göre yardımcı matris şu şekildedir:

4. İncelenen durumda sadece bir yardımcı polinom bulmak gerekir. Bunu yapmak için, matris elemanının paydasının köklerini, yani polinomun köklerini bulmanız gerekir. Bu kökler

Sonuç olarak,

.

5. Son aşamada kesirli rasyonel fonksiyonları çarpanlarına ayırmak gerekir.

Bu durumda kesirli rasyonel fonksiyonların pay ve paydalarının kökleri ve kolayca hesaplanabilir. Üst yarı düzlemde bulunan kökleri kullanarak (pozitif hayali kısımları olan kökler), ve değişkenine şunu elde ederiz:

.

Şek. 2.9 gösterilen yapısal şema filtre girişine beyaz gürültü etki ediyorsa, çıkışında gerekli spektral özelliklere sahip iki boyutlu rastgele bir işlemin oluşturulduğu iki boyutlu şekillendirme filtresi. Sürekli değiştirme 2D filtre karşılık gelen ayrık filtre, dijital bir bilgisayarda iki boyutlu rastgele normal sürecin ayrık gerçekleşmelerini üretmek için bir algoritma elde ederiz, yani iki durağan ve durağan ilişkili normal rastgele sürecin ayrık gerçekleşmeleri, üstel otomatik ve çapraz korelasyon fonksiyonları ile. formu (2.115).

Bir şekillendirme filtresinin sentezine başka bir yaklaşımla, önce karşılık gelen ayrık çok boyutlu rastgele sürecin spektral matrisi bulunmalıdır. Söz konusu örnekte, bu matris şu şekildedir:

Ve matrisler (2.116).

Dikkate alınan örnek, spektral matrislerin çarpanlara ayrılmasının, ilgili polinomların sıfırları analitik olarak bulunabiliyorsa, nispeten basit bir şekilde gerçekleştirildiğini göstermektedir. Sürekli iki boyutlu bir işlemin spektral matrisini çarpanlara ayırırken, bu zor değildi, çünkü sıfırları belirlemek sadece ikinci dereceden ve iki dereceli denklemleri çözmek gerekiyordu. Ayrık iki boyutlu bir sürecin spektral matrisini çarpanlara ayırırken, ikinci dereceden denklemler ve aynı zamanda analitik bir çözüme izin veren dördüncü dereceden bir karşılıklı denklem vardı.

Diğerlerinde, daha zor vakalar bir polinomun sıfırlarını analitik olarak bulmak her zaman mümkün değildir. Bu durumlarda, inci dereceden denklemleri çözmek için sayısal yöntemlere başvurulur. Genel olarak, çarpanlara ayırma işlemi bir bilgisayarda standart bir program olarak uygulanabilir. Bu amaçla burada verilenin dışında başka çarpanlara ayırma algoritmaları da kullanılabilir.

Şu anda mevcut olan tüm spektral matris çarpanlara ayırma algoritmalarının, genel olarak konuşursak, çok zahmetli olduğuna dikkat edilmelidir.

Modül STATISTICA analizi için çok boyutlu keşif teknolojileri(ürün modüllerinden biri İSTATİSTİK Gelişmiş), model oluşturma için çok çeşitli etkileşimli görselleştirme araçlarıyla birlikte küme analizinden gelişmiş sınıflandırma ağacı yöntemlerine kadar çok çeşitli keşif teknolojileri sağlar. Modül şunları içerir:

Modülde küme analizi uygulandı tam set k-ortalamalar, hiyerarşik kümeleme ve iki girişli birleştirme yöntemleri dahil olmak üzere küme veri analizi yöntemleri. Veriler şu şekilde gelebilir: Orijinal form ve nesneler arasındaki mesafeler matrisi şeklinde. Gözlemler, değişkenler ve/veya gözlemler ve değişkenler, çeşitli uzaklık ölçüleri (Öklid, Öklid karesi, şehir blokları (Manhattan), Chebyshev, güç, uyumsuzluk yüzdesi ve Pearson'ın 1-korelasyon katsayısı) ve çeşitli kümeleme (bağlama) kuralları kullanılarak kümelenebilir. (tek, tam bağlantı, ağırlıksız ve ağırlıklı ikili grup ortalaması, ağırlıksız, merkezler arası ağırlıklı mesafe, Ward yöntemi ve diğerleri).

Diğer sistem modüllerinde daha fazla analiz için mesafe matrisleri kaydedilebilir İSTATİSTİK. K-ortalama küme analizi gerçekleştirirken, kullanıcı küme merkezlerinin ilk konumu üzerinde tam kontrole sahiptir. Son derece büyük analiz planları gerçekleştirilebilir: örneğin hiyerarşik (ağaç) bağlantı ile 90 bin mesafelik bir matrisle çalışabilirsiniz. Kümeleme analizinin standart sonuçlarına ek olarak, modülde çeşitli tanımlayıcı istatistikler ve gelişmiş tanı yöntemleri de mevcuttur (hiyerarşik kümeleme için eşik seviyeleri ile eksiksiz havuzlama şeması, k-ortalama kümeleme için ANOVA tablosu). Nesnelerin kümelere aidiyeti hakkında bilgi veri dosyasına eklenebilir ve daha sonraki analizlerde kullanılabilir. Grafik özellikleri modül küme analiziözelleştirilebilir dendrogramlar, iki yönlü havuzlama çizimleri, bir grafik havuzlama diyagramı, k-ortalama kümeleme ortalama grafiği ve daha fazlasını içerir.

Modül Faktor analizi gelişmiş teşhis ve çok çeşitli araştırma ve keşif grafikleri ile çok çeşitli istatistik ve faktör analizi yöntemleri (hiyerarşik faktör analizinin yanı sıra) içerir. Burada, 300'e kadar değişken içeren veri kümeleri için temel bileşenlerin ve temel faktörlerin analizini (genel ve hiyerarşik eğik) gerçekleştirebilirsiniz (modül kullanılarak daha büyük modeller araştırılabilir). (AYRI)).

Temel bileşen analizi ve sınıflandırması

İSTATİSTİK ayrıca temel bileşen analizi ve sınıflandırması için bir program içerir. Bu programın çıktısı öz değerler(normal, kümülatif ve göreli), faktör yükleri ve faktör puanı katsayıları (giriş veri dosyasına eklenebilir, bir piktogram üzerinde görüntülenebilir ve etkileşimli olarak yeniden kodlanabilir) ve ayrıca bazı daha özel istatistikler ve teşhisler. Kullanıcı, aşağıdaki faktör döndürme yöntemlerine sahiptir: varimax, biquartimax, quartimax ve equimax (normalleştirilmiş veya ilk yüklere göre) ve ayrıca eğik döndürmeler.

Faktör uzayı, etiketli veri noktalarına sahip 2B veya 3B dağılım grafiklerinde dilim dilim görsel olarak görüntülenebilir; diğer grafik araçları arasında "kayşat" grafikleri, çeşitli dağılım grafikleri, histogramlar, Çizgi grafikleri Faktör çözümü belirlendikten sonra, kullanıcı korelasyon matrisini hesaplayabilir (yeniden üretebilir) ve artık korelasyon matrisini (veya artık varyans/kovaryans matrisini) analiz ederek faktör modelinin tutarlılığını değerlendirebilir. Girişte hem orijinal verileri hem de korelasyon matrislerini kullanabilirsiniz. Modül aracılığıyla doğrulayıcı faktör analizi ve ilgili diğer analiz türleri yapılabilmektedir. Yapısal Denklem Modelleme(AYRI) bloktan STATISTICA Genel Doğrusal ve Doğrusal Olmayan Modeller, burada özel bir Doğrulayıcı Faktör Analizi Sihirbazı kullanıcıya modeli oluşturmanın tüm adımlarında rehberlik edecektir.

Bu modül, eksiksiz bir kanonik analiz yöntemleri seti uygular (diğer modüllerde yerleşik olan kanonik analiz yöntemlerini tamamlar). Hem kaynak veri dosyalarıyla hem de korelasyon matrisleriyle çalışabilirsiniz; tüm standart kanonik korelasyon istatistikleri (özvektörler ve özdeğerler, artıklık katsayıları, kanonik ağırlıklar, yüklemeler, varyanslar, her bir kök için anlamlılık testleri, vb.) ve ayrıca bazı genişletilmiş teşhisler hesaplanır. Her gözlem için, daha sonra gömülü piktogramlarda görüntülenebilen (ve ayrıca veri dosyasına eklenebilen) kanonik değişken değerleri hesaplanabilir.

Bu modül, örnek anketleri ve anketleri tasarlamak ve değerlendirmek için çok çeşitli prosedürler içerir. Sistemin tüm modüllerinde olduğu gibi İSTATİSTİK, son derece büyük veri dizileri burada analiz edilebilir (programa yapılan bir çağrıda 300 pozisyondan oluşan bir ölçek işlenebilir).

Ölçekteki tüm konumlar için güvenilirlik istatistiklerini hesaplamak, alt kümeleri etkileşimli olarak seçmek ve bölünmüş yarı veya bölünmüş parça karşılaştırması kullanarak konumların alt kümeleri arasında karşılaştırma yapmak mümkündür. Bir ziyarette özet ölçeğinin ve alt ölçeklerin güvenilirliği değerlendirilebilir. Konumların etkileşimli olarak silinmesi ile, elde edilen ölçeğin güvenilirliği, veri dosyasına yeniden erişmeden anında hesaplanır. Analiz sonuçları şunlardır: konumlar için korelasyon matrisleri ve tanımlayıcı istatistikler, Cronbach alfa, standartlaştırılmış alfa, ortalama konum-konum korelasyonu, tam tabloölçek için varyans analizi, tüm pozisyonlar için ortak olan tam bir istatistik seti (çoklu korelasyon katsayıları dahil), bölünmüş yarı güvenilirlik ve iki yarı arasındaki zayıflama düzeltmeli korelasyon.

Ölçekler geliştirmenize yardımcı olacak geniş bir grafik seçimi (yerleşik dağılım grafikleri, histogramlar, çizgi ve diğer grafikler dahil) ve bir dizi etkileşimli durum rutini vardır. Örneğin, bir ölçeğe belirli sayıda madde eklerken, kullanıcı beklenen güvenirliği hesaplayabilir veya istenen güvenirliği elde etmek için ölçeğe eklenmesi gereken madde sayısını tahmin edebilir. Mevcut ölçek ile başka bir ölçüm arasındaki zayıflamayı düzeltmek de mümkündür (mevcut ölçeğin güvenilirliği göz önüne alındığında).

Modül sistemler İSTATİSTİK verimli inşaat ve test için son zamanlarda geliştirilen yöntemlerin en eksiksiz uygulamasını içerir (sınıflandırma ağaçları yöntemi, bir nesnenin ait olduğu sınıfı tahmin etmek için belirli bir ("yinelemeli") yöntemdir, için tahmin değişkenlerinin değerlerine dayanarak bu nesne). Sınıflandırma ağaçları, kategorik veya sıralı tahmin ediciler veya bireysel değişkenler veya bunların doğrusal kombinasyonları üzerinde dallara ayrılarak her iki tür tahmin edicinin bir karışımı üzerine inşa edilebilir.

Modül ayrıca şunları da uygular: (THAID ve CART paketlerinde olduğu gibi) tam dallandırma seçenekleri ve ayrımcı dallandırma arasında seçim; dal değişkenlerinin tarafsız seçimi (QUEST paketinde olduğu gibi); durdurma kurallarının açık bir şekilde belirlenmesi (FACT paketinde olduğu gibi) veya ağacın yapraklarından köküne kadar budama (CART paketinde olduğu gibi); sınıflandırma hatalarının payı veya sapma fonksiyonu ile kesilir; genelleştirilmiş uyum ki-kare, G-kare ve Gini indeksi ölçüleri. Sınıflara ait olma a priori olasılıkları ve sınıflandırma hatalarının maliyetleri eşit olarak ayarlanabilir, verilerden tahmin edilebilir veya manuel olarak ayarlanabilir.

Kullanıcı ayrıca ağaç oluşturma sırasında çapraz doğrulamanın çokluğunu ve hata tahmini için SE kuralı parametresini, kesme noktasındaki minimum nesne sayısını, rasgele sayı üreteci için tohum ve için alfa parametresini ayarlayabilir. değişkenlerin seçilmesi. Yerleşik grafik araçları, giriş ve çıkış verilerini keşfetmeye yardımcı olur.

Bu modül, basit ve çok değişkenli yazışma analiz yöntemlerinin eksiksiz bir uygulamasını içerir, çok sayıda tabloyu analiz edebilir. büyük boy. Program aşağıdaki veri dosyalarını kabul eder: bir beklenmedik durum matrisi (çapraz sınıflandırma) oluşturmak için kullanılan kategorize edilmiş değişkenleri içeren dosyalar; giriş tablosunun hücrelerini tanımlayan (numaralandıran) sıklık tablolarını (veya diğer yazışma, bağlantı, benzerlik, düzensizlik vb. ölçülerini) ve kod değişkenlerini içeren veri dosyaları; frekansları (veya diğer yazışma ölçülerini) içeren veri dosyaları. Örneğin, kullanıcı doğrudan bir sıklık tablosu oluşturabilir ve analiz edebilir. Ek olarak, çok değişkenli uygunluk analizi durumunda, Burt matrisini girdi verisi olarak doğrudan belirtmek mümkündür.

Program çalışırken, satır, sütun ve toplam yüzdelerin yüzdesi, beklenen değerler, beklenen ve gözlenen değerler arasındaki farklar, standartlaştırılmış sapmalar ve ki-kare istatistiğine katkılar gibi çeşitli tabloları hesaplar. Tüm bu istatistikler, 3D histogramlarda çizilebilir ve özel bir dinamik katmanlama tekniği kullanılarak görüntülenebilir.

Modülde genelleştirilmiş özdeğerler ve özvektörler hesaplanır ve tekil değerler, öz değerler ve ölçüm başına atalet fraksiyonu dahil olmak üzere standart bir tanısal büyüklükler seti çıktılanır. Kullanıcı, ölçüm sayısını seçebilir veya maksimum kümülatif atalet yüzdesi için bir eşik değeri ayarlayabilir.

Program, satır noktaları ve sütun noktaları için standart koordinatları hesaplar. Kullanıcı, satır profili standardizasyonu, sütun profili standardizasyonu, satır ve sütun profili standardizasyonu veya kanonik standardizasyon arasında seçim yapabilir. Her boyut ve her satır noktası ve sütun noktası için program atalet, kalite ve kosinüs**2 değerlerini hesaplar. Ek olarak, kullanıcı genelleştirilmiş tekil vektörlerin matrislerini (sonuçlar penceresinde) görüntüleyebilir. Çalışma penceresindeki herhangi bir veri gibi, bu matrisler de dildeki programları kullanarak işlemek için kullanılabilir. İSTATİSTİK Visual Basic, örneğin, herhangi birini kullanmak için standart olmayan yöntemler koordinat hesaplamaları.

Kullanıcı, ek noktalar (-sütunlar veya -satırlar) için koordinatları ve karşılık gelen istatistikleri (kalite ve kosinüs**2) hesaplayabilir ve sonuçları orijinal satır noktaları ve sütun noktaları ile karşılaştırabilir. AT çok değişkenli analiz eşleştirmek için ek puanlar kullanılabilir. Tüm tablolar için hesaplanabilen 3D histogramlara ek olarak, kullanıcı bir grafik görüntüleyebilir. öz değerler, satır noktaları ve sütun noktaları için bir, iki ve üç boyutlu grafikler. Satır noktaları ve sütun noktaları, herhangi bir ek noktayla birlikte aynı grafik üzerinde aynı anda görüntülenebilir (her nokta türü, farklı noktaların grafiklerde kolayca ayırt edilmesi için farklı bir renk ve benzersiz işaret kullanır). Tüm noktaların işaretleri vardır ve kullanıcı, işaretçinin boyutunu ayarlama olanağına sahiptir.

Modülde (metrik olmayan) çok boyutlu ölçekleme için eksiksiz bir yöntem seti uygulanmıştır. Burada değişkenler arasındaki benzerlik, farklılık ve korelasyon matrisleri analiz edilebilir ve ölçekleme alanının boyutu 9'a kadar çıkabilir. Başlangıç ​​konfigürasyonu program tarafından hesaplanabilir (temel bileşen analizi kullanılarak) veya kullanıcı tarafından ayarlanabilir. Stres miktarı ve yabancılaşma faktörü, özel bir yinelemeli prosedür kullanılarak en aza indirilir.

Kullanıcı yinelemeleri gözlemleme ve bu değerlerdeki değişiklikleri takip etme yeteneğine sahiptir. Nihai konfigürasyon, sonuçlar tablosunda ve ayrıca işaretli nesne noktalarıyla ölçek uzayındaki 2B ve 3B dağılım grafiklerinde görüntülenebilir. Çıktı sonuçları şunlardır: standartlaştırılmamış stres (F), Kruskal stres katsayısı S ve dışlama katsayısı. Uyum düzeyi, Shepard çizelgeleri kullanılarak değerlendirilebilir ("d üst sınırlı" ve "yıldızlı d" değerleriyle). Sistemdeki tüm analiz sonuçları gibi İSTATİSTİK, son konfigürasyon bir veri dosyası olarak kaydedilebilir.

Modül diskriminant fonksiyonlarını kullanarak adım adım diskriminant analiz yöntemlerinin eksiksiz bir uygulamasını içerir. İSTATİSTİK ayrıca modül içerir Genel Diskriminant Analizi Modelleri (GDA) kategorik bağımlı değişkenlerin ANOVA/ANCOVA benzeri tasarımlarına uyması veya çeşitli tipler analizler (örneğin, en iyi tahmin seçimi, sonsal olasılıkların profillenmesi).

Program, değişkenlerin adım adım dahil edilmesi veya hariç tutulması ile analiz gerçekleştirmenize veya kullanıcı tanımlı değişken bloklarını modele girmenize olanak tanır. Ayırma (ayırt etme) işlevini açıklayan çok sayıda grafik ve istatistiğe ek olarak, program aynı zamanda eski ve yeni gözlemleri sınıflandırmak için (modelin kalitesini değerlendirmek için) çok sayıda araç ve istatistik içerir. Çıktılar şunlardır: Her değişken için Wilks' lambda istatistiği, bölüm lambda, dahil etme (veya hariç tutma) için F istatistiği, p anlamlılık seviyeleri, tolerans değerleri ve çoklu korelasyon katsayısının karesi. Program tam bir kanonik analiz gerçekleştirir ve tüm özdeğerleri (doğrudan ve kümülatif), önem düzeylerini p, diskriminant (kanonik) fonksiyonunun katsayılarını (doğrudan ve standartlaştırılmış biçimde), yapısal matris katsayılarını (faktör yükleri), ortalama değerleri döndürür. ​​diskriminant fonksiyonu ve her nesne için diskriminant ağırlıkları (bunlar otomatik olarak veri dosyasına eklenebilir).

Yerleşik grafik desteği şunları içerir: her grup için kanonik ağırlıkların histogramları (ve tüm gruplarda ortaktır), kanonik değişken çiftleri için özel dağılım grafikleri (her bir gözlemin hangi gruba ait olduğunu gösterir), geniş bir kategorize edilmiş (çoklu) grafik kümesi. farklı gruplar (kutu grafikleri, histogramlar, dağılım grafikleri ve normal olasılık grafikleri gibi çoklu grafikler dahil) ve çok daha fazlası için bağımlı değişkenler arasındaki dağılımı ve ilişkileri keşfetmenize olanak tanır.

Modülde ayrıca hesaplanabilir standart özellikler Her grup için sınıflandırma Gözlem sınıflandırma sonuçları Mahalanobis mesafeleri, sonsal olasılıklar ve sınıflandırma sonuçlarının kendileri açısından görüntülenebilir ve bireysel gözlemler için diskriminant fonksiyon değerleri (kanonik değerler) genel bakış piktograflarında ve doğrudan sonuç tablolarından erişilebilen diğer çok değişkenli grafiklerde görüntülenebilir. Tüm bu veriler, daha fazla analiz için mevcut veri dosyasına otomatik olarak eklenebilir. Ayrıca, doğru sınıflandırılmış gözlemlerin sayısını ve yüzdesini gösteren nihai sınıflandırma matrisini de görüntüleyebilirsiniz. Mevcut Çeşitli seçenekler belirli gözlemleri sınıflandırma prosedürüne dahil etmenize veya hariç tutmanıza izin veren seçim koşullarının yanı sıra (örneğin, daha sonra kalitesini yeni bir örnek üzerinde kontrol etmek için) önsel olasılıkların belirlenmesi.

Diskriminant Analizi (GDA) için Genel Modeller

Modül Diskriminant Analizi için Genel Modeller STATISTICA (GDA) bir uygulama ve bir uzantıdır Genel Doğrusal Modeller görevleri sınıflandırmak için Modül ile aynı Diskriminant analizi, GDA, geleneksel sıralı diskriminant analizleri yapmanızı sağlar. GDA, diskriminant analizi problemini genel lineer modelin özel bir durumu olarak sunar ve böylece son derece kullanışlı yeni kullanıcı tanımlı analitik teknolojiler sağlar.

Geleneksel diskriminant analizinin yanı sıra GDA, istediğiniz bağımlı değişken kategorilerini seçmenize olanak tanır. Analizde, eleman grupları gösterge değişkenler olarak kaydedilmekte ve tüm GRM yöntemleri kolaylıkla uygulanabilmektedir. GDA sonuçları iletişim kutusunda çok çeşitli GRM ve GLM artık istatistikleri mevcuttur.

GDA, veri madenciliği ve uygulamalı araştırma için çeşitli güçlü araçlar sağlar. GDA, diskriminant fonksiyon katsayıları, kanonik analiz sonuçları (standartlaştırılmış ve ham katsayılar, kanonik kök adım testleri vb.), sınıflandırma istatistikleri (Maalanobis mesafesi, sonsal olasılıklar, kabul edilebilir analizlerde gözlemlerin sınıflandırılması, yanlış sınıflandırma dahil) dahil olmak üzere tüm standart diskriminant analizi sonuçlarını hesaplar. matrisler, vb.). GDA'nın benzersiz özellikleri hakkında daha fazla bilgi için

Çok boyutlu süreçlerin analitik tahmini.

Genel parametre yöntemi.

Amaç:çok parametreli bir nesnenin durumunu tahmin etmek için pratik tekniklerin incelenmesi.

Kısa teorik bilgi:

Teknik sistemlerin durumundaki değişiklik, belirli bir dizi parametredeki değişikliklerle karakterize edilen bir süreç olarak düşünülebilir. Durum vektörünün uzaydaki konumu, sistem performansının derecesini belirler. Sistemin durumu, uzay koordinatlarının k sistem parametreleri olduğu k boyutlu uzayda bir vektör ile karakterize edilir.

Durum tahmini, parametrelerin periyodik ön kontrolüne indirgenir; durum fonksiyonunun kontrolünün t i T 1 anlarında belirlenmesi

Q=Q[ ] ve durumun Q fonksiyonunun değerlerinin T 2 > T 1 zaman değerleri aralığında hesaplanması.

Bu durumda, durum vektörü, Q * performans derecesinin kabul edilebilir değerlerinin hiper yüzeyinden ne kadar uzakta bulunursa, teşhis edilen sistemin performansı o kadar yüksek olur. Fark * ne kadar küçükse, performans düzeyi o kadar düşük olur.

Analitik tahmin yöntemlerinin kullanımı, zaman içinde sürecin bileşenlerindeki değişikliklerin düzenliliğini varsayar.

Genelleştirilmiş parametre yönteminin fikri, birçok bileşenle karakterize edilen bir sürecin, sayısal değerleri sürecin kontrollü bileşenlerine bağlı olan tek boyutlu bir fonksiyonla tanımlanmasıdır. Böyle bir işlev, genelleştirilmiş bir süreç parametresi olarak kabul edilir. Bu durumda, genelleştirilmiş parametrenin belirli bir fiziksel anlamı olmadığı, tahmin edilen sürecin kontrollü bileşenlerinden yapay olarak oluşturulmuş matematiksel bir ifade olduğu ortaya çıkabilir.

Teknik sistemlerin çalışabilirlik derecesini karakterize eden parametreleri özetlerken, aşağıdaki sorunları çözmek gerekir:

Birincil parametrelerin göreceli değerlerinin tanımları;

Nesnenin durumunu değerlendirmek için birincil parametrenin önemine ilişkin tahminler;

Genelleştirilmiş bir parametre için matematiksel bir ifadenin oluşturulması.

Nesnenin durumunun farklı boyutlara sahip parametrelerle karakterize edilebilmesi nedeniyle, birincil parametrelerin göreceli değerlerinin belirlenmesi gereklidir. Bu nedenle, tüm kontrollü birincil parametreler, karşılaştırılabilir olabilecekleri tek bir hesaplama sistemine indirgenmelidir. Böyle bir sistem, boyutsuz (normalleştirilmiş) göreli hesap sistemidir.

Gerçekte, her ,s = 1, 2, …, k parametresi için, nesnenin işlevselliğini kaybettiğine ulaşıldığında kabul edilebilir bir değer olan * ve optimum değer opt'i (genellikle şuna eşittir) ayırmak mümkündür. nominal değer n).

Nesnenin çalışması sırasında koşulun gözlemlenmesine izin verin. Eğer bir , yerel parametreyi girmek yeterlidir ve sonra gerekli koşul yerine getirilecektir.

Boyutsuz (normalleştirilmiş) parametreyi şu şekilde yazıyoruz:

nerede , ve , ve ne zaman .

Böylece, (1) ifadesi kullanılarak parametre normalleştirilir ve boyutsuz normalleştirilmiş değer zamanla 1'den 0'a değişir. verilen parametre. Teorik olarak olabilir, ancak bu pratikte nesnenin çalışamaz olduğu anlamına gelir.

Belirli sorunları çözmek için uygun olan çeşitli normalleştirilmiş ifadeler belirleyebilirsiniz, örneğin:

vb. nerede - sırasıyla akım, sıfır, mat. S-th parametresi bekleniyor.

Normalleştirme ifadelerinin kullanılması, bir nesnenin durumunu karakterize eden bir dizi boyutsuz nicelik elde etmeyi mümkün kılar. Ancak nicel olarak bu değerlerdeki aynı değişiklik, nesnenin performansındaki değişiklik üzerindeki etki derecesi açısından eşdeğer değildir, bu nedenle birincil parametreleri ayırt etmek gerekir. Bu işlem, değerleri, sorunun fiziksel özü için karşılık gelen parametrelerin önemini karakterize eden ağırlık katsayıları yardımıyla gerçekleştirilir. Bu durumda nesnenin parametreleri olsun karşılık gelen ağırlık katsayıları , verilen bir veya daha fazla kriteri karşılayan ve .

Bir nesnenin sağlık derecesi, bir dizi kontrollü parametre açısından genelleştirici bir ifade kullanılarak tahmin edilebilir.

Genelleştirilmiş bir nesne parametresi nerede.

İfade (2), doğrusal bir ortalamadır. Genelleştirilmiş parametrenin tanımından, ve değeri ne kadar büyük olursa, S -inci terimin (parametrenin) 'ye katkısı o kadar büyük olur.

Genel bir parametre, formun bir ifadesi kullanılarak tanımlanabilir

, (3)

bu, doğrusal olmayan bir ortalamadır. Bu model aynı zamanda şu koşulu da karşılar: terimin katkısı ne kadar büyükse ve o kadar büyük boyutunda.

Pratikte, doğrusal olmayan bir ortalama yazmanın diğer biçimleri de kullanılır, örneğin:

, (4)

, (5)

burada (5) deneysel olarak elde edilen sonuçlara en iyi yaklaşımı verecek şekilde seçer.

Genelleştirilmiş parametre için ifadeler göz önüne alındığında, işareti değiştirmediği, yani her zaman olduğu varsayılmıştır. İşareti dikkate almak gerekirse, ifade (2) formuna dönüştürülür.

, (6)

Böylece, genelleştirilmiş bir parametrenin kullanılması, çok parametreli bir nesnenin durumunu tahmin etme problemini tek boyutlu bir zaman fonksiyonunu tahmin etmeye indirmeyi mümkün kılar.

Örnek. 6 parametreyi kontrol eden 250 saat boyunca nesneyi test etmek, tablo 1'de gösterilen sonuçları verdi.

tablo 1

ben n, nom = 9,5

V g1 . sayı = 120

ben, isim = 2.0

ben g3 , isim = 70

(1) ifadesi kullanılarak parametre değerleri normalleştirildikten sonra tablo (tablo2) şeklini alır.

Tablo 2

A.I. Saichev* ve S.G. Utkin*

ÇOK BOYUTLU ZIPLAMA SÜREÇLERİNİN ANOMALİDEN LİNEER DİFÜZYONA GEÇİŞİ

Üzerinde doğrusal difüzyon asimptotikleri olan "yarı-anormal" rastgele yürüyüşlerin çok boyutlu süreçlerini ele alıyoruz. büyük zamanlar ve orta (mikroskopik ölçeklere göre oldukça büyük) zamanlarda anormal difüzyon modellerine uymak. Bir sıçrama sürecinin anormalden doğrusal difüzyona geçişi gösterilmiştir. Sayısal hesaplamalar, iki boyutlu ve üç boyutlu durumlar için analitik hesaplamaların geçerliliğini doğrular. , .....

anahtar kelimeler Anahtar Kelimeler: anormal alt difüzyon, anormal süper difüzyon, kısmi kesirli diferansiyel denklemler, ara asimptotikler, yarı anormal rastgele yürüyüşler.

1. GİRİŞ

Anormal difüzyonun ana işareti, rastgele bir sürecin ortalama karesinin zamanla doğrusal olmayan büyümesidir: >r:V» «

karakteristik, örneğin türbülanslı difüzyon , Hamilton sistemlerinin kaotik dinamiği , , amorf yarı iletkenlerde yük transferi vb. gibi fiziksel fenomenler için karakteristiktir. sıçramalar ve dağılımlar w(x) sıçramaların büyüklüğü.

Anormal difüzyonun, merkezi limit teoreminin (CLT) veya büyük sayılar yasasının (LLN) ihlali nedeniyle meydana geldiği de bilinmektedir (bakınız, örneğin, ). Buna karşılık, LSP'nin uygulanamazlığı, atlamalar için bekleme süresinin ilk anlarının sonsuzluğundan kaynaklanmaktadır ve CLT'nin ihlali, ikinci atlama anlarının sonsuzluğu ile ilişkilidir. Bu koşullar, çoğu fiziksel fenomen için belirtilen momentlerin sınırlı olduğunu haklı olarak not eden fizikçiler tarafından anormal difüzyon teorisinin eleştirisinin nesnesi olarak hizmet eder.

"Nizhny Novgorod Devlet Üniversitesi, Nizhny Novgorod, Rusya. E-posta: [e-posta korumalı]; [e-posta korumalı]

Fiyat 18 ^ub. Bağlama 1 s.

456 A.I. SAICCHEV, S.G. UTKIN;

Bu çalışmanın amacı, LBP ve CLT geçerli olduğunda "klasik durumda" anormal subdifüzyonun da meydana gelebileceğini göstermektir. Yani, ayrıntılı olarak incelenen "tamamen" anormal difüzyon süreçleri ile birlikte, çok büyük zamanlarda ve uzaysal ölçeklerde lineer difüzyon yasalarına uyan ve "ara" zamanlarda evrensel anormal difüzyon asimptotiklerini gösteren "yarı anormal" rastgele süreçler de vardır. . Bu çalışma, farklı boyutlardaki uzaylarda tam da bu tür yarı-anormal rastgele süreçlerin analizine ayrılmıştır. Özellikle, klasik çok boyutlu difüzyonun aksine, anormal difüzyon sıçrama sürecinin rastgele koordinatlarının, rastgele atlama vektörlerinin bağımsız bileşenleri için bile istatistiksel olarak bağımlı olduğu bulundu.

2. rasgele yürüyüşler

En basit stokastik denklem hh-'ye uyan tipik bir rastgele yürüyüş süreci düşünün.

*-----. < к 1

Genelliği kaybetmeden varsayalım ki rastgele aralıklar atlama beklentileri m~k = tk - ifc-i ve rasgele atlama hk'nin kendileri karşılıklı olarak bağımsızdır ve ayrıca sırasıyla aynı f(t) ve w(x) dağılımlarına sahiptir. bariz ki

burada N(t), t zamanına göre atlama sayısıdır. Bu, n'inci atlama zamanı T(n)'nin ters fonksiyonudur:

t = T(n) = ] " "

Bu fonksiyonlar için bariz denklik bağıntısını kullanarak ~ !! N(t)^n T(n)

ve birimin bölümü - m. „>”.. l ■>.

1= ^IIn(z) = ^, z>0, "Y ■

x(z) adım fonksiyonu olduğunda, dikkate alınan X(f) sürecinin karakteristik fonksiyonu için bir denklem elde ederiz:

©(«; t) = (¿»ХМ) = £ /exp (w £ hk) V n=0 ^ ^ fc=1 " "

Fiyat 18 meşe. Bağlama Í s.

■ th) anormal alt fark ve CLT geçerlidir. Ve mi difüzyon pro-l, yasal ölçeklere tabi, nye anormal-diffu-ama böyle yarı-anomali-1. Kısım-I'de, rastgele koordinatların bile bağımlı olduğu bulundu.

telaşlı proteo-

1-)

n'inci atlamanın 1i T(n):

r\u003e O, ^ "dağıtımın ic işlevi

ÇOK BOYUTLU ATLAMA SÜREÇLERİNİN GEÇİŞİ. ..

Laplace dönüşümünü eşitliğin her iki kısmına da uygularız ve elde edilen geometrik ilerlemeyi toplarız:

Karakteristik fonksiyonun 0(u; s) Laplace görüntüsü için bulunan ifade, Monroll-Weiss denkleminin çok boyutlu bir analogudur. Burada f(s), atlamalar arasındaki aralıkların dağılımının Laplace görüntüsüdür ve w(u) atlamaların karakteristik işlevidir. Son eşitlikten Q(u; s)'nin denkleme uyduğu görülebilir.

0(u;s) - w(u)Q(u;s) =

........... ÎM (2-2)

Buna ters Fourier ve Laplace dönüşümlerini uygulayarak, hem klasik Kolmogorov-V-Feller denklemini hem de anormal difüzyonun kinetik denklemlerini (dağıtımların /(r) ve w(x) tipine bağlı olarak) elde etmek kolaydır.

3. YÜRÜMELER X(t) OLASILIK YOĞUNLUĞU İÇİN ASİMPTOTİK DENKLEMLER

Yukarıda belirtildiği gibi, W(x; t) olasılık yoğunluğu denkleminin formu, f(r) ve tu(x) dağılımlarının tipine veya daha doğrusu, onların Laplace imajı f(s) ve karakteristik fonksiyonuna bağlıdır. w(u) . Daha sonra, Laplace dönüşümü ile f(r) dağılımı durumunda farklı zaman ölçeklerinde geçerli olan W(x; t) için asimptotik denklemleri elde edeceğiz.

V "I + sp" >

burada S küçük bir parametredir. Tüm /(r) momentleri sınırlıdır, bu da onu anormal difüzyon teorisindeki anahtarlardan biri olan ilgili kesirli-üssel dağılımdan (6 = 0 değerine karşılık gelen) fiziksel olarak daha doğru kılar. Parametre 6'nın 1 ile 1/(5 arasındaki zaman aralığının yeterince büyük olduğu kadar küçük olduğu durumu ele alalım. O zaman X(t) süreci birbirini takip eden üç aşamadan geçer.Başlangıçta, t 1 zamanlarında, süreç dağılımların ince yapısına bağlıdır / (r ) u(x) uae evrensel difüzyon yasalarını yansıtır.Ayrıca, 1 ile 1/6 arasındaki zamanlarda, dağılımın yavaş düşen kuvvet kanunu kuyruklarından dolayı / (t), süreç anormal difüzyon yasalarına uyar Sonra, t 3> 1/6'da süreç, m 1/6'da üssel olarak azalan /(r) dağılımının kuyrukları nedeniyle normal lineer difüzyon yasasına uyar.

f(s) (3.1)'i Denklem (2.2)'de yerine koyarız ve asimptotik davranışını büyük zamanlarda bir sıçrama sürecinin olasılık özelliklerine karşılık gelen s 1 olarak tartışırız.

/(m) dağılımının Laplace görüntüsüne uygulandığında, s durumunu seçiyoruz. oo ve ayrıca "orta" mod 1'den sorumlu durum 6 s 1

Fiyat 18 ^ub. Bağlama 1 s.

ve (2.2) formu alır

A.I. Saichev, S.G. Utkin

©(«;«) + - w(«)]v(«; 5) = 1 olarak,

ve ikinci / (c) ~ 1 - (1 + 8 $) ve buna göre,

"" § ("; e) + (1 + - d (")] içinde (u; ") \u003d "-1.

Elde edilen eşitliklere ters Fourier ve Laplace dönüşümlerini uygulayarak Kolmogorov-Feller denklemine ulaşırız.

> + [tsg(x.^ _ * Z*)] =< оо,

veya genelleştirilmiş Kolmogorov-Feller denklemine

A + b0) t * m) - x (x-l) * u (, x)) \u003d 1 "*"

örneğin, bağımsız koordinatlara ve tüm eksenler boyunca aynı dağılıma a2 sahip çok değişkenli bir normal dağılım için karakteristik. Daha sonra yukarıdaki denklemlerden, sırasıyla farklı zaman asimptotikleri için lineer ve anormal difüzyon denklemlerini takip edin:

e-l".(< "■

t? 2h* ""h"#"""g(1 -0)

Bunlardan ilkinin çözümü iyi bilinmektedir:

хШх), !«*<-. (3.3)

* "Ve" (x O- (1 + 1 + -)

burada n, rastgele süreç uzayının boyutudur. İkinci denklemin çözümü bir sonraki bölümde verilmiştir.

n-boyutlu w'de h'yi elde etmek için

argümanın bileşenleri! /3-sabit

Çok Boyutlu Etiket-Leffle

Yani arg difüzyonu)