Küçük bir şirket için Olap. Geleneksel karar destek sistemi. İşletmede personel sirkülasyonu

  • 23.05.2019

Karmaşık hesaplamalar, tahminler, modelleme senaryoları ile ilgili analitik problemleri çözmek için "Ya eğer ..." çok boyutlu veri analizi teknolojisi kullanılır - Teknoloji OLAP. OLAP kavramı ilk olarak 1993 yılında tanınmış bir veri tabanı araştırmacısı ve ilişkisel veri modelinin yazarı olan Edgar Codd tarafından "OLAP for Analyst Users: What It Should Be" (Analyst Kullanıcıları için OLAP: Ne Olmalı) adlı kitabında açıklanmıştır ve burada analitik verilerin 12 yasasını özetlemiştir. OLAP geliştiricilerinin - ürünlerin şu anda yaşadığı işleme göre:

1. Verilerin kavramsal çok boyutlu gösterimi.

2. Şeffaflık (kullanıcı için harici verilere şeffaf erişim, nerede olursa olsun, bir analitik araç kullanarak sunucuyla iletişim kurmasına olanak tanır).

3. Verilerin mevcudiyeti ve detayı.

4. Rapor geliştirmede tutarlı performans (Veritabanının boyutlarının sayısı veya boyutu artarsa, analist kullanıcısı performansta herhangi bir düşüş hissetmemelidir).

5. İstemci-sunucu mimarisi (OLAP, masaüstünden kullanılabilir).

6. Genel çok boyutluluk.

7. Seyrek matrislerin dinamik kontrolü.

8. Çoklu kullanıcı desteği. Çoğu zaman, birkaç analist kullanıcısı aynı analitik model üzerinde birlikte çalışma ihtiyacı hisseder. çeşitli modeller aynı verilerden. OLAP aracı da şu yeteneği sağlamalıdır: paylaşmak(istek ve ekleme), bütünlük ve güvenlik.

9. Sınırsız çapraz işlem.

10. Sezgisel veri işleme.

11. Esnek raporlama seçenekleri.

12. Sınırsız boyut ve toplama düzeyi sayısı (analitik araç aynı anda en az 15 boyut ve tercihen 20 boyut sağlamalıdır).

Bir yönetici için geleneksel raporların dezavantajları açıktır: yöneticinin, özellikle çok fazla olabileceğinden, rapordan ilgilenilen sayıları seçmek için zamanı yoktur. Raporların anlaşılması için karmaşıklığı, onlarla çalışmanın zorluğu, verilerle çalışma konusunda yeni bir kavram yaratma ihtiyacına yol açtı.

Bir analist bilgi alması gerektiğinde, kendi başına veya bir programcı yardımıyla veritabanına uygun bir SQL sorgusu yapar, ilgilendiği verileri rapor şeklinde alır. Raporlar, talep üzerine veya belirli olayların veya zamanların başarılması üzerine oluşturulabilir. Bu birçok sorunu beraberinde getiriyor. Her şeyden önce, analist çoğu zaman üst düzey programlama becerilerine sahip değildir ve bağımsız olarak veritabanına bir SQL sorgusu yürütemez. Ek olarak, analistin bir rapora değil, birçoğuna ve gerçek zamanlı olarak ihtiyacı vardır. Veritabanına kolayca herhangi bir sorgu yapabilen programcılar, eğer ona yardım ederlerse, o zaman her zaman değil, çünkü onların da kendi işleri var. Veritabanı sunucusuna toplu istekler, sürekli veritabanlarıyla çalışan şirket çalışanlarının işini zorlaştırır.

OLAP kavramı tam olarak bu tür sorunları çözmek için ortaya çıktı. OLAP (Ö n L ben A analitik P işleme), büyük miktarda verinin gerçek zamanlı olarak operasyonel analitik olarak işlenmesidir. OLAP sistemlerinin amacı, büyük miktarda veriyi analiz etme ve karmaşık veritabanı sorgularını hızla işleme sorunlarını çözmeyi kolaylaştırmaktır.

OLAP:

    bir yazılım ürünü değil

    bir programlama dili değil

    teknoloji değil

OLAP, analistlerin verilere erişmesini kolaylaştıran bir kavramlar, ilkeler ve gereksinimler topluluğudur. Büyük hacimli verilerin gerçek zamanlı olarak çok boyutlu dinamik analizi için bir araçtır.

Bir analistin görevi, büyük veri kümelerinde kalıpları bulmaktır. Analist tek bir gerçeğe dikkat etmeyecek, birkaç düzine benzer olay hakkında bilgiye ihtiyacı var. Veritabanındaki tek gerçekler, örneğin, işlemin yetkin olduğu bir satış departmanı çalışanı veya bir muhasebeci için ilgi çekicidir. Bir analist için bir kayıt yeterli değildir - örneğin, belirli bir şube veya temsilciliğin tüm işlemlerine bir ay veya bir yıl boyunca ihtiyaç duyabilir. Aynı zamanda analist, alıcının TIN'i, tam adresi ve telefon numarası, sözleşme endeksi ve benzeri gibi gereksiz ayrıntıları atar. Aynı zamanda, bir analistin çalışması gereken veriler mutlaka sayısal değerler içerir - bu, faaliyetinin özünden kaynaklanmaktadır.

Çok boyutlu bir veri kümesi genellikle bir OLAP küpü olarak temsil edilir (bkz. Şekil 26). Bir OLAP küpünün eksenleri parametreleri içerir ve hücreler, bunlara bağlı olan toplu verileri içerir.

Pirinç. 26OLAP - küp

OLAP küpleri aslında meta raporlardır. Küplerin avantajları açıktır - bir küp oluştururken veri tabanından yalnızca bir kez veri talep edilmesi gerekir. Analistler, kural olarak, anında eklenen ve değiştirilen bilgilerle çalışmadığından, oluşturulan küp oldukça uzun bir süre için geçerlidir. Bu sayede, veritabanı sunucusunun çalışmasındaki kesintiler yalnızca ortadan kaldırılmakla kalmaz (binlerce ve milyonlarca yanıt satırı olan sorgular yoktur), aynı zamanda analistin verilere erişim hızı da önemli ölçüde artar.

Ancak önemli bir dezavantaj da var: Bir OLAP küpü onlarca, hatta yüzlerce kez alabilir. daha çok alan orijinal verilerden daha

OLAP - küpün üç boyutlu olması gerekmez. Çözülmekte olan probleme bağlı olarak hem iki boyutlu hem de çok boyutlu olabilir. Analistler 20'den fazla ölçüme ihtiyaç duyabilir - ciddi OLAP ürünleri tam da böyle bir sayı için tasarlanmıştır. Daha basit masaüstü uygulamaları maksimum 6 boyutu destekler.

Küpün tüm öğelerinden uzak doldurulmalıdır: herhangi bir bilgi eksikse, ilgili hücredeki değer bunun için belirlenmeyecektir. Bir OLAP uygulamasının verileri mutlaka çok boyutlu bir yapıda depolaması da gerekli değildir - asıl mesele, kullanıcı için bu verilerin tam olarak böyle görünmesidir.

OLAP küpünün doldurulması hem operasyonel sistemlerden gelen gerçek verilerle gerçekleştirilebilir hem de geçmiş verilere dayalı olarak tahmin edilebilir. Hiperküp boyutları karmaşık, hiyerarşik olabilir ve bunlar arasında ilişkiler kurulabilir. Analiz sırasında, kullanıcı veriler üzerindeki bakış açısını değiştirebilir (mantıksal görünümü değiştirme işlemi olarak adlandırılır), böylece verileri farklı bölümlerde görüntüleyebilir ve belirli sorunları çözebilir. Tahmin ve koşullu zamanlama (what-if analizi) dahil olmak üzere küpler üzerinde çeşitli işlemler gerçekleştirilebilir.

Üç boyutlu bir küp kolayca çizilebilir ve hayal edilebilir. Bununla birlikte, altı veya yirmi boyutlu bir küpü yeterince temsil etmek veya tasvir etmek neredeyse imkansızdır. Bu nedenle, kullanımdan önce, çok boyutlu bir küpten sıradan iki boyutlu tablolar çıkarılır, yani. küpün boyutlarını etiketlere göre "kesin". OLAP küplerini boyutlara göre keserek, analist aslında kendisini ilgilendiren “sıradan iki boyutlu raporları” alır (terimin genel anlamıyla raporlar olması gerekmez - aynı işlevlere sahip veri yapılarından bahsediyoruz). Bu işleme küpü "kesmek" denir. Bu şekilde, analist küpün iki boyutlu bir dilimini alır ve onunla çalışır. İhtiyacınız olan kesintiler raporlardır.

OLAP sistemi ile etkileşime giren kullanıcı, bilgilerin esnek bir şekilde görüntülenmesini gerçekleştirebilir, keyfi veri dilimleri elde edebilir ve detaylandırma, evrişim, uçtan uca dağıtım ve zaman karşılaştırması gibi analitik işlemleri gerçekleştirebilir (bkz. Şekil 27).

Pirinç. 27 PRasgele veri dilimleri elde edildiğindeOLAP küpünü kesmek.

OLAP ürünlerinin sınıflandırılması

Veri işlemleri bir OLAP makinesi tarafından gerçekleştirilir. OLAP ürünleri, verilerin saklanma şekline ve OLAP makinesinin konumuna göre sınıflandırılır.

Veri saklama yöntemine göre MOLAP, ROLAP ve HOLAP olmak üzere üç kategoriye ayrılırlar:

    MOLAP - kaynak ve toplu veriler şurada depolanır: çok boyutlu veritabanı veya çok boyutlu bir yerel küpte.

    ROLAP - kaynak veriler şurada saklanır: ilişkisel veritabanı veya bir dosya sunucusundaki düz yerel tablolarda. Toplu veriler, aynı veritabanındaki hizmet tablolarına yerleştirilebilir. Verilerin ilişkisel bir veritabanından çok boyutlu küplere dönüştürülmesi, bir OLAP aracının talebi üzerine gerçekleşir.

    HOLAP - orijinal veriler içinde kalır ilişkisel veritabanı, ve toplu veriler yerleştirilir çok boyutlu veritabanı. OLAP küpü, ilişkisel ve çok boyutlu verilere dayalı olarak bir OLAP aracının isteği üzerine oluşturulur.

OLAP makinesinin konumuna bağlı olarak, OLAP ürünlerinin iki ana sınıfı vardır: OLAP sunucusu ve OLAP istemcisi.

OLAP sunucusu bir istek alır, sunucuda toplu verileri hesaplar ve depolar, istemci bilgisayarda yüklü istemci uygulamasına yalnızca sorguların sonuçlarını sunucuda depolanan çok boyutlu küplere verir. Birçok modern OLAP sunucusu, üç veri depolama yöntemini de destekler: MOLAP, ROLAP ve HOLAP.

OLAP istemcisi ayrı bir sunucuda değil, kullanıcının istemci bilgisayarında çok boyutlu bir küp ve OLAP hesaplamaları oluşturur. OLAP istemcileri ayrıca ROLAP ve MOLAP olarak ikiye ayrılır.

Bir OLAP sunucusunun, eşit bilgisayar gücüne sahip bir OLAP istemcisinden daha önemli miktarda veri işleyebildiği bilinmektedir. Bunun nedeni, OLAP sunucusunun sabit sürücülerönceden hesaplanmış küpleri içeren çok boyutlu bir veritabanı. Müşteri programları hem küpü hem de parçalarını alarak sunucuya istekler gerçekleştirin. Bir OLAP sunucusunun performans özellikleri, veri büyümesine daha az duyarlıdır.

OLAP istemcisi, işlem sırasında tüm küpü RAM'de bulundurmalıdır. Bu nedenle, OLAP istemcisi tarafından işlenen veri miktarı, doğrudan kullanıcının bilgisayarındaki RAM miktarına bağlıdır. OLAP istemcisi, birincil verilerin ön gruplaması için filtreleme koşullarını ve algoritmayı açıklayan veritabanına bir sorgu oluşturur. Sunucu, kayıtları bulur, gruplandırır ve daha fazla OLAP hesaplaması için kompakt bir seçim döndürür. Bu örneğin boyutu, birleştirilmemiş birincil kayıtların hacminden onlarca ve yüzlerce kez daha küçük olabilir. Sonuç olarak, bilgisayar kaynaklarında böyle bir OLAP istemcisine duyulan ihtiyaç önemli ölçüde azalır.

OLAP sunucusu sunar minimum Gereksinimler istemci bilgisayarların gücüne. OLAP istemcisinin gereksinimleri daha yüksektir, çünkü RAM'inde hesaplamalar yapar. İstemci bilgisayarların kapasitesi düşükse, OLAP istemcisi yavaş çalışır veya hiç çalışamaz. Güçlü bir sunucu satın almak, tüm bilgisayarları yükseltmekten daha ucuz olabilir.

Bir OLAP sunucusunun maliyeti oldukça yüksektir ve bir OLAP sunucusunun uygulanması ve bakımı yüksek nitelikli personel gerektirir. Bir OLAP istemcisinin maliyeti, bir OLAP sunucusunun maliyetinden çok daha düşüktür.

OLAP'ın kullanıma sunulmasıyla birlikte kurumsal yönetimin üretkenliği ve verimliliği önemli ölçüde artar. Veri analizi sürecinde asıl kişi, uzman- uzman konu alanı. Bir uzman, hipotezler (varsayımlar) ortaya koyar ve bunları analiz etmek için ya bazı örnekleri çeşitli şekillerde inceler ya da hipotezlerin güvenilirliğini test etmek için modeller oluşturur.

Analitik araçlar izin verir son kullanıcı IT alanında özel bilgisi olmayan, büyük miktarda veri ile çalışır. Analitik iş sistemlerinin amacı: kurumsal yönetimin tüm seviyelerinde karar desteği.

analitik sistemler operasyonel seviye işletmenin "çalışma modunda" yönetimini sağlamak, yani. belirli bir üretim programının uygulanması. analitik sistemler stratejik seviye işletmenin yönetimine "geliştirme modunda" çözümler geliştirmesine yardımcı olur. Stratejik yönetim sistemleri, şirketin stratejik yönetiminin kilit görevlerinin çözümünü destekleyen analitik IS'lerdir.

OLAP ile ilgili birçok makale şu sitede bulunabilir: http://www.olap.ru/basic/oolap.asp

OLAP sağlayan özel bir iş raporlama teknolojisidir. hızlı ayar yeni raporlar, raporun anında alınması ve onunla etkileşimli çalışma imkanı.

OLAP (Çevrimiçi Analitik İşleme) terimi genellikle "operasyonel veri analizi" olarak çevrilir. Operasyonel veri analizi, analiz edilen bilginin özünü kendisi için en açık şekilde ortaya koyan bu veri sunum biçimlerini araştırmak için raporu değiştirmenin birçok yinelemesinin son kullanıcı tarafından uygulanmasıdır. şu an Sorunlar.

OLAP raporu

Ancak, OLAP karmaşık bir analitik teknoloji değildir; bunun yerine OLAP, çeşitli bölümlerde toplanan rakamları içeren standartlaştırılmış, basitleştirilmiş bir rapor formu sağlar. Bu form, kurumsal bir raporlama sistemi oluşturmak için en uygun olanıdır ve geniş ofis çalışanları ve çeşitli seviyelerdeki yöneticilere yöneliktir.

Son kullanıcının bakış açısından, OLAP teknolojisinin özü, verilerin kendisine çeşitli bölümlerde otomatik olarak özetleyen ve hem hesaplamaları hem de raporun formunu etkileşimli olarak yönetmenizi sağlayan dinamik bir tabloda sunulmasıdır.

Rapor yönetim araçları, tablonun kendisinin unsurlarıdır. Sütunları ve satırları sürükleyerek, kullanıcı bağımsız olarak rapor türünü ve veri gruplandırmasını değiştirir, sistem anında yeni toplamları hesaplar, binlerce hatta milyonlarca satırı toplar.

Dal

Bütçe kalemi

Ürün

toplam

Faiz geliri

Toplam

30 000 000

Faiz dışı gelir

Müşteri ödemeleri

takas işlemleri

Toplam

10 000 000

Toplam

40 000 000

Faiz geliri

Toplam

6 000 000

Faiz dışı gelir

Müşteri ödemeleri

takas işlemleri

Toplam

3 000 000

Toplam

9 000 000

Novosibirsk

Toplam

52 000 000

Pirinç. 1 OLAP raporu

Bir OLAP raporu, kullanıcı komutlarının bir saniyeden daha kısa bir sürede alınmasıyla yeniden oluşturulur ve bu, kullanıcının bir raporlama formundan diğerlerini almasına izin verir. Raporun bu hızı, diğer raporlama sistem ve teknolojilerinden temel olarak farklı olan OLAP sistemlerinin özel mimarisi sayesinde sağlanmaktadır.

OLAP raporundaki herhangi bir veri iki kategoriye ayrılır - boyutlar (satırlar veya tarihler) ve olgular veya ölçümler (sayısal veriler). Rapor birkaç sabit alandan oluşur - sütunlar, satırlar, veriler ve etkin olmayan boyutlar alanı.

Veri alanı, ayrıntılı verileri, ara toplamları ve nihai toplamları görüntüler. Sonuç olarak, verilerin doğası, konu alanı ve kullanıcı grubu ne olursa olsun, bir rapor oluşturan sınırlı sayıda kural vardır.

Bu, oluşturmanıza olanak sağlar evrensel mekanizmalar hesaplamalar (OLAP-makinesi), raporun yönetimi ve gösterimi (OLAP-tablosu, OLAP-grafiği, OLAP-haritası).

Bir OLAP raporunun ekran ve kağıt formları olabilir. OLAP raporu ekran formu verileri işlemenize ve formu görüntülemenize olanak tanır. Ortaya çıkan herhangi bir ekran raporu, ekranda göründüğü gibi kağıda yazdırılabilir.

Bir OLAP raporu, bir veya daha fazla tabloya ek olarak, grafikler, çizelgeler gibi başka görsel öğeler içerebilir. Sözde "trafik ışıkları" - anlaşılması kolay diyagramlar - raporun hücrelerine eklenebilir. Bu, verileri bir bakışta anlamanıza olanak tanır, bu nedenle bu tür raporlar genellikle üst düzey yöneticiler için oluşturulur.

OLAP raporu özellikleri

Dolayısıyla, bir OLAP raporunun bir dizi temel özelliği vardır, bunlar:

  • kullanıcıya verilerle çalışmak için yüksek düzeyde etkileşimli bir yol sağlayan bir rapor
  • ayrıntıları incelemenize olanak tanıyan toplu bir rapor
  • alanların sırasını değiştirerek analitik bölümleri kolayca değiştirmenizi sağlayan bir rapor
  • tüm olası kombinasyonlara göre verileri anında filtrelemenizi sağlayan bir rapor
  • bir yazıcıya çıktı alma özelliğine sahip ekran raporu
  • programlama gerektirmeden kullanıcı tarafından özelleştirilebilir rapor
  • basit, düzenli bir yapıya sahip bir rapor

Talepler, raporlar, analizler

OLAP raporları, kullanıcıya verilerle çalışma konusunda yeni bir kalite sağlar. Kullanıcı verileri özetleyebilir, özetleyebilir ve iyileştirebilir, satırları ve sütunları taşıyabilir, tüm bölümler için anında yeni ara ve nihai toplamlar alabilir, raporla diğer birçok etkileşimli işlemi gerçekleştirebilir, verileri daha hızlı ve daha derin analiz edebilir.

OLAP(İngilizce Çevrimiçi Analitik İşleme'den - operasyonel analitik veri işleme, ayrıca: gerçek zamanlı analitik veri işleme, etkileşimli analitik veri işleme) - daha geniş bir bilgi teknolojisi alanının parçası olan çok boyutlu hiyerarşik temsillerine dayalı analitik veri işlemeye yönelik bir yaklaşım - iş -analitiği().

TAdviser'daki OLAP bölümünde OLAP çözümleri ve projeleri kataloğuna bakın.

Kullanıcının bakış açısından, OLAP-sistemler, çeşitli bölümlerdeki bilgilerin esnek bir şekilde görüntülenmesi, toplu verilerin otomatik olarak alınması, analitik konvolüsyon işlemlerinin performansı, detaylandırma, zaman içinde karşılaştırma araçları sağlar. Tüm bunlar, OLAP sistemlerini, verilerin çeşitli bölümlerde sunulmasını içeren her türlü iş raporlaması için veri hazırlama alanında belirgin avantajlara sahip bir çözüm haline getirir. farklı seviyeler hiyerarşiler - örneğin, satış raporları, çeşitli bütçe biçimleri vb. Böyle bir sunumun avantajları, tahmin de dahil olmak üzere diğer veri analizi biçimlerinde de açıktır.

OLAP sistemleri için gereksinimler. FASMİ

OLAP sistemleri için temel gereksinim, bir analistin bilgi ile etkileşimli çalışması sürecinde kullanılmalarına izin veren hızdır. Bu anlamda, OLAP sistemleri, ilk olarak, veri gruplandırma ve toplama kullanan analistler için tipik sorgularla yapılan seçimlerin bekleme süresi ve RDBMS'yi yükleme açısından genellikle pahalı olduğu geleneksel RDBMS'ye karşıdır, bu nedenle, önemli hacimlerle etkileşimli çalışma onlarla birlikte çalışır. veriler karmaşıktır. İkinci olarak, OLAP sistemleri ayrıca, örneğin, yaygın olarak kullanılan geleneksel elektronik tablolar biçiminde, zor ve sezgisel olmayan çok boyutlu verilerin sunumu ve dilimi değiştirme operasyonları biçimindeki olağan düz dosya veri temsiline de karşıdır. veriler üzerinde görüş - ayrıca zaman ve çaba gerektirir. verilerle etkileşimli çalışmayı karmaşıklaştırır.

Aynı zamanda, bir yandan OLAP sistemlerine özgü veri gereksinimleri, genellikle tipik OLAP görevleri için optimize edilmiş özel yapılarda veri depolama anlamına gelirken, diğer yandan, analiz süreci sırasında mevcut sistemlerden doğrudan veri çıkarılması önemli bir düşüşe yol açacaktır. performanslarında.

Bu nedenle, önemli bir gereklilik, veri kaynağı olarak hareket eden mevcut sistemler ile OLAP sistemi ve ayrıca OLAP sistemi ve harici veri analizi ve raporlama uygulamaları arasında en esnek ithalat-ihracat bağlantısının sağlanmasıdır.

Aynı zamanda, böyle bir bağlantı, çeşitli veri kaynaklarından içe aktarma-dışa aktarmayı desteklemek, verileri temizlemek ve dönüştürmek için prosedürleri uygulamak ve kullanılan sınıflandırıcıları ve dizinleri birleştirmek için açık gereksinimleri karşılamalıdır. Ek olarak, bu gereksinimler, mevcut bilgi sistemlerindeki çeşitli veri güncelleme döngülerini hesaba katma ve gerekli veri detay düzeyini birleştirme ihtiyacı ile tamamlanmaktadır. Bu sorunun karmaşıklığı ve çok yönlülüğü, veri ambarları kavramının ortaya çıkmasına ve dar anlamda, ayrı bir veri dönüştürme ve dönüştürme yardımcı programı sınıfının - ETL (Dönüşüm Yükünü Çıkarma) tahsis edilmesine yol açmıştır.

Aktif veri depolama modelleri

Yukarıda, OLAP'ın verilerin çok boyutlu hiyerarşik bir temsilini varsaydığını ve bir anlamda RDBMS tabanlı sistemlere karşı olduğunu belirtmiştik.

Ancak bu, tüm OLAP sistemlerinin aktif, "çalışan" sistem verilerini depolamak için çok boyutlu bir model kullandığı anlamına gelmez. Aktif veri depolama modeli, FASMI testi tarafından belirlenen tüm gereksinimleri etkilediğinden, OLAP alt türlerinin geleneksel olarak ayırt edilmesinin bu temelde olduğu gerçeğiyle vurgulanmaktadır - çok boyutlu (MOLAP), ilişkisel (ROLAP) ve hibrit (HOLAP).

Bununla birlikte, yukarıda belirtilenler tarafından yönetilen bazı uzmanlar Nigel Bekleyen, bir kritere dayalı sınıflandırmanın yeterince tamamlanmadığını gösterir. Ayrıca, mevcut OLAP sistemlerinin büyük çoğunluğu hibrit tipte olacaktır. Bu nedenle, hangisinin geleneksel OLAP alt türlerinden hangisine karşılık geldiğini belirterek, aktif veri depolama modelleri üzerinde daha ayrıntılı olarak duracağız.

Aktif verileri çok boyutlu bir veritabanında saklama

Bu durumda, OLAP verileri, bu tür veriler için optimize edilmiş yapıları kullanan çok boyutlu DBMS'lerde depolanır. Tipik olarak, çok boyutlu DBMS, gerekli hiyerarşi düzeylerine göre toplama vb. dahil olmak üzere tüm tipik OLAP işlemlerini de destekler.

Bu tür veri depolama bir anlamda OLAP için klasik olarak adlandırılabilir. Ancak onun için, verilerin ön hazırlığı için tüm adımlar tamamen gereklidir. Tipik olarak, çok boyutlu DBMS verileri diskte depolanır, ancak bazı durumlarda veri işlemeyi hızlandırmak için bu tür sistemler verileri RAM'de saklamanıza izin verir. Aynı amaçlar için, bazen önceden hesaplanmış toplam değerlerin ve diğer hesaplanan değerlerin veritabanında depolanması kullanılır.

Eşzamanlı okuma ve yazma işlemleri ile çok kullanıcılı erişimi tam olarak destekleyen çok boyutlu VTYS'ler oldukça nadirdir, normal mod bu tür DBMS için, çok kullanıcılı salt okunurken yazma erişimine sahip tek kullanıcılı veya çok kullanıcılı salt okunurdur.

Onlara dayanan çok boyutlu DBMS ve OLAP sistemlerinin bazı uygulamalarının koşullu eksiklikleri arasında, veritabanı tarafından işgal edilen ve kullanıcının bakış açısından öngörülemeyen alan miktarındaki artışa duyarlılıkları not edilebilir. Bu etki, veri tabanında depolanan bilgi miktarında doğrusal olmayan bir artışa neden olan veri tabanında önceden hesaplanmış toplam göstergelerin ve diğer miktarların değerlerinin depolanmasını dikte eden sistem yanıt süresini en aza indirme arzusundan kaynaklanır. buna yeni veri değerlerinin veya ölçümlerin eklenmesi.

Seyrek veri küplerinin verimli depolanmasıyla ilgili sorunların yanı sıra bu sorunun tezahür derecesi, OLAP sistemlerinin belirli uygulamaları için uygulanan yaklaşımların ve algoritmaların kalitesi ile belirlenir.

Aktif verileri ilişkisel bir veritabanında saklama

OLAP verileri ayrıca geleneksel bir RDBMS'de saklanabilir. Çoğu durumda, bu yaklaşım, OLAP'ı mevcut olanlarla "acısız bir şekilde" entegre etmeye çalışırken kullanılır. muhasebe sistemleri veya RDBMS'ye dayalı veri ambarları. Aynı zamanda, bu yaklaşım, FASMI testinin gereksinimlerinin etkin bir şekilde yerine getirilmesini sağlamak için (özellikle minimum sistem yanıt süresinin sağlanması) RDBMS'den bazı ek özellikler gerektirir. Tipik olarak, OLAP verileri denormalize edilmiş bir biçimde saklanır ve önceden hesaplanmış toplamaların ve değerlerin bazıları özel tablolarda saklanır. Normalleştirilmiş bir biçimde saklandığında, aktif veri depolama yöntemi olarak RDBMS'nin etkinliği azalır.

Önceden hesaplanmış verileri depolamak için verimli yaklaşımlar ve algoritmalar seçme sorunu, RDBMS tabanlı OLAP sistemleriyle de ilgilidir, bu nedenle bu tür sistemlerin üreticileri genellikle kullanılan yaklaşımların esasına odaklanır.

Genel olarak, OLAP görevleri için daha az verimli olan veri depolama yapıları nedeniyle, RDBMS tabanlı OLAP sistemlerinin çok boyutlu DBMS tabanlı sistemlerden daha yavaş olduğuna inanılmaktadır, ancak pratikte bu, belirli bir sistemin özelliklerine bağlıdır.

RDBMS'de veri depolamanın avantajları arasında genellikle bu tür sistemlerin daha fazla ölçeklenebilirliği denir.

Aktif verileri "düz" dosyalarda saklama

Bu yaklaşım, veri parçalarını depolamayı içerir. normal dosyalar. Genellikle güncel verileri diskte veya diskte önbelleğe alarak işi hızlandırmak için iki ana yaklaşımdan birine ek olarak kullanılır. rasgele erişim belleği istemci bilgisayarı.

Hibrit depolama yaklaşımı

Çoğu OLAP satıcısı, karmaşık çözümler OLAP sisteminin kendisine ek olarak, bir DBMS, ETL (Dönüşüm Yükünü Ayıkla) ve raporlama araçları da dahil olmak üzere, şu anda aktif sistem verilerinin depolanmasını organize etmek, bunları bir şekilde RDBMS ve arasında dağıtmak için hibrit bir yaklaşım kullanıyor. özel depolamanın yanı sıra disk yapıları ve RAM'de önbelleğe alma arasında.

Böyle bir çözümün etkinliği, üretici tarafından kullanılan belirli yaklaşımlara ve algoritmalara bağlı olduğundan, hangi verilerin ve nerede saklanacağı, daha sonra, söz konusu sistemin belirli özelliklerini değerlendirmeden, bir sınıf olarak bu tür çözümlerin başlangıçta daha yüksek verimliliği hakkında aceleyle sonuçlar çıkarın.

OLAP(İngilizce çevrimiçi analitik işleme) - analitik veritabanlarında çok boyutlu sorguların dinamik olarak işlenmesi için bir dizi yöntem. Bu tür veri kaynakları genellikle oldukça büyüktür ve bunları işlemek için kullanılan araçlarda en önemli gereksinimlerden biri, yüksek hız. İlişkisel veritabanlarında bilgiler, iyi normalleştirilmiş ayrı tablolarda depolanır. Ancak karmaşık çok tablolu sorgular oldukça yavaştır. OLAP sistemlerinde veri depolama yapısının özellikleri nedeniyle işlem hızı açısından önemli ölçüde daha iyi performans elde edilir. Tüm bilgiler açıkça düzenlenmiştir ve iki tür veri deposu kullanılmaktadır: ölçümler(satış noktaları, müşteriler, çalışanlar, hizmetler vb. gibi kategorilere ayrılmış dizinleri içerir) ve veri(farklı boyutlardaki unsurların etkileşimini karakterize edin, örneğin, 3 Mart 2010'da, satıcı A, müşteri B'ye C mağazasında G miktarı için bir hizmet sağladı para birimleri). Bir analitik küpte sonuçları hesaplamak için ölçümler kullanılır. Ölçüler, karşılık gelen seçilen boyutlar ve onların üyeleri tarafından toplanan olguların koleksiyonlarıdır. Bu özellikler nedeniyle, çok boyutlu veriler içeren karmaşık sorgular, ilişkisel kaynaklara göre çok daha az zaman alır.

OLAP sistemlerinin ana satıcılarından biri Microsoft Corporation'dır. Microsoft SQL Server Business Intelligence Development Studio (BIDS) ve Microsoft Office PerformancePoint Server Planning Business Modeler (PPS) uygulamalarında analitik bir küp oluşturmaya ilişkin pratik örnekleri kullanarak OLAP ilkelerinin uygulanmasını düşünün ve olasılıkları öğrenin. Görsel sunum grafikler, çizelgeler ve tablolar şeklinde çok boyutlu veriler.

Örneğin, TEKLİFLER'de bir sigorta şirketi, çalışanları, ortakları (müşterileri) ve satış noktaları hakkındaki verilere dayalı bir OLAP küpü oluşturmanız gerekir. Şirketin tek bir hizmet türü sağladığını varsayalım, bu nedenle hizmetlerin ölçümüne gerek yoktur.

Önce boyutları tanımlayalım. Aşağıdaki varlıklar (veri kategorileri) şirketin faaliyetleri ile ilişkilidir:

  • Satış puanı
    - Çalışanlar
    - Ortaklar
Ayrıca, herhangi bir küp için zorunlu olan Zaman ve Senaryo boyutlarını da oluşturur.
Ardından, gerçekleri saklamak için bir tabloya ihtiyacınız var (olgu tablosu).
Tablolardaki bilgiler manuel olarak girilebilir, ancak en yaygın yol, çeşitli kaynaklardan içe aktarma sihirbazını kullanarak verileri yüklemektir.
Aşağıdaki şekil, boyut ve olgu tablolarını manuel olarak oluşturmak ve doldurmak için süreç akışını gösterir:

Şekil 1. Analitik bir veritabanında ölçüm ve gerçekler tabloları. oluşturma sırası
TEKLİFLER'de çok boyutlu bir veri kaynağı oluşturduktan sonra, temsilini görüntüleyebilirsiniz ( veri kaynağı görüş). Örneğimizde, aşağıdaki şekilde gösterilen devreyi elde ediyoruz.


İncir. 2. Business Intelligence Development Studio'da (BIDS) Veri Kaynağı Görünümü

Görüldüğü gibi olgu tablosu, tanımlayıcı alanların (PartnerID, EmployeeID, vb.) bire bir yazışmaları aracılığıyla boyut tablolarıyla ilişkilidir.

Sonuca bakalım. Küp tarayıcı sekmesinde, ölçüleri ve boyutları toplamlar, satırlar, sütunlar ve filtreler alanlarına sürükleyerek, ilgilenilen verilere (örneğin, belirli bir çalışanın 2005 yılında imzaladığı sigorta sözleşmeleri) bir görünüm elde edebiliriz.

4. OLAP ürünlerinin sınıflandırılması.

5. OLAP istemcilerinin çalışma prensipleri.

7. OLAP teknolojilerinin uygulama alanları.

8. Satış alanında analiz için OLAP teknolojilerinin kullanımına bir örnek.

1. OLAP'ın işletmenin bilgi yapısındaki yeri.

"OLAP" terimi, ayrılmaz bir şekilde "veri ambarı" (Veri Ambarı) terimiyle bağlantılıdır.

Depolamadaki veriler, iş süreçlerini otomatikleştirmek için tasarlanmış operasyonel sistemlerden (OLTP sistemleri) gelir. Ek olarak, depolama şu şekilde doldurulabilir: dış kaynaklar istatistik raporları gibi.

Deponun görevi, analiz için "hammaddeyi" tek bir yerde ve basit, anlaşılır bir yapıda sağlamaktır.

Ayrı bir depolamanın görünümünü haklı çıkaran başka bir neden daha var - operasyonel bilgiler için karmaşık analitik sorgular, şirketin mevcut çalışmasını yavaşlatır, tabloları uzun süre engeller ve sunucu kaynaklarını ele geçirir.

Depolama altında, mutlaka devasa bir veri birikimi olmadığı anlaşılabilir - ana şey, analiz için uygun olmasıdır.

Merkezileştirme ve uygun yapılandırma, bir analistin ihtiyaç duyduğu her şeyden uzaktır. Sonuçta, bilgileri görüntülemek, görselleştirmek için hala bir araca ihtiyacı var. Tek bir veri havuzu temelinde oluşturulmuş bile geleneksel raporlarda tek bir şey eksiktir - esneklik. Verilerin istenen görünümünü elde etmek için "bükülemez", "genişletilemez" veya "daraltılamaz". Keşke verileri basit ve rahat bir şekilde genişletip daraltmasına izin verecek bir araca sahip olsaydı! OLAP böyle bir araçtır.

OLAP, bir veri ambarının gerekli bir özelliği olmamasına rağmen, bu veri ambarında biriken bilgileri analiz etmek için giderek daha fazla kullanılmaktadır.

OLAP'ın işletmenin bilgi yapısındaki yeri (Şekil 1).

Resim 1. YerOLAP işletmenin bilgi yapısında

Operasyonel veriler çeşitli kaynaklardan toplanır, temizlenir, entegre edilir ve ilişkisel bir depoya konur. Aynı zamanda, çeşitli raporlama araçları kullanılarak analiz için zaten mevcutturlar. Daha sonra veriler (tamamen veya kısmen) OLAP analizi için hazırlanır. Özel bir OLAP veritabanına yüklenebilir veya ilişkisel bir depoda bırakılabilirler. En önemli unsuru meta verilerdir, yani verilerin yapısı, yerleştirilmesi ve dönüştürülmesi hakkında bilgi. Onlar sayesinde, çeşitli depolama bileşenlerinin etkin etkileşimi sağlanır.

Özetle, OLAP'ı bir depoda biriken verilerin çok boyutlu analizi için bir dizi araç olarak tanımlayabiliriz.

2. Operasyonel analitik veri işleme.

OLAP kavramı, çok boyutlu veri gösterimi ilkesine dayanmaktadır. 1993 yılında E. F. Codd, ilişkisel modelin eksikliklerini göz önünde bulundurarak, önce "verileri çok boyutlu, yani kurumsal analistler için en anlaşılır şekilde birleştirme, görüntüleme ve analiz etme" yetersizliğine işaret etti ve tanımladı. Genel Gereksinimler ile OLAP sistemleri, ilişkisel VTYS'nin işlevselliğini genişletmek ve dahil çok değişkenli analizözelliklerinden biri olarak.

Codd'a göre, çok boyutlu kavramsal bir veri görünümü, belirli veri kümelerinin analiz edilebildiği birkaç bağımsız boyuttan oluşan çoklu bir bakış açısıdır.

Birden fazla boyutta eş zamanlı analiz, çok değişkenli analiz olarak tanımlanır. Her boyut, bir dizi ardışık genelleme düzeyinden oluşan veri birleştirme yönlerini içerir; burada her bir üst düzey, karşılık gelen boyut için daha büyük bir veri toplama derecesine karşılık gelir.

Böylece Yüklenici boyutu, "işletme - alt bölüm - departman - çalışan" genelleme düzeylerinden oluşan konsolidasyon yönü ile belirlenebilir. Zaman boyutu, aylara ve haftalara göre zaman sayımı uyumlu olmadığı için "yıl - çeyrek - ay - gün" ve "hafta - gün" olmak üzere iki konsolidasyon yönü içerebilir. Bu durumda, ölçümlerin her biri için istenen bilgi detay seviyesini keyfi olarak seçmek mümkün hale gelir.

İniş işlemi (delme), daha yüksek konsolidasyon seviyelerinden alt seviyelere doğru harekete tekabül eder; aksine, kaldırma (yuvarlama) işlemi, daha düşük seviyelerden daha yüksek seviyelere hareket anlamına gelir (Şekil 2).


Şekil 2.Veri birleştirmenin boyutları ve yönleri

3. Operasyonel analitik işleme araçları için gereklilikler.

Çok boyutlu yaklaşım, ilişkisel yaklaşımla neredeyse aynı anda ve paralel olarak ortaya çıkmıştır. Ancak, yalnızca doksanların ortasından başlayarak, daha doğrusu
1993, ilgi MDBMS genel olmaya başladı. Bu yıl yeni bir program makalesi ilişkisel yaklaşımın kurucularından biri E. Kodda uygulama araçları için 12 temel gereksinimi formüle ettiği OLAP(Tablo 1).

Tablo 1.

Çok Boyutlu Veri Görünümü

Araçlar, verilerin kavramsal düzeyde çok boyutlu bir görünümünü desteklemelidir.

şeffaflık

Kullanıcının, verileri depolamak ve işlemek için hangi özel araçların kullanıldığını, verilerin nasıl düzenlendiğini ve nereden geldiğini bilmesine gerek yoktur.

kullanılabilirlik

Araçların kendileri, belirli bir isteğe yanıt oluşturmak için en iyi veri kaynağını seçmeli ve bunlarla ilişkilendirilmelidir. Araçlar kendi otomatik görüntülerini sağlamalıdır mantık şemasıçeşitli heterojen veri kaynaklarına

Tutarlı Performans

Performans, sorgudaki Dimensions sayısından pratik olarak bağımsız olmalıdır.

İstemci-sunucu mimarisi için destek

Araçlar bir istemci-sunucu mimarisinde çalışmalıdır.

Tüm boyutların eşitliği

Boyutların hiçbiri temel olmamalı, hepsi eşit (simetrik) olmalıdır.

Seyrek matrislerin dinamik olarak işlenmesi

Null değerler en verimli şekilde saklanmalı ve işlenmelidir.

Verilerle çalışmanın çok kullanıcılı modu için destek

Araçlar, birden fazla kullanıcının çalışmasına izin vermelidir.

Çeşitli ölçümlere dayalı operasyonlar için destek

Herşey çok boyutlu işlemler(örn. Toplama), herhangi bir sayıda herhangi bir boyuta tek tip ve tutarlı bir şekilde uygulanmalıdır.

Veri Manipülasyonunun Kolaylığı

Araçlar en uygun, doğal ve rahat kullanıcı arayüzüne sahip olmalıdır.

Gelişmiş veri sunum araçları

Araçlar, verilerin görselleştirilmesinin (temsilinin) çeşitli yollarını desteklemelidir.

Sınırsız sayıda boyut ve veri toplama düzeyi

Desteklenen Boyutların sayısında bir sınırlama olmamalıdır.

OLAP sınıfı yazılım ürünlerini değerlendirme kuralları

OLAP'ın fiili tanımı olarak hizmet eden bu gereksinimler dizisi, tavsiyeler olarak düşünülmeli ve bireysel ürünler, tüm gereksinimlerle ideal olarak tam uyum için yaklaşıklık derecesine göre değerlendirilmelidir.

Daha sonra, Codd'un tanımı, bir OLAP uygulamasının paylaşılan çok boyutlu bilgileri hızlı bir şekilde analiz etme yeteneği sağlamasını gerektiren FASMI testi olarak yeniden işlendi.

Codd'un 12 Kuralını hatırlamak çoğu insan için fazla külfetlidir. OLAP tanımını sadece beş anahtar kelime ile özetleyebileceğiniz ortaya çıktı: Paylaşılan Çok Boyutlu Bilgilerin Hızlı Analizi - veya kısaca - FASMI (İngilizce'den çevrilmiştir:F ast A analizi S paylaşılan M ultra boyutlu ben bilgi).

Bu tanım ilk olarak 1995'in başlarında formüle edilmiştir ve o zamandan beri revizyona ihtiyaç duymamıştır.

HIZLI ( Hızlı ) - sistemin kullanıcılara yanıtların çoğunu yaklaşık beş saniye içinde sağlaması gerektiği anlamına gelir. Aynı zamanda, en basit istekler bir saniye içinde ve çok az - 20 saniyeden fazla - işlenir. Araştırmalar, 30 saniye sonra sonuçlar alınmazsa, son kullanıcıların bir işlemin başarısız olduğunu algıladıklarını göstermiştir.

İlk bakışta, çok uzun olmayan bir süre önce günler süren bir dakika içinde bir rapor alındığında, kullanıcının beklerken çok çabuk sıkılması ve projenin bir duruma göre çok daha az başarılı olduğu şaşırtıcı görünebilir. daha az ayrıntılı analiz pahasına bile anında yanıt.

ANALİZ (Analiz)sistemin belirli bir uygulamaya özgü her türlü mantıksal ve istatistiksel analizi işleyebilmesi ve son kullanıcının erişebileceği bir biçimde tutulmasını sağlaması anlamına gelir.

Bu analizin satıcının kendi araçlarında mı yoksa elektronik tablo gibi ilgili bir harici yazılım ürününde mi gerçekleştirildiği o kadar önemli değildir, sadece gerekli tüm analiz işlevselliğinin son kullanıcılar için sezgisel bir şekilde sağlanması gerekir. Analiz araçları, zaman serisi analizi, maliyet tahsisi, döviz transferleri, amaç arama, çok boyutlu yapıları değiştirme, prosedürel olmayan modelleme, istisnai durumları belirleme, veri çıkarma ve uygulamaya bağlı diğer işlemler. Bu tür yetenekler, hedef yönelimine bağlı olarak ürünler arasında büyük farklılıklar gösterir.

PAYLAŞILAN (Paylaşılan) sistemin tüm gizlilik koruma gereksinimlerini (belki de hücre düzeyine kadar) uyguladığı anlamına gelir ve eğer Çoklu erişim yazmak için gereklidir, değişikliklerin uygun seviyede kilitlenmesini sağlar. Tüm uygulamaların verileri geri yazması gerekmez. Ancak, bu tür uygulamaların sayısı artıyor ve sistemin birden çok değişikliği zamanında ve güvenli bir şekilde işleyebilmesi gerekiyor.

ÇOK BOYUTLU - bu anahtar gereksinim. OLAP'ı tek kelimeyle tanımlamamız gerekse, onu seçerdik. Sistem, iş ve organizasyonları analiz etmenin kesinlikle en mantıklı yolu olduğundan, hiyerarşiler ve çoklu hiyerarşiler için tam destek dahil olmak üzere verilerin çok boyutlu kavramsal bir sunumunu sağlamalıdır. Uygulamaya da bağlı olduğu için işlenmesi gereken minimum boyut sayısı yoktur ve çoğu OLAP ürününün hedeflediği pazarlar için yeterli boyutu vardır.

BİLGİ - hepsi bu. Gerekli bilgi ihtiyaç duyulan yerden temin edilmelidir. Ancak, çoğu uygulamaya bağlıdır. Çeşitli ürünlerin gücü, kaç gigabayt depolayabilecekleri ile değil, ne kadar girdi işleyebilecekleri ile ölçülür. Ürünlerin gücü büyük ölçüde değişir - en büyük OLAP ürünleri, en küçüğünden en az bin kat daha fazla veri işleyebilir. Bu konuda dikkate alınması gereken birçok faktör vardır; veri kopyalama, gerekli RAM, disk alanı, operasyonel göstergeler, bilgi havuzları ile entegrasyon vb.

FASMI testi, OLAP'ın odaklandığı hedeflerin makul ve anlaşılır bir tanımıdır.

4. SınıflandırmaOLAP- Ürün:% s.

Yani, OLAP'ın özü analiz için ilk bilgilerin çok boyutlu bir küp şeklinde sunulması gerçeğinde yatmaktadır ve onu keyfi olarak manipüle etmek ve gerekli bilgi bölümlerini - raporları elde etmek mümkündür. Aynı zamanda, son kullanıcı, küpü, verileri (olguları) çeşitli bölümlerde (boyutlar) otomatik olarak özetleyen ve hesaplamaları ve raporun formunu etkileşimli olarak yönetmenize olanak tanıyan çok boyutlu dinamik bir tablo olarak görür. Bu işlemler yapılır OLAP makine (veya makine OLAP hesaplama).

Bugüne kadar dünyada uygulayan birçok ürün geliştirilmiştir. OLAP -teknoloji. Aralarında gezinmeyi kolaylaştırmak için sınıflandırmaları kullanın OLAP -ürünler: analiz için ve konuma göre veri depolama yoluyla OLAP -arabalar. Her kategoriye daha yakından bakalım. OLAP ürünleri.

Veri depolama yöntemine göre sınıflandırma

Çok boyutlu küpler, kaynak ve toplu veriler temelinde oluşturulur. Küpler için hem kaynak hem de toplu veriler hem ilişkisel hem de çok boyutlu tabanlar veri. Bu nedenle, şu anda verileri depolamanın üç yolu vardır: MOLAP (Çok Boyutlu OLAP), ROLAP (İlişkisel OLAP) ve HOLAP (Hibrit OLAP) ). Sırasıyla, OLAP -ürünler veri depolama yöntemine göre üç benzer kategoriye ayrılır:

1. MOLAP durumunda , kaynak ve toplu veriler çok boyutlu bir veritabanında veya çok boyutlu bir yerel küpte depolanır.

2. ROLAP'ta -ürünler, kaynak veriler ilişkisel veritabanlarında veya dosya sunucusundaki düz yerel tablolarda saklanır. Toplu veriler, aynı veritabanındaki hizmet tablolarına yerleştirilebilir. İlişkisel bir veritabanından çok boyutlu küplere veri dönüşümü istek üzerine gerçekleşir OLAP araçları.

3. Kullanım durumunda HOLAP mimaride, kaynak veriler ilişkisel veritabanında kalırken, kümeler çok boyutlu olana yerleştirilir. Bina OLAP -küp istek üzerine gerçekleştirilir OLAP -ilişkisel ve çok boyutlu verilere dayalı araçlar.

Konum sınıflandırması OLAP-arabalar.

Bu temelde OLAP -Ürünler ikiye ayrılır OLAP sunucuları ve OLAP istemcileri:

· Sunucuda OLAP - toplu verilerin hesaplanması ve depolanması ayrı bir işlem - sunucu tarafından gerçekleştirilir. İstemci uygulaması, yalnızca sunucuda depolanan çok boyutlu küplere yönelik sorguların sonuçlarını alır. Bazı OLAP -sunucular yalnızca ilişkisel veritabanlarında veri depolamayı destekler, bazıları - yalnızca çok boyutlu olanlarda. birçok modern OLAP -sunucular veri depolamanın üç yolunu da destekler:MOLAP, ROLAP ve HOLAP.

MOLAP.

MOLAP Çok Boyutlu On Line Analitik İşleme, yani Çok Boyutlu OLAP.Bu, sunucunun verileri depolamak için çok boyutlu bir veritabanı (MBD) kullandığı anlamına gelir. MDB kullanmanın anlamı açıktır. Doğası gereği çok boyutlu verileri verimli bir şekilde depolayabilir ve veritabanı sorgularına hızlı bir şekilde hizmet vermenin bir yolunu sağlar. Veriler, veri kaynağından çok boyutlu veri tabanına aktarılır ve ardından veri tabanı toplanır. Ön hesaplama, özet veriler zaten hesaplandığından OLAP sorgularını hızlandıran şeydir. Sorgu süresi, yalnızca belirli bir veri parçasına erişmek ve bir hesaplama gerçekleştirmek için gereken zamanın bir işlevi haline gelir. Bu yöntem, işin bir kez yapıldığı ve sonuçların tekrar tekrar kullanıldığı kavramını destekler. Çok boyutlu veritabanları nispeten yeni bir teknolojidir. MDB kullanımı, çoğu yeni teknolojiyle aynı dezavantajlara sahiptir. Yani, ilişkisel veritabanları (RDB'ler) kadar kararlı değiller ve aynı ölçüde optimize edilmemişler. MDB'nin bir diğer zayıf noktası, veri toplama sürecinde çok boyutlu veritabanlarının çoğunun kullanılamamasıdır, bu nedenle zaman alır. yeni bilgi analiz için kullanılabilir hale geldi.

ROLAP.

ROLAP (şimdiki değeri) İlişkisel Çevrimiçi Analitik İşleme, yani, İlişkisel OLAP.ROLAP terimi, OLAP sunucusunun ilişkisel bir veritabanına dayalı olduğu anlamına gelir. Kaynak veriler, alma sürelerini azaltmaya yardımcı olmak için genellikle bir yıldız veya kar tanesi şemasında ilişkisel bir veritabanına girilir. Sunucu, optimize edilmiş SQL sorgularını kullanarak çok boyutlu bir veri modeli sağlar.

Çok boyutlu bir veritabanı yerine ilişkisel bir veritabanını seçmenin birkaç nedeni vardır. RDB, optimizasyon için birçok fırsatı olan köklü bir teknolojidir. Gerçek dünya kullanımı daha olgun bir ürünle sonuçlandı. Ayrıca, RDB'ler MDB'lerden daha büyük miktarda veriyi destekler. Sadece bu tür hacimler için tasarlanmıştır. RDB'lere karşı ana argüman, SQL kullanarak büyük bir veritabanından bilgi almak için gereken sorguların karmaşıklığıdır. Deneyimsiz bir SQL programcısı, bir şeyler yapmaya çalışarak değerli sistem kaynaklarını kolayca yükleyebilir. benzer istek, MDB'de gerçekleştirmek çok daha kolaydır.

Birleştirilmiş/Önceden birleştirilmiş veriler.

Hızlı sorgu uygulaması OLAP için bir zorunluluktur. Bu biri temel prensipler OLAP - verileri sezgisel olarak değiştirme yeteneği şunları gerektirir: hızlı çıkarma bilgi. Genel olarak, bir bilgi parçası almak için ne kadar çok hesaplama yapılması gerekiyorsa, yanıt o kadar yavaş olur. Bu nedenle, küçük bir sorgu uygulama süresinden tasarruf etmek için, genellikle en sık erişilen ancak aynı zamanda hesaplama gerektiren bilgi parçaları önceden toplanır. Yani bunlar sayılır ve daha sonra veritabanında yeni veri olarak saklanır. Önceden hesaplanabilen veri türüne bir örnek, girilen fiili verilerin günlük rakamlar olduğu aylık, üç aylık veya yıllık satış rakamları gibi özet verilerdir.

Farklı satıcılar, parametreleri seçmek için, önceden toplama ve bir dizi önceden hesaplanmış değer gerektiren farklı yöntemlere sahiptir. Toplama yaklaşımı, hem veritabanını hem de sorguların yürütme süresini etkiler. Daha fazla değer hesaplanırsa, kullanıcının önceden hesaplanan değeri talep etme olasılığı artar ve dolayısıyla hesaplama için ilk değerin istenmesine gerek olmayacağından yanıt süresi azalacaktır. Ancak, olası tüm değerleri hesaplarsanız - bu en iyi çözüm değildir - bu durumda, veritabanının boyutu önemli ölçüde artacak ve bu da onu yönetilemez hale getirecek ve toplama süresi çok uzun olacaktır. Ayrıca veritabanı eklendiğinde Sayısal değerler veya değişirlerse, bu bilgiler yeni verilere bağlı olarak önceden hesaplanmış değerlere yansıtılmalıdır. Bu nedenle, veri tabanının güncellenmesi durumunda da uzun zaman alabilir. Büyük bir sayıönceden hesaplanmış değerler Veri tabanı, toplama sırasında genellikle çevrimdışı çalıştığından, toplama süresinin çok uzun olmaması istenir.

OLAP İstemci farklı şekilde yapılandırılmıştır. Çok boyutlu bir küpün inşası ve OLAP -Hesaplamalar istemci bilgisayarın hafızasında yapılır.OLAP -müşteriler de ikiye ayrılır ROLAP ve MOLAP.Bazıları ise her iki veri erişim seçeneğini de destekleyebilir.

Bu yaklaşımların her birinin artıları ve eksileri vardır. Sunucu araçlarının istemci araçlara göre avantajları hakkındaki yaygın inanışın aksine, bazı durumlarda OLAP -kullanıcılar için istemci kullanımı daha verimli ve karlı olabilir OLAP sunucuları.

İstemci OLAP araçlarını kullanarak analitik uygulamaların geliştirilmesi hızlı bir süreçtir ve icracının özel eğitimini gerektirmez. Veritabanının fiziksel uygulamasını bilen bir kullanıcı, bir BT uzmanının katılımı olmadan kendi başına bir analitik uygulama geliştirebilir.

Bir OLAP sunucusu kullanırken, sunucu üzerinde küp oluşturmak ve bir istemci uygulaması geliştirmek için bazen farklı satıcılardan 2 farklı sistem öğrenmeniz gerekir.

OLAP istemcisi, küpleri tanımlamak ve onlar için kullanıcı arabirimlerini özelleştirmek için tek bir görsel arabirim sağlar.

Peki, hangi durumlarda kullanıcılar için bir OLAP istemcisi kullanmak, bir OLAP sunucusu kullanmaktan daha verimli ve faydalı olabilir?

· Uygulamanın ekonomik fizibilitesi OLAP - sunucu, veri miktarı çok büyük ve dayanılmaz olduğunda oluşur OLAP -müşteri, aksi takdirde ikincisinin kullanımı daha haklıdır. Bu durumda OLAP -Müşteri, yüksek performans özelliklerini ve düşük maliyeti birleştirir.

· Güçlü analist bilgisayarları, OLAP -müşteriler. Uygulandığında OLAP -server bu kapasiteler kullanılmaz.

OLAP istemcilerinin diğer faydaları şunlardır:

· Uygulama ve bakım maliyetleri OLAP -müşteri maliyetinden önemli ölçüde daha düşüktür OLAP sunucusu.

· kullanma OLAP - İstemci yerleşik makine ile ağ üzerinden veri aktarımı bir kez yapılır. Yaparken OLAP -işlemler yeni veri akışları oluşturulmaz.

5. Çalışma prensipleri OLAP-müşteriler.

İstemci aracını kullanarak bir OLAP uygulaması oluşturma sürecini düşünün (Şekil 1).

Resim 1.ROLAP İstemci Aracını Kullanarak bir OLAP Uygulaması Oluşturun

ROLAP istemcilerinin çalışma prensibi, arkasında kaynak verinin fiziksel yapısının gizlendiği anlamsal katmanın ön açıklamasıdır. Bu durumda veri kaynakları şunlar olabilir: yerel tablolar, RDBMS. Desteklenen veri kaynaklarının listesi, belirli yazılım ürünü tarafından belirlenir. Bundan sonra, kullanıcı, küpler ve analitik arayüzler oluşturmak için konu alanı açısından anladığı nesneleri bağımsız olarak manipüle edebilir.

OLAP sunucu istemcisinin çalışma prensibi farklıdır. OLAP sunucusunda, küp oluştururken kullanıcı, veritabanının fiziksel açıklamalarını değiştirir. Bu, küpün kendisinde özel açıklamalar oluşturur. OLAP Server istemcisi yalnızca küp için yapılandırılır.

Anlamsal bir katman oluştururken, veri kaynakları - Satış ve Anlaşma tabloları - son kullanıcının anlayabileceği terimlerle tanımlanır ve "Ürünler" ve "Anlaşmalar"a dönüşür. "Ürünler" tablosundaki "Kimlik" alanı "Kod" ve "Ad" - "Ürün" vb.

Ardından bir Satış iş nesnesi oluşturulur. Bir iş nesnesi, çok boyutlu bir küpün oluşturulduğu düz bir masadır. Bir iş nesnesi oluştururken, "Ürünler" ve "Anlaşmalar" tabloları, ürünün "Kod" alanı ile birleştirilir. Tabloların tüm alanlarının raporda görüntülenmesi gerekmeyeceğinden, iş nesnesi yalnızca "Madde", "Tarih" ve "Miktar" alanlarını kullanır.

Örneğimizde, "Satış" iş nesnesine dayalı olarak, aylara göre mal satışları hakkında bir rapor oluşturulmuştur.

Etkileşimli bir raporla çalışırken, kullanıcı aynı basit fare hareketleriyle filtreleme ve gruplama koşullarını ayarlayabilir. Bu noktada, ROLAP istemcisi önbellekteki verilere erişir. OLAP sunucusunun istemcisi, çok boyutlu veritabanına yeni bir sorgu oluşturur. Örneğin satış raporunda ürün filtresi uygulayarak ilgimizi çeken ürünlerin satışlarına ilişkin bir rapor alabilirsiniz.

Bir OLAP uygulamasının tüm ayarları, atanmış bir meta veri deposunda, bir uygulamada veya çok boyutlu bir veritabanı sistemi deposunda saklanabilir.Uygulama, belirli yazılım ürününe bağlıdır.

Bu uygulamalara dahil olan her şey, arayüzün, önceden tanımlanmış işlevlerin ve yapının standart bir görünümüdür ve hızlı düzeltmeler az çok standart durumlar için. Örneğin, finansal paketler popülerdir. Önceden oluşturulmuş finansal uygulamalar, profesyonellerin bir veritabanı yapısı veya ortak formlar ve raporlar tasarlamak zorunda kalmadan tanıdık finansal araçları kullanmalarına olanak tanır.

İnternet yeni bir müşteri biçimidir. Ayrıca yeni teknolojilerin de damgasını taşıyor; bir çok internet çözümleri genel olarak yeteneklerinde ve özel olarak bir OLAP çözümünün kalitesinde önemli ölçüde farklılık gösterir. İnternet üzerinden OLAP raporları oluşturmanın birçok avantajı vardır. En önemlisi, uzmanlaşmaya gerek yok yazılım bilgilere erişmek için. Bu, şirkete çok fazla zaman ve para tasarrufu sağlar.

6. OLAP uygulama mimarisi seçimi.

Bir bilgi-analitik sistemi uygularken, bir OLAP uygulamasının mimarisini seçerken hata yapmamak önemlidir. Çevrimiçi Analitik İşlem - "çevrimiçi analitik işleme" teriminin tam anlamıyla çevirisi, genellikle sisteme giren verilerin hızlı bir şekilde analiz edilmesi anlamında kelimenin tam anlamıyla alınır. Bu bir yanılsamadır - analizin verimliliği, sistemdeki verilerin gerçek zamanlı olarak güncellenmesiyle hiçbir şekilde bağlantılı değildir. Bu özellik, OLAP sisteminin kullanıcı isteklerine yanıt verme süresini ifade eder. Aynı zamanda, örneğin depolardaki veriler günde bir kez güncelleniyorsa, analiz edilen veriler genellikle "dünün" bilgisinin anlık görüntüsüdür.

Bu bağlamda OLAP'ın "etkileşimli analitik işleme" olarak çevrilmesi daha doğrudur. OLAP sistemlerini düzenlenmiş raporlar hazırlamak için sistemlerden ayıran, verileri etkileşimli bir modda analiz etme yeteneğidir.

OLAP'ın kurucusu E. Codd'un formülasyonundaki etkileşimli işlemenin bir başka özelliği de "verileri çok boyutlu olarak, yani kurumsal analistler için en anlaşılır şekilde birleştirme, görüntüleme ve analiz etme" yeteneğidir. Codd'un kendisi için OLAP terimi, verileri kavramsal düzeyde - çok boyutlu olarak sunmanın son derece özel bir yolunu ifade eder. Fiziksel düzeyde, veriler ilişkisel veritabanlarında saklanabilir, ancak gerçekte OLAP araçları, verilerin bir hiperküp şeklinde düzenlendiği çok boyutlu veritabanlarıyla çalışma eğilimindedir (Şekil 1).

Resim 1. OLAP- küp (hiperküp, metaküp)

Aynı zamanda, bu verilerin alaka düzeyi, hiperküpün yeni verilerle doldurulduğu ana göre belirlenir.

Çok boyutlu bir veritabanının oluşum süresinin önemli ölçüde içine yüklenen veri miktarına bağlı olduğu açıktır, bu nedenle bu miktarı sınırlamak mantıklıdır. Ancak, analiz olanaklarını nasıl daraltmamalı ve kullanıcıyı tüm ilgili bilgilere erişimden mahrum bırakmamalı? İki alternatif yol vardır: Analiz et, sonra sorgula ("Önce analiz et - sonra ek bilgi iste") ve sorgula, sonra analiz et ("Önce verileri sorgula - sonra analiz et").

İlk yolun takipçileri, genelleştirilmiş bilgilerin çok boyutlu bir veritabanına, örneğin departmanlar için aylık, üç aylık, yıllık sonuçlar gibi yüklenmesini önerir. Ve verileri hassaslaştırmak gerekirse, kullanıcıdan, örneğin belirli bir departman için günlere göre veya seçilen bir departmanın aylara ve çalışanlarına göre gerekli seçimi içeren bir ilişkisel veritabanı hakkında bir rapor oluşturması istenir.

Aksine, ikinci yolun savunucuları, kullanıcının her şeyden önce analiz edeceği verilere karar vermesini ve onu bir mikro kübe - küçük bir çok boyutlu veritabanına yüklemesini önerir. Her iki yaklaşım da kavramsal düzeyde farklılık gösterir ve avantaj ve dezavantajlarına sahiptir.

İkinci yaklaşımın avantajları, kullanıcının çok boyutlu bir rapor - "mikro küp" şeklinde aldığı bilgilerin "tazeliğini" içerir. Mikroküp, gerçek ilişkisel veri tabanından az önce istenen bilgilere dayanarak oluşturulur. Bir mikroküple çalışmak etkileşimli bir modda gerçekleştirilir - bilgi dilimlerinin elde edilmesi ve bir mikroküp çerçevesinde detaylandırılması anında gerçekleştirilir. Bir diğer olumlu nokta, yapının tasarımının ve mikroküpün doldurulmasının, bir veritabanı yöneticisinin katılımı olmadan kullanıcı tarafından "anında" gerçekleştirilmesidir. Bununla birlikte, yaklaşım aynı zamanda ciddi eksikliklerden muzdariptir. Kullanıcı büyük resmi görmez ve araştırmasının yönüne önceden karar vermelidir. Aksi takdirde, istenen mikroküp çok küçük olabilir ve ilgili tüm verileri içermeyebilir ve kullanıcının önce yeni bir mikroküp, ardından yenisini, ardından bir tane daha ve bir tane daha istemesi gerekir. Sorgu daha sonra analiz yaklaşımı, aynı adı taşıyan şirketin BusinessObjects aracını ve Şirket Kontur platformunun araçlarını uygular.Intersoft laboratuvar.

Analiz et sonra sorgu yaklaşımı ile çok boyutlu bir veri tabanına yüklenen veri miktarı oldukça fazla olabilir, doldurmanın kurallara göre yapılması gerekir ve çok zaman alabilir. Bununla birlikte, tüm bu eksiklikler daha sonra, kullanıcı herhangi bir kombinasyonda neredeyse tüm gerekli verilere eriştiğinde kendini gösterir. İlişkisel bir veritabanındaki orijinal verilere referans, yalnızca gerektiğinde, son çare olarak gerçekleştirilir. detaylı bilgi, örneğin belirli bir fatura için.

Tek bir çok boyutlu veritabanının çalışması, ona erişen kullanıcı sayısından pratik olarak etkilenmez. Limit durumdaki mikroküp sayısının kullanıcı sayısıyla aynı oranda büyüyebildiği Sorgu Sonra Analiz Et yaklaşımının aksine, yalnızca orada bulunan verileri okurlar.

Bu yaklaşımla, ilişkisel hizmetlerin yanı sıra çok boyutlu veritabanlarına da hizmet etmek zorunda kalan BT hizmetleri üzerindeki yük artmaktadır.Çok boyutlu veritabanlarındaki verilerin zamanında otomatik olarak güncellenmesinden sorumlu olan bu hizmetlerdir.

"Analiz et, sonra sorgula" yaklaşımının en belirgin temsilcileri Cognos'un PowerPlay ve Impromptu araçlarıdır.

Hem yaklaşımın hem de onu uygulayan aracın seçimi öncelikle izlenen hedefe bağlıdır: her zaman bütçeden tasarruf etmek ile son kullanıcı hizmetinin kalitesini artırmak arasında bir denge kurmanız gerekir. Aynı zamanda, stratejik planda bilgi ve analitik sistemlerin oluşturulmasının, otomasyon maliyetinden kaçınma değil, rekabet avantajı elde etme hedefini takip ettiği dikkate alınmalıdır. Örneğin, bir kurumsal bilgi ve analitik sistem, bir şirket hakkında, potansiyel yatırımcılar için yayınlanması, bu şirketin şeffaflığını ve öngörülebilirliğini sağlayacak ve yatırım çekiciliğinin kaçınılmaz bir koşulu haline gelecek olan bir şirket hakkında gerekli, zamanında ve güvenilir bilgileri sağlayabilir.

7. OLAP teknolojilerinin uygulama alanları.

OLAP, çok faktörlü verileri analiz etme görevinin olduğu her yerde uygulanabilir. Genel olarak, en az bir tanımlayıcı sütunu (boyut) ve sayılar içeren bir sütunu (ölçüler veya gerçekler) içeren veriler içeren bir tablonuz varsa, bir OLAP aracı genellikle raporları analiz etmek ve oluşturmak için etkili bir araç olacaktır.

OLAP teknolojilerinin gerçek hayattan alınan bazı uygulama alanlarını düşünün.

1. Satış.

Satış yapısının analizine dayanarak, yönetimsel kararların alınması için gerekli konular çözülür: mal yelpazesinin değiştirilmesi, fiyatlar, mağazaların, şubelerin kapatılması ve açılması, bayilerle sözleşmelerin feshi ve imzalanması, yürütülmesi veya feshedilmesi reklam kampanyaları vb.

2. Satın alma.

Görev, satış analizinin tam tersidir. Birçok işletme, tedarikçilerden bileşen ve malzeme satın alır. Tüccarlar yeniden satmak için mal satın alırlar. Satın alma analizinde, geçmiş deneyimlere dayalı nakit planlamasından, satın alma analizine kadar birçok olası görev vardır. yöneticiler üzerinde kontrol tedarikçileri seçmek.

3. Fiyatlar.

Alımların analizi, piyasa fiyatlarının analizi ile birleşir. Bu analizin amacı, maliyetleri optimize etmek, en avantajlı teklifleri seçmektir.

4. Pazarlama.

Pazarlama analizi ile, yalnızca alıcıların veya hizmetlerin müşteri-tüketicilerinin analiz alanını kastediyoruz. Bu analizin görevi, malların doğru konumlandırılması, hedeflenen reklam için alıcı gruplarının belirlenmesi ve ürün çeşitliliğinin optimizasyonudur. Bu durumda OLAP'ın görevi, kullanıcıya veri analizi sırasında sezgisel olarak ortaya çıkan soruların yanıtlarını düşünme hızında hızlı bir şekilde alması için bir araç sağlamaktır.

5. Depo.

Depodaki stok bakiyelerinin yapısının mal türlerine, depolara göre analizi, malların raf ömürlerinin analizi, alıcılar tarafından sevkiyatın analizi ve işletme için önemli olan diğer birçok analiz türü, kuruluşun depo muhasebesine sahip olması durumunda mümkündür.

6. Nakit akışı.

Bu, birçok ekolü ve yöntemi olan bütün bir analiz alanıdır. OLAP teknolojisi, bu tekniklerin uygulanması veya geliştirilmesi için bir araç olarak hizmet edebilir, ancak bunların yerini alamaz. Nakit olmayan ve nakit fonların nakit akışları, akışları optimize etmek, likiditeyi sağlamak vb. için ticari faaliyetler, karşı taraflar, para birimleri ve zaman bağlamında analiz edilir. Ölçümlerin bileşimi büyük ölçüde işin, endüstrinin ve metodolojinin özelliklerine bağlıdır.

7. Bütçe.

OLAP teknolojilerinin en verimli uygulama alanlarından biri. hiçbir şey için yok modern sistem Bileşiminde bütçe analizi için bir OLAP araç takımı bulunmadan bütçeleme tamamlanmış sayılmaz. Çoğu bütçe raporu, OLAP sistemleri temelinde kolayca oluşturulur. Aynı zamanda, raporlar çok çeşitli sorulara yanıt verir: gider ve gelir yapısının analizi, farklı departmanlardaki belirli kalemler için harcamaların karşılaştırılması, belirli kalemler için harcama dinamiklerinin ve eğilimlerinin analizi, maliyet ve kâr analizi .

8. Muhasebe hesapları.

Bir hesap numarasından oluşan ve gelen bakiyeleri, ciroları ve giden bakiyeleri içeren klasik bir bilanço, bir OLAP sisteminde mükemmel bir şekilde analiz edilebilir. Ayrıca OLAP sistemi, çok şubeli bir organizasyonun konsolide bakiyelerini, aylık, üç aylık ve yıllık bakiyeleri, hesap hiyerarşisine göre toplu bakiyeleri, analitik özelliklere dayalı analitik bakiyeleri otomatik ve çok hızlı bir şekilde hesaplayabilir.

9. Mali raporlama.

Teknolojik olarak oluşturulmuş bir raporlama sistemi, belirli raporlar elde etmek için çeşitli bölümlerde gruplandırılması ve özetlenmesi gereken tarih değerlerine sahip bir dizi adlandırılmış göstergeden başka bir şey değildir. Bu durumda raporların görüntülenmesi ve yazdırılması en kolay ve ucuza OLAP sistemlerinde uygulanmaktadır. Her durumda, işletmenin dahili raporlama sistemi o kadar muhafazakar değildir ve raporlama konusundaki teknik çalışmalardan tasarruf etmek ve çok boyutlu operasyonel analiz yetenekleri kazanmak için yeniden tasarlanabilir.

10. Site trafiği.

İnternet sunucusu günlük dosyası, doğası gereği çok boyutludur ve bu nedenle OLAP analizi için uygundur. Gerçekler şunlardır: ziyaret sayısı, isabet sayısı, sayfada geçirilen süre ve günlükte bulunan diğer bilgiler.

11. Üretim hacimleri.

Bu, istatistiksel analizin başka bir örneğidir. Böylece yetiştirilen patateslerin, eritilmiş çeliklerin, mamul malların hacimlerini analiz etmek mümkündür.

12. Sarf malzemelerinin tüketimi.

Soğutma sıvısı, yıkama sıvısı, yağ, paçavra, zımpara kağıdı - yüzlerce parça tüketen düzinelerce atölyeden oluşan bir tesis hayal edin. Tedarik. Doğru planlama ve maliyet optimizasyonu, sarf malzemelerinin fiili tüketiminin kapsamlı bir analizini gerektirir.

13. Tesislerin kullanımı.

Başka bir istatistiksel analiz türü. Örnekler: dersliklerin, kiralık binaların ve tesislerin iş yükünün analizi, konferans salonlarının kullanımı vb.

14. İşletmedeki personel sirkülasyonu.

İşletmedeki personel devir hızının şubeler, bölümler, meslekler, eğitim düzeyi, cinsiyet, yaş, zaman bağlamında analizi.

15. Yolcu taşımacılığı.

Satılan biletlerin sayısı ve miktarlarının mevsimlere, yönlere, araba türlerine (sınıflara), tren türlerine (uçak) göre analizi.

Bu liste uygulama alanlarıyla sınırlı değildir. OLAP - teknolojiler. Örneğin, teknolojiyi düşünün OLAP - Satış analizi.

8. Kullanım örneği OLAP -satış alanında analiz için teknolojiler.

Tasarım çok boyutlu temsil için veri OLAP -analiz, bir ölçüm haritasının oluşturulmasıyla başlar. Örneğin, satışları analiz ederken, bireysel pazar bölümlerini (gelişmekte olan, istikrarlı, büyük ve küçük müşteriler, yeni müşteri olasılığı vb.) belirlemek ve satış hacimlerini ürünlere, bölgelere, müşterilere, pazar bölümlerine, dağıtıma göre değerlendirmek faydalı olabilir. kanallar ve sipariş boyutları. Bu yönler, satışların çok boyutlu temsilinin koordinat ızgarasını oluşturur - boyutlarının yapısı.

Herhangi bir işletmenin faaliyeti zaman içinde ilerlediğinden, analizde ortaya çıkan ilk soru, iş geliştirme dinamikleri sorusudur. Uygun organizasyon zaman ekseni bu soruya niteliksel bir cevap verecektir. Genellikle zaman ekseni yıllara, çeyreklere ve aylara bölünür. Belki daha da fazla bölünerek haftalara ve günlere. Zaman boyutunun yapısı, veri alma sıklığı dikkate alınarak oluşturulur; ayrıca bilgi talep etme sıklığına göre de belirlenebilir.

“Mal grubu” boyutu, satılan ürünlerin yapısını olabildiğince yansıtacak şekilde tasarlanmıştır. Aynı zamanda, bir yandan aşırı ayrıntıdan kaçınmak (grup sayısı görünür olmalıdır) ve diğer yandan önemli bir pazar segmentini kaçırmamak için belirli bir dengeyi korumak önemlidir.

"Müşteriler" boyutu, coğrafi bölgeye göre satış yapısını yansıtır. Her boyutun kendi hiyerarşileri olabilir, örneğin bu boyutta bir yapı olabilir: Ülkeler - Bölgeler - Şehirler - Müşteriler.

Departmanların performansını analiz etmek için kendi boyutunuzu oluşturmalısınız. Örneğin, iki hiyerarşi düzeyi ayırt edilebilir: "Alt Bölümler" boyutunda yansıtılması gereken departmanlar ve bunlara dahil olan departmanlar.

Aslında "Zaman", "Ürünler", "Müşteriler" boyutları, konu alanının alanını tam olarak tanımlar.

Ek olarak, bu alanı, hesaplanan özellikleri, örneğin değer cinsinden işlem hacmi aralıklarını temel alarak koşullu alanlara bölmek yararlıdır. Daha sonra tüm iş, gerçekleştirildiği bir dizi maliyet aralığına bölünebilir. Bu örnekte, kendinizi aşağıdaki göstergelerle sınırlayabilirsiniz: mal satış miktarı, satılan mal sayısı, gelir miktarı, işlem sayısı, müşteri sayısı, üreticilerin satın alma hacmi.

OLAP - analiz küpü şöyle görünecektir (Şekil 2):


Şekil 2.OLAP– satış hacmini analiz etmek için bir küp

Aynen böyle 3B dizi OLAP açısından ve bir küp olarak adlandırılır. Aslında, katı matematik bakış açısından, böyle bir dizi her zaman bir küp olmayacaktır: gerçek bir küp için, tüm boyutlardaki öğelerin sayısı aynı olmalıdır, oysa OLAP küplerinin böyle bir sınırlaması yoktur. Bir OLAP küpünün 3B olması gerekmez. Çözülmekte olan probleme bağlı olarak hem iki boyutlu hem de çok boyutlu olabilir. Ciddi OLAP ürünleri yaklaşık 20 boyut için tasarlanmıştır.Daha basit masaüstü uygulamaları yaklaşık 6 boyutu destekler.

Küpün tüm öğeleri doldurulmamalıdır: Üçüncü çeyrekte Ürün 2'nin Müşteri 3'e satışı hakkında bilgi yoksa, ilgili hücredeki değer belirlenmeyecektir.

Ancak küpün kendisi analiz için uygun değildir. Üç boyutlu bir küpü yeterince temsil etmek veya tasvir etmek hala mümkünse, altı veya on dokuz boyutlu işler çok daha kötü. Bu nedenle, sıradan iki boyutlu tablolar, kullanımdan önce çok boyutlu bir küpten çıkarılır. Bu işleme küpü "kesmek" denir. Analist, olduğu gibi, küpün boyutlarını ilgilendiği işaretlere göre alır ve "keser". Bu şekilde analist küpün (rapor) iki boyutlu bir dilimini alır ve onunla çalışır. Raporun yapısı Şekil 3'te gösterilmektedir.

Figür 3Analitik rapor yapısı

OLAP - küpümüzü keselim ve üçüncü çeyrek için bir satış raporu alalım, böyle görünecek (Şekil 4).

Şekil 4Üçüncü Çeyrek Satış Raporu

Küpü diğer eksen boyunca kesebilir ve ürün grubu 2'nin yıl içindeki satışlarını raporlayabilirsiniz (Şekil 5).

Şekil 5Ürün Satışları Üç Aylık Rapor 2

Benzer şekilde, müşteri 4 ile olan ilişkiyi analiz edebilirsiniz, küpü Müşteriler etiketine göre kesmek(Şek. 6)

Şekil 6Müşteriye mal tedariki hakkında rapor 4

Raporu aya göre detaylandırabilir veya müşterinin belirli bir şubesine mal tedariki hakkında konuşabilirsiniz.

Veriler alındıktan, temizlendikten, tek bir forma getirildikten ve depoya yerleştirildikten sonra analiz edilmesi gerekir. Bunun için OLAP teknolojisi kullanılmaktadır.

OLAP'ın on iki tanımlayıcı ilkesi, 1993 yılında ilişkisel veritabanlarının "mucidi" olan E.F. Codd tarafından formüle edilmiştir. OLAP, Çevrimiçi Analitik İşleme, yani çevrimiçi veri analizidir. Daha sonra, Codd'un tanımı, paylaşılan çok boyutlu bilgilerin hızlı analizi için aşağıdaki yetenekleri sağlamak için bir OLAP uygulaması gerektiren FASMI testi (Paylaşılan Çok Boyutlu Bilginin Hızlı Analizi - paylaşılan çok boyutlu bilginin hızlı analizi) olarak yeniden çalışıldı: yüksek hız; analiz; erişim paylaşımı; çok boyutluluk; bilgi ile çalışın.

Yüksek hız. Analiz, bilgilerin tüm yönleri üzerinde eşit derecede hızlı bir şekilde yapılmalıdır. nerede izin verilen süre yanıt 5 saniyeden az.

analiz. Uygulama geliştiricisi tarafından önceden tanımlanmış veya kullanıcı tarafından keyfi olarak tanımlanmış temel sayısal ve istatistiksel analiz türlerini gerçekleştirmek mümkün olmalıdır.

Erişim paylaşımı. Verilere erişim çok kullanıcılı olmalı, gizli bilgilere erişim ise kontrol edilmelidir.

çok boyutluluk. OLAP'ın ana, en önemli özelliği.

Bilgi ile çalışmak. Uygulama herhangi bir şeye erişebilmelidir. gerekli bilgi, hacminden ve depolama konumundan bağımsız olarak.

Çok boyutlu temsil. OLAP, kuruluşlara en uygun ve hızlı fonlar iş bilgilerine erişin, görüntüleyin ve analiz edin. En önemlisi, OLAP kullanıcıya doğal, sezgisel bir anlaşılır model veri, onları çok boyutlu küpler (Küpler) şeklinde organize eder. Eksenler (boyutlar) çok boyutlu sistem koordinatlar, analiz edilen iş sürecinin ana özellikleridir. Örneğin, bir satış süreci için bu bir ürün kategorisi, bir bölge, bir müşteri türü olabilir. Neredeyse her zaman, ölçümlerden biri olarak zaman kullanılır. Küpün içinde, süreci nicel olarak karakterize eden veriler bulunur - sözde önlemler (Önlemler). Bunlar, parça veya parasal olarak satış hacimleri, stok bakiyeleri, maliyetler vb. olabilir. Bilgileri analiz eden kullanıcı, küpü farklı yönlerde "kesebilir", özet (örneğin yıllara göre) veya tersine ayrıntılı (haftalara göre) veriler elde edebilir ve analiz etmesi için gerekli diğer işlemleri gerçekleştirebilir.

OLAP verilerinin depolanması . Her şeyden önce, analist her zaman (ayrıntılı değil) bazı özet verilerle çalıştığı için, OLAP veritabanlarının neredeyse her zaman ayrıntılı verilerle birlikte toplu olarak adlandırılan, yani önceden hesaplanmış özet göstergeleri depoladığı söylenmelidir. Toplama örnekleri, bir yıl için toplam satışlar veya ortalama stok bakiyesidir. OLAP sorgularını hızlandırmanın birincil yolu, önceden hesaplanmış toplamaları depolamaktır.


Bununla birlikte, yapı kümeleri, veritabanının boyutunda önemli bir artışa neden olabilir.

OLAP veri depolama ile ilgili diğer bir sorun, çok boyutlu verilerin seyrekliğidir. Örneğin, 2000 yılında belirli bir bölgede satış olmasaydı, küpün karşılık gelen boyutlarının kesiştiği noktada bir değer olmayacaktı. OLAP sunucusu bu durumda bir miktar eksik değer depolarsa, o zaman önemli veri seyrekliği ile, boş hücrelerin sayısı (yine de depolama alanı gerektirir) doldurulmuş olanların sayısını birçok kez aşabilir ve sonuç olarak toplam hacim mantıksız bir şekilde artar. Microsoft'un bu amaçla sunduğu çözümler aşağıda verilmiştir.

OLAP çeşitleri. OLAP verilerini depolamak için kullanılabilir:

Özel çok boyutlu DBMS (OLAP sunucuları). Bu durumda birinden bahseder MOLAP (Çok Boyutlu OLAP). Verileri ayrıştıran karmaşık sorguları yürütürken farklı boyutlar, çok boyutlu VTYS, ilişkisel olanlardan daha iyi performans sağlar. Aynı zamanda, sorgu yürütme hızı, çok boyutlu küpün "kesilmesinin" hangi boyutta yapıldığına bağlı değildir.

Geleneksel ilişkisel VTYS - ROLAP (İlişkisel OLAP). Özel veri yapılarının kullanımı - "yıldız" ve "kar tanesi" şemalarının yanı sıra hesaplanmış kümelerin depolanması, ilişkisel verilerin çok boyutlu analizini mümkün kılar. İlişkisel VTYS'ler tarihsel olarak daha tanıdıktır ve bunlara önemli yatırımlar yapılmıştır, bu nedenle ROLAP şimdiye kadar daha yaygındır.

Kombine seçenek - HOLAP (Hibrit OLAP), her iki DBMS türünü birleştirir. İki tür DBMS'yi birleştirme seçeneklerinden biri, kümeleri çok boyutlu bir VTYS'de ve ayrıntılı verileri (en büyük hacme sahip) ilişkisel bir veride depolamaktır.

Microsoft teklifleri aşağıdaki anlamlar OLAP analizi:

Dahil Microsoft SQL'i Sunucu 7.0, tam özellikli bir OLAP sunucusu içerir - SQL Server OLAP hizmetleri. Sunucu, elbette, istemci isteklerine hizmet etmek için tasarlanmıştır ve bu, bir tür etkileşim protokolü ve istek dili gerektirir. Örneğin, sunucu ile istemci etkileşimi için ilişkisel VTYS- SQL Server - ODBC veya OLE DB protokolleri ve dili kullanılır SQL sorguları. OLAP sunucusuna erişmek için Microsoft, OLAP protokolü için OLE DB'yi ve çok boyutlu veriler için sorgu dilini - MDX'i (MultiDimensional eXpression) geliştirdi. Basitlik ve rahatlık için OLE DB üzerinde bir ADO (ActiveX Data Objects) nesneleri katmanı geliştirildi, ADO MD (MultiDimensional ADO), OLAP için OLE DB üzerine inşa edildi.

Microsoft Office 2000'deki veri analiz araçları. Microsoft Excel 2000 şunları içerir: yeni mekanizma pivot tablolar - önceki sürümlerden aynı adı taşıyan mekanizmanın yerini alan OLAP PivotTable. PivotTable motoru, önceki ilişkisel veri analizi yeteneklerinin yanı sıra artık OLAP veri analizi yeteneklerini de içeriyor, yani bir OLAP istemcisi gibi davranıyor. Microsoft SQL Server 7.0, OLAP arabirimi için OLE DB'yi destekleyen herhangi bir ürünün yanı sıra sunucu olarak da kullanılabilir. Excel PivotTable motoru, yukarıda açıklanan PivotTable Hizmetleri (PTS) tarafından sağlanan yetenekleri tam olarak destekler. Böylece, analiz edilen OLAP verileri hem yerel küplerde hem de OLAP sunucusunda bulunabilir.

Microsoft Office 2000 ayrıca şu adlarla adlandırılan bir dizi ActiveX bileşeni içerir: Office 2000 Web Bileşenleri kullanarak OLAP verilerinin analizini düzenlemenize izin verir. Web'de gezinme. Bunlar aşağıdaki dört bileşeni içerir:

E-tablo- uygular sınırlı işlevsellik Excel sayfası.

Pivot tablo- Excel pivot tablolarının "ikizi"; OLAP Hizmetleri verileriyle çalışabilir.

çizelge- hem ilişkisel hem de OLAP verilerine dayalı grafikler oluşturmanıza olanak tanır.

veri kaynağı- diğer bileşenleri veri kaynağına bağlamak için hizmet bileşeni.

OLAP verileriyle çalışırken, Web Bileşenleri PivotTable Hizmetlerine erişir.

5.5. ANALİZ TEKNOLOJİSİ "VERİ MADENCİLİĞİ"

Dış görünüş teknolojiler Veriler Madencilik, bilgi sistemleri tarafından toplanan heterojen verilerden bilgi çıkarma ihtiyacı ile ilişkilidir. Rusça'da "madencilik", "bilginin çıkarılması" olarak adlandırılmaya başlayan bir kavram vardı. Yurtdışında "Veri Madenciliği" terimi oluşturulmuştur.

Geçmişte yaygın olarak kullanılan yöntemler matematiksel istatistik temel olarak önceden formüle edilmiş hipotezleri test etmek (doğrulama odaklı veri madenciliği) ve çevrimiçi analitik işlemenin (OLAP) temelini oluşturan “kaba” keşif analizi için yararlı olduğu ortaya çıktı.

Anahtar avantaj veri madenciliğiönceki yöntemlerle karşılaştırıldığında, çeşitli parametreler veya veri bileşenleri arasındaki ilişki hakkında otomatik olarak hipotezler oluşturma yeteneği. Bir analistin geleneksel bir veri işleme paketiyle çalışırken yaptığı iş, aslında onun ürettiği bir veya iki hipotezi kontrol etmeye veya düzeltmeye indirgenir. Başlangıç ​​varsayımlarının olmadığı ve veri miktarının önemli olduğu durumlarda, mevcut sistemler verimliliklerini kaybederler ve analistlerin zamanını boşa harcarlar.

Bir diğeri önemli özellik Veri Madenciliği sistemleri, çok boyutlu sorguları işleme ve çok boyutlu bağımlılıkları arama yeteneği. Ayrıca, veri madenciliği sistemlerinin otomatik olarak algılama yeteneği de benzersizdir. istisnai durumlar- yani genel kalıplardan "düşen" veri öğeleri.

beş tahsis et standart tipler tanımlamayı mümkün kılan desenler Veri yöntemleri madencilik

bağlantı

sıra

sınıflandırma

kümeleme

tahmin

Model araştırması, numunenin yapısı ve analiz edilen göstergelerin değerlerinin dağılımlarının türü hakkında önsel varsayımlarla sınırlı olmayan yöntemlerle gerçekleştirilir. Böyle bir arama için görev örnekleri Veri kullanma Madencilik Tablo 1'de gösterilmiştir.

Tablo 1 - OLAP ve Veri Madenciliği yöntemlerini kullanırken görev formülasyonlarının karşılaştırılması