İstatistiksel verileri sunmak için grafik yöntemler. İstatistik sunma yöntemleri

  • 17.05.2019

İstatistikler kullanılabilecek şekilde sunulmalıdır. İstatistiklerin 3 ana sunum şekli vardır:

1) metin - verilerin metne dahil edilmesi;

2) tablo - verilerin tablolarda sunumu;

3) grafiksel - verilerin grafik şeklinde ifadesi.

Metin formu az miktarda dijital veri ile kullanılır.

İstatistiksel verilerin daha verimli bir sunum şekli olduğu için tablo formu en sık kullanılır. Başlangıç ​​koşullarına göre şu veya bu sonucun elde edilmesini sağlayan matematiksel tabloların aksine, istatistiksel tablolar incelenen nesneler hakkında sayıların dilinde anlatır.

istatistiksel tablo Belirli bir sıra ve bağlantı içinde sosyo-ekonomik olaylar hakkında istatistiksel bilgilerin sunulduğu bir satır ve sütun sistemidir.

Tablo 2. 2000 - 2006 yılları için Rusya Federasyonu'nun dış ticareti, milyar dolar.

Gösterge 2000 2001 2002 2003 2004 2005 2006
Dış ticaret cirosu 149,9 155,6 168,3 280,6 368,9 468,4
İhracat 101,9 107,3 135,9 183,2 243,6 304,5
İçe aktarmak 44,9 53,8 76,1 97,4 125,3 163,9
Ticaret dengesi 60,1 48,1 46,3 59,9 85,8 118,3 140,7
dahil olmak üzere:
yabancı ülkelerle
ihracat 90,8 86,6 90,9 114,6 210,1 261,1
içe aktarmak 31,4 40,7 48,8 77,5 103,5 138,6
Ticaret dengesi 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Örneğin, tabloda. 2, Rusya'nın dış ticareti hakkında metin şeklinde ifade edilmesi etkisiz olacak bilgiler sağlar.

Ayırmak ders ve yüklem istatistiksel tablo. Özne, karakterize edilen nesneyi belirtir - ya bir popülasyonun birimleri ya da bir birimler grubu ya da bir bütün olarak bütünlük. Yüklem, öznenin bir özelliğini, genellikle sayısal biçimde verir. Zorunlu başlık tablodaki verilerin hangi kategoriye ve ne zamana ait olduğunu gösteren tablo.

Konunun doğası gereği, istatistiksel tablolar alt bölümlere ayrılmıştır. basit, grup ve kombinasyonel... Basit bir tablo konusunda, çalışma nesnesi gruplara bölünmez, ancak kümenin tüm birimlerinin bir listesi verilir veya bir bütün olarak küme belirtilir (örneğin, Tablo 11). Grup tablosunun konusunda, çalışma nesnesi bir özelliğe göre gruplara ayrılır ve yüklem, gruplardaki birimlerin sayısını (mutlak veya yüzde olarak) ve gruplara göre özet göstergeleri gösterir (örneğin, Tablo 4) . Kombinasyon tablosunun konusunda, popülasyon bir değil, birkaç kritere göre gruplara ayrılır (örneğin, Tablo 2).

Tabloları oluştururken, aşağıdakiler tarafından yönlendirilmelisiniz Genel kurallar.

1. Tablonun konusu sol (daha az sıklıkla - üst) kısımda ve yüklem - sağda (daha az sıklıkla - alt) bulunur.

2. Sütun başlıkları, göstergelerin adlarını ve ölçü birimlerini içerir.

3. Son satır tabloyu sonlandırır ve sonunda bulunur, ancak bazen ilk sıradadır: bu durumda, ikinci satırda “dahil” girişi yapılır ve sonraki satırlar toplam satırın bileşenlerini içerir.

4. Dijital veriler, sayıların basamakları basamakların altında yer alacak şekilde her sütuna aynı doğruluk derecesinde kaydedilir ve tamsayı kısmı kesirli virgülden ayrılır.

5. Tabloda boş hücreler olmamalıdır: veriler sıfıra eşitse, "-" (tire) işareti konur; veri bilinmiyorsa “bilgi yok” girişi yapılır veya “…” (üç nokta) işareti konur. Üsün değeri sıfır değilse, ancak kabul edilen doğruluk derecesinden sonra ilk anlamlı basamak görünüyorsa, o zaman 0.0 kaydedilir (diyelim ki, doğruluk derecesi 0.1 olarak kabul edildiyse).

Amaç, verilerin bazı özelliklerini vurgulamak, onları karşılaştırmak olduğunda, bazen istatistiksel tablolar grafiklerle desteklenir. Grafik form, algıları açısından en etkili veri sunum şeklidir. Grafiklerin yardımıyla yapının özelliklerinin görünürlüğü, dinamikleri, fenomenlerin birbirine bağlanması ve bunların karşılaştırılması sağlanır.

istatistiksel grafikler- Bunlar, çizgiler, geometrik şekiller, çizimler veya coğrafi haritalar aracılığıyla sayısal değerlerin ve oranlarının geleneksel görüntüleridir. Grafiksel form, istatistiksel verilerin incelenmesini kolaylaştırır, onları açık, anlamlı ve gözlemlenebilir hale getirir. Bununla birlikte, grafiklerin belirli sınırlamaları vardır: her şeyden önce, grafik, tabloya dahil edilebilecek kadar çok veri içeremez; ek olarak, grafik her zaman yuvarlatılmış verileri gösterir - kesin değil, yaklaşık. Bu nedenle grafik, ayrıntıları değil, yalnızca genel durumu göstermek için kullanılır. Son dezavantaj, çizimin zahmetli olmasıdır. Kişisel bir bilgisayar kullanılarak üstesinden gelinebilir (örneğin, paketten "Diyagram Sihirbazı" Microsoft Office Excel'i).

İnşaat yöntemine göre, grafikler ayrılır çizelgeler, kartogramlar ve kartodiyagramlar.

Verileri grafik olarak göstermenin en yaygın yolu, aşağıdaki türlerden olan grafiklerdir: doğrusal, radyal, nokta, düzlemsel, hacimsel, figürlü. Grafiklerin türü, sunulan verinin türüne ve çizim görevine bağlıdır. Her durumda, çizelgeye bir başlık eşlik etmelidir - çizelge alanının üstünde veya altında. Başlık, hangi göstergenin, hangi bölge için ve ne zaman gösterildiğini gösterir.

Çizgi grafikler nicel değişkenleri temsil etmek için kullanılır: değerlerindeki varyasyon özellikleri, dinamikler, değişkenler arasındaki ilişkiler. Veri varyasyonu kullanılarak analiz edilir dağıtım poligonu, kümülatif("küçüktür" eğrisi) ve ojeler("büyüktür" eğrisi). Dağılım poligonu konu 4'te tartışılmaktadır (örneğin, Şekil 5). Kümülatifleri oluşturmak için, değişen özelliğin değerleri apsis ekseni boyunca çizilir ve birikmiş toplam frekans veya frekanslar ( f1∑ için F). Ojileri çizmek için, birikmiş toplam frekanslar, ordinat eksenine ters sırada yerleştirilir (∑'den itibaren). Fönceki f1). Tabloya göre kümülatif ve ogiv. 4. Şek. bir.

Pirinç. 1. Gümrük değerine göre eşyanın dağılımı ve dağılımı

Dinamik analizde çizgi grafiklerinin kullanımı, konu 5'te (örneğin, Şekil 13) tartışılmaktadır ve bağlantı analizi için kullanımları, konu 6'da (örneğin, Şekil 21) tartışılmaktadır. Konu 6 ayrıca dağılım çizelgelerinin kullanımını tartışır (örneğin, Şekil 20).

Çizgi grafikler alt bölümlere ayrılır tek boyutlu verileri tek bir değişken bazında temsil etmek için kullanılır ve iki boyutlu- iki değişkende. Tek boyutlu çizgi grafiğinin bir örneği, bir dağılım poligonudur ve iki boyutlu olan, bir regresyon çizgisidir (örneğin, Şekil 21).

Bazen göstergedeki büyük değişiklikler için logaritmik bir ölçeğe başvururlar. Örneğin, göstergenin değerleri 1'den 1000'e değişirse, bu bir grafik oluştururken zorluklara neden olabilir. Bu gibi durumlarda, çok fazla değişmeyecek olan gösterge değerlerinin logaritmasına geçerler: lg 1 = 0, lg 1000 = 3.

Arasında düzlemsel grafiklerin kullanım sıklığına göre, göstergenin bir çubuk şeklinde sunulduğu, yüksekliği göstergenin değerine karşılık gelen çubuk grafikler (histogramlar) vurgulanır (örneğin, Şekil 4).

Belirli bir geometrik şeklin alanının göstergenin değerine oranı, diğer düzlem diyagram türlerinin temelini oluşturur: üçgensel, Meydan, dikdörtgen... Bir dairenin alanlarının karşılaştırılması da kullanılabilir - bu durumda dairenin yarıçapı belirtilir.

Şerit grafiği metrikleri yatay olarak uzatılmış dikdörtgenler olarak sunar ve aksi takdirde çubuk grafikten farklı değildir.

Düzlem çizelgelerinde sıklıkla kullanılır. yuvarlak diyagram, hedef popülasyonun yapısını göstermek için kullanılır. Tüm set %100 olarak alınır, dairenin toplam alanı ona karşılık gelir, sektörlerin alanları setin bölümlerine karşılık gelir. Tabloya göre 2006 yılında Rusya Federasyonu'nun dış ticaret yapısının sektörel bir diyagramını oluşturalım. 2 (bkz. şekil 2). Bilgisayar programlarını kullanırken, pasta grafikler hacimsel biçimde, yani iki değil, üç düzlemde oluşturulur (bkz. Şekil 3).

Pirinç. 2. Basit pasta grafiği Şek. 3. 3-D pasta grafiği

Figürlü (resimli) çizelgeler, boyutu göstergenin boyutuna karşılık gelen, görüntülenen göstergenin bir resmini içerdiklerinden görüntünün netliğini artırır.

Bir grafik oluştururken, her şey eşit derecede önemlidir - bir grafik görüntüsünün doğru seçimi, oranlar, grafik çizme kurallarına uygunluk. Bu konular ve içinde daha ayrıntılı olarak ele alınmaktadır.

Kartogramlar ve kartodiyagramlar, incelenen fenomenlerin coğrafi özelliklerini tasvir etmek için kullanılır. İncelenen olgunun yerini, belirli bir bölgedeki yoğunluğunu gösterirler - cumhuriyette, bölgede, ekonomik veya idari bölgede vb. Kartogramların ve kartodiyagramların yapımı, örneğin özel literatürde dikkate alınır.

İstatistiksel bilgilerin açık ve kompakt bir sunumu için istatistiksel tablolar ve grafikler kullanılır (şemalar, kartogramlar ve kartodiyagramlar dahil).

İstatistiksel gözlem materyallerinin özetinin ve gruplandırılmasının sonuçları, kural olarak, tablolar şeklinde sunulur.

Tablo, istatistiksel materyalin en rasyonel, görsel ve kompakt sunum şeklidir.

İstatistiksel tablo, ekonomik analiz mantığıyla birbirine bağlı bir veya birkaç temel özelliğe göre incelenen popülasyonun sayısal özelliklerinin bir özetini içeren bir tablodur.

Şekil 2'de gösterilen istatistiksel tablonun ana unsurları. 5.1, düzenini oluşturun:

Pirinç. 5.1. istatistiksel tablo

Bir tablo oluştururken, sayısal bilgiler satırların ve grafiklerin kesişiminde bulunur. Bu nedenle, dışarıdan bir tablo, onu oluşturan grafiklerin ve satırların bir koleksiyonudur.

iskelet. Tablonun boyutu, satır sayısı ile sütun sayısının çarpımı ile belirlenir.

İstatistik tablosu üç tür başlık içerir: genel, üst ve yan. Ortak başlık, tüm tablonun içeriğini yansıtır, yerleşimin üzerinde ortalanır ve dış başlıktır. Üst başlıklar (yüklem başlıkları) grafiklerin içeriğini, yan başlıklar (konu başlıkları) ise satırların içeriğini karakterize eder. Bunlar dahili başlıklardır.

Tablonun başlıklarla dolu gövdesi, düzenini oluşturur. Grafiklerin ve satırların kesişim noktalarına sayılar yazarsanız, eksiksiz bir istatistiksel tablo elde edersiniz. Dijital malzeme mutlak, göreli (gıda fiyat endeksleri) ve ortalama değerler olarak sunulabilir. Gerekirse, tablolara başlıkları, bazı göstergeleri hesaplama yöntemlerini, bilgi kaynaklarını vb. açıklığa kavuşturmak için kullanılan bir not eşlik edebilir.

Mantıksal içeriğine göre, tablo, ana unsurları konu ve yüklem olan bir "istatistiksel cümle" dir.

İstatistiksel tablonun konusu, sayılarla karakterize edilen bir gösterge listesi içerir. Bir veya birkaç küme, liste sırasına göre ayrı küme birimleri (firmalar, dernekler) veya bazı kriterlere göre gruplandırılmış (ayrı bölgesel birimler, kronolojik tablolardaki zaman periyotları vb.) olabilir. Genellikle tablonun konusu satırların adına solda verilir.

İstatistiksel bir tablonun yüklemi, çalışma nesnesini, yani tablonun konusunu karakterize eden bir göstergeler sistemi oluşturur. Yüklem üst başlıkları oluşturur ve grafiklerin içeriğini soldan sağa mantıksal bir sıralı gösterge düzenlemesiyle oluşturur.

Araştırmacının seçimine bağlı olarak özne ve yüklemin yeri tersine çevrilebilir. Konunun yapısına ve birimlerin gruplandırılmasına bağlı olarak, basit ve karmaşık istatistiksel tablolar arasında ayrım yapar ve ikincisi sırayla grup ve kombinasyon tablolarına bölünür.

Konudaki basit bir tabloda, nüfusun herhangi bir nesnesinin veya bölgesel birimlerinin basit bir listesi verilir. Basit tablolar monografik ve kahverengidir. Monografiler, incelenen cildin tüm birimlerini değil, belirli, önceden formüle edilmiş bir kritere göre ayırt edilen, ondan herhangi bir grubu karakterize eder. Bu nedenle, tablolara, konusu incelenen popülasyonun birimlerinin bir listesini içeren basit kahverengi tablolar denir.

Basit bir tablonun konusu aşağıdaki ilkelere göre oluşturulabilir: spesifik, bölgesel (BDT ülkelerindeki nüfus); geçici, vb. Basit tablolar, incelenen fenomenlerin sosyo-ekonomik türlerini, yapılarını ve ayrıca onları karakterize eden özellikler arasındaki ilişkiyi ve karşılıklı bağımlılığı tanımlamayı mümkün kılmaz. Bu görevler, karmaşık tabloların yardımıyla daha eksiksiz bir şekilde çözülür: grup ve özellikle kombinasyon tabloları.

İstatistiksel tablolara, konusu bir nicel veya nitelik özelliğine göre popülasyon birimlerinin gruplandırılmasını içeren grup tabloları denir. Grup tablolarındaki yüklem, konuyu karakterize etmek için gerekli göstergelerden oluşur.

En basit grup tabloları türü, nitelik ve varyasyon dağılım serileridir. Yüklem yalnızca her gruptaki birimlerin sayısını değil, aynı zamanda konunun gruplarını nicel ve nitel olarak karakterize eden bir dizi başka önemli göstergeyi de içeriyorsa, grup tablosu daha karmaşık olabilir. Bu tür tablolar genellikle gruplar arasında toplu göstergeleri karşılaştırmak amacıyla kullanılır ve bu da bazı pratik sonuçların çıkarılmasına olanak tanır. Grup tabloları, sosyo-ekonomik fenomen türlerini, yapılarını yalnızca bir özelliğe bağlı olarak tanımlamayı ve karakterize etmeyi mümkün kılar.

Kombinasyon tabloları, konusu iki veya daha fazla kritere göre aynı anda nüfus birimlerinin gruplandırılmasını içeren istatistiksel tablolardır: bir özelliğe göre oluşturulan grupların her biri, başka bir özelliğe göre alt gruplara bölünür, vb.

Kombinasyon tabloları, çeşitli özelliklerle ayırt edilen tipik grupları ve ikincisi arasındaki ilişkiyi karakterize etmenize olanak tanır. Popülasyonun birimlerini özelliklere göre homojen gruplara ayırma sırası, bunlardan birinin kombinasyonlarındaki önemine veya çalışılma sırasına göre belirlenir.

Bir yüklemin karmaşık gelişimi, onu oluşturan niteliğin alt gruplara bölünmesini içerir. Bu durumda, nesnenin daha eksiksiz ve ayrıntılı bir açıklaması elde edilir. Bu durumda, her bir işletme grubu veya her biri ayrı ayrı, yüklemi oluşturan farklı bir özellik kombinasyonu ile karakterize edilebilir.

1. İstatistik kavramı

İstatistik, ekonomik muhasebe temelinde ortaya çıkan en eski bilgi dallarından biridir. Oluşumu, çeşitli bilgi türleri için toplumun ihtiyaçları ile ilişkilidir.

İstatistik teriminin Latince stato (durum) ve status (konum, durum) kelimelerinden geldiğine inanılmaktadır.

Geniş anlamda istatistik, kitle olaylarını ve yasalarını nicel açıdan inceleyen bir bilim olarak anlaşılmaktadır.

Genel istatistik teorisi, metodolojik bir bilimdir, herhangi bir alandaki kalıpları tanımlamak için geçerli olan, sonuçların kitlesel gözlem temelinde çıkarıldığı, bir popülasyonun bireysel unsurlarında bir özellik varyasyonunun olduğu bir yöntemin bilimidir, genel kalıpların kendilerini ancak bireysel birimlerdeki kazaların karşılıklı olarak iptal edilmesiyle gösterebildiği yer ...

2. Bir bilim olarak istatistik

2.1 İstatistik geliştirme yolları

Bir bilim olarak istatistiğin gelişimi iki yöne gitti:

İlk yön Almanya'da ortaya çıktı ve devlet çalışmaları veya tanımlayıcı okul olarak bilinir. Bu okulun temsilcileri, aralarındaki kalıpları ve ilişkileri analiz etmeden devletin manzaralarını tanımlamak için ana görevlerini düşündüler. Tanımlayıcı okulun kurucusu Alman bilim adamı Hermann Konring'di.

İstatistiğin ikinci gelişim yönü İngiltere'de ortaya çıktı ve siyasi aritmetik olarak bilinir. Bu okulun temsilcileri, çok sayıda gözlem temelinde, incelenen fenomenlerin çeşitli kalıplarını ve ilişkilerini belirlemek için ana görevlerini düşündüler. Okulun kurucusu William Petty'dir.

2.2 İstatistik konusu ve temel kavramlar

Belçikalı matematikçi Adolphe Ketiye, devlet araştırmalarından teorik bilgileri özetledi ve siyasi aritmetik okulunun temsilcilerinin pratik çalışmalarını açıkladı. Verdi istatistik konusunun tanımı, toplumun yaşamı ve bir kişi ile ilişkili kitlesel bir olgudur. Ayrıca istatistikleri bir sosyal biliş silahı olarak gördü.

Kitle fenomenlerinin ayırt edici özellikleri:

1. Kümenin her bir elemanının hem bireysel hem de ayırt edici, ortak veya benzer özellikleri vardır.

2. Bir kütle olgusunun öğelerinden birinin özellikleri, diğer öğelerin özelliklerinden türetilemez.

Tanım: Farklı bireysel özelliklere sahip bir dizi tek-kaliteli birimler şeklinde istatistik tarafından incelenen kütle fenomenlerine istatistiksel toplamlar denir. Buna dayanarak, istatistiğin konusunun, çalışması nicel bir özellik ve bunların doğasında bulunan kalıpların tanımlanması ile ilişkili olan çeşitli istatistiksel kümeler olduğunu söyleyebiliriz. İstatistiksel nüfus, istatistik biliminin temel kavramlarından biridir. Bununla ilişkili, aşağıdaki gibi kavramlardır: toplamın bir birimi. Tanım: Kümesi çalışılan kümeyi oluşturan elemanlara birim denir. Nüfus birimlerinin işaretleri:

Popülasyonun her birimi, farklı türde niteliksel ve niceliksel özelliklerle karakterize edilebilir.

Belirli bir özelliğin popülasyonun belirli birimleri için farklı anlamları varsa, buna varyasyon denir. Tanım: Kitle gözlemi yoluyla tanımlanan bir model, yani. Kendi doğasında bulunan rastgeleliğin tek bir unsur tarafından üstesinden gelinmesi yoluyla büyük bir fenomen kütlesinde tezahür eden, istatistiksel düzenlilik olarak adlandırılır. İstatistiğin ana görevi, rastgele olandan soyutlamak ve tipik, doğal olanı tanımlamaktır.

Kalıpları tanımlamanın üç yolu vardır:

1. mantıksal;

2. ampirik;

3. Büyük sayılar yasasına dayalı.


2.3 İstatistik yöntemi

Kitle gözlemi, sonuçlarının gruplandırılması ve özeti, özet göstergelerin hesaplanması ve analizi. Bütün bunlar birlikte istatistik yöntemini verir.

3. İstatistiksel gözlem

3.1 İstatistiksel araştırmanın bir aşaması olarak istatistiksel gözlem. İstatistiksel gözlem planı

İstatistiksel gözlem, istatistiksel araştırmanın ilk adımıdır.

Tanım: İstatistiksel gözlem, önceden geliştirilmiş bir programa göre yürütülen, incelenen süreçler ve fenomenler hakkında bilimsel olarak organize edilmiş bir yığın veri koleksiyonudur.

Toplu veri gereksinimleri:

İstatistikler yeterince eksiksiz olmalıdır. Her fenomen birbiriyle ilişkili çeşitli özelliklere sahiptir. Verilerin eksiksizliği, nesnel sonuçlara ulaşmak için gerekli olan en temel özelliklerin kapsamını sağlar. İstatistiksel gözlem verileri farklı zaman dilimlerine atıfta bulunuyorsa, bunların karşılaştırılabilirliğini sağlamak gerekir. İstatistiksel bilgilerin karşılaştırılabilirliği, ölçüm birimlerinin, maliyet tahminlerinin, idari bölgelerin sınırlarının, zamansal özelliklerin vb. tekdüzeliği anlamına gelir. İstatistiksel bir gözleme başlamadan önce, davranış sırasını belirlemek gerekir. Bunun için aşağıdakileri içeren ayrıntılı bir gözlem planı geliştirilmiştir:

1.program-metodolojik kısım:

2. organizasyonel kısım.

1. Gözlem planının programı ve metodolojik konuları.

Planın bu kısmı şunları tanımlamalıdır:

a) gözlemin amacı ve hedefleri:

b) incelenecek nesne ve birimler;

c) gözlem programı.

Gözlem programı, anket sırasında cevaplanması gereken soruların bir listesidir. Program kapsamlı ve kapsamlı olmalıdır. Soruların ifadesi mümkün olduğunca kısa ve net olmalı, cevaplarda yanlışlık ve belirsizliği hariç tutmalı, gerekirse, soruların birleşik bir yorumu ve anlaşılması için bir ipucu verilir. Gözlemin yazılım metodolojik bölümünde, belirli bir istatistiksel araştırma araç seti belirtilir, yani. formüle edilmiş soruların cevaplarını ve bunları doldurma talimatlarını içermesi gereken formlar.

2. Gözlem planının organizasyonel sorunları.

Başarılı bir gözlem organizasyonu ve popülasyonun kapsamının eksiksizliği için, gözlem için bir organizasyon planı geliştirilir.

Belirtir:

a) gözlem konusu:

b) çalışmanın zamanlaması ve yeri;

c) işlenmesi için veri toplama ve teknolojinin organizasyonu.


3.2 İstatistiksel gözlem biçimleri ve türleri

İstatistiksel gözlem biçimleri, türleri ve yöntemleri.

İstatistiksel gözlemin organizasyonel biçimleri

İstatistiksel gözlem türleri

İstatistiksel gözlem yöntemleri

gerçeklerin tescili sırasında

nüfus birimlerinin kapsamına göre

1. İstatistiksel raporlama.

2. Özel olarak organize edilmiş gözlem.

3. Gözlemi kaydedin.

1. Akım veya sürekli.

2. Süreksiz:

a) periyodik;

b) tek seferlik.

1. Katı.

2. Süreksiz:

a) seçici;

b) ana dizi;

c) monografik.


1. Hemen.

2. Belgesel.

a) seferi;

b) kendi kendine kayıt;

c) muhabir;

d) anket;

e) güvenli.

Yurt içi istatistiklerde, istatistiksel gözlemin üç örgütsel biçimi (türü) kullanılır:

1. Raporlama- bu, istatistik makamlarının belirli bir zaman dilimi içinde, yasal olarak oluşturulmuş raporlama belgeleri şeklinde gerekli verileri işletmelerden, kurumlardan ve kuruluşlardan aldığı, yardımıyla, istatistiksel gözlemin ana şeklidir. bunların sağlanmasından ve toplanan bilgilerin güvenilirliğinden sorumlu kişiler.

Paylar: telefon, teletype, posta.

2. Özel olarak organize edilmiş gözlem raporlamada yer almayan bilgileri elde etmek veya verilerini doğrulamak için gerçekleştirilir. Pratik istatistikler nüfus, malzeme kaynakları, çok yıllık tarlalar, tanımlanamayan ekipman, devam eden inşaat, ekipman vb. Sayımları gerçekleştirir. Sayımlara ek olarak, istatistikler ayrıca diğer özel olarak organize edilmiş gözlemleri, özellikle de tüketici harcamalarının yapısını karakterize eden bütçe anketlerini yürütür. ve aile geliri.

3. Kayıt gözlemi Sabit bir başlangıcı, bir gelişim aşaması ve sabit bir sonu olan uzun vadeli süreçlerin sürekli istatistiksel gözleminin bir şeklidir. İstatistiksel bir kaydın tutulmasına dayanır. Kayıt, gözlem biriminin durumunu sürekli izleyen ve çeşitli faktörlerin incelenen göstergeler üzerindeki etkisinin gücünü değerlendiren bir sistemdir.

İstatistik uygulamasında nüfus kayıtları ile ticaret sicilleri arasında bir ayrım yapılmaktadır.

Gerçeklerin kaydedildiği zamana göre istatistiksel gözlem türleri

Devam eden izleme, olayların meydana gelmesi gibi sistematik olarak gerçekleştirilir. Periyodik gözlem ile, incelenen fenomenlerin kaydı belirli, genellikle eşit zaman dilimlerinde gerçekleştirilir. Bir sorunu çözmek için bir kerelik gözlem yapılır veya gerektiğinde belirli sürelerden sonra ara sıra tekrarlanır.

Nüfus birimlerinin kapsamına ilişkin istatistiksel gözlem türleri

Sürekli gözlem ile, popülasyonun istisnasız tüm birimleri kaydedilir. Seçici gözlemde, tüm popülasyonu karakterize etmek için popülasyonun rastgele seçilen bir kısmı incelenir.

Kusurlu bir şekilde sürekli gözlem durumunda (ana gövdenin), popülasyonun ana kısmı incelenir ve belirli bir kısım kasıtlı olarak hariç tutulur, bunun hakkında tüm popülasyonun özelliklerinde büyük bir rol oynamadığı bilinmektedir. Monografik gözlem, popülasyonun az sayıda veya bireysel tipik biriminin ayrıntılı açıklamasından oluşur.

Gerçekleri kaydetme yöntemleri veya birincil materyal elde etme yöntemleri

Doğrudan gözlem, incelenen birimlerin ve özelliklerinin özel olarak belirlenmiş kişiler tarafından doğrudan inceleme, sayım, tartım, cihaz okumaları vb. Belgesel gözlem, işletmelerin, kurumların, kuruluşların çeşitli birincil muhasebe belgelerinin istatistiksel bilgi kaynağı olarak kullanılmasına dayanır. Bir ankette, ankete katılanlar tarafından verilen cevaplar kaydedilerek istatistiksel materyaller elde edilir. Keşif yöntemi, özel olarak eğitilmiş kayıt şirketlerinin formülleri yoklama yoluyla doldurması ve aynı zamanda alınan bilgilerin özgürlüğünü kontrol etmesi gerçeğinden oluşur. Kendi kendine kayıt veya kendi kendine kayıt sırasında, istatistik kurumlarının çalışanları anketleri katılımcılara dağıtır, onlara talimat verir ve daha sonra alınan bilgilerin eksiksizliğini ve doğruluğunu kontrol ederek doldurulmuş formları toplar. Anket, geliştirilen anketin bir grup insana gönderilmesi ve doldurulduktan sonra gözlemleri yapan organlara iade edilmesinden oluşur. Muhabir, geliştirilen form ve talimatlara göre gözlem yapan ve istatistik kuruluşlarına bilgi rapor eden, alanda yaşayan insanlardan özel bir muhabir ağının istatistik kuruluşları tarafından düzenlenmesidir. Açık, gizli bir şekilde gözetim yapan yetkililere bilgi sunulmasını sağlar.

4. İstatistiklerin özeti ve gruplandırılması

4.1 İstatistiksel özetin amaçları ve türleri


Tanım: Özet, bir bütün olarak incelenen olgunun doğasında bulunan tipik özellikleri ve kalıpları belirlemek için bir küme oluşturan belirli bireysel gerçekleri genelleştirmek için bir dizi ardışık işlemdir.

Bu nedenle, istatistiksel gözlem bir nesnenin her bir birimi hakkında veri toplarsa, özetin sonucu, bir bütün olarak bütünlüğünü yansıtan ayrıntılı verilerdir.

İstatistiksel özet, fenomenlerin ve süreçlerin ön teorik analizine dayanmalıdır.

Malzeme işleme derinliğine göreözet basit veya karmaşık olabilir.

Basit bir özet, bir gözlem birimi koleksiyonunun genel toplamlarını hesaplayan bir işlemdir.

Karmaşık bir özet, gözlem birimlerini gruplandırmayı, her grup ve tüm nesne için toplamları hesaplamayı ve gruplandırma sonuçlarını ve özetini istatistiksel tablolar şeklinde sunmayı içeren bir işlemler kompleksidir.

Bir özet yürütmek, aşağıdaki aşamalardan oluşan programının geliştirilmesinden önce gelir:

Gruplama işaretlerinin seçimi;

Grupların oluşum sırasının belirlenmesi;

Grupları ve bir bütün olarak nesneyi karakterize etmek için bir istatistiksel göstergeler sisteminin geliştirilmesi;

Özet sonuçlarının sunulacağı istatistiksel tabloların düzenlerinin geliştirilmesi.

Malzeme işleme şekline göreÖzet, merkezi olmayan ve merkezi hale getirilebilir.

Merkezi olmayan bir özetle (kural olarak istatistiksel raporların işlenmesinde kullanılan budur), materyalin geliştirilmesi sıralı aşamalarda gerçekleştirilir. Bu nedenle, işletmelerin raporları Rusya Federasyonu'nun kurucu kuruluşlarının istatistik organları tarafından derlenir ve bölge için sonuçlar zaten Rusya Devlet İstatistik Komitesi'ne sunulur ve ülkenin ulusal ekonomisi için bir gösterge olarak belirlenmiş göstergeler vardır. tüm. Merkezi bir özet ile tüm birincil materyaller, baştan sona işlendiği tek bir kuruluşa gider. Tek seferlik istatistiksel anketlerden elde edilen materyalleri işlemek için genellikle merkezi bir özet kullanılır. Yürütme tekniğine göre, istatistiksel özet, mekanize ve manuel olarak alt bölümlere ayrılmıştır.

Bir özet yapmak için, örgütsel konuları belirleyen bir plan hazırlanır: tüm işlemlerin kim tarafından ve ne zaman gerçekleştirileceği, uygulama prosedürü, süreli yayınlarda yayınlanacak bilgilerin bileşimi.


4.2 İstatistikte gruplandırma yöntemi

İstatistiksel gruplama, sosyal hayatın fenomenleri ve süreçleri hakkında kapsamlı bir çalışma için tüm materyal setinin temel özelliklere göre gruplara ve alt gruplara bölünmesidir.

Temel gruplama olarak adlandırılır.

İstatistikte gruplar oluşturmak için esas olarak iki tür işaret kullanılır:

1. nicel (sayısal);

2. nitel (nitelikli).

Bir özniteliğe göre gruplandırma denir basit, ve iki veya daha fazla özelliğin birbiriyle kombinasyon halinde alınmasına dayalı gruplamalara denir. kombinasyonel(zor).

Gruplama özniteliği seçildikten sonra grup sayısı seçilir. Gruplama nitel bir özelliğe dayanıyorsa, grup sayısı sorunu otomatik olarak çözülür - incelenen kümede (birimleri) nitel durumlar olduğu kadar çok olacaktır.

Nicel kriterlere göre gruplama yaparken, gruplama aralıklarının belirlenmesi sorunu ortaya çıkar. Aralığın boyutu, her gruptaki bir özelliğin maksimum ve minimum değeri arasındaki farktır. Belirli bir kriter için popülasyon birimlerinin dağılımlarının doğasına bağlı olarak, aralıklar büyüklük olarak farklı olabilir ve eşit olmayabilir. Bir özelliğin varyasyon sınırları içindeki dağılımı yeterince tekdüze ise, özelliğin dalgalanma aralığı, uzunluğu aşağıdaki formülle belirlenen eşit aralıklara bölünür:

nerede xmak ve xdk sırasıyla, belirli bir popülasyondaki bir özelliğin maksimum ve minimum değeri,

n, oluşturulan grup sayısıdır.

Grup sayısı önceki araştırmalara göre belirlenebilir. Grup sayısı sorununun bağımsız olarak çözülmesi gerekiyorsa, optimal grup sayısını belirlemek için Sturgess formülü kullanılabilir:



n - grup sayısı

N, popülasyondaki birim sayısıdır

Üst ve alt sınırların verildiği kapalı aralıklar ile yalnızca bir sınırın olduğu açık aralıklar arasında ayrım yapın: üst veya alt.

Yardımlarıyla çözülen görevlere göre istatistiksel gruplamalar şu şekildedir:

tipolojik gruplama- Bu, incelenen niteliksel olarak heterojen nüfusun, bilimsel gruplama kurallarına uygun olarak sınıflara, sosyo-ekonomik türlere, homojen birim gruplarına bölünmesidir.

yapısal homojen bir popülasyonun yapısını değişen bazı özelliklere göre karakterize eden gruplara ayrıldığı bir gruplama denir.

analitik incelenen fenomenler ve özellikleri arasındaki ilişkiyi ortaya koyan bir gruplama denir.


4.3 İstatistiklerde dağılım serileri

İstatistiksel bir dağılım serisi, nüfus birimlerinin belirli bir değişken özelliğe göre gruplara sıralı bir dağılımıdır.

Bir dizi oluşumunun altında yatan dağılımın işaretine bağlı olarak, bunlar ayırt edilir:

1. Niteliksel özelliklere göre oluşturulmuş nitelik - dağıtım serisi.

2. Varyasyonel - nicel bir temele dayalı dağıtım serisi. Herhangi bir varyasyon özelliği 2 öğeden oluşur: seçenekler ve frekanslar.

Varyantlar, varyasyon serilerinde aldığı özelliğin bireysel değerleri olarak kabul edilir.

Frekanslar, bireysel varyantların veya bir varyasyon serisinin her bir grubunun sayısıdır.

Frekanslar, bir birimin kesirleri veya toplamın yüzdesi olarak ifade edilen frekanslardır.

Özelliğin varyasyonunun doğasına bağlı olarak, ayırt edilirler:

1. Ayrık bir varyasyon serisi, ayrı bir özelliğe göre popülasyonun birimlerinin dağılımını karakterize eder (niceliksel bir özelliğin değeri yalnızca tamsayı değerleri alır).

2. Aralıklı varyasyon serisi - özelliğin sürekli varyasyonu durumunda ve ayrıca ayrı varyasyonun geniş bir aralıkta kendini göstermesi durumunda, yani. ayrı bir özellik için seçeneklerin sayısı yeterince büyüktür.

Dağılım serilerini ugaric görüntülerini kullanarak analiz etmek en uygunudur.

Çokgen, ayrık varyasyon serileri görüntülenirken kullanılır.

Aralık varyasyon serisinin görüntüsü için histogram alınır.

5. İstatistiksel göstergeler

İstatistiksel bir gösterge, sosyo-ekonomik olayların ve süreçlerin niteliksel kesinlik koşullarında nicel bir özelliğidir. Göstergenin niteliksel kesinliği, incelenen fenomenin veya sürecin içsel içeriği, özü ile doğrudan ilgili olması gerçeğinde yatmaktadır.

Kural olarak, istatistik tarafından incelenen süreçler ve fenomenler oldukça karmaşıktır ve özleri tek bir gösterge aracılığıyla yansıtılamaz. Bu gibi durumlarda, bir istatistiksel göstergeler sistemi kullanılır (tek seviyeli veya çok seviyeli bir yapıya sahip ve belirli bir istatistiksel problemi çözmeyi amaçlayan birbiriyle ilişkili bir dizi gösterge).


5.1 Mutlak ve bağıl göstergeler

Mutlak istatistikler.

Mutlak değerler şeklindeki istatistiksel göstergeler, istatistik tarafından incelenen süreçlerin ve fenomenlerin mutlak boyutlarını karakterize eder: kütleleri, alanları, hacimleri, uzunlukları; zamansal özelliklerini yansıtır ve ayrıca nüfusun hacmini temsil edebilir, yani. oluşturan birimlerin sayısı.

Bireysel mutlak göstergeler, kural olarak, ilgili nicel özelliğin ölçülmesi, tartılması, sayılması ve değerlendirilmesi sonucunda doğrudan istatistiksel gözlem sürecinde elde edilir.

Toplu hacimsel göstergeler, bireysel değerlerin bir özeti ve gruplandırılmasının bir sonucu olarak elde edilir (hem incelenen nesne için hem de herhangi bir kısmı için bir özelliğin hacmini veya bir popülasyonun hacmini karakterize edin).

Mutlak istatistikler aşağıdaki birimlerde ifade edilir:

Doğal (ton, kilogram, kilometre, adet);

Maliyet (sosyo-ekonomik olayların ve süreçlerin parasal değerlendirmesi);

İşçilik (adam-gün, adam-saat).

Göreceli istatistikler.

Göreceli bir gösterge, bir mutlak göstergenin diğerine bölünmesinin sonucudur ve sosyo-ekonomik süreçlerin nicel özellikleri ile fenomenler arasındaki ilişkiyi ifade eder. Payda göstergeye cari veya karşılaştırmalı, paydada ise karşılaştırma tabanı veya tabanı denir.

Karşılaştırma tabanı 1 alınırsa bağıl gösterge katsayılarla, taban 100 alınırsa yüzde (%) olarak, 1000 için ise ppm (% 0) olarak ifade edilir. , taban 10.000 alınırsa prodecymilla ile ifade edilir...

Yüzdeler, kural olarak, karşılaştırılan mutlak göstergenin temel değeri 2-3 kattan fazla aşmadığı durumlarda kullanılır. 200-300'ün üzerindeki yüzdeler genellikle çoklu bir oran olan bir katsayı ile değiştirilir.


5.2 Ortalamalar (değerler)

İstatistiksel bir popülasyondaki bir özelliğin belirli yer ve zaman koşullarında genelleştirilmiş nicel bir özelliği olan ortalama değer, istatistiksel göstergelerin en yaygın biçimidir.

Varyasyon serisinin her bir varyantının yalnızca bir kez gerçekleştiği (o zaman ortalamaya basit veya ağırlıksız olarak adlandırılır) ve varyant veya aralıkların tekrarlandığı (ağırlıklı ortalama) durumlar için hesaplanan ortalama türlerini düşünün. Tekrar sayısı seçeneği - sıklık. Bir veya başka bir ortalama türü seçerken, özetleme veya tartma sırasında sonucun anlamlılığı ilkesinden hareket edilmelidir.

Aritmetik ortalama.

X - güç yasası ortalama;

Z, ortalamanın türünü belirleyen bir üstür;

Xi - seçenekler;

mi - değişkenlerin frekansları veya istatistiksel ağırlıkları.

Ortalama harmonik (z = -1).


özel ders

Bir konuyu keşfetmek için yardıma mı ihtiyacınız var?

Uzmanlarımız, ilginizi çeken konularda tavsiyelerde bulunacak veya özel ders hizmetleri sunacaktır.
İstek gönder Konunun belirtilmesi ile şu anda bir danışma alma olasılığını öğrenmek için.

İSTATİSTİKSEL VERİLERİN GRAFİK SUNUMU, sosyo-ekonomik olaylar hakkındaki verilerin geometrik görüntüler, çizimler veya şematik coğrafi haritalar ve bunlara açıklayıcı yazılar aracılığıyla görsel temsili ve genelleştirilmesi yöntemi. İstatistiksel verilerin grafiksel sunumu, kamusal yaşamın fenomenleri ve süreçleri, gelişimlerindeki ana eğilimler, uzaydaki dağılımlarının derecesi arasındaki ilişkiyi açık ve görsel olarak gösterir; hem tüm fenomen setini hem de tek tek parçalarını görmenizi sağlar.

İstatistiksel verileri grafiksel olarak temsil etmek için çeşitli istatistiksel grafikler kullanılır. Her çizelge bir grafik görüntü ve yardımcı öğelerden oluşur. Bunlar şunları içerir: grafik açıklaması, uzamsal referans noktaları, ölçek referans noktaları, grafik alanı. Yardımcılar grafiğin okunmasını, anlaşılmasını ve kullanılmasını mümkün kılar. Grafikler bir dizi özelliğe göre sınıflandırılabilir: grafik görüntünün şekline bağlı olarak nokta, doğrusal, düzlemsel, uzamsal ve figürlü olabilirler. Yapım yöntemine göre grafikler diyagramlara ve istatistiksel haritalara ayrılır.

En yaygın grafik gösterim şekli bir diyagramdır. Bu, istatistiksel verilerin geometrik şekiller veya işaretler olarak sunulduğu ve bu verilerin atıfta bulunduğu bölgenin yalnızca sözlü olarak belirtildiği bir çizimdir. Diyagram, bir coğrafi harita veya istatistiksel verilerin atıfta bulunduğu bölgenin planı üzerine bindirilirse, grafiğe kartodiyagram denir. İstatistiksel veriler, bir coğrafi harita veya plan üzerinde ilgili bölgeyi gölgelendirerek veya renklendirerek gösteriliyorsa, grafiğe kartogram denir.

Farklı nesneleri veya bölgeleri karakterize eden aynı ada sahip istatistiksel verileri karşılaştırmak için çeşitli diyagram türleri kullanılabilir. En belirgin olanı, istatistiksel verilerin dikey olarak uzatılmış dikdörtgenler şeklinde gösterildiği çubuk grafiklerdir. Netlikleri, kolonların yüksekliği karşılaştırılarak elde edilir (Şekil 1).

Taban çizgisi dikeyse ve çubuklar yataysa, çizelgeye şerit grafiği denir. Şekil 2, dünyanın bölgesini karakterize eden bir karşılaştırma çubuk grafiğini göstermektedir.

Popülerleştirmeye yönelik diyagramlar bazen standart şekiller şeklinde oluşturulur - gösterilen istatistiksel verilerin karakteristik resimleri, bu da diyagramı daha anlamlı kılar ve ona dikkat çeker. Bu tür diyagramlara figüratif veya figüratif denir (şekil 3).

Büyük bir gösterge grafik grubu, yapısal diyagramlardan oluşur. İstatistiksel veri yapısının grafiksel gösterimi yöntemi, yapısal pasta veya pasta grafiklerinin hazırlanmasından oluşur (Şekil 4).

Zaman içinde fenomenlerin gelişiminin görüntüsü ve analizi için dinamik diyagramlar oluşturulur: çubuk, şerit, kare, dairesel, doğrusal, radyal vb. Diyagram türünün seçimi, ilk verilerin özelliklerine, amaca bağlıdır. Çalışmanın. Örneğin, zaman içinde (1913, 1940, 1950, 1980, 2000, 2005) biraz eşit olmayan aralıklara sahip bir dizi dinamik varsa, o zaman çubuk, kare veya pasta grafikleri kullanın. Görsel olarak etkileyiciler, iyi hatırlanıyorlar, ancak çok sayıda seviyeyi tasvir etmek için uygun değiller. Bir dizi dinamikteki seviye sayısı büyükse, geliştirme sürecini sürekli bir kesikli çizgi şeklinde yeniden üreten doğrusal diyagramlar kullanılır (Şekil 5).

Çoğu zaman, farklı ülkelerdeki çeşitli göstergelerin veya aynı göstergenin dinamiklerinin karşılaştırmalı bir özelliğini sağlayan bir çizgi grafik üzerinde birkaç eğri verilir (Şekil 6).

Bir göstergenin diğerine bağımlılığını göstermek için bir ilişki diyagramı oluşturulur. Göstergelerden biri X, diğeri Y (yani X'in bir fonksiyonu) olarak alınır. Göstergeler için ölçekler içeren dikdörtgen bir koordinat sistemi oluşturulur ve içinde bir grafik çizilir (Şekil 7).

Bilgisayar teknolojisinin ve uygulamalı yazılımın gelişimi, bilginin grafik sunumunda niteliksel olarak yeni bir aşamayı temsil eden coğrafi bilgi sistemleri (CBS) oluşturmayı mümkün kılmıştır. CBS, mekansal olarak koordine edilmiş verilerin toplanmasını, depolanmasını, işlenmesini, erişimini, görüntülenmesini ve yayılmasını sağlar; Bölgenin çeşitli ölçeklerde çok katmanlı elektronik haritalarını elde etmek için bilgiyi mekansal (kartografik) biçimde sunmayı mümkün kılan modelleme ve hesaplama işlevleriyle bağlantılı çok sayıda grafik ve tematik veri tabanı içerir. Bölgesel kapsama göre, küresel, kıta altı, eyalet, bölgesel ve yerel CBS türleri vardır. CBS'nin konu yönelimi, aralarında kaynak envanteri, analiz, değerlendirme, izleme, yönetim ve planlama olabilecek, yardımı ile çözülen görevlerle belirlenir.

Yanan: Gerchuk Ya. P. İstatistikte grafik yöntemleri. M., 1968; İstatistik teorisi / Düzenleyen R. A. Shmoilova. 4. baskı. M., 2005.S. 150-83.

§1.İstatistik kavramları, istatistiksel düzenlilik ve bütünlük ..... 2

§2. İstatistiksel bir popülasyonun birimlerinin işaretleri, sınıflandırılması ... 2

§bir. İstatistiksel gözlem kavramı, hazırlanması ................................. 4

§2. İstatistiksel gözlem türleri .................................................. .. 5

§3. Gözlem hataları ................................................................ ................... 6

§4. Özet ve Gruplandırma ................................................................. ................. 6

§5. İstatistiksel gruplama türleri .................................................. 6

§6. İstatistiksel tablolar ................................................................ ............ 7

§7. İstatistiksel grafikler ................................................................ ............ sekiz

§bir. Gerçek ve teorik dağılım ................................ 21

§2. Normal dağılım eğrisi ..................................................... 21

§3. Normal dağılım hipotezinin test edilmesi ................................. 21

§4. Uyum iyiliği ölçütleri: Pearson, Romanovsky, Kolmogorov ........... 21

§5. Modelleme dağıtım serisinin pratik değeri ... 22

§bir. Seçici gözlem kavramı. Kullanım nedenleri ... 23

§3. Seçici gözlem hataları .................................................. 24

§4. Seçici gözlemin görevleri .................................................. 25

§5. Örnek gözlem verilerinin genel popülasyona dağılımı ... 26

§6. Küçük örnek ................................................................ ................ 26

§bir. Korelasyon kavramı ve CRA ................................................. 27

§2. KRA'nın başvuru koşulları ve sınırlamaları ..................... 27

§3. İkili en küçük kareler regresyonu 28

§4. Eşleştirilmiş doğrusal regresyon denklemi uygulama .......... 29

§6. Çoklu korelasyon ................................................. 32


Konu 1.: İstatistiklere Giriş.

  1. istatistik, istatistiksel düzenlilik ve bütünlük kavramları.
  2. istatistiksel bir toplamın birimlerinin işaretleri, sınıflandırılması.
  3. istatistiğin konusu ve yöntemi.

§1. İstatistik kavramları, istatistiksel düzenlilik ve bütünlük.

İstatistik kelimesi Latince “ durum”Çeviride - bir devlet, bir durum.

İstatistik terimi 18. yüzyılın ikinci yarısında ortaya çıkmıştır. Devletlerin bilgisi ile bağlantılı olarak, özelliklerinin incelenmesi. Üniversitede istatistik öğretiminin başlangıcı da aynı yıllara dayanmaktadır. İstatistiksel araştırma dalına bağlı olarak, ayırt ederler: nüfus istatistikleri, sanayi, tarım vb. - uygulanmış istatistikler.

Genel istatistik teorisi - sayısal verileri toplamak, işlemek, sunmak ve analiz etmek için bir dizi yöntem ve teknik. İstatistik terimi günümüzde 3 anlamda kullanılmaktadır:

  1. "veri" ile eşanlamlı olarak
  2. kitle fenomenlerini karakterize eden sayısal verilerle çalışma ilke ve yöntemlerini birleştiren anlamlar dalı (erkekler için yaşam beklentisi kadınlardan daha düşüktür)
  3. sayısal verileri işlemeyi ve analiz etmeyi amaçlayan uygulama dalı.

İstatistikler, sosyo-ekonomik süreçlerin ve fenomenlerin gelişim modelini ve ayrıca belirli yer ve zaman koşullarında aralarındaki ilişkiyi tanımlamanıza ve ölçmenize olanak tanır.

Düzenlilik, fenomenlerdeki değişikliklerin tekrarlanabilirliği, sırası ve sırası olarak anlaşılır.

İstatistiksel düzenlilik - zorunluluğun her bir bireysel fenomende ayrılmaz bir şekilde şansla bağlantılı olduğu ve sadece çeşitli fenomenlerde kendini bir yasa olarak gösteren bir düzenlilik. İstatistiksel düzenlilik kavramına, her olguda kendini gösteren dinamik düzenlilik kavramı karşı çıkar. (örnek: S çemberi = pr 2'den> r so> S çemberi). İstatistiksel araştırmanın amacı, istatistiksel bir popülasyondur - bütünlük ve varyasyon varlığı ile belirlenen kütle karakteri, homojenliği olan bir dizi birim. Her bir öğeye istatistiksel popülasyon birimi (ESS) denir.

§2. İstatistiksel bir popülasyonun birimlerinin işaretleri, sınıflandırılması.

ECC, özellikler adı verilen belirli özelliklere sahiptir. İstatistik, fenomenleri işaretleri aracılığıyla inceler, küme ne kadar homojen olursa, birimlerinin işaretleri o kadar ortak olur ve bu işaretlerin değerleri o kadar az değişir.

Tanımlayıcı bir özellik, yalnızca sözlü olarak ifade edilebilen bir özelliktir.

  1. Nicel bir özellik, sayısal olarak ifade edilebilen bir özelliktir.
  2. Doğrudan işaret - bir özellik, doğrudan karakteristik bir nesnede bulunur.
  3. Dolaylı bir işaret, karakterize edilen nesnenin kendisinin özellikleri değil, onunla ilişkili veya onun içinde yer alan nesnenin özellikleridir.
  4. birincil nitelik, ölçülebilen mutlak bir değerdir.
  5. ikincil karakteristik, birincil özelliklerin karşılaştırılmasının sonucudur, doğrudan ölçülür.
  6. doğal nitelik - adet, kg, ton, litre vb.
  7. emek niteliği - adam-gün, adam-saat olarak ölçülür.
  8. değer özelliği - ruble, $, €, ₤ cinsinden ölçülür.
  9. boyutsuz özellik - kesirlerde ölçüm,%
  10. alternatif bir özellik, olası birkaç değerden yalnızca birini alan bir özelliktir.
  11. ayrık özellik - ara değer olmadan yalnızca bir tamsayı değeri alır.
  12. sürekli karakteristik - belirli bir aralıkta herhangi bir değer alan bir özellik.
  13. faktör işareti - etkisi altında başka bir işaretin değiştiği bir işaret.
  14. sonuç işareti - başka birinin işareti altında değişen bir işaret
  15. anlık özellik - zamanın belirli bir noktasında ölçülen bir özellik.
  16. aralık özelliği - belirli bir zaman aralığı için bir özellik.

Bir ve aynı özellik, farklı sınıflandırmalara göre aynı anda sınıflandırılabilir.

§3. İstatistik konusu ve yöntemi.

İstatistiksel araştırmanın konusu, istatistiksel toplamlardır - bir dizi tek kaliteli değişken konu.

İstatistik konusunun özgüllüğü, yöntemin özgüllüğünü belirler, şunları içerir:

  1. veri toplama (istatistiksel gözlem, yayın)
  2. veri özetleme (özet, gruplama)
  3. veri sunumu (tablolar ve grafikler)
  4. sayısal verilerin analizi ve yorumlanması (ortalamaların hesaplanması, varyans analizi, CRA, zaman serileri, endeksler)

konu 2: İstatistiksel gözlemin organizasyonu.

Veri özeti ve gruplama.

§bir. İstatistiksel gözlem kavramı, hazırlanması.

§2. İstatistiksel gözlem türleri.

§3 Gözlem hataları.

§4 Özet ve gruplama

§5 İstatistiksel gruplama türleri.

§6 İstatistik tabloları.

§7 İstatistiksel grafikler.

§bir. İstatistiksel gözlem kavramı, hazırlanması.

Herhangi bir istatistiksel araştırma, veri toplama ile başlar.

Bilgi kaynakları:

  1. çeşitli yayınlar (gazete, dergi vb.)
  2. yayınlanan istatistiksel bilgilerin ana kaynağı, devlet istatistik organlarının yayınlarıdır ("RF 2001" yayınevi GOSKOMSTAT).
  3. istatistiksel gözlem, yani Bilimsel olarak organize edilmiş veri toplama.

İstatistiksel gözlem, incelenen popülasyonun her bir biriminin özelliklerini kaydetmekten oluşan, sosyal ve ekonomik yaşam olgusunun büyük, planlı, bilimsel olarak organize edilmiş bir gözlemidir.

Gözlem süreci:

  1. Gözlem için hazırlanıyor
  2. Toplu veri toplamanın yapılması
  3. Verilerin işlenmek üzere hazırlanması
  4. İstatistiksel gözlemi geliştirmek için önerilerin geliştirilmesi.

Gözlem hazırlığı:

  1. Gözlem amacının ve nesnesinin belirlenmesi
  2. Tescile tabi özelliklerin kompozisyonunun belirlenmesi
  3. Veri toplama için belgelerin geliştirilmesi
  4. Raporlama biriminin ve gözlemin gerçekleştirileceği birimin seçimi.
  5. Veri elde etmenin yöntemlerini ve araçlarını tanımlamak gerekir.

Organizasyonel sorunları çözmek için gereklidir:

  1. araştırmayı yürüten hizmetlerin bileşimini belirlemek gerekir
  2. personele talimat vermek
  3. bir çalışma programı hazırlamak
  4. veri toplama için belgeleri çoğaltın

Gözlemin amacı sosyo-ekonomik olgular ve süreçlerdir.

Kayıt için işaretler açıkça tanımlanmalıdır.

Gözlem programı - gözlem sürecinde kaydedilecek işaretlerin bir listesi.

İzleme programı gereksinimleri:

  1. Program, incelenen fenomeni doğrudan karakterize eden temel özellikleri içermeli, programda, değerleri kasıtlı olarak güvenilmez olacak veya tamamen yok olacak ikincil fenomen veya özelliklere sahip özellikler içermemelidir.
  2. Gözlem soruları kesin ve net olmalı ve cevapları elde etmede zorluk yaşamamak için anlaşılması kolay olmalıdır.
  3. Soruların sırası belirlenmelidir.
  4. İzleme programı, toplanan verileri yönlendirmek ve netleştirmek için doğrudan soruları içermelidir.
  5. Alınan bilgilerin tekdüzeliğini sağlamak için program, istatistiksel form adı verilen bir belge şeklinde hazırlanır.

İstatistiksel form, programı ve gözlem sonuçlarını içeren tek bir örnek belgedir.

Bireysel bir form (bir gözlem birimindeki soruların cevapları) ve yazılı (istatistiksel popülasyonun birkaç birimi hakkında bilgi) arasında ayrım yapın.

Form ve doldurma talimatları, istatistiksel gözlem için bir araçtır.

Gözlem süresinin seçimi 2 sorunun çözülmesinden oluşur: kritik bir tarih veya aralığın belirlenmesi, gözlem süresinin belirlenmesi.

Kritik tarih, çalışılan popülasyonun her bir biriminin özelliklerinin kaydedilmesi gereken günün saati olan, yılın belirli bir günüdür.

Gözlem süresi - istatistiksel formların doldurulduğu süre, yani. verileri toplamak için geçen süre.

Gözlem süresinin kritik tarih veya aralıktan uzaklaştırılmasının alınan bilgilerin güvenilirliğinde azalmaya yol açabileceği unutulmamalıdır.

§2. İstatistiksel gözlem türleri.

Yurt içi istatistiklerde, üç tür istatistiksel gözlem kullanılır.

  1. işletmelerin, kuruluşların, kurumların istatistiksel raporlaması.
  2. özel olarak organize edilmiş istatistiksel gözlem (nüfus sayımı, vb.)
  3. kayıt - uzun vadeli süreçlerin sürekli istatistiksel gözleminin bir biçimi

İstatistiksel gözlem sınıflandırılır:

Gözlem süresine göre:

  • sürekli gözlem - işaretlerin (sicil dairesi, suç vb.) sürekli kaydı yapılır.
  • periyodik gözlem - düzenli aralıklarla gerçekleştirilir (Çelyabinsk şehrinde yaşam standardı, tüketici sepetinin maliyeti, nüfus sayımı).
  • Tek seferlik - belirli bir amaç için bir kez yapılan gözlem.

Nüfus birimlerinin kapsamına göre:

  • Sürekli gözetim - tüm ECC'ler hakkında bilgi alınmalıdır
  • Sürekli gözlem değil:
    • Ana dizinin yöntemi - incelenen popülasyonun en önemli birimleri incelenir (Çelyabinsk bölgesinin makine yapımı işletmesini incelemek için).
    • Seçici gözlem - gözlemlenecek rastgele bir ESS seçimi.
    • Monografik gözlem - tek bir ESA gözlemlendiğinde, genellikle bir toplu gözlem programı tasarlamak için kullanılır.

Veri toplama yöntemine göre:

  • Doğrudan gözlem - kayıt memurlarının kendileri, doğrudan ölçüm, tartma yoluyla, kayda tabi olma gerçeğini belirler (bir poliklinikte 1 yaşın altındaki bir çocuk).
  • Belgesel gözlem - çeşitli belgeler kullanılır (bir beyan hazırlamak)

Anket - gerekli bilgi, yanıtlayanın sözlerinden elde edilir.

  • Sefer anketi - ilgili kişilerle görüşülerek gerekli bilgileri alan ve yanıtları forma kaydeden özel eğitimli işçiler tarafından gerçekleştirilir. Sefer araştırması doğrudan (yüz yüze) ve dolaylı (telefon araştırması) olabilir.
  • Muhabir anketi - bilgi gönüllü muhabirlerin personeli tarafından sağlanır, bu yöntem çok az finansal maliyet gerektirir, ancak gözlem için doğru bir değer vermez.
  • Kendi kendine kayıt - formlar yanıtlayanların kendileri tarafından doldurulur ve kayıt memurları onlara yalnızca anket formlarını verir ve nasıl doldurulacağını açıklar.

§3. Gözlem hataları

İstatistiksel gözlem için uygulanan temel gereksinim doğruluktur.

Doğruluk - bir özelliğin herhangi bir göstergesinin istatistiksel gözlem materyallerinden belirlenen gerçek değere uygunluk derecesi.

Hesaplanan ve gerçek değer arasındaki tutarsızlığa, meydana gelme nedenlerine bağlı olarak gözlem hatası denir, bunlar ayırt edilir: kayıt hataları ve temsil hataları. Kayıt hataları rastgele ve sistematik olarak ikiye ayrılır.

Rastgele hatalar, rastgele faktörlerin eylemlerinin sonucudur (satırlar, sütunlar karıştırılır)

Sistematik hatalar - her zaman göstergeyi ya abartma ya da küçümseme eğilimindedir. (yaş)

Temsili hatalar, sürekli olmayan gözlem için bir karakterdir ve seçmeli bir başlangıç ​​popülasyonunun tamamının hatalı çoğaltılmasının bir sonucu olarak ortaya çıkar.

İstatistik formlarını aldıktan sonra şunları yapmalısınız:

  1. toplanan verilerin eksiksizliğini kontrol edin.
  2. çeşitli işaretlerin birbirleriyle olan ilişkisine dayalı aritmetik kontrol yapmak.
  3. özellikler arasındaki mantıksal bağlantıların bilgisine dayalı mantıksal kontrol yapmak.

§4. Özet ve gruplama

Toplanan verilere dayanarak, bir hesaplama yapmak ve sonuç çıkarmak imkansızdır, önce tek bir tabloda özetlenmeleri ve özetlenmeleri gerekir. Özet ve gruplama bu amaçlara hizmet eder.

Özet - bir dizi oluşturan ve bir bütün olarak incelenen fenomenin doğasında bulunan tipik özellikleri ve kalıpları tanımlayan belirli bireysel gerçekleri genelleştirmek için bir dizi ardışık işlem.

Sade votka - toplam için toplamların hesaplanması.

Karmaşık özet - tek gözlemleri gruplamak, her grup ve bir bütün olarak tüm nesne için toplamları hesaplamak ve sonuçları istatistiksel tablolar şeklinde sunmak için bir dizi işlem.

Malzeme işleme biçimine göre, özet merkezi olmayan, merkezileştirilmiş olabilir - böyle bir özet, bir kerelik istatistiksel gözlem ile gerçekleştirilir.

Gruplama - incelenen popülasyonun birimlerinin belirli özelliklere göre gruplara bölünmesi.

§5. İstatistiksel gruplama türleri

Gruplamalar yapı ve içeriğe göre sınıflandırılabilir.

Analitik gruplama, biri faktöriyel, diğeri etkili olan özellikler arasındaki ilişkiyi karakterize eder.

Eğitim

bitmemiş yüksek

§6. istatistiksel tablolar

Özet ve gruplandırma sonuçları kullanılabilecek şekilde sunulmalıdır.

Verileri sunmanın 3 yolu vardır:

  1. veriler metne dahil edilebilir.
  2. tablolarda sunum.
  3. grafiksel yol

İstatistiksel tablo, sosyo-ekonomik olaylarla ilgili istatistiksel bilgilerin belirli bir sırayla sunulduğu bir satır ve sütun sistemidir.

Konu ve tablonun yüklemi arasında ayrım yapın.

Konu, sayılarla karakterize edilen bir nesnedir, genellikle konu tablonun sol tarafında verilir.

Öngörülebilir - nesnenin karakterize edildiği bir göstergeler sistemi.

İstatistik tablosu 3 tür başlık içerir: genel, yan

Genel başlık, ortadaki tablonun üzerinde yer alan tüm tablonun içeriğini yansıtmalıdır.

Tabloları derleme kuralı.

  1. her üç başlık türü de kısaltma yapılmadan zorunludur; başlığa ortak ölçü birimleri dahil edilebilir.
  2. tabloda fazladan satır olmamalıdır, dikey işaretleme olmayabilir.
  3. Son satır gereklidir. Belgenin başında veya sonunda olabilir. Belgenin başında ise, sonunda ise TOPLAM:
  1. bir sütundaki dijital veriler bir derece doğrulukla kaydedilir. Rakamlar kesinlikle rakamların altına yazılır, tüm kısım virgülle ayrılır.
  2. tabloda boş hücreler olmamalı, veri yoksa "Bilgi yok" veya "..." yazarlar, veriler sıfıra eşitse "-" yazarlar. Değer sıfır değilse ancak ilk anlamlı basamak belirtilen hassasiyet 0.01®0.0'dan sonra görünürse - kabul edilen kesinlik onda birine kadar ise.
  3. tabloda çok sayıda sütun varsa, konu sütunları büyük harflerle ve yüklem sütunları sayılarla gösterilir.
  4. tablo ödünç alınan verilere dayanıyorsa, veri kaynağı tablonun altında belirtilir, gerekirse tabloya notlar eklenebilir.

§7. istatistiksel grafikler

İstatistiksel tablolar grafiklerle desteklenebilir.

İstatistiksel grafikler - sayısal değerlerin koşullu görüntüleri ve çizgiler, geometrik şekiller, çizimler yoluyla oranları.

Grafik görüntünün artıları

  1. açık, görünür, anlamlı.
  2. göstergenin değişim sınırları, karşılaştırmalı değişim oranı ve değişkenlik hemen görülebilir

Grafik görüntünün eksileri

  1. Tablodan daha az veri içerir.
  2. grafik yuvarlatılmış verileri, genel durumu gösterir, ancak ayrıntıları göstermez.

istatistiksel grafikler

diyagramlar

Kıvırcık

Konu 3: İstatistiksel göstergeler.

§bir. İstatistiksel bir göstergenin özü ve değeri, özellikleri.

§2. İstatistiksel göstergelerin sınıflandırılması.

§3. Göreceli gösterge türleri. İnşaat ilkeleri.

§4. İstatistiksel gösterge sistemleri.

İstatistiksel bir özellik, ESS'nin doğasında bulunan bir özelliktir, onu bir bilim olarak çalışıp çalışmadığından nesnel olarak var olur.

İstatistiksel gösterge, nüfusun herhangi bir özelliğinin genelleştirici bir özelliğidir.

İstatistiksel bir göstergenin yapısı (nitelikleri):

  • Ortalama değerler
  • Varyasyon göstergeleri
  • İşaretlerin bağlantısının göstergeleri
  • Dağıtımın yapısı ve doğasının göstergeleri
  • dinamik göstergeler
  • Titreşim göstergeleri
  • Numune tahminlerinin doğruluğu ve güvenilirliğinin göstergeleri
  • Tahminlerin doğruluğu ve güvenilirliğinin göstergeleri

görerek: toplam birim sayısı veya nesnenin toplam özelliği. Bu, parçalar, kg, m, $ vb. olarak ölçülen birincil özelliklerin toplamıdır.

bağıl gösterge- uzaydaki, zamandaki mutlak veya göreceli göstergeleri karşılaştırarak veya incelenen nesnenin farklı özelliklerinin göstergelerini karşılaştırarak elde edilir.

1. sıra bağıl puan, 2 x mutlak puanın karşılaştırılmasıyla elde edilir. 2. sıra göreli puan, 1. sıra göreli puanlar vs. karşılaştırılarak elde edilir.

3. mertebe ve daha yüksek nispi üsler çok nadirdir.

Doğrudan göstergeler - değeri araştırılan fenomende bir artışla artan bu tür göstergeler.

Ters göstergeler - araştırılan fenomende bir artışla değeri azalan göstergeler.

... yapılar

... hoparlörler

... ilişkiler

... yoğunluk

... standarda karşı tutum

... karşılaştırmalar

Yapı göstergeleri parçanın bütünle ilişkisinden elde edilir.

Dinamiklerin göreceli göstergeleri

ü Dinamik göstergeler (büyüme oranları, büyüme)

ü Endeksler

ilişki göstergeleri işaretler arasındaki ilişkiyi karakterize edin:

ü Korelasyon katsayısı

ü Analitik indeksler

Yoğunluk göstergeleri iki nesnenin ilişkisini farklı gerekçelerle karakterize eder.

ü Emek yoğunluğu - ürünün bir biriminin üretimi için kullanılan süre

ü Üretim - birim zamanda üretilen ürün miktarı

ÜRETİM = 1 / emek yoğunluğu

Standarda karşı tutum göstergeleri- göstergenin gerçek değerlerinin standart, planlı, optimale oranı.

Karşılaştırma göstergeleri - farklı nesnelerin aynı temelde karşılaştırılması.

İstatistiksel göstergeler oluşturmak için genel ilkeler:

  1. istatistiksel göstergeler nesnel olarak bağlantılıdır.
  2. karşılaştırılan göstergeler yalnızca bir nitelik açısından farklılık gösterebilir; göstergeyi iki veya daha fazla nitelik ile karşılaştırmak mümkün değildir.
  3. göstergenin sınırlarını bilmek ve dikkate almak gerekir.

Bir nesnenin her özelliği için bir istatistiksel göstergeler sistemi gereklidir.

  1. bilişsel işlev - veri analizine dayalı
  2. propaganda
  3. uyarıcı fonksiyon

Konu 4: Ortalamalar

§bir. ortalama kavram

§2. ortalama türleri

§3. aritmetik ortalama ve özellikleri

§4. harmonik ortalama, geometrik, ikinci dereceden.

§5. çok değişkenli ortalama

İstatistiklerin en yaygın biçimi ortalamadır.

Ortalamanın en önemli özelliği, incelenen kümenin her biriminde var olan geneli yansıtmasıdır, ancak kümenin bireysel birimlerinin özniteliğinin değeri bir yönde dalgalanabilir.

Ortalamanın tipikliği, incelenen popülasyonun homojenliği ile doğrudan ilişkilidir. Homojen olmayan bir popülasyon durumunda, onu niteliksel olarak homojen gruplara ayırmak ve homojen grupların her biri için her biri için ortalamayı hesaplamak gerekir.

Ortalamayı, mantıksal formülü olan ortalamanın (ISC) ilk oranı aracılığıyla belirleyebilirsiniz.

yapısal ortalamalar

Moda - Moe

Medyan - Ben

Dinamik dizisinde aritmetik ortalama, kronolojik ortalama hesaplanır.

Aritmetik ortalama bir özelliğin toplam miktarının değişmediği hesaplanırken bir özelliğin böyle bir ortalama değeri çağrılır.

Örnek: ağırlık.

evlenmek aritmetik asal

x Bence- özelliğin bireysel değeri

n, çalışılan popülasyonun toplam sayısıdır

evlenmek aritmetik ağırlıklı

Özellikler bkz. aritmetik.

Bir özelliğin bireysel değerlerinin ortalama değerinden sapmalarının toplamı sıfıra eşittir.

niteliğin her bir değeri aynı sabit sayı ile çarpılır veya bölünürse, ortalama aynı miktarda artacak veya azalacaktır.

bir özelliğin her bir değerine bir ve aynı sabit sayı eklenirse, ortalama değer buna göre aynı sayıya göre değişecektir.

Kanıt

ağırlıklı ortalamanın f ağırlıkları aynı sayı ile çarpılır veya bölünürse ortalama değişmez.

özniteliğin sapmalarının karelerinin toplamı, diğer herhangi bir sayıdan daha azdır.

Diğer ortam türleri

Orta görünüm

basit ortalama

Ağırlıklı ortalama

harmonik

geometrik

ikinci dereceden

Gruplamayı tek bir nitelikle karakterize etmek çok zordur ve bellekte çok az bilgi kalır.

Çok boyutlu ortalama - E.S.'nin çeşitli özellikleri için ortalama değer.

E.S. için karakteristik değerlerinin ilişkisinden. bu işaretlerin ortalama değerlerine.

için çok değişkenli ortalama i birimleri

x ij- i birimi için j özelliğinin değeri

j özelliğinin ortalama değeri

k - özellik sayısı

j - özelliğin sayısı ve popülasyonunun sayısı

Konu 5: Varyans analizi

§bir. İşaretlerin çeşitliliği ve nedenleri

§2. dağıtım serisi

§3. Varyasyon serilerinin yapısal özellikleri.

§4. Varyasyonun gücünün göstergeleri.

§5. Varyasyon yoğunluğu göstergeleri

§6. dispersiyon türleri. Varyans toplama kuralı.

Bir kümedeki bir özelliğin değerindeki bir değişiklik, belirli bir kümenin aynı zaman diliminde veya anda farklı birimleri için değerlerindeki farktır.

Varyasyonun nedeni: ESS'nin varlığının farklı koşulları, istatistik gibi bir bilime duyulan ihtiyacı doğuran varyasyondur.

Varyans analizi, bir varyasyon serisinin oluşturulmasıyla başlar - popülasyon birimlerinin artan veya azalan işaretlere göre sıralı bir dağılımı ve karşılık gelen frekansların hesaplanması.

dağıtım serisi

ü dereceli

ü ayrık

ü aralık

Dereceli varyasyon serisi- bireysel öğelerin listesi. azalan sıralı özelliği artan düzende popülasyon

Ayrık varyasyon serisi - 2 satırdan oluşan bir tablo - değişen özelliğin polimerik değerleri ve verilen nitelik değerine sahip birimlerin sayısı.

Aşağıdaki durumlarda bir aralık varyasyon serisi oluşturulur:

  1. öznitelik ayrık değerler alır, ancak sayıları çok büyük
  2. nitelik, belirli bir aralıktaki herhangi bir değeri alır

Bir aralık varyasyon serisi oluştururken, Sturgess formülüne göre en yaygın yöntem olan optimal grup sayısını seçmek gerekir.

k - aralık sayısı

n - nüfus büyüklüğü

Hesaplamalarda, kesirli değerler neredeyse her zaman bir tam sayıya yuvarlanarak elde edilir.

Aralık uzunluğu - ben

Aralık türleri

sonraki aralığın alt sınırı, sonraki aralığın üst sınırını tekrarlar

açık aralık, tek kenarlıklı aralık

Aralık varyasyon serisi hesaplanırken aralığın ortası x i olarak alınır.

N ME = 60 medyan = 1

Kümülat - dağıtım daha az

Ogiva - dağıtım şundan büyük

Medyan - tüm popülasyonu iki eşit parçaya bölen bir özelliğin değeri.

Kesikli bir varyasyon serisi için medyan hesaplanır: n çift ise, o zaman Medyan birim No.

Aralık varyasyon serisi:

k - aralık sayısı

x 0 - ortanca aralığın alt sınırı

ben- medyan aralığın uzunluğu

frekansların toplamı

Medyandan önceki aralığın birikmiş frekansı.

Medyan aralık frekansı

medyan aralık- birikmiş frekansı, toplam frekans toplamının yarısından fazlası olan ilk aralık.

Grafiksel olarak, medyan kümülatiftir.

  1. Çeyrekler - popülasyonu 4 eşit parçaya bölen bir özelliğin değeri.

1. çeyrek

3. çeyrek

2. çeyrek - medyan.

x S 1 x Q 3 - 1. ve 3. çeyrekleri içeren aralığın alt sınırı.

l - aralık uzunluğu

ve - 1 ve 3 çeyreği içeren önceki aralıkların aralıklarının kümülatif sıklıkları.

Çeyrek aralık frekansları.

Varyasyon serilerini karakterize etmek için aşağıdakiler kullanılır:

Ondalık - agregayı 10 eşit parçaya bölün, Percytili - agregayı 100 eşit parçaya bölün.

  1. Moda, bir özelliğin ortak bir özelliğidir. Ayrık bir varyasyon serisi için - en yüksek frekans. Bir aralık varyasyon serisi için mod, aşağıdaki formül kullanılarak hesaplanır:

Modal aralığın alt sınırı

ben- mod aralığının uzunluğu

f Ay - mod aralığı frekansı

f Mo +1 - modu takip eden aralığın frekansı

Modal aralık, frekansı en yüksek olan aralıktır. Grafiksel olarak, mod histogramda bulunur.

  1. Kaydırma varyasyonu
  2. Ortalama doğrusal sapma

Ağırlıklı

  1. Dağılım:

Ağırlıklı

  1. Kök ortalama kare sapma

Dispersiyon özelliği.

  1. bir özelliğin tüm değerlerinde aynı değerde bir azalma olması, varyansın değerini değiştirmez.
  2. Özelliklerin tüm değerlerinde k kat azalma, varyansın değerini şu kadar azaltır: 2'ye kez ve RMS'de İle bir Zamanlar
  3. Aritmetik ortalamadan farklı herhangi bir A değerinden sapmaların ortalama karesini hesaplarsanız, bu daima aritmetik ortalamadan hesaplanan sapmaların ortalama karesinden daha büyük olacaktır. Bu nedenle, ortalama her zaman diğer herhangi bir değerden hesaplanandan daha azdır, yani. minimal olma özelliğine sahiptir. Normale yakın dağılımlar için RMSD = 1.25.

Normal dağılım koşulları altında, gözlemlerin %68,3'ü içindeki gözlem sayısı ile arasında aşağıdaki ilişki vardır.

Gözlemlerin %95,4'ü içinde

Gözlemlerin %99,7'si sınırlar içinde

Farklı popülasyonlardaki özelliklerin varyasyonunu karşılaştırmak veya bir dizideki farklı özelliklerin varyasyonunu karşılaştırmak için göreceli göstergeler kullanılır, aritmetik ortalama temel olarak hizmet eder.

  1. Göreceli varyasyon aralığı.
  2. bağıl doğrusal sapma
  3. varyasyon katsayısı

bu göstergeler sadece karşılaştırmalı bir değerlendirme sağlamakla kalmaz, aynı zamanda nüfusun homojenliğini de oluşturur. Varyasyon katsayısı %33'ü geçmezse popülasyon homojen kabul edilir.

Bir özelliğin varyasyonunun bir bütün olarak popülasyonun tamamı için incelenmesiyle birlikte, bir özellikteki niceliksel değişiklikleri, ancak popülasyonun bölündüğü gruplar halinde ve bunlar arasında izlemek genellikle gereklidir. Bu, farklı türler hesaplanarak elde edilir.

Dispersiyon türleri:

  1. toplam varyans
  2. gruplar arası varyans
  3. Grup içi varyans (artık)

1. Bu varyasyona neden olan tüm faktörlerin etkisi altında tüm setteki bir özelliğin varyasyonunu ölçer

Örnek: yoğurt tüketimi: 100 kişilik bir örneklemde

Sosyal durum

x ben - özelliğin bireysel değeri

Tüm popülasyon üzerinden özelliğin ortalama değeri

Bu semptomun sıklığı.

  1. 2. gruplandırmanın altında yatan faktörün özelliğinin etkisi altında özelliğin varyasyonunu karakterize eder.

Grup ortalaması

Grup ortalaması

Gruba göre sıklık

  1. 3. gruplamaya dahil olmayan faktörlerin etkisi altında bir özelliğin varyasyonunu karakterize eder

x iji, j grubundaki özelliğin değeridir.

Karakteristiğin ortalama değeri J grup

f ij - frekansi-th özelliğij grubu

3 çeşit varyansı birbirine bağlayan bir kural vardır, buna varyans toplama kuralı denir.

artık varyans J grup

üzerindeki frekansların toplamı J grup

n- toplam frekans miktarı

varyasyon serilerinin analizinin ana görevi, frekans dağılımının modellerini belirlemektir.

Dağılım eğrisi, bir özelliğin değerinde işlevsel olarak ilişkili bir değişiklikte bir varyasyon serisindeki sürekli bir frekans değişiklikleri çizgisi biçimindeki grafiksel bir temsildir.

Bir poligon ve bir histogram kullanılarak bir dağılım eğrisi çizilebilir. Ampirik dağılımın teorik olana, iyi çalışılmış türlerden birine indirilmesi tavsiye edilir.

Normal dağılım eğrisi.

Aşağıdaki dağıtım eğrisi türleri vardır:

  1. tek modlu
  2. birçok köşe

Homojen agregalar, tek modlu eğrilerle karakterize edilir, çok köşeli bir eğri, agreganın homojen olmadığını ve yeniden gruplandırma ihtiyacını gösterir.

Dağılımın genel doğasının netleştirilmesi, homojenliğinin değerlendirilmesini ve çarpıklık ve basıklığın hesaplanmasını içerir. Simetrik dağılımlar için

Farklı dağılımların asimetrisinin karşılaştırmalı bir çalışması için asimetri katsayısı As hesaplanır.

Üçüncü mertebenin merkezi momenti; - Küpte RMS;

Eğer, o zaman asimetri önemlidir

Eğer<0, то As – левосторонняя, если As>0, sonra As sağlaktır.

Eğer, o zaman As ihmal edilebilir. Simetrik ve orta derecede asimetrik için basıklık indeksi hesaplanır: E k> 0 ise, dağılım zirveye ulaşır, E k ise<0, то распределение плосковершинное.

Alternatif özelliğin varyasyonu, nicel olarak aşağıdaki gibi kendini gösterir.

0 - bu özelliğe sahip olmayan birimler;

1 - bu özelliğe sahip birimler;

r- bu özelliğe sahip birimlerin oranı;

Q- bu özelliğe sahip olmayan birimlerin oranı;

sonra p +q=1.

Alternatif bir özellik, ağırlıklarla 0 ve 1 olmak üzere 2 değer alır. P ve Q.

Doğrudan işaretler- bunlar, araştırılan fenomende bir artışla büyüklüğü artan işaretlerdir.

Ters işaretler - araştırılan fenomendeki bir artışla büyüklüğü azalan işaretler.

Üretim (doğrudan)

Emek yoğunluğu (ters)

Maksimum pay varyansı 0.25'tir.

Konu 6: Dağıtım serilerinin modellenmesi.

§bir. Gerçek ve teorik dağılım

§2. Normal dağılım eğrisi.

§3. Normal dağılım hipotezinin test edilmesi.

§4. Uyum iyiliği kriterleri: Pearson, Romanovsky, Kolmogorov.

§5. Dağılım serilerini modellemenin pratik değeri.

§bir. Gerçek ve teorik dağılım

Dağılım serilerini incelemenin en önemli amaçlarından biri, dağılım modelini belirlemek ve doğasını belirlemektir. Dağılım kalıpları en açık şekilde yalnızca çok sayıda gözlemle kendini gösterir.

Gerçek dağılım, dağılım eğrisi kullanılarak grafik olarak görüntülenebilir - bu, değişiklikle işlevsel olarak ilişkili varyantın varyasyon serisindeki sürekli bir frekans değişiklikleri çizgisi olarak grafik olarak gösterilir.

Teorik bir dağılım eğrisi, düzenlilik için rastgele olan faktörlerin etkisini hariç tutan, genel biçimde belirli bir dağılım türünün bir eğrisi olarak anlaşılır.

Teorik dağılım, analitik formül adı verilen analitik bir formülle ifade edilebilir. En yaygın olanı normal yayılmadır.

§2. Normal dağılım eğrisi.

Normal dağılım yasası:

y - normal dağılımın koordinatı

t - standart sapma.

; e = 2.7218; x ben - varyasyon aralığı seçenekleri; - ortalama;

Özellikler:

Normal dağılım işlevi eşittir, yani. f(t) = f(-t),. Normal dağılım fonksiyonu tamamen standart sapma ile belirlenir.

§3. Normal dağılım hipotezinin test edilmesi.

Dağıtım yasasına sık sık atıfta bulunulmasının nedeni, hiçbiri baskın olmayan birçok rastgele nedenin eyleminden kaynaklanan bağımlılığın olmasıdır. Varyasyon serisinde Mo = Me hesaplanmışsa, bu normal dağılıma yakınlığı gösterebilir. Normal yasaya uygunluğun en doğru şekilde doğrulanması, özel kriterler kullanılarak gerçekleştirilir.

§4. Uyum iyiliği kriterleri: Pearson, Romanovsky, Kolmogorov.

Pearson kriteri.

teorik frekans

ampirik frekans

Teorik frekansları hesaplama yöntemi.

  1. Aritmetik ortalama belirlenir ve aralık varyasyon serisi için her aralık için t dikkate alınır.
  2. Normalleştirilmiş dağılım yasası için olasılık yoğunluğunun değerini bulun. SAYFA 49
  3. Teorik frekansı bulun.

l - aralık uzunluğu

- ampirik frekansların toplamı

- olasılık yoğunluğu

değeri tam sayılara yuvarla

  1. Pearson katsayısının hesaplanması
  2. tablo değeri

d.f. - aralık sayısı - 3

d.f. - serbestlik derecesi sayısı.

  1. eğer> ise, dağılım normal değildir, yani. normal dağılım hipotezi iptal edilir. Eğer< , то распределение является нормальным.

Romanovski kriteri.

Pearson'ın hesaplanan kriteri;

Derece sayısı.

eğer ile<3, то распределение близко к нормальному.

Kolmogorov kriteri

, D - birikmiş ampirik ve teorik frekanslar arasındaki maksimum değer. Kolmogorov'u kullanmak için bir ön koşul: Gözlem sayısı 100'den fazladır. Özel bir olasılık tablosuna göre bu dağılımın normal olduğu iddia edilebilir.

§5. Dağılım serilerini modellemenin pratik değeri.

  1. normal dağılım yasalarını ampirik dağılıma uygulama becerisi.
  2. 3 x sigma kuralını kullanma yeteneği.
  3. Nüfusu inceleyerek, dağılımın normal olduğunu bilerek ek zaman alıcı ve maliyetli hesaplamalardan kaçınma yeteneği.

Konu 7: Seçici gözlem.

§bir. Seçici gözlem kavramı. Kullanım nedenleri.

§2. Seçici gözlem türleri.

§3. Örnek gözlem hataları.

§4. Seçici Gözlem Görevleri

§5. Örnek gözlem verilerinin genel popülasyona dağılımı.

§6. Küçük örnek.

§bir. Seçici gözlem kavramı. Kullanım nedenleri.

seçici gözlem - istatistiksel araştırmanın, incelenen popülasyonun belirli bir şekilde seçilmiş birimlerini konu aldığı böyle sürekli olmayan bir gözlem.

Örnek gözlemin amacı (görevi): incelenen kısım için, istatistiksel gözlemin tüm kurallarına ve ilkelerine tabi olarak, tüm birim setini karakterize etmek.

Seçici gözlem kullanma nedenleri:

  1. malzeme, işçilik maliyetleri ve zamandan tasarruf;
  2. istatistiksel popülasyonun bireysel birimlerini ve gruplarını daha ayrıntılı ve ayrıntılı olarak inceleme fırsatı.
  3. bazı özel problemler sadece seçici gözlemin kullanılmasıyla çözülebilir.
  4. yetkin ve iyi organize edilmiş seçici gözlem, sonuçların yüksek doğrulukta olmasını sağlar.

Genel popülasyon - seçimin yapıldığı birimler topluluğu.

Örnek popülasyon - anket için seçilen bir dizi birim. İstatistikte, genel popülasyonun parametreleri ile örnek popülasyonun parametreleri arasında ayrım yapmak gelenekseldir.

Seçici gözlem türleri

Seçim yöntemine göre:

tekrarlanan

Gözlenen özellikleri kaydettikten sonra, numuneye giren birim, sonraki seçim prosedürüne katılması için genel popülasyona geri gönderilir.

Genel popülasyonun boyutu değişmeden kalır, bu da numuneye herhangi bir birimin sürekli olarak dahil edilmesini belirler.

tekrarlanamaz

Seçilen birim, seçimin gerçekleştiği popülasyona döndürülmez.

Seçim yöntemine göre:

aslında rastgele herhangi bir sistematik unsur olmaksızın rastgele veya rastgele genel popülasyondaki birimlerin oranından oluşur. Ancak, böyle bir örneklem yapmadan önce, genel popülasyonun tüm birimlerinin örnekleme dahil olma şansının eşit olduğundan emin olmanız gerekir, yani. istatistiksel popülasyonun birimlerinin tam listesinde, bireysel birimlerin ihmali veya ihmali yoktur. Aynı zamanda genel nüfusun sınırlarını da açıkça belirlemelidir. Teknik olarak belirlenmiş seçim, kura çekilerek veya rastgele sayılar tablosu kullanılarak gerçekleştirilir.

mekanik örnekleme (listeye göre her 5'i), genel popülasyonun bir şekilde sıralandığı durumlarda kullanılır, yani. birimlerin dağılımında belirli bir sıra vardır. Mekanik örnekleme yapılırken, genel popülasyonun ve örnek popülasyonun oranı ile kurulan seçim oranı belirlenir.

Mekanik örneklemede hata tehlikesi şunlardan dolayı ortaya çıkabilir: seçilen aralığın rastgele çakışması ve genel popülasyonun birimlerinin düzenlenmesindeki döngüsel kalıplar.

Bölgesel örnekleme genel nüfusun tüm birimleri bazı kriterlere göre gruplara (bölgeler, ülkeler) bölünebildiğinde kullanılır.

Birleşik örnek.

Birim seçimi yapılabilir:

  1. veya grubun büyüklüğü ile orantılı olarak
  2. ya özelliğin grup içi farklılaşmasıyla orantılı olarak
  3. , burada n örneklem büyüklüğüdür, N genel popülasyonun büyüklüğüdür, n Benceörnek boyut Bence-gruplar, N Bence Ses Benceörnekleme.
  4. - bu yöntem daha doğrudur, ancak örnek bir gözlem sırasında varyasyonu önceden belirlemek çok zordur. (gözlem tezahüründen önce).

Seri seçimi.

ECC, örneğin bitmiş ürünlerle paketleme, öğrenci grupları gibi küçük gruplar (seriler) halinde birleştirildiğinde kullanılır. Seri örneklemenin özü - seriler rastgele veya mekanik bir yöntemle seçilir ve ardından seçilen seriler içinde sürekli bir inceleme yapılır.

Kombine seçim.

Bu, yukarıda tartışılan seçim yöntemlerinin bir kombinasyonudur Daha sıklıkla tipik ve seri serilerin bir kombinasyonu kullanılır, yani. birkaç tipik gruptan dizi seçimi.

Yıkama seçimi ayrıca çok kademeli ve tek kademeli, çok cümleli ve tek kelimeli olabilir.

Çok aşamalı seçim: genel popülasyondan, ilk önce, genişleyen gruplar çıkarılır, daha sonra daha küçük olanlar, vb., incelenmekte olan birimler seçilene kadar bu böyle devam eder.

Çok yönlü örnekleme: uygulanmasının tüm aşamalarında aynı seçim biriminin korunmasını varsayar. Aynı zamanda, sonraki her aşamada seçilen seçim birimleri, programı genişleyen bir ankete tabi tutulur (Örnek: tüm enstitünün öğrencileri, ardından bazı fakültelerin öğrencileri).

§3. Örnek gözlem hataları.

Sistematik

Temsili hatalar yalnızca seçici gözlemle ortaya çıkar. Örnek popülasyonun genel popülasyonu doğru bir şekilde yeniden üretememesi nedeniyle ortaya çıkarlar. Kaçınılmazlar, ancak kolayca tahmin edilebilirler ve gerekirse en aza indirilebilirler.

Örnek gözlem hatası, bir parametrenin genel popülasyondaki değeri ile örnek gözlem sonuçlarından hesaplanan değeri arasındaki farktır. Dх = -m +, Dх - örneklemdeki marjinal hata, m - genel ortalama; - örnek ortalama.

Marjinal örnekleme hatası rasgele bir değerdir.Chebyshev'in çalışmaları rasgele örnekleme hatalarının kalıplarının incelenmesine adanmıştır. Chebyshev teoreminde, Dx'in aşağıdakileri aşmadığı kanıtlanmıştır: - ortalama örnekleme hatası T-güven katsayısı bu hatanın olasılığını gösterir. Sayfa 42-43.

Bilinen F(t)'den t'yi belirlemek gerektiğinde, F(t)'yi en yakın büyük olanı alıp t'yi belirlemek için kullanırız.

Marjinal hata uzunluğu

P - paylaş.

Seçim tekrarlanamaz bir şekilde yapıldıysa, sınırlama hataları için formüller eklenir.

Sonsuz tekrar için düzeltme.

Her bir örnek gözlem türü için sunulan hata farklı şekillerde hesaplanır:

  1. aslında tesadüfi ve mekanik gözlem;
  2. Bölgesel gözetim
  3. seri örnekleme

r örnekteki seri sayısıdır;

R, genel popülasyondaki seri sayısıdır;

Oranın gruplar arası varyansı.

§4. Seçici Gözlem Görevleri

Aşağıdaki görevler için kullanılır:

  1. n -? bilinen F(t), Dx'den numune boyutunu belirlemek için.
  2. bilinen F(t), n'den Dx örneğinin belirlenmesi
  3. bilinen Dx ve n'den F(t)'nin belirlenmesi

1 görev n -? İlk olarak, n, yeniden seçim için yeniden seçim formülü ile belirlenir:

Varyansı belirleme yöntemleri:

  1. daha önceki benzer çalışmalardan alınmıştır.
  2. Normal dağılımda standart sapma ”varyasyon aralığının 1/6'sı.
  3. dağılımın asimetrik olduğu biliniyorsa, standart sapma varyasyon aralığının "1/5'idir.
  4. Pay için maksimum olası varyans uygulanır p (1-p) = 0.25
  5. n³100 için s 2 = S 2 - örnek varyansı

30 £ n 100 TL sonra s 2 = S 2 (n/n-1), s 2 genel varyanstır

n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

n'yi hesaplarken, büyük bir t değeri ve küçük marjinal hataların peşinden koşmamak gerekir, çünkü bu, n'de bir artışa ve dolayısıyla maliyetlerde bir artışa yol açar. Aşağıdaki yasa benzerdir.

§5. Örnek gözlem verilerinin genel popülasyona dağılımı.

Herhangi bir VN'nin nihai amacı, genel popülasyonu karakterize etmektir.

VN sonuçlarından hesaplanan değerler, marjinal hatalarının sınırı dikkate alınarak genel popülasyon için geçerlidir.

Diyelim ki ayda bir kişi yoğurt tüketiyor.

250-20 milyon £ 250 + 20; 230 £ milyon £ 270

Ve sadece 1000 kişi

230.000 milyon £ 270.000 £

%48 -%5 £ p £ %48 + %5

§6. Küçük örnek.

Modern koşullarda istatistiksel araştırma pratiğinde, giderek daha sık küçük örneklerle uğraşmak gerekir.

Küçük örnek - Birim sayısı 30'u geçmeyen gözlem örneği, n £ 30 /

Küçük örnek teorisi, 1908'de öğrenci takma adıyla yazan İngiliz istatistikçi Gosset tarafından geliştirildi.

Küçük bir örneklemin ortalamaları ile genel bir örneklem arasındaki tutarsızlığın tahmininin özel bir dağıtım yasasına sahip olduğunu kanıtladı. Küçük bir örnek için hesaplanırken, s 2 değeri hesaplanmaz. t st olası hata limitleri için öğrenci kriterini kullanın. Sayfa 44-45. - ters olayın olasılığı.

Serbestlik derecesi sayısı

küçük örnek marj hatası

marjinal kesir hatası

Konu 8: Korelasyon-regresyon analizi ve modelleme.

§bir. Korelasyon kavramı ve CRA.

§2. KRA'nın kullanım koşulları ve sınırlamaları.

§3. İkili en küçük kareler regresyonu.

§4. Eşleştirilmiş doğrusal regresyon denkleminin uygulanması.

§5. Bağlantının sıkılığının ve bağlantının gücünün göstergeleri.

§6. Çoklu korelasyon.

§bir. Korelasyon kavramı ve CRA.

İşlevsel bağlantı y = 5x

Korelasyon bağlantısı

Farklı fenomenler ve karakteristik fonksiyonel ve istatistiksel olarak bal ile 2 tür bağlantı vardır.

Değişkenlerden birinin değerindeki bir değişiklikle, ikinci kesin olarak tanımlanmış bir şekilde değiştiğinde, yani bir değişkenin değeri, diğer değişkenin bir veya daha fazla kesin olarak belirlenmiş değerine karşılık geldiğinde, işlevsel bir bağlantı denir. İşlevsel bir bağlantı ancak y değişkeni x değişkenine bağlı olduğunda ve başka herhangi bir faktöre bağlı olmadığında mümkündür, ancak gerçek hayatta bu imkansızdır.

Değişkenlerden birinin değerindeki bir değişiklikle, ikincisi belirli sınırlar içinde herhangi bir değer alabildiğinde, ancak istatistiksel özellikleri belirli bir yasaya göre değiştiğinde istatistiksel bir ilişki vardır.

İstatistiksel bir bağlantının en önemli özel durumu bir korelasyon bağlantısıdır. Bir korelasyon ile, bir değişkenin farklı değerleri, başka bir değişkenin farklı ortalama değerlerine karşılık gelir, yani. x özniteliğinin değerindeki bir değişiklikle, y özniteliğinin ortalama değeri düzenli bir şekilde değişir.

Korelasyon kelimesi İngiliz biyolog ve istatistikçi Francis Gal tarafından tanıtıldı (korelasyon)

Korelasyon farklı şekillerde ortaya çıkabilir:

  • etkili özelliğin varyasyonunun faktör özelliğinin varyasyonuna nedensel bağımlılığı.
  • Bir nedenin 2 sonucu (yangınlar, itfaiyeci sayısı, yangının boyutu) arasında bir korelasyon ortaya çıkabilir.
  • Her biri aynı anda sebep ve sonuç olan göstergelerin ilişkisi (emek verimliliği ve maaş)

İstatistikte, aşağıdaki bağımlılık türlerini ayırt etmek gelenekseldir:

  1. çift ​​korelasyonu, etkin ve faktöriyel 2 gösterge arasındaki veya iki faktöriyel gösterge arasındaki bağlantıdır.
  2. kısmi korelasyon - etkili ve bir faktöriyel öznitelik arasındaki ilişki, diğer faktöriyel özniteliğin sabit bir değeri ile.
  3. çoklu korelasyon - etkili özelliğin çalışmaya dahil edilen iki veya daha fazla faktöriyel özelliğe bağımlılığı.

Korelasyon analizinin görevi, özellikler arasındaki ilişkinin sıkılığını ölçmektir. 19. yüzyılın sonlarında, Galton ve Pearson, babaların ve çocukların büyümesi arasındaki ilişkiyi araştırdı.

Regresyon, bir ilişkinin biçimini inceler. Regresyon analizinin görevi, ilişkinin analitik ifadesini belirlemektir.

Genel bir kavram olarak korelasyon-regresyon analizi, iletişimin sıkılığında bir değişiklik ve ilişkinin analitik bir ifadesinin kurulmasını içerir.

§2. KRA'nın kullanım koşulları ve sınırlamaları.

  1. kütle verilerinin varlığı, çünkü korelasyon istatistikseldir
  2. popülasyonun yüksek kalitede homojenliği gereklidir.
  3. Nüfusun dağılımının etkin ve faktöriyel özniteliğe göre sıralanması, en küçük kareler yönteminin kullanımı ile ilişkili olan normal dağılım yasası.

§3. İkili en küçük kareler regresyonu.

Regresyon analizi, bir ilişki için analitik bir ifadenin tanımıdır. Biçim açısından, düz bir çizginin denklemi ile ifade edilen lineer regresyon ile lineer regresyon veya arasında bir fark yoktur.

İletişim yönünde düz bir çizgide ayırt edilirler, yani. x işaretinin artmasıyla y işareti de artar.

tersi

Ters, yani x arttıkça y azalır.

  1. grafiksel yöntem, deneysel verilerin korelasyon alanı üzerine çizilmesidir, ancak en küçük kareler yöntemi kullanılarak daha doğru bir tahmin yapılır.

X - gerçek işaret

Y - etkili işaret

Gerçek değer ile iletişim karesi denklemi tarafından hesaplanan değer arasındaki fark minimuma yönelmelidir.

En küçük kareler min ile, seçilen regresyon denklemi ile elde edilen teorik olanlardan y'nin ampirik değerlerinin sapmalarının karelerinin toplamı.

Doğrusal bağımlılık için

Þ bir,B

parabol için

abartma için

a, b, c parametreleri denkleme yazılır, ardından ortaya çıkan denklemi ampirik değerle değiştiririz x ben ve teorik değeri bulun ben. Sonra karşılaştır ben teorik ve ben ampirik. Aralarındaki farkın karelerinin toplamı minimum olmalıdır. Bu bağımlılığın yerine getirildiği bağımlılık türünü seçiyoruz.

Bir ikili doğrusal regresyon denkleminde:

b - eşleştirilmiş doğrusal regresyon katsayısı, bağın gücünü ölçer, yani. kabul edilen ölçüm birimi için ortalama değerinden toplam ortalama sapma y'yi karakterize eder.

B= 20, x'te 1'lik bir değişiklikle y, ortalama değerinden toplamda ortalama olarak 20 sapma gösterir.

Regresyon katsayısındaki pozitif işaret, özellikler arasında doğrudan bir ilişkiyi, “-” işareti ise özellikler arasında bir geri bildirimi gösterir.

§4. Eşleştirilmiş doğrusal regresyon denkleminin uygulanması.

Ana uygulama, regresyon denklemi ile tahmindir. Diğer faktörlerin kararlılık koşulları ve süreç koşulları, tahminde bir sınırlama görevi görür. İçinde devam eden sürecin ortamı keskin bir şekilde değişirse, bu regresyon denklemi gerçekleşmeyecektir.

Nokta tahmini, beklenen faktör değerinin regresyon denklemine yerleştirilmesiyle elde edilir. Böyle bir tahminin doğru bir şekilde gerçekleşme olasılığı son derece küçüktür.

Bir nokta tahminine ortalama tahmin hatasının değeri eşlik ediyorsa, böyle bir tahmine aralıklı tahmin denir.

Ortalama tahmin hatası, iki tür hatadan oluşur:

  1. tip 1 hataları - regresyon çizgisi hatası
  2. tip 2 hatası - bir varyasyon hatasıyla ilişkili bir hata.

Ortalama tahmin hatası.

Genel popülasyonda regresyon çizgisinin konumunda hata

n - örnek boyutu

x k - faktörün hatalı değeri

Genel popülasyondaki regresyon çizgisinden etkili özelliğin RMSD'si

Korelasyon analizi, ilişkinin sıkılığını değerlendirmeyi içerir. Göstergeler:

  1. doğrusal korelasyon katsayısı - aralarında doğrusal bir ilişki olması durumunda iki işaret arasındaki ilişkinin sıkılığını ve yönünü karakterize eder

= -1'de, bağlantı işlevsel terstir, = 1, bağlantı doğrudan işlevseldir, = 0'da bağlantı yoktur.

Yalnızca doğrusal ilişkiler için kullanılır, nicel özellikler arasındaki ilişkileri değerlendirmek için kullanılır. Yalnızca bireysel değerlere göre hesaplanır.

Korelasyon oranı:

Ampirik: her iki varyans türü de etkin gösterge temelinde hesaplanır.

Teorik:

Regresyon denklemi ile hesaplanan efektif özellik değerlerinin dağılımı

Etkin göstergenin ampirik değerinin dağılımı

  • yüksek doğruluk derecesi
  • tanımlayıcı ve nicel bir özellik arasındaki ilişkinin sıkılığını değerlendirmek için uygundur, ancak nicel etkili olmalıdır
  • her türlü bağlantı için uygun

Spearman korelasyon katsayısı

Rütbeler - sıralı dizilerdeki popülasyon birimlerinin sıra sayıları. Her iki özelliği de küçükten büyüğe ya da tam tersi şekilde aynı sırada sıralamak gerekir. Popülasyon birimlerinin sıraları p x ve p y ile gösterilirse, sıraların korelasyon katsayısı aşağıdaki formu alacaktır:

Korelasyon serisi katsayısının avantajları:

  1. Sayısal olarak ifade edilemeyen tanımlayıcı özelliklere göre de sıralayabilirsiniz, bu nedenle aşağıdaki özellik çiftleri için Spearman katsayısının hesaplanması mümkündür: sayı - sayı; tanımlayıcı - nicel; açıklayıcı - açıklayıcı. (eğitim açıklayıcı bir özelliktir)
  2. iletişimin yönünü gösterir

Spearman katsayısının dezavantajları.

  1. Sıralardaki aynı farklılıklar, bir özelliğin değerindeki (nicel özellikler durumunda) tamamen farklı farklılıklara karşılık gelebilir. Örnek: Bir ülkenin yıllık elektrik üretimi

ABD 2400 kWh 1

RF 800 kWh 2

Kanada 600 kWh 3

Spearman'ın değerleri arasında birkaç özdeş değer varsa, ilgili sıralar oluşur, yani. aynı orta sayılar

Bu durumda Spearman katsayısı şu şekilde hesaplanır:

J - x özelliği için demet sayısı

bir j - j bağındaki x'e göre özdeş sıraların sayısı

k - y özelliğinin sırasına göre demet sayısı

bk - aynı sıraların sayısı ah bir demet y

  1. 4. Kendall sıra korelasyon katsayısı

Maksimum rütbe miktarı

S - sıraların gerçek toplamı

Spearman katsayısından daha katı bir tahmin verir.

Hesaplama için, tüm birimler, özniteliğe göre x özniteliğine göre sıralanır. de her sıra için, verilen toplamları aşan sonraki sıraların sayısı sayılır, P'yi ve bu Q işaretinin altındaki sonraki sıraların sayısını gösteririz.

P + Q = 1/2 n (n-1)

  1. Fechner'in sıra korelasyon katsayısı.

Fechner katsayısı - çakışan ve çakışmayan işaret çiftlerinin sayısındaki farkın bu sayıların toplamına oranı şeklinde bağlantının sıkılığının bir ölçüsü.

  1. x ve y için ortalamaları hesaplama
  2. bireysel değerler x ben y ben, "+" veya "-" işaretinin zorunlu olarak gösterilmesiyle ortalama değerlerle karşılaştırılır. İşaretler x ve y'de çakışıyorsa, onları "C" sayısına, değilse "H" sayısına bağlarız.
  3. eşleşen ve eşleşmeyen çiftlerin sayısını sayın.

İlişkiyi ölçme görevi, tanımlayıcı özelliklerle ilgili olarak istatistiklerin karşılaştığı, böyle bir görevin önemli bir özel durumu, biri sebep, diğeri sonuç olan 2 alternatif özellik arasındaki ilişkiyi ölçmek.

2 alternatif işaret arasındaki ilişkinin sıkılığı 2 katsayı kullanılarak ölçülebilir:

  1. ilişki katsayısı
  2. beklenmedik durum oranı

Olasılık katsayısının bir dezavantajı vardır: Ab veya Ba'nın iki heterojen kombinasyonundan biri sıfıra eşit olduğunda, katsayı bir olur. Bağlantının sıkılığını çok özgürce tahmin ediyor - abartıyor.

Pearson katsayısı

Birbiriyle ilişkili özelliklerin her birinin iki değil, daha fazla olası değeri varsa, aşağıdaki katsayılar hesaplanır:

  1. Pearson katsayısı
  2. Tanımlayıcı bir özellik için Chuprov katsayısı

Pearson katsayısı kare matrisler kullanılarak hesaplanır

Normalin altında

k 1 ve k 2 - sırasıyla 1 ve 2 özelliklerine göre grup sayısı. Pearson katsayısının dezavantajı, grup sayısındaki artışla bile 1'e ulaşmamasıdır.

Chuprov katsayısı (1874 -1926)

Chuprov'un katsayısı, iletişimin sıkılığının daha katı bir değerlendirmesidir.

§6. Çoklu korelasyon.

Etkili ve iki veya daha fazla faktör işareti arasındaki ilişkinin çalışmasına denir. çoklu regresyon. Çoklu regresyon yöntemlerini kullanarak bağımlılıkları araştırırken 2 görev ortaya çıkar.

  1. üretken özellik y ile gerçek özellikler x 1, x 2, x 3, ... x k arasındaki ilişkinin analitik ifadesinin belirlenmesi, yani. y = f (x 1, x 2, ... x k) fonksiyonunu bulun
  2. Etkili ve faktöriyel işaretlerin her biri arasındaki ilişkinin sıkılığının değerlendirilmesi.

Korelasyon-regresyon modeli (CRM), etkili özelliğin varyasyonunu etkileyen ana faktörleri içeren bir regresyon denklemidir.

Çoklu regresyon modeli oluşturmak aşağıdaki adımları içerir:

  1. iletişim formu seçimi
  2. faktör işaretlerinin seçimi
  3. popülasyonun doğru tahminler elde etmek için yeterince büyük olmasını sağlamak.

I. Pratikte karşılaşılan değişkenler arasındaki ilişkilerin tamamı, 5 tip fonksiyonla tam olarak tanımlanmıştır:

  1. doğrusal:
  2. Güç yasası:
  3. gösterge:
  4. parabol:
  5. hiperbol:

5 fonksiyonun tümü CRA uygulamasında mevcut olmasına rağmen, en sık kullanılanı, doğrusal bağımlılığın en basit ve en kolay yorumlanabilen denklemi olarak doğrusal bağımlılıktır:, k - denklemde yer alan birçok faktör, bj

0 - beri > 0.7 bu nedenle onlara özel önem veriyoruz

EKO. Sızdırmazlık ölçeği:

Bağlantı 0 - 0.3 ise - zayıf bağlantı

0,3 - 0,5 - fark edilir

0,3 - 0,5 - sıkı

0,7 - 0,9 - yüksek

0,9'dan fazla - çok yüksek

sonra iki özelliği karşılaştırırız (gelir ve cinsiyet)<0,7, то включаем в уравнение множественной регрессии.

Çoklu regresyon denklemine dahil edilecek faktörlerin seçimi:

  1. etkili ve fiili işaretler arasında nedensel bir ilişki olmalıdır.
  2. etkili ve gerçek işaretler birbiriyle yakından ilişkili olmalıdır, aksi takdirde bir fenomen meydana gelir. çoklu doğrusallık (> 06) , yani denkleme dahil edilen faktör işaretleri sadece etkili olanı değil, birbirlerini de etkiler ve bu da sayısal verilerin yanlış yorumlanmasına yol açar.

Çoklu regresyon denklemine dahil edilecek faktörleri seçme yöntemleri:

1. uzman yöntemi - yüksek nitelikli uzmanlar tarafından gerçekleştirilen sezgisel mantıksal analize dayalıdır.

2. eşleştirilmiş korelasyon katsayılarının matrislerinin kullanımı, ilk yönteme paralel olarak gerçekleştirilir, matris birim köşegenine göre simetriktir.

3. adım adım regresyon analizi - faktör işaretlerinin regresyon denklemine sıralı olarak dahil edilmesi ve önem testi, her adımda iki göstergenin değerlerine dayanarak gerçekleştirilir. Korelasyon indeksi, regresyon.

Korelasyon İndeksi: Oranın teorik korelasyonundaki değişiklik veya ortalama artık varyanstaki değişiklik hesaplanır. Regresyon göstergesi - koşullu saf regresyon katsayısındaki değişiklik.

Toplam

31

32

22

85