Grafické metódy prezentácie štatistických údajov. Metódy prezentácie štatistických údajov

  • 17.05.2019

Štatistické údaje by mali byť prezentované takým spôsobom, aby sa dali použiť. Existujú 3 hlavné formy prezentácie štatistických údajov:

1) text - zahrnutie údajov do textu;

2) tabuľkový - prezentácia údajov v tabuľkách;

3) grafický – vyjadrenie údajov vo forme grafov.

Textová forma sa používa v prípade malého množstva digitálnych údajov.

Najčastejšie sa používa tabuľková forma, keďže ide o efektívnejšiu formu prezentácie štatistických údajov. Na rozdiel od matematických tabuliek, ktoré podľa počiatočných podmienok umožňujú získať jeden alebo druhý výsledok, štatistické tabuľky hovoria rečou čísel o skúmaných objektoch.

Štatistická tabuľka- ide o systém riadkov a stĺpcov, v ktorom sú v určitej postupnosti a súvislosti uvádzané štatistické informácie o sociálno-ekonomických javoch.

Tabuľka 2. Zahraničný obchod Ruskej federácie za roky 2000 - 2006, miliardy dolárov

Indikátor 2000 2001 2002 2003 2004 2005 2006
Obrat zahraničného obchodu 149,9 155,6 168,3 280,6 368,9 468,4
Export 101,9 107,3 135,9 183,2 243,6 304,5
Importovať 44,9 53,8 76,1 97,4 125,3 163,9
Obchodná rovnováha 60,1 48,1 46,3 59,9 85,8 118,3 140,7
počítajúc do toho:
so zahraničím
export 90,8 86,6 90,9 114,6 210,1 261,1
importovať 31,4 40,7 48,8 77,5 103,5 138,6
obchodná rovnováha 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Napríklad v tabuľke. 2 uvádza informácie o zahraničnom obchode Ruska, ktoré by bolo neefektívne vyjadrovať v textovej forme.

Rozlišovať predmet A predikátštatistická tabuľka. Subjekt označuje charakterizovaný objekt – buď jednotky populácie, alebo skupiny jednotiek, alebo celok ako celok. V prísudku sa uvádza charakteristika podmetu spravidla v číselnom tvare. Povinné hlavička tabuľka, ktorá označuje, do ktorej kategórie a do akého času údaje v tabuľke patria.

Podľa charakteru predmetu sa štatistické tabuľky delia na jednoduché, skupina A kombinačné. V predmete jednoduchej tabuľky nie je predmet štúdia rozdelený do skupín, ale je uvedený buď zoznam všetkých jednotiek populácie, alebo je uvedená populácia ako celok (napríklad tabuľka 11). V predmete skupinovej tabuľky je predmet štúdia rozdelený do skupín podľa jedného atribútu a predikát udáva počet jednotiek v skupinách (absolútne alebo v percentách) a súhrnné ukazovatele pre skupiny (napríklad tabuľka 4). V predmete kombinovanej tabuľky je populácia rozdelená do skupín nie podľa jedného, ​​ale podľa niekoľkých kritérií (napríklad tabuľka 2).

Pri konštrukcii tabuliek sa musíte riadiť nasledujúcim všeobecné pravidlá.

1. Predmet tabuľky sa nachádza v ľavej (menej často - hornej) časti a predikát - v pravej (menej často - dolnej).

2. Záhlavia stĺpcov obsahujú názvy ukazovateľov a ich jednotky.

3. Posledný riadok dopĺňa tabuľku a nachádza sa na jej konci, ale niekedy je prvý: v tomto prípade je druhý riadok napísaný „vrátane“ a ďalšie riadky obsahujú zložky celkového riadku.

4. Číselné údaje sa zapisujú s rovnakým stupňom presnosti v každom stĺpci, pričom číslice čísel sú umiestnené pod číslicami a celá časť je oddelená od zlomkovej čiarky.

5. V tabuľke by nemali byť prázdne bunky: ak sú údaje nulové, vloží sa znak „–“ (pomlčka); ak údaje nie sú známe, zapíše sa „žiadne informácie“ alebo sa vloží znak „...“ (elipsa). Ak hodnota exponentu nie je nula, ale prvá platná číslica sa objaví po akceptovanom stupni presnosti, potom sa zaznamená 0,0 (ak bol akceptovaný napríklad stupeň presnosti 0,1).

Niekedy sú štatistické tabuľky doplnené o grafy, keď je cieľom zdôrazniť niektorú vlastnosť údajov, porovnať ich. Grafická forma je z hľadiska ich vnímania najefektívnejšou formou prezentácie údajov. Pomocou grafov sa dosahuje viditeľnosť charakteristík štruktúry, dynamiky, vzťahu javov a ich porovnávanie.

Štatistické grafy- sú to podmienené obrázky číselných hodnôt a ich pomerov prostredníctvom čiar, geometrických tvarov, kresieb alebo geografických máp. Grafická forma uľahčuje zohľadnenie štatistických údajov, robí ich vizuálnymi, expresívnymi a viditeľnými. Grafy však majú určité obmedzenia: v prvom rade graf nemôže obsahovať toľko údajov, koľko sa zmestí do tabuľky; v grafe sú navyše vždy zaokrúhlené údaje - nie presné, ale približné. Graf sa teda používa len na zobrazenie všeobecnej situácie, nie na detaily. Posledným nedostatkom je zložitosť kreslenia. Dá sa prekonať pomocou osobného počítača (napríklad „Sprievodca diagramom“ z balíka Microsoft Office Excel).

Podľa spôsobu konštrukcie grafiky sa delia na diagramy, kartogramy A diagramy.

Najbežnejším spôsobom grafického znázornenia údajov sú grafy, ktoré sú týchto typov: lineárne, radiálne, bodové, rovinné, objemové, kučeravé. Typ diagramov závisí od typu prezentovaných údajov a konštrukčnej úlohy. V každom prípade musí byť graf sprevádzaný nadpisom - nad alebo pod poľom grafu. Názov označuje, ktorý indikátor sa zobrazuje, pre ktoré územie a na aký čas.

Čiarové grafy sa používajú na znázornenie kvantitatívnych premenných: charakteristiky variácie ich hodnôt, dynamika, vzťahy medzi premennými. Zmeny údajov sa analyzujú pomocou distribučná oblasť, kumuluje(menej ako krivka) a ogives(krivka "väčšia ako"). Distribučný polygón je diskutovaný v téme 4 (napr. obr. 5). Na vytvorenie kumulácie sa hodnoty premenného znaku vynesú pozdĺž vodorovnej osi a ordináty sú akumulované súčty frekvencií alebo frekvencií (od f1 do ∑ f). Na vytvorenie ogive sa nahromadené súčty frekvencií umiestnia na os y v opačnom poradí (od ∑ f predtým f1). Kumulujte a dávajte podľa tabuľky. 4. znázorniť na obr. jeden.

Ryža. 1. Kumuluje a určuje rozdelenie tovaru podľa hodnoty colnej hodnoty

Použitie čiarových grafov v analýze trendov je zahrnuté v téme 5 (napr. obrázok 13) a ich použitie na analýzu prepojenia je uvedené v téme 6 (napr. obrázok 21). Téma 6 zahŕňa aj použitie bodových grafov (napr. obrázok 20).

Čiarové grafy sú rozdelené na jednorozmerný, ktorý sa používa na reprezentáciu údajov o jednej premennej a dvojrozmerný- pre dve premenné. Príkladom jednorozmerného čiarového grafu je distribučný mnohouholník a dvojrozmerným je regresná čiara (napr. obr. 21).

Niekedy sa pri veľkých zmenách indikátora používa logaritmická stupnica. Napríklad, ak sa hodnoty indikátora líšia od 1 do 1 000, môže to spôsobiť ťažkosti pri vykresľovaní. V takýchto prípadoch prechádzajú na logaritmy hodnôt ukazovateľa, ktoré sa nebudú až tak líšiť: lg 1 = 0, lg 1000 = 3.

Medzi rovinný Podľa frekvencie používania sa rozlišujú stĺpcové grafy (histogramy), v ktorých je ukazovateľ prezentovaný ako stĺpec, ktorého výška zodpovedá hodnote ukazovateľa (napríklad obr. 4).

Úmernosť plochy konkrétneho geometrického útvaru k hodnote ukazovateľa je základom iných typov rovinných diagramov: trojuholníkový, námestie, pravouhlý. Môžete použiť aj porovnanie plôch kruhu – v tomto prípade sa nastavuje polomer kruhu.

pásový graf predstavuje indikátory vo forme horizontálne natiahnutých obdĺžnikov a je inak rovnaký ako stĺpcový graf.

Z rovinných diagramov sa často používa koláčový graf, ktorý slúži na ilustráciu štruktúry skúmanej populácie. Celá súprava sa berie ako 100%, zodpovedá celkovej ploche kruhu, plochy sektorov zodpovedajú častiam súpravy. Zostavme sektorový diagram štruktúry zahraničného obchodu Ruskej federácie v roku 2006 podľa tabuľky. 2 (pozri obr. 2). Pri použití počítačových programov sa sektorové diagramy budujú v trojrozmernej forme, teda nie v dvoch, ale v troch rovinách (pozri obr. 3).

Ryža. 2. Jednoduchý koláčový graf 3. 3D koláčový graf

Kučeravé (obrázkové) diagramy umocňujú prehľadnosť obrázku, keďže obsahujú obrázok zobrazeného indikátora, ktorého veľkosť zodpovedá veľkosti indikátora.

Pri vykresľovaní grafu je všetko rovnako dôležité - správny výber grafického obrázka, proporcie, dodržiavanie pravidiel pre navrhovanie grafov. Tieto problémy sú podrobnejšie opísané v a.

Kartogramy a kartogramy sa používajú na zobrazenie geografických charakteristík skúmaných javov. Zobrazujú umiestnenie skúmaného javu, jeho intenzitu na určitom území – v republike, kraji, hospodárskom alebo správnom obvode a pod. Konštrukciou kartogramov a kartogramov sa zaoberá napr.

Pre vizuálnu a kompaktnú prezentáciu štatistických informácií slúžia štatistické tabuľky a grafy (vrátane tabuliek, kartogramov a kartogramov).

Výsledky súhrnu a zoskupovania materiálov štatistického pozorovania sú spravidla prezentované vo forme tabuliek.

Tabuľka - najracionálnejšia, najnázornejšia a najkompaktnejšia forma prezentácie štatistického materiálu.

Štatistická tabuľka je tabuľka, ktorá obsahuje súhrnnú číselnú charakteristiku skúmanej populácie podľa jedného alebo viacerých podstatných znakov, vzájomne prepojených logikou ekonomickej analýzy.

Hlavné prvky štatistickej tabuľky znázornenej na obr. 5.1, vytvorte jeho rozloženie:

Ryža. 5.1. Štatistická tabuľka

Pri konštrukcii tabuľky sa číselné informácie nachádzajú na priesečníku riadkov a grafov. Navonok je teda tabuľka súborom stĺpcov a riadkov, ktoré ju tvoria.

kostra. Veľkosť tabuľky sa určí vynásobením počtu riadkov počtom stĺpcov.

Štatistická tabuľka obsahuje tri typy nadpisov: všeobecné, horné a bočné. Všeobecný nadpis odráža obsah celej tabuľky, nachádza sa nad jej rozložením v strede a je vonkajším nadpisom. Horné nadpisy (predikátové nadpisy) charakterizujú obsah stĺpcov a vedľajšie nadpisy (predmetové nadpisy) charakterizujú obsah riadkov. Sú to interné hlavičky.

Kostra tabuľky vyplnená nadpismi tvorí jej rozvrhnutie. Ak na priesečníku grafu a čiar zapíšeme čísla, dostaneme úplnú štatistickú tabuľku. Digitálny materiál môže byť reprezentovaný absolútnymi, relatívnymi (indexy cien potravín) a priemernými hodnotami. V prípade potreby môže byť k tabuľkám pripojená poznámka slúžiaca na objasnenie nadpisov, metodiky výpočtu niektorých ukazovateľov, zdrojov informácií atď.

Podľa logického obsahu je tabuľka „štatistická veta“, ktorej hlavnými prvkami sú predmet a predikát.

Predmet štatistickej tabuľky obsahuje zoznam ukazovateľov charakterizovaných číslami. Môže ísť o jeden alebo viac agregátov, samostatné jednotky agregátov (firmy, združenia) v poradí podľa ich zoznamu alebo zoskupené podľa určitých kritérií (samostatné územné jednotky, časové obdobia v chronologických tabuľkách a pod.). Zvyčajne je predmet tabuľky uvedený na ľavej strane v názvoch riadkov.

Predikát štatistickej tabuľky tvorí sústavu ukazovateľov, ktoré charakterizujú predmet štúdia, teda predmet tabuľky. Predikát tvorí horné nadpisy a tvorí obsah grafu s logicky postupným usporiadaním ukazovateľov zľava doprava.

Umiestnenie subjektu a predikátu môže meniť miesta v závislosti od výberu výskumníka. V závislosti od štruktúry predmetu a zoskupenia jednotiek sa v nej rozlišujú jednoduché a zložité štatistické tabuľky, ktoré sa zase delia na skupinové a kombinované tabuľky.

V jednoduchej tabuľke subjekt uvádza jednoduchý zoznam akýchkoľvek objektov alebo územných jednotiek obyvateľstva. Jednoduché tabuľky sú monografické a zoznamové. Monografické necharakterizujú celý súbor jednotiek skúmaného zväzku, ale len jednu z ktorejkoľvek skupiny z neho, vyčlenenú podľa určitého, vopred formulovaného znaku. Jednoduché zoznamové tabuľky sa teda nazývajú tabuľky, ktorých predmetom je zoznam jednotiek skúmanej populácie.

Predmet jednoduchej tabuľky môže byť vytvorený podľa nasledujúcich princípov: druhový, územný (populácia v krajinách SNŠ); dočasné a pod. Jednoduché tabuľky neumožňujú identifikovať sociálno-ekonomické typy skúmaných javov, ich štruktúru, ako aj vzájomné vzťahy a závislosti medzi znakmi, ktoré ich charakterizujú. Tieto úlohy sú plnšie vyriešené pomocou komplexných tabuliek: skupinových a najmä kombinovaných tabuliek.

Skupinové tabuľky sa nazývajú štatistické tabuľky, ktorých predmetom je zoskupenie jednotiek obyvateľstva podľa jedného kvantitatívneho alebo atribútového atribútu. Predikát v tabuľkách skupín pozostáva z ukazovateľov potrebných na charakterizáciu subjektu.

Najjednoduchším typom skupinových tabuliek sú série distribúcie atribútov a variácií. Tabuľka skupín môže byť zložitejšia, ak predikát obsahuje nielen počet jednotiek v každej skupine, ale aj množstvo ďalších dôležitých ukazovateľov, ktoré kvantitatívne a kvalitatívne charakterizujú predmetné skupiny. Takéto tabuľky sa často používajú na porovnanie súhrnných ukazovateľov medzi skupinami, čo umožňuje vyvodiť určité praktické závery. Skupinové tabuľky umožňujú identifikovať a charakterizovať sociálno-ekonomické typy javov, ich štruktúru v závislosti len od jedného atribútu.

Kombinačné tabuľky sa nazývajú štatistické tabuľky, ktorých predmetom je zoskupenie jednotiek obyvateľstva súčasne podľa dvoch alebo viacerých charakteristík: každá zo skupín postavená na jednom základe je rozdelená na podskupiny podľa nejakého iného atribútu atď.

Kombinačné tabuľky umožňujú charakterizovať typické skupiny identifikované podľa niekoľkých charakteristík a vzťah medzi nimi. Postupnosť rozdeľovania jednotiek populácie do homogénnych skupín podľa charakteristík je určená buď dôležitosťou jednej z nich v ich kombinácii, alebo poradím, v akom sú skúmané.

Komplexný vývoj predikátu zahŕňa rozdelenie atribútu, ktorý ho tvorí, do podskupín. Výsledkom je úplnejší a podrobnejší popis objektu. V tomto prípade môže byť každá skupina podnikov alebo každý z nich jednotlivo charakterizovaný inou kombináciou znakov, ktoré tvoria predikát.

1. Pojem štatistiky

Štatistika je jedným z najstarších odborov vedomostí, ktoré vznikli na základe ekonomického účtovníctva. Jeho vznik je spojený s potrebami spoločnosti v rôznych druhoch informácií.

Predpokladá sa, že pojem štatistika pochádza z latinských slov stato (stav) a status (pozícia, stav).

V širšom zmysle je štatistika chápaná ako veda, ktorá študuje hromadné javy a ich zákonitosti z kvantitatívneho hľadiska.

Všeobecná teória štatistiky je metodologická veda, veda o metóde, ktorá je použiteľná na identifikáciu vzorcov v akejkoľvek oblasti, kde sú závery založené na masovom pozorovaní, kde existuje variácia znaku v jednotlivých prvkoch populácie, kde všeobecné vzorce sa môžu prejaviť len vzájomným zrušením náhodnosti v jednotlivých jednotkách.

2. Štatistika ako veda

2.1 Spôsoby vypracovania štatistiky

Vývoj štatistiky ako vedy sa uberal dvoma smermi:

Prvý smer vznikol v Nemecku a je známy ako štátne štúdiá alebo deskriptívna škola. Predstavitelia tejto školy považovali za svoju hlavnú úlohu opis pamiatok štátu bez toho, aby analyzovali vzorce a vzťahy medzi nimi. Zakladateľom deskriptívnej školy bol nemecký vedec Hermann Konring.

Druhý smer vo vývoji štatistiky vznikol v Anglicku a je známy ako politická aritmetika. Predstavitelia tejto školy považovali za svoju hlavnú úlohu odhaliť na základe veľkého množstva pozorovaní rôzne zákonitosti a vzájomné súvislosti skúmaných javov. Zakladateľom školy bol William Petty.

2.2 Predmet štatistiky a základné pojmy

Belgický matematik Adolphe Ketie zhrnul teoretické informácie zo štátnic a praktickej práce predstaviteľov školy politickej aritmetiky. Aj dal vymedzenie predmetu štatistiky – ide o masové javy spojené so životom spoločnosti a človeka. V štatistike videl aj nástroj sociálneho poznania.

Charakteristické črty hromadných javov:

1. Každý prvok súpravy má tak individuálne alebo charakteristické znaky, ako aj spoločné alebo podobné.

2. Charakteristiky jedného z prvkov hromadného javu nemožno získať na základe charakteristík iných prvkov.

Definícia: Hromadné javy skúmané štatistikou vo forme súboru jednotiek podobnej kvality s rôznymi individuálnymi charakteristikami sa nazývajú štatistické agregáty. Na základe toho môžeme povedať, že predmetom štatistiky sú rôzne štatistické agregáty, ktorých štúdium je spojené s kvantitatívnou charakteristikou a identifikáciou ich inherentných vzorcov. Štatistická totalita je jedným z hlavných pojmov štatistickej vedy. Spája sa aj s takými pojmami ako: jednotka obyvateľstva. Definícia: Prvky, ktorých súbor tvorí skúmaný súbor, sa nazývajú jednotky. Znaky jednotiek populácie:

Každá jednotka populácie môže byť charakterizovaná rôznymi druhmi kvalitatívnych a kvantitatívnych znakov.

Ak má určitý atribút rôzne hodnoty pre určité jednotky populácie, nazýva sa to variácia. Definícia: Vzor identifikovaný na základe hromadného pozorovania, t.j. prejavujúca sa vo veľkom množstve javov cez prekonanie inherentnej náhodnosti jej jednotlivého prvku, sa nazýva štatistická pravidelnosť. Hlavnou úlohou štatistiky je abstrahovať od náhodného a identifikovať typické, pravidelné.

Existujú tri spôsoby, ako identifikovať vzory:

1. logický;

2. empirický;

3. na základe zákona veľkých čísel.


2.3 Metóda štatistiky

Hromadné pozorovanie, zoskupovanie a zhrnutie jeho výsledkov, výpočet a analýza zovšeobecňujúcich ukazovateľov. To všetko spolu dáva metódu štatistiky.

3.Štatistické pozorovanie

3.1 Štatistické pozorovanie ako etapa štatistického výskumu. Plán štatistického pozorovania

Štatistické pozorovanie je prvou fázou štatistického výskumu.

Definícia: Štatistické pozorovanie je vedecky organizovaný zber hromadných údajov o skúmaných procesoch a javoch, ktorý sa uskutočňuje podľa vopred navrhnutého programu.

Požiadavky na hromadné údaje:

Štatistické údaje musia byť dostatočne úplné. Každý jav má rôzne vzájomne súvisiace črty. Úplnosť údajov poskytuje pokrytie najvýznamnejších znakov potrebných na získanie objektívnych záverov. Ak sa údaje štatistického pozorovania týkajú rôznych časových období, území, potom je potrebné zabezpečiť ich porovnateľnosť. Pod porovnateľnosťou štatistických informácií sa rozumie jednotnosť ich merných jednotiek, odhady nákladov, hranice administratívnych území, časové charakteristiky atď. Pred začatím štatistického pozorovania je potrebné stanoviť postup na jeho realizáciu. Na tento účel sa vypracuje podrobný plán monitorovania, ktorý obsahuje:

1. programová a metodická časť:

2. organizačná časť.

1. Programové a metodické otázky plánu pozorovania.

Táto časť plánu by mala zahŕňať:

a) účel a ciele pozorovania:

b) objekt a jednotky, ktoré sa majú preskúmať;

c) program monitorovania.

Pozorovací program je zoznam otázok, ktorých zodpovedanie sa očakáva počas prieskumu. Program by sa mal odlišovať úplnosťou informácií a šírkou pokrytia. Znenie otázok by malo byť čo najkratšie a najjasnejšie, vylúčiť nepresnosť a vágnosť v odpovediach, v prípade potreby je uvedený náznak pre jednotný výklad a pochopenie otázok. Programová metodická časť pozorovania uvádza konkrétne nástroje štatistického štúdia, t.j. formuláre, ktoré by mali obsahovať odpovede na formulované otázky, ako aj pokyny na ich vyplnenie.

2. Organizačné otázky plánu pozorovania.

Pre úspešnú organizáciu pozorovania a úplnosť pokrytia obyvateľstva je vypracovaný organizačný plán pozorovania.

V ňom sa uvádza:

a) predmet pozorovania:

b) čas a miesto štúdie;

c) organizácia zberu údajov a technológie na ich spracovanie.


3.2 Formy a typy štatistického pozorovania

Formy, druhy a metódy štatistického pozorovania.

Organizačné formy štatistického pozorovania

Druhy štatistického pozorovania

Metódy štatistického pozorovania

v čase registrácie skutočností

pokrytím jednotiek obyvateľstva

1. Štatistické vykazovanie.

2. Špeciálne organizované pozorovanie.

3. Zaregistrujte pozorovanie.

1. Aktuálne alebo nepretržité.

2. Diskontinuálne:

a) periodické;

b) raz.

1. Pevné.

2. Diskontinuálne:

a) selektívne;

b) hlavné pole;

c) monografická.


1. Okamžite.

2. Dokumentárny.

a) zasielateľstvo;

b) samoregistrácia;

c) korešpondent;

d) dotazník;

e) sprievodca.

V domácej štatistike sa používajú tri organizačné formy (typy) štatistického pozorovania:

1. Hlásenie- ide o hlavnú formu štatistického pozorovania, pomocou ktorej štatistické úrady dostávajú potrebné údaje od podnikov, inštitúcií a organizácií v určitom časovom období vo forme zákonom stanovených výkazov, podpísaných osobami zodpovednými za ich poskytovania a spoľahlivosti zhromaždených informácií.

Zdieľané: telefón, ďalekopis, pošta.

2. Špeciálne organizovaný dohľad sa vykonáva s cieľom získať informácie, ktoré nie sú vo výkaze, alebo overiť jeho údaje. V praktickej štatistike sa vykonávajú sčítania obyvateľstva, materiálnych zdrojov, trvalkových výsadieb, neinštalovaných zariadení, stavebných projektov zariadení a pod. výdavky a rodinný príjem.

3. Zaregistrujte dohľad je formou nepretržitého štatistického pozorovania dlhodobých procesov, ktoré majú pevný začiatok, štádium vývoja a pevný koniec. Je založená na vedení štatistického registra. Register je systém, ktorý neustále sleduje stav jednotky pozorovania a vyhodnocuje silu vplyvu rôznych faktorov na skúmané ukazovatele.

V štatistickej praxi sa rozlišuje medzi registrami obyvateľstva a obchodnými registrami.

Druhy štatistického pozorovania podľa času registrácie faktov

Súčasné pozorovanie sa vykonáva systematicky podľa toho, ako sa javy vyskytujú. Pri pravidelnom pozorovaní sa registrácia skúmaných javov vykonáva v určitých, zvyčajne rovnakých, časových intervaloch. Jednorazové pozorovanie sa vykonáva raz, aby sa vyriešil problém, alebo sa podľa potreby po určitých časových úsekoch epizodicky opakuje.

Typy štatistického pozorovania podľa pokrytia populačných jednotiek

Pri nepretržitom pozorovaní sa zaznamenávajú všetky jednotky obyvateľstva bez výnimky. Pri selektívnom pozorovaní sa skúma náhodne vybraná časť jednotiek populácie s cieľom charakterizovať celú populáciu.

Pri nedokonale kontinuálnom pozorovaní (hlavného poľa) sa skúma hlavná časť populácie a zámerne sa vylučuje určitá časť, o ktorej je známe, že pri charakterizácii celej populácie nehrá veľkú úlohu. Monografické pozorovanie spočíva v podrobnom popise malého počtu alebo jednotlivých typických jednotiek obyvateľstva.

Spôsoby evidencie faktov alebo spôsoby získavania primárneho materiálu

Priame pozorovanie sa vykonáva registráciou skúmaných jednotiek a ich charakteristík špeciálne určenými osobami na základe priameho skúmania, počítania, váženia, odčítania prístrojov atď. Dokumentárne pozorovanie je založené na použití rôznych primárnych účtovných dokladov podnikov, inštitúcií a organizácií ako zdroja štatistických informácií. Počas prieskumu sa štatistické materiály získavajú registráciou odpovedí opýtaných osôb. Spôsob preposielania spočíva v tom, že špeciálne vyškolení registrátori vyplnia vzorce pomocou prieskumu, pričom súčasne kontrolujú slobodu prijímaných informácií. Zamestnanci štatistických orgánov počas samoregistrácie alebo vlastného výpočtu distribuujú opýtaným dotazníky, inštruujú ich a následne zbierajú vyplnené formuláre, pričom kontrolujú úplnosť a správnosť získaných informácií. Dotazníkový prieskum spočíva v tom, že vyvinutý dotazník je zaslaný okruhu ľudí a po vyplnení je vrátený orgánom vykonávajúcim pozorovanie. Korešpondent spočíva v tom, že štatistické úrady organizujú osobitnú sieť korešpondentov z osôb žijúcich v teréne, ktorí vykonávajú pozorovania v súlade s vypracovaným formulárom a pokynmi a oznamujú štatistickým úradom informácie. Nevyžiadané zabezpečuje predkladanie informácií orgánom vykonávajúcim dohľad na nevyžiadanom základe.

4. Súhrn a zoskupovanie štatistík

4.1 Úlohy a typy štatistického súhrnu


Definícia: Súhrn je súbor sekvenčných operácií na zovšeobecnenie konkrétnych jednotlivých faktov, ktoré tvoria súbor s cieľom identifikovať typické črty a vzorce vlastné skúmanému fenoménu ako celku.

Ak sa teda počas štatistického pozorovania zhromažďujú údaje o každej jednotke objektu, výsledkom súhrnu sú podrobné údaje, ktoré odrážajú jeho súhrn ako celok.

Štatistický súhrn by mal byť založený na predbežnej teoretickej analýze javov a procesov.

Podľa hĺbky spracovania materiálu zhrnutia sú jednoduché aj zložité.

Jednoduché zhrnutie je operácia na výpočet súčtu pre množinu jednotiek pozorovania.

Komplexné zhrnutie je súbor operácií, ktoré zahŕňajú zoskupovanie jednotiek pozorovania, sčítanie súčtov pre každú skupinu a pre celý objekt a prezentáciu výsledkov zoskupovania a súhrnu vo forme štatistických tabuliek.

Zhrnutiu predchádza vývoj jeho programu, ktorý pozostáva z nasledujúcich krokov:

Výber funkcií zoskupenia;

Stanovenie poradia vytvárania skupín;

Rozvoj systému štatistických ukazovateľov na charakterizáciu skupín a objektu ako celku;

Vývoj rozložení štatistických tabuliek, v ktorých by mali byť prezentované výsledky súhrnu.

Podľa spracovania materiálu zhrnutie je decentralizované a centralizované.

Pri decentralizovanom súhrne (používa sa spravidla pri spracovaní štatistického výkazníctva) sa tvorba materiálu uskutočňuje postupne. Správy podnikov sú teda zhrnuté štatistickými úradmi zakladajúcich subjektov Ruskej federácie a výsledky za región sa už posielajú Štátnemu výboru pre štatistiku Ruska a tam sú ukazovatele za národné hospodárstvo ako celok. určený. Pri centralizovanom súhrne sa všetok primárny materiál dostane do jednej organizácie, kde sa spracuje od začiatku do konca. Centralizovaný sumár sa zvyčajne používa na spracovanie materiálov z jednorazových štatistických zisťovaní. Podľa techniky vykonávania sa štatistický súhrn delí na mechanizovaný a ručný.

Na vykonanie súhrnu sa vypracuje plán, ktorý stanovuje organizačné otázky: kto a kedy bude vykonávať všetky operácie, postup ich vykonania a zloženie informácií, ktoré sa majú uverejniť v periodickej tlači.


4.2 Metóda zoskupovania v štatistike

Štatistické zoskupovanie je rozdelenie celého súboru materiálov do skupín a podskupín podľa podstatných znakov pre komplexné štúdium javov a procesov spoločenského života.

Základný znak sa nazýva zoskupenie.

Na vytváranie skupín v štatistikách sa používajú hlavne dva typy funkcií:

1. kvantitatívna (číselná);

2. kvalitatívny (prívlastkový).

Zoskupovanie na rovnakom základe je tzv jednoduché a nazývajú sa zoskupenia podľa dvoch alebo viacerých znakov, ktoré sa navzájom kombinujú kombinačné(ťažké).

Po výbere atribútu zoskupenia sa vyberie počet skupín. Ak je zoskupenie založené na kvalitatívnom znaku, potom sa otázka počtu skupín rieši automaticky - bude ich toľko, koľko je kvalitatívnych stavov skúmanej populácie (jej jednotiek).

Pri zoskupovaní podľa kvantitatívnych charakteristík vzniká otázka určenia intervalov zoskupovania. Hodnota intervalu je rozdiel medzi maximálnou a minimálnou hodnotou atribútu v každej skupine. V závislosti od charakteru rozdelenia jednotiek populácie pre danú charakteristiku môžu byť intervaly rôzne a nerovnako veľké. Ak je distribúcia znaku v rámci hraníc jeho variácie dostatočne rovnomerná, potom sa rozsah fluktuácií znaku rozdelí na rovnaké intervaly, ktorých dĺžka je určená vzorcom:

kde XMak A Xmin maximálnu a minimálnu hodnotu prvku v tejto populácii,

n je počet vytvorených skupín.

Počet skupín je možné nastaviť na základe predchádzajúcich štúdií. V prípade, že sa musíte rozhodnúť o počte skupín sami, môžete na určenie optimálneho počtu skupín použiť Sturgessov vzorec:



n - počet skupín

N je počet jednotiek obyvateľstva

Existujú uzavreté intervaly, v ktorých je uvedená horná a dolná hranica, a otvorené intervaly, v ktorých je len jedna hranica: horná alebo dolná.

Štatistické zoskupenia podľa úloh riešených s ich pomocou sa delia na:

Typologické zoskupenie- ide o rozdelenie skúmanej kvalitatívne heterogénnej populácie na triedy, socioekonomické typy, homogénne skupiny jednotiek v súlade s pravidlami vedeckého zoskupovania.

Štrukturálne nazývané zoskupenie, v ktorom je homogénna populácia rozdelená do skupín, ktoré charakterizujú jej štruktúru podľa nejakého premenlivého znaku.

analytické nazývané zoskupenie, ktoré odhaľuje vzťah medzi skúmanými javmi a ich črtami.


4.3 Distribučné rady v štatistike

Štatistický distribučný rad je usporiadané rozdelenie populačných jednotiek do skupín podľa určitého premenlivého atribútu.

V závislosti od znaku, ktorý je základom vytvorenia distribučného radu, existujú:

1. Atributívny – distribučný rad postavený na kvalitatívnych základoch.

2. Variačné – distribučné rady postavené na kvantitatívnom základe. Každý variačný znak pozostáva z 2 prvkov: variantov a frekvencií.

Varianty sú jednotlivé hodnoty funkcie, ktorú má v sérii variácií.

Frekvencie sú počty jednotlivých variantov alebo každej skupiny variačných sérií.

Frekvencie sa nazývajú frekvencie a sú vyjadrené v zlomkoch jednotky alebo ako percento z celku.

V závislosti od povahy variácie znaku existujú:

1. Diskrétny variačný rad charakterizuje rozdelenie jednotiek populácie podľa diskrétneho atribútu (hodnota kvantitatívneho atribútu nadobúda iba celočíselné hodnoty).

2. Intervalový variačný rad - je vhodný pre kontinuálnu variáciu znaku a tiež vtedy, ak sa diskrétna variácia prejavuje v širokom rozsahu, t.j. počet možností pre diskrétnu funkciu je pomerne veľký.

Najpohodlnejšie je analyzovať distribučné série pomocou ich ugarského obrazu.

Polygón sa používa pri zobrazovaní diskrétnych variačných radov.

Histogram sa použije na zobrazenie série variácií intervalu.

5. Štatistické ukazovatele

Štatistický ukazovateľ je kvantitatívna charakteristika sociálno-ekonomických javov a procesov z hľadiska kvalitatívnej istoty. Kvalitatívna istota ukazovateľa spočíva v tom, že priamo súvisí s vnútorným obsahom skúmaného javu alebo procesu, jeho podstatou.

Procesy a javy, ktoré študuje štatistika, sú spravidla pomerne zložité a ich podstatu nemožno odzrkadliť pomocou jedného jediného ukazovateľa. V takýchto prípadoch sa využíva systém štatistických ukazovateľov (súbor vzájomne súvisiacich ukazovateľov, ktorý má jednoúrovňovú alebo viacúrovňovú štruktúru a je zameraný na riešenie konkrétneho štatistického problému).


5.1 Absolútne a relatívne ukazovatele

Absolútna štatistika.

Štatistické ukazovatele vo forme absolútnych hodnôt charakterizujú absolútne rozmery procesov a javov študovaných štatistikou: ich hmotnosť, plocha, objem, dĺžka; odrážať ich časové charakteristiky, a môže predstavovať aj objem populácie, t.j. počet jeho základných jednotiek.

Jednotlivé absolútne ukazovatele sa spravidla získavajú priamo v procese štatistického pozorovania ako výsledok merania, váženia, počítania a hodnotenia záujmovej kvantitatívnej vlastnosti.

Konsolidované objemové ukazovatele sa získajú ako výsledok zhrnutia a zoskupenia jednotlivých hodnôt (charakterizujú objem prvku alebo objem populácie ako celku pre skúmaný objekt, ako aj pre akúkoľvek jeho časť).

Absolútne štatistické ukazovatele sú vyjadrené v nasledujúcich jednotkách merania:

Prírodné (tony, kilogramy, kilometre, kusy);

Náklady (peňažné hodnotenie sociálno-ekonomických javov a procesov);

Práca (osobo-dni, osobohodiny).

Relatívna štatistika.

Relatívny ukazovateľ je výsledkom delenia jedného absolútneho ukazovateľa druhým a vyjadruje pomer medzi kvantitatívnymi charakteristikami sociálno-ekonomických procesov a javov. V čitateli sa ukazovateľ nazýva aktuálny alebo porovnávaný ukazovateľ, v menovateli základ alebo základ porovnania.

Ak sa porovnávací základ berie ako 1, potom je relatívny ukazovateľ vyjadrený v koeficientoch, ak je základ braný ako 100, potom je vyjadrený v percentách (%), ak pre 1000, je vyjadrený v ppm (% 0 ), ak sa ako základ berie 10 000, potom sa vyjadruje v decimiloch.

Percento sa spravidla používa v prípadoch, keď porovnávaný absolútny ukazovateľ prevyšuje základný ukazovateľ najviac 2-3 krát. Úroky nad 200-300 sa zvyčajne nahrádzajú násobkom, koeficientom.


5.2 Priemery (hodnoty)

Priemerná hodnota, ktorá je zovšeobecnenou kvantitatívnou charakteristikou znaku v štatistickej populácii za špecifických podmienok miesta a času, je najbežnejšou formou štatistických ukazovateľov.

Zvážte typy priemerov, ktoré sa počítajú pre prípady, keď sa každý z variantov variačného radu vyskytuje iba raz (vtedy sa priemer nazýva jednoduchý alebo nevážený) a keď sa variant alebo intervaly opakujú (vážený priemer). Možnosť počtu opakovaní - frekvencia. Pri výbere jedného alebo druhého typu priemeru by sa malo pri sčítaní alebo vážení vychádzať zo zásady zmysluplnosti výsledku.

Aritmetický priemer.

X je stredná mocnina;

Z je exponent, ktorý určuje typ priemeru;

Xi - možnosti;

mi – frekvencie alebo štatistické váhy variantov.

Priemerná harmonická (z=-1).


Doučovanie

Potrebujete pomôcť s učením témy?

Naši odborníci vám poradia alebo poskytnú doučovacie služby na témy, ktoré vás zaujímajú.
Odošlite žiadosť s uvedením témy práve teraz, aby ste sa dozvedeli o možnosti konzultácie.

GRAFICKÉ ZOBRAZENIE ŠTATISTICKÝCH ÚDAJOV, metóda vizuálneho znázornenia a zovšeobecnenia údajov o sociálno-ekonomických javoch prostredníctvom geometrických obrázkov, nákresov alebo schematických geografických máp a vysvetľujúcich nápisov k nim. Grafické znázornenie štatistických údajov prehľadne a názorne zobrazuje vzťah medzi javmi a procesmi spoločenského života, hlavné trendy v ich vývoji, mieru ich distribúcie v priestore; umožňuje vidieť ako celok javov ako celok, tak aj jeho jednotlivé časti.

Na grafickú prezentáciu štatistických údajov sa používajú rôzne typy štatistických grafov. Každý graf pozostáva z grafického obrázku a pomocných prvkov. Patria sem: vysvetlenie mapy, priestorové odkazy, mierka, pole mapy. Pomocné prvky umožňujú čítať graf, porozumieť mu a použiť ho. Grafy možno klasifikovať podľa množstva znakov: v závislosti od tvaru grafického obrazu môžu byť bodové, čiarové, rovinné, priestorové a kučeravé. Podľa spôsobu konštrukcie grafiky sa delia na diagramy a štatistické mapy.

Najbežnejším spôsobom grafických obrázkov je diagram. Ide o kresbu, na ktorej sú štatistické údaje prezentované ako geometrické tvary alebo znaky a územie, ktorého sa tieto údaje týkajú, je uvedené len slovne. Ak je diagram prekrytý na geografickej mape alebo na pláne územia, ktorého sa štatistické údaje týkajú, potom sa graf nazýva mapový diagram. Ak sú štatistické údaje zobrazené tieňovaním alebo vyfarbením príslušného územia na geografickej mape alebo pláne, potom sa graf nazýva kartogram.

Na porovnanie podobných štatistických údajov charakterizujúcich rôzne objekty alebo územia možno použiť rôzne typy grafov. Najviditeľnejšie sú stĺpcové grafy, v ktorých sú štatistické údaje zobrazené ako vertikálne pretiahnuté obdĺžniky. Ich prehľadnosť sa dosiahne porovnaním výšky stĺpov (obr. 1).

Ak je základná čiara vertikálna a pruhy sú vodorovné, potom sa graf nazýva pásový graf. Obrázok 2 zobrazuje porovnávací stĺpcový graf, ktorý charakterizuje územie zemegule.

Grafy určené na popularizáciu sú niekedy zostavené vo forme štandardných obrázkov - nákresov charakteristických pre zobrazované štatistické údaje, čo robí graf výraznejším a upozorňuje naň. Takéto diagramy sa nazývajú kučeravé alebo obrázkové (obr. 3).

Veľkú skupinu indikatívnych grafov tvoria štrukturálne diagramy. Spôsob grafického znázornenia štruktúry štatistických údajov spočíva v zostavení štruktúrnych koláčových alebo koláčových grafov (obr. 4).

Na zobrazenie a analýzu vývoja javov v čase sa konštruujú diagramy dynamiky: tyčové, pásové, štvorcové, kruhové, lineárne, radiálne atď. Výber typu diagramu závisí od charakteristík počiatočných údajov, účel štúdie. Napríklad, ak existuje séria dynamiky s trochu nerovnakými úrovňami v čase (1913, 1940, 1950, 1980, 2000, 2005), potom sa použijú stĺpcové, štvorcové alebo koláčové grafy. Sú vizuálne pôsobivé, dobre zapamätateľné, no nehodia sa na zobrazenie veľkého množstva úrovní. Ak je počet úrovní v sérii dynamiky veľký, potom sa použijú lineárne diagramy, ktoré reprodukujú vývojový proces vo forme súvislej prerušovanej čiary (obr. 5).

Pomerne často sa na jednom čiarovom grafe zobrazuje niekoľko kriviek, ktoré poskytujú porovnávací popis dynamiky rôznych ukazovateľov alebo toho istého ukazovateľa v rôznych krajinách (obr. 6).

Na zobrazenie závislosti jedného indikátora na druhom sa vytvorí diagram vzťahov. Jeden indikátor sa považuje za X a druhý za Y (t. j. funkcia X). Je vybudovaný pravouhlý súradnicový systém so stupnicami pre ukazovatele, v ktorom je nakreslený graf (obr. 7).

Rozvoj výpočtovej techniky a aplikovaného softvéru umožnil vytvárať geografické informačné systémy (GIS), ktoré predstavujú kvalitatívne novú etapu v grafickom znázornení informácií. GIS poskytujú zber, uchovávanie, spracovanie, prístup, zobrazovanie a distribúciu priestorovo koordinovaných údajov; zahŕňajú veľké množstvo grafických a tematických databáz v spojení s modelovými a výpočtovými funkciami, ktoré umožňujú prezentovať informácie v priestorovej (kartografickej) forme, získavať viacvrstvové elektronické mapy regiónu v rôznych mierkach. Podľa územného pokrytia sa rozlišujú globálne, subkontinentálne, štátne, regionálne a lokálne typy GIS. Predmetové zameranie GIS je určené úlohami riešenými s jeho pomocou, medzi ktoré môže patriť inventarizácia zdrojov, analýza, hodnotenie, monitorovanie, riadenie a plánovanie.

Lit .: Gerchuk Ya. P. Grafické metódy v štatistike. M., 1968; Teória štatistiky / Edited by R. A. Shmoylova. 4. vyd. M., 2005. S. 150-83.

§ 1. Pojmy štatistiky, štatistická pravidelnosť a totalita ..... 2

§2. Znaky jednotiek štatistickej populácie, ich klasifikácia ...... 2

§jedna. Pojem štatistického pozorovania, jeho príprava ............... 4

§2. Typy štatistického pozorovania ................................................................. ................. .. päť

§3. Chyby v pozorovaní ................................................ ...................................... 6

§4. Zhrnutie a zoskupenie ................................................... ...................................... 6

§päť. Typy štatistických zoskupení ...................................................... ............ 6

§6. Štatistické tabuľky ................................................ ............... 7

§7. Štatistické grafy ...................................................... ............................. 8

§jedna. Skutočné a teoretické rozdelenie ................................................................ 21

§2. Krivka normálneho rozdelenia................................................................ 21

§3. Testovanie hypotézy normálneho rozdelenia................................ 21

§4. Kritériá zhody: Pearson, Romanovsky, Kolmogorov.......... 21

§päť. Praktická hodnota modelovej distribučnej série ..... 22

§jedna. Koncept selektívneho pozorovania. Dôvody jeho použitia ...... 23

§3. Chyby pri vzorkovaní ................................................................ ............... 24

§4. Vzorové pozorovacie úlohy ................................................................ 25

§päť. Rozšírenie údajov z pozorovania vzorky na všeobecnú populáciu... 26

§6. Malá vzorka ................................................. ............................. 26

§jedna. Koncept korelácie a CRA ................................................. 27

§2. Podmienky používania a obmedzenia KPA .................................. 27

§3. Párová regresia založená na metóde najmenších štvorcov.. 28

§4. Aplikácia párovej lineárnej regresnej rovnice .......... 29

§6. Viacnásobná korelácia................................................ 32


Téma 1.: Úvod do štatistiky.

  1. koncepcie štatistiky, štatistickej pravidelnosti a populácie.
  2. znaky jednotiek štatistickej populácie, ich klasifikácia.
  3. predmet a metóda štatistiky.

§ 1 Pojmy štatistiky, štatistická pravidelnosť a totalita.

Slovo štatistika pochádza z latinského „ postavenie” v preklade – stav, stav vecí.

Pojem štatistika vznikol v druhej polovici 18. storočia. V súvislosti s poznaním stavov, štúdiom ich znakov. Do rovnakého obdobia sa datuje aj začiatok výučby štatistiky na univerzite. V závislosti od odvetvia štatistického výskumu existujú: štatistiky obyvateľstva, priemyslu, poľnohospodárstva atď. - aplikovaná štatistika.

Všeobecná teória štatistiky je súbor metód a techník na zber, spracovanie, prezentáciu a analýzu číselných údajov. Pojem štatistika sa dnes používa v 3 významoch:

  1. ako synonymum slova "údaje"
  2. významový odbor, ktorý spája princípy a metódy práce s číselnými údajmi charakterizujúcimi masové javy (stredná dĺžka života u mužov je nižšia ako u žien)
  3. odbor praktickej činnosti zameraný na spracovanie a analýzu číselných údajov.

Štatistika umožňuje identifikovať a merať vzorec vývoja sociálno-ekonomických procesov a javov, ako aj vzťah medzi nimi v konkrétnych podmienkach miesta a času.

Pravidelnosť označuje opakovanie, postupnosť a poradie zmien javov.

Štatistická zákonitosť - zákonitosť, v ktorej nevyhnutnosť je v každom jednotlivom jave nerozlučne spojená s náhodou a len v množstve javov sa prejavuje ako zákon. Proti konceptu štatistickej zákonitosti stojí koncept dynamickej zákonitosti, ktorý sa prejavuje v každom jave. (príklad: S kruh =pr 2 ako > r tém > S kruh). Predmetom štatistického skúmania je štatistický súbor - súbor jednotiek, ktoré majú hromadný charakter, homogenitu, determinovanú celistvosťou a prítomnosťou variácií. Každý jednotlivý prvok sa nazýva štatistická populačná jednotka (ESS).

§2. Znaky jednotiek štatistickej populácie, ich klasifikácia.

ECC majú určité vlastnosti, ktoré sa nazývajú vlastnosti. Štatistika študuje javy prostredníctvom ich znakov, čím je súbor homogénnejší, tým má jeho jednotky viac spoločných znakov a tým menej sa líšia hodnoty týchto znakov.

Opisný znak je znak, ktorý možno vyjadriť len slovne.

  1. Kvantitatívny znak - znak, ktorý možno vyjadriť číselne.
  2. Priamy znak je vlastnosť, ktorá je priamo vlastná charakteristickému objektu.
  3. Nepriamym znakom nie sú vlastnosti samotného charakterizovaného objektu, ale objektu s ním spojeného alebo v ňom zahrnutého.
  4. primárny atribút je absolútna hodnota, ktorú možno merať.
  5. sekundárny znak - výsledok porovnania primárnych znakov, meria sa priamo.
  6. prírodné znamenie - meria sa v kusoch, kg, tonách, litroch atď.
  7. pracovné znamenie – meria sa v človekodňoch, človekohodinách.
  8. atribút hodnoty – meraný v rubľoch, $, €, ₤.
  9. bezrozmerný znak - meranie v podieloch,%
  10. alternatívna vlastnosť je vlastnosť, ktorá preberá iba jednu hodnotu z niekoľkých možných.
  11. diskrétne znamienko - má iba celočíselné hodnoty, bez medziľahlého.
  12. spojitý znak je znak, ktorý nadobúda akúkoľvek hodnotu v určitom rozsahu.
  13. Faktorová vlastnosť je vlastnosť, ktorá mení inú vlastnosť.
  14. efektívna vlastnosť – vlastnosť, ktorá sa mení pod črtou inej
  15. momentálny znak - znak meraný v určitom časovom bode.
  16. intervalový znak - znak pre určité časové obdobie.

Rovnaký znak možno klasifikovať súčasne podľa rôznych klasifikácií.

§3. Predmet a metóda štatistiky.

Predmetom štatistického skúmania sú štatistické agregáty - súbor jednokvalitných premenlivých objektov.

Špecifiká predmetu štatistiky určujú špecifiká metódy, medzi ktoré patria:

  1. zber údajov (štatistické pozorovanie, publikácia)
  2. zovšeobecňovanie údajov (súhrn, zoskupovanie)
  3. prezentácia údajov (tabuľky a grafy)
  4. analýza a interpretácia numerických údajov (výpočet priemerov, analýza variácií, KRA, série dynamiky, indexy)

Téma 2: Organizácia štatistického pozorovania.

Zhrnutie a zoskupenie údajov.

§jedna. Pojem štatistického pozorovania, jeho príprava.

§2. Druhy štatistického pozorovania.

§ 3 Chyby pozorovania.

§4 Zhrnutie a zoskupenie

§5 Typy štatistických zoskupení.

§6 Štatistické tabuľky.

§7 Štatistické grafy.

§jedna. Pojem štatistického pozorovania, jeho príprava.

Akýkoľvek štatistický výskum začína zberom údajov.

Zdroje informácií:

  1. rôzne publikácie (noviny, časopisy atď.)
  2. hlavným zdrojom publikovaných štatistických informácií sú publikácie orgánov štátnej štatistiky (RF v roku 2001, vydavateľstvo GOSKOMSTAT).
  3. vykonávanie štatistického pozorovania, t.j. vedecky organizovaný zber údajov.

Štatistické pozorovanie je hromadné, plánované, vedecky organizované pozorovanie fenoménu spoločenského a ekonomického života, ktoré spočíva v registrácii znakov pre každú jednotku skúmanej populácie.

Proces pozorovania:

  1. Príprava na pozorovanie
  2. Vykonávanie hromadného zberu dát
  3. Príprava údajov na spracovanie
  4. Vypracovanie návrhov na zlepšenie štatistického pozorovania.

Príprava na pozorovanie:

  1. Určenie účelu a predmetu pozorovania
  2. Určenie zloženia označení podliehajúcich registrácii
  3. Vývoj dokumentov pre zber údajov
  4. Výber spravodajskej jednotky a jednotky, voči ktorej sa bude vykonávať zisťovanie.
  5. Je potrebné definovať metódy a prostriedky získavania údajov.

Organizačné problémy, ktoré treba vyriešiť:

  1. je potrebné určiť zloženie služieb vykonávajúcich štúdiu
  2. informovať personál
  3. zostaviť harmonogram prác
  4. replikovať dokumenty na zber údajov

Objektom pozorovania sú sociálno-ekonomické javy a procesy.

Na registráciu je potrebné jasne identifikovať znaky.

Pozorovací program - zoznam znakov znakov podliehajúcich registrácii v procese pozorovania.

Požiadavky programu pozorovania:

  1. Program by mal obsahovať podstatné črty, ktoré priamo charakterizujú skúmaný jav, nemal by obsahovať črty programu, ktoré majú sekundárne javy alebo črty, ktorých hodnoty budú zjavne nespoľahlivé alebo budú úplne chýbať.
  2. Otázky programu pozorovania by mali byť presné, nie nejednoznačné a ľahko pochopiteľné, aby sa predišlo ťažkostiam pri získavaní odpovedí.
  3. Malo by sa určiť poradie otázok.
  4. Program monitorovania by mal zahŕňať otázky priamej povahy na vykonávanie a objasňovanie zozbieraných údajov.
  5. na zabezpečenie jednotnosti prijímaných informácií je program vypracovaný vo forme dokumentu - nazývaného štatistický formulár.

Štatistický formulár je dokument jednej vzorky obsahujúci program a výsledky pozorovaní.

Rozlišuje sa individuálna forma (odpovede na otázky o jednej jednotke pozorovania) a odpisová (informácie o viacerých jednotkách štatistického súboru).

Formulár a návod na jeho vyplnenie sú nástrojmi na štatistické pozorovanie.

Výber času pozorovania spočíva v riešení 2 otázok: stanovenie kritického dátumu alebo intervalu, určenie doby pozorovania.

Kritický dátum - konkrétny deň v roku, hodina dňa, od ktorej musia byť znamenia registrované pre každú jednotku skúmanej populácie.

Obdobie pozorovania - čas, počas ktorého sa vypĺňajú štatistické formuláre, t.j. čas potrebný na zber údajov.

Malo by sa vziať do úvahy, že vzdialenosť obdobia pozorovania od kritického dátumu alebo intervalu môže viesť k zníženiu spoľahlivosti získaných informácií.

§2. Druhy štatistického pozorovania.

V domácej štatistike sa používajú tri formy štatistických pozorovaní.

  1. štatistické výkazníctvo podnikov, organizácií, inštitúcií.
  2. špeciálne organizované štatistické pozorovanie (sčítanie ľudu atď.)
  3. register - forma priebežného štatistického sledovania dlhodobých procesov

Štatistické pozorovanie je klasifikované:

Podľa času pozorovania:

  • aktuálne pozorovanie - vykonáva sa priebežná evidencia znakov (matrika, kriminalita a pod.).
  • periodické pozorovanie - vykonáva sa v určitých časových intervaloch (životná úroveň v meste Čeľabinsk, náklady na spotrebný kôš, sčítanie obyvateľstva).
  • Jednorazové – jednorazové pozorovanie na konkrétny účel.

Podľa pokrytia jednotiek obyvateľstva:

  • Nepretržité pozorovanie – je potrebné získať informácie o všetkých ECC
  • Nie úplné pozorovanie
    • Metóda hlavného poľa - skúmajú sa najvýznamnejšie jednotky študovanej populácie (na štúdium strojárskeho podniku v regióne Čeľabinsk).
    • Selektívne pozorovanie je náhodný výber ECC, ktoré sa majú pozorovať.
    • Monografické pozorovanie - keď sa pozoruje jedno ECC, často sa používajú na zostavenie programu hromadného pozorovania.

Spôsobom zberu údajov:

  • Priame pozorovanie - registrátori sami priamym meraním, vážením zisťujú skutočnosť subjektu, ktorý má byť zaregistrovaný (dieťa do 1 roku v poliklinike).
  • Dokumentárne pozorovanie - používajú sa rôzne dokumenty (vyhotovenie vyhlásenia)

Anketa – potrebné informácie sa získavajú zo slov respondenta.

  • Špedičný prieskum - realizujú špeciálne vyškolení pracovníci, ktorí na základe prieskumu u relevantných osôb dostávajú potrebné informácie a odpovede sami zaznamenávajú do formulára. Expedičný prieskum môže byť priamy (tvárou v tvár) a nepriamy (telefónny prieskum)
  • Korešpondenčný prieskum - informácie poskytuje personál dobrovoľných korešpondentov, táto metóda si vyžaduje malé finančné náklady, ale neudáva presnú hodnotu pozorovania.
  • Samoregistrácia - formuláre si vypĺňajú sami respondenti a matrikári im tlačivá dotazníkov iba rozdávajú a vysvetľujú, ako ich treba vyplniť.

§3. Chyby v pozorovaní

Hlavnou požiadavkou na štatistické pozorovanie je presnosť.

Presnosť - miera zhody ktoréhokoľvek charakteristického ukazovateľa so skutočnou hodnotou určenou z materiálov štatistického pozorovania.

Nesúlad medzi vypočítanou a skutočnou hodnotou sa nazýva chyba pozorovania, v závislosti od príčin výskytu rozlišujú: chyby registrácie a chyby reprezentatívnosti. Chyby registrácie sa delia na náhodné a systematické.

Náhodné chyby - výsledok akcií náhodných faktorov (riadky, stĺpce sú zmiešané)

Systematické chyby – vždy majú tendenciu ukazovateľ buď nadhodnocovať, alebo podceňovať. (Vek)

Chyby reprezentatívnosti sú povahou nekontinuálneho pozorovania a vznikajú v dôsledku nepresnej reprodukcie vzorky celej pôvodnej populácie.

Po prijatí štatistických formulárov musíte:

  1. skontrolujte úplnosť zozbieraných údajov.
  2. vykonávať aritmetickú kontrolu založenú na vzájomnom vzťahu rôznych znakov.
  3. vykonávať logickú kontrolu založenú na znalosti logických vzťahov medzi znakmi.

§4. Zhrnutie a zoskupenie

Na základe zozbieraných údajov nie je možné urobiť výpočet a vyvodiť závery, najskôr ich treba zhrnúť a zhrnúť do jednej tabuľky. Na tieto účely sa používa súhrn a zoskupovanie.

Zhrnutie – súbor sekvenčných operácií na zovšeobecnenie konkrétnych jednotlivých faktov, ktoré tvoria súbor a identifikujú typické znaky a vzorce vlastné skúmanému javu ako celku.

Jednoduchá vodka - počítanie súčtov za obyvateľstvo.

Komplexné zhrnutie je súbor operácií na zoskupovanie jednotlivých pozorovaní, počítanie výsledkov pre každú skupinu a za celý objekt ako celok a prezentovanie výsledkov vo forme štatistických tabuliek.

Podľa formy spracovania materiálu môže byť sumár decentralizovaný, centralizovaný - takýto sumár sa vykonáva s jednorazovým štatistickým pozorovaním.

Zoskupovanie - rozdelenie súboru jednotiek skúmanej populácie do skupín podľa určitých charakteristík.

§päť. Typy štatistických zoskupení

Zoskupenia možno klasifikovať podľa štruktúry a obsahu.

Analytické zoskupenie charakterizuje vzťah medzi znakmi, z ktorých jeden je faktor a druhý je produktívny.

vzdelanie

Neúplné Vyššie

§6. Štatistické tabuľky

Výsledky zhrnutia a zoskupenia by mali byť prezentované takým spôsobom, aby sa dali použiť.

Existujú 3 spôsoby prezentácie údajov:

  1. údaje môžu byť zahrnuté do textu.
  2. prezentácia v tabuľkách.
  3. grafickým spôsobom

Štatistická tabuľka - systém riadkov a stĺpcov, v ktorých sú v určitej postupnosti prezentované štatistické informácie o sociálno-ekonomických javoch.

Rozlišujte medzi predmetom a prísudkom tabuľky.

Predmet je objekt charakterizovaný číslami, zvyčajne sa predmet uvádza na ľavej strane tabuľky.

Predikát je sústava ukazovateľov, ktorými je objekt charakterizovaný.

Štatistická tabuľka obsahuje 3 typy hlavičiek: všeobecné, bočné

Všeobecný názov by mal odrážať obsah celej tabuľky umiestnenej nad tabuľkou v strede.

Pravidlo tabuľky.

  1. sú povinné všetky tri typy nadpisov bez slovných skratiek, do nadpisu možno umiestniť spoločné merné jednotky.
  2. tabuľka by nemala mať extra čiary, môžu chýbať zvislé značky.
  3. Vyžaduje sa posledný riadok. Môže byť na začiatku alebo na konci dokumentu. Ak na začiatku dokumentu, potom ak na konci, potom SPOLU:
  1. digitálne údaje v rámci jedného stĺpca sa zaznamenávajú s jedným stupňom presnosti. Číslice sa píšu striktne pod číslicami, celá časť je oddelená čiarkou.
  2. tabuľka by nemala obsahovať prázdne bunky, ak nie sú žiadne údaje, píšu „Žiadne informácie“ alebo „...“, ak sú údaje nulové, potom „-“. Ak sa hodnota nerovná nule, ale prvá platná číslica sa objaví po špecifikovanej presnosti 0,01®0,0 - ak je akceptovaná presnosť až na desatiny.
  3. ak je v tabuľke veľa stĺpcov, stĺpce predmetu sú označené veľkými písmenami a stĺpce predikátu číslami.
  4. ak je tabuľka založená na vypožičaných údajoch, zdroj údajov je uvedený pod tabuľkou, v prípade potreby môžu byť k tabuľke pripojené poznámky.

§7. Štatistické grafy

Štatistické tabuľky je možné doplniť grafmi.

Štatistické grafy sú podmienené obrázky číselných hodnôt a ich pomerov cez čiary, geometrické tvary, kresby.

Výhody grafického obrazu

  1. jasne, nápadne, výrazne.
  2. hranice zmeny ukazovateľa, komparatívna miera zmeny a volatilita sú okamžite viditeľné

Nevýhody grafického obrazu

  1. Zahrňte menej údajov ako v tabuľke.
  2. graf zobrazuje zaokrúhlené údaje, všeobecnú situáciu, ale nie detaily.

Štatistické grafy

Diagramy

kučeravý

Téma 3: Štatistické ukazovatele.

§jedna. Podstata a význam štatistického ukazovateľa, jeho atribúty.

§2. Klasifikácia štatistických ukazovateľov.

§3. Typy relatívnych ukazovateľov. Konštrukčné princípy.

§4. Systémy štatistických ukazovateľov.

Štatistický znak je vlastnosť obsiahnutá v ESS, existuje objektívne od toho, či sa študuje ako veda alebo nie.

Štatistický ukazovateľ je zovšeobecňujúca charakteristika nejakej vlastnosti obyvateľstva.

Štruktúra štatistického ukazovateľa (jeho atribúty):

  • Priemerné hodnoty
  • Variačné ukazovatele
  • Funkcie indikátorov pripojenia
  • Ukazovatele štruktúry a charakteru distribúcie
  • Dynamické ukazovatele
  • Ukazovatele variability
  • Ukazovatele presnosti a spoľahlivosti vzorových odhadov
  • Indikátory presnosti a spoľahlivosti prognózy

Podľa typu: celkový počet jednotiek alebo celková vlastnosť objektu. Toto je súčet primárnych charakteristík, meraných v kusoch, kg, m, $ atď.

Relatívny ukazovateľ- získaná porovnaním absolútnych alebo relatívnych ukazovateľov v priestore, v čase alebo porovnaním ukazovateľov rôznych vlastností skúmaného objektu.

Relatívny ukazovateľ 1. rádu sa získa porovnaním 2 x absolútnych ukazovateľov. Relatívny ukazovateľ 2. rádu sa získa porovnaním relatívnych ukazovateľov 1. rádu atď.

Relatívny index 3. rádu a vyššie je veľmi zriedkavý.

Priame ukazovatele - také ukazovatele, ktorých hodnota rastie s nárastom skúmaného javu.

Inverzné ukazovatele - ukazovatele, ktorých hodnota klesá s nárastom skúmaného javu.

… štruktúry

…reproduktory

…vzťahy

… intenzita

...vzťah k štandardu

... prirovnania

Štruktúrne ukazovatele sa získajú vzťahom časti k celku.

Relatívne ukazovatele dynamiky

ü Ukazovatele dynamiky (tempa rastu, rast)

ü Indexy

Ukazovatele vzťahov charakterizujte vzťah medzi vlastnosťami:

ü Korelačný koeficient

ü Analytické indexy

Indikátory intenzity charakterizovať vzťah dvoch objektov na rôznych základoch.

ü Náročnosť práce – množstvo času potrebného na výrobu jednej jednotky výrobku

ü Výroba – množstvo výrobkov vyrobených za jednotku času

VÝSTUP \u003d 1 / intenzita práce

Ukazovatele postoja k štandardu- pomer skutočných hodnôt znamenia ukazovateľa k normatívnemu, plánovanému, optimálnemu.

Porovnávacie ukazovatele - porovnanie rôznych predmetov na rovnakom základe.

Všeobecné princípy konštrukcie štatistických ukazovateľov:

  1. štatistiky spolu objektívne súvisia.
  2. Porovnávané ukazovatele sa môžu líšiť iba v jednom atribúte, nemôžete porovnávať ukazovateľ podľa dvoch alebo viacerých atribútov.
  3. je potrebné poznať a brať do úvahy limity ukazovateľa.

Pre každú charakteristiku objektu je potrebný systém štatistických ukazovateľov.

  1. kognitívna funkcia – založená na analýze údajov
  2. propaganda
  3. stimulačná funkcia

Téma 4: Priemery

§jedna. pojem priemeru

§2. typy priemerov

§3. aritmetický priemer a jeho vlastnosti

§4. harmonický priemer, geometrický priemer, kvadratický priemer.

§päť. viacrozmerný priemer

Najbežnejšou formou štatistických ukazovateľov je priemer.

Najdôležitejšou vlastnosťou priemeru je, že odráža to spoločné, čo je vlastné každej jednotke skúmanej populácie, hoci hodnota atribútu jednotlivých jednotiek populácie môže kolísať jedným alebo druhým smerom.

Typickosť priemeru priamo súvisí s homogenitou skúmanej populácie. V prípade nehomogénnej populácie je potrebné ju rozdeliť na kvalitatívne homogénne skupiny a pre každú z homogénnych skupín vypočítať priemer pre každú z nich.

Priemer môžete určiť pomocou počiatočného pomeru priemeru (ISS) jeho logického vzorca.

Štrukturálne priemery

Móda - Mo

Medián – ja

V sérii dynamiky sa vypočíta aritmetický priemer a chronologický priemer.

aritmetický priemer sa nazýva taká priemerná hodnota znaku, pri ktorej výpočte sa nemení celkový objem znaku.

Príklad: hmotnosť.

St jednoduchá aritmetika

X i– individuálna hodnota vlastnosti

n je celkový počet študovanej populácie

porov. aritmeticky vážené

Vlastnosti porov. aritmetika.

Súčet odchýlok jednotlivých hodnôt vlastnosti od jej priemernej hodnoty je nula

ak sa každá jednotlivá hodnota prvku vynásobí alebo vydelí rovnakým konštantným číslom, potom sa priemer zvýši alebo zníži o rovnakú hodnotu.

ak sa ku každej jednotlivej hodnote atribútu pridá jedno a to isté konštantné číslo, potom sa priemerná hodnota zodpovedajúcim spôsobom zmení o rovnaké číslo.

Dôkaz

ak sa váhy f váženého priemeru vynásobia alebo vydelia rovnakým číslom, potom sa priemer nezmení.

súčet štvorcových odchýlok atribútu je menší ako od akéhokoľvek iného čísla.

Iné typy priemerov

Typ stredu

jednoduchý priemer

Vážený priemer

harmonický

geometrický

kvadratický

Charakterizovať zoskupenie na jednom základe je veľmi ťažké a v pamäti zostáva málo informácií.

Viacrozmerný priemer – priemerná hodnota pre niekoľko funkcií E.S.S.

Z pomerov hodnôt funkcií pre E.S. k priemerným hodnotám týchto vlastností.

Viacrozmerný priemer pre i jednotky

X ij– hodnota znaku j pre jednotku i

Stredná hodnota znaku j

k je počet funkcií

j je číslo objektu a počet jeho populácie

Téma 5: Analýza variácií

§jedna. Variácie znakov a ich príčiny

§2. Distribučné rady

§3. Štrukturálne charakteristiky variačného radu.

§4. Sila variačných indikátorov.

§päť. Indikátory intenzity variácie

§6. typy disperzie. Pravidlo sčítania odchýlky.

Odchýlka v hodnote prvku v populácii je rozdiel v jeho hodnotách medzi rôznymi jednotkami danej populácie v rovnakom období alebo časovom bode.

Dôvod variácie: rozdielne podmienky pre existenciu ESS, je to variácia, ktorá vytvára potrebu takej vedy, akou je štatistika.

Uskutočnenie variačnej analýzy začína konštrukciou variačného radu - usporiadaného rozdelenia populačných jednotiek podľa rastúcich alebo klesajúcich znamienok a počítaním zodpovedajúcich frekvencií.

Distribučné rady

ü zaradený

ü diskrétne

ü interval

Hodnotené série variácií- zoznam jednotlivých jednotiek. agregáty vo vzostupnom zostupnom poradí hodnoteného prvku

Séria diskrétnych variácií - tabuľka pozostávajúca z 2 riadkov - polymérne hodnoty premennej vlastnosti a počet jednotiek s danou hodnotou vlastnosti.

Intervalový variačný rad sa vytvorí v týchto prípadoch:

  1. funkcia nadobúda diskrétne hodnoty, ale ich počet je príliš veľký
  2. atribút má akúkoľvek hodnotu v určitom rozsahu

Pri konštrukcii intervalového variačného radu je potrebné zvoliť optimálny počet skupín, najbežnejšia metóda pomocou Sturgessovho vzorca

k - počet intervalov

n je objem populácie

Pri výpočtoch sa takmer vždy získajú zlomkové hodnoty, ktoré sa zaokrúhľujú na celé číslo.

Dĺžka intervalu - l

Typy intervalov

dolná hranica nasledujúceho intervalu opakuje hornú hranicu nasledujúceho intervalu

otvorený interval, interval s jednou hranicou

Pri výpočte pre intervalový variačný rad sa stred intervalu berie ako x i.

NME = 60 medián = 1

Kumulovať - ​​rozdelenie menšie ako

Ogiva – distribúcia väčšia ako

Medián je hodnota vlastnosti, ktorá rozdeľuje celú populáciu na dve rovnaké časti.

Pre diskrétny variačný rad výpočet mediánu: ak je n párne, potom č. Jednotka mediánu

Séria intervalových variácií:

k - počet intervalov

x 0 - dolná hranica mediánu intervalu

l je dĺžka stredného intervalu

Súčet frekvencií

Kumulatívna frekvencia intervalu predchádzajúceho mediánu.

Stredná intervalová frekvencia

Stredný interval– prvý interval, ktorého akumulovaná frekvencia presahuje polovicu celkového súčtu frekvencií.

Graficky je medián na súčte.

  1. Kvartily - hodnota atribútu rozdeľujúceho populáciu na 4 rovnaké časti.

1. kvartil

3. kvartil

2. kvartil – medián.

xQ 1 x Q 3 - dolná hranica intervalu obsahujúceho 1. a 3. kvartil.

l - dĺžka intervalu

a - akumulované frekvencie intervalov predchádzajúcich intervalov obsahujúcich 1. a 3. kvartil.

Frekvencie kvartilových intervalov.

Na charakterizáciu série variácií sa používajú:

Decily - rozdeľujú populáciu na 10 rovnakých častí, Percitily - rozdeľujú populáciu na 100 rovnakých častí.

  1. Režim je často sa vyskytujúca charakteristická vlastnosť. Pre diskrétne variačné série - najvyššia frekvencia. Pre sériu intervalových variácií sa režim vypočíta pomocou nasledujúceho vzorca:

Dolná hranica modálneho intervalu

l– dĺžka modálneho intervalu

fMo- frekvencia modálneho intervalu

f Mo +1 je frekvencia intervalu nasledujúceho po modáli

Modálny interval - interval s najvyššou frekvenciou. Graficky sa režim nachádza na histograme.

  1. Variácia rozpätia
  2. Priemerná lineárna odchýlka

vážený

  1. Rozptyl:

vážený

  1. smerodajná odchýlka

disperzná vlastnosť.

  1. zníženie všetkých hodnôt prvku o rovnakú hodnotu nemení hodnotu rozptylu.
  2. Zníženie všetkých hodnôt vlastností o k-krát zníži rozptyl o do 2časy a RMS v do raz
  3. ak vypočítate strednú druhú mocninu odchýlok od akejkoľvek hodnoty A odlišnej od aritmetického priemeru, potom bude vždy väčšia ako stredná druhá mocnina odchýlok vypočítaná z aritmetického priemeru. Teda z priemeru je vždy menej ako vypočítané z akejkoľvek inej hodnoty, t.j. má minimálny majetok. RMS = 1,25 – s rozdeleniami blízkymi normálu.

V podmienkach normálneho rozdelenia existuje nasledujúci vzťah medzi a počet pozorovaní v rámci limitov je 68,3 % pozorovaní.

95,4 % pozorovaní je v medziach

99,7 % pozorovaní je v medziach

Na porovnanie variácií znakov v rôznych súboroch alebo na porovnanie variácií rôznych znakov v rovnakom súbore sa používajú relatívne ukazovatele, základom je aritmetický priemer.

  1. Relatívny rozsah variácií.
  2. Relatívna lineárna odchýlka
  3. Variačný koeficient

tieto ukazovatele poskytujú nielen porovnávacie hodnotenie, ale tvoria aj homogenitu populácie. Súbor sa považuje za homogénny, ak variačný koeficient nepresiahne 33 %.

Spolu so štúdiom variácií znaku v celej populácii je často potrebné sledovať kvantitatívne zmeny znaku, ale v skupinách, do ktorých je populácia rozdelená, a medzi nimi. To sa dosiahne výpočtom rôznych pohľadov.

Typy disperzie:

  1. Celkový rozptyl
  2. Medziskupinový rozptyl
  3. Rozptyl v rámci skupiny (zvyškový)

1. meria variáciu vlastnosti v celej populácii pod vplyvom všetkých faktorov, ktoré túto variáciu spôsobili

Príklad: spotreba jogurtov: na základe vzorky 100 ľudí

Sociálny status

x i -individuálna hodnota atribútu

Priemerná hodnota znaku za celú populáciu

frekvenciu tejto funkcie.

  1. 2. charakterizuje variáciu znaku pod vplyvom znaku faktora, ktorý je základom zoskupenia.

Priemer skupiny

Celkový priemer skupiny

Frekvencia podľa skupiny

  1. 3. charakterizuje variáciu vlastnosti pod vplyvom faktorov nezaradených do zoskupenia

X iji charakteristická hodnota v skupine j

Priemerná hodnota funkcie v j skupina

f ij - frekvenciai-tá funkcia vj skupina

Existuje pravidlo, ktoré spája 3 typy rozptylu, nazýva sa pravidlo sčítania rozptylu.

Zvyškový rozptyl podľa j skupina

Súčet frekvencií nad j skupina

n je celkový súčet frekvencií

hlavnou úlohou analýzy variačných radov je identifikovať vzory frekvenčného rozloženia.

Distribučná krivka je grafické znázornenie vo forme súvislej čiary zmeny frekvencie v sérii variácií vo funkčne súvisiacej zmene hodnoty vlastnosti.

Distribučnú krivku je možné vykresliť pomocou mnohouholníka a histogramu. Empirické rozdelenie je vhodné zredukovať na teoretické, na niektorú z dobre preštudovaných foriem.

Krivka normálneho rozdelenia.

Existujú nasledujúce typy distribučných kriviek:

  1. unimodálne
  2. veľa vrcholov

Homogénne populácie sú charakterizované jednovertexovými krivkami, multivertexová krivka naznačuje heterogenitu populácie a potrebu preskupenia.

Zistenie všeobecnej povahy rozloženia zahŕňa posúdenie jeho homogenity a výpočet šikmosti a špičatosti. Pre symetrické distribúcie

Pre porovnávaciu štúdiu asymetrie rôznych rozdelení sa vypočíta koeficient asymetrie As.

Centrálny moment tretieho rádu; - RMS kocky;

Ak, potom je asymetria významná

Ak As<0, то As – левосторонняя, если As>0, potom je As pravák.

Ak, potom je As bezvýznamné. Pre symetrické a stredne asymetrické sa vypočíta indikátor špičatosti: ak E k > 0, potom je distribúcia vrcholná, ak E k<0, то распределение плосковершинное.

Variácia alternatívneho znaku sa kvantitatívne prejavuje nasledovne.

0 - jednotky, ktoré túto funkciu nemajú;

1 - jednotky s touto vlastnosťou;

R- podiel jednotiek s týmto znakom;

q- podiel jednotiek, ktoré túto vlastnosť nemajú;

potom p+q = 1.

Alternatívna funkcia má 2 hodnoty 0 a 1 s váhami p A q.

Priame znamenia- ide o znaky, ktorých hodnota rastie s nárastom skúmaného javu.

Obrátené znamienka - znaky, ktorých veľkosť klesá s nárastom skúmaného javu.

Generácia (priama)

Intenzita práce (obrátená)

Maximálny rozptyl podielu je 0,25.

Téma 6: Modelovanie distribučných seriálov.

§jedna. Aktuálne a teoretické rozdelenie

§2. Krivka normálneho rozdelenia.

§3. Testovanie hypotézy normálneho rozdelenia.

§4. Kritériá súhlasu: Pearson, Romanovsky, Kolmogorov.

§päť. Praktická hodnota modelovania distribučných sérií.

§jedna. Aktuálne a teoretické rozdelenie

Jedným z najdôležitejších cieľov štúdia distribučných radov je odhaliť vzor distribúcie a určiť jej povahu. Distribučné vzorce sa najzreteľnejšie prejavia až pri veľkom počte pozorovaní.

Skutočnú distribúciu možno graficky znázorniť pomocou distribučnej krivky - graficky znázornenej ako súvislá čiara zmeny frekvencie vo variačnom rade variantu funkčne súvisiaceho so zmenou.

Teoretická distribučná krivka je chápaná ako krivka tohto typu rozdelenia vo všeobecnosti, ktorá vylučuje vplyv faktorov náhodných pre pravidelnosť.

Teoretické rozdelenie možno vyjadriť analytickým vzorcom nazývaným analytický vzorec. Najbežnejšie je normálne rozdelenie.

§2. Krivka normálneho rozdelenia.

Zákon normálneho rozdelenia:

y je ordináta normálneho rozdelenia

t je normalizovaná odchýlka.

; e=2,7218; x i - možnosti variačnej série; - priemerný;

Vlastnosti:

Normálna distribučná funkcia je rovnomerná, t.j. f(t)=f(-t), . Funkcia normálneho rozdelenia je úplne určená štandardnou odchýlkou.

§3. Testovanie hypotézy normálneho rozdelenia.

Dôvodom častého odvolávania sa na zákon rozdeľovania je závislosť vyplývajúca z pôsobenia mnohých náhodných príčin, z ktorých žiadna nie je dominantná. Ak sa Mo = Me vypočítalo vo variačnom rade, potom to môže naznačovať blízkosť k normálnemu rozdeleniu. Najpresnejší test súladu s bežným zákonom sa robí pomocou špeciálnych kritérií.

§4. Kritériá súhlasu: Pearson, Romanovsky, Kolmogorov.

Pearsonovo kritérium.

Teoretická frekvencia

Empirická frekvencia

Metóda výpočtu teoretických frekvencií.

  1. Stanoví sa aritmetický priemer a podľa série variácií intervalu sa vypočíta t pre každý interval.
  2. Nájdeme hodnotu hustoty pravdepodobnosti pre zákon normalizovaného rozdelenia. STRANA 49
  3. Nájdeme teoretickú frekvenciu.

l - dĺžka intervalu

- súčet empirických početností

- hustota pravdepodobnosti

zaokrúhlite hodnotu na celé čísla

  1. Výpočet Pearsonovho pomeru
  2. tabuľková hodnota

d.f. – počet intervalov – 3

d.f. je počet stupňov voľnosti.

  1. ak > , tak rozdelenie nie je normálne, t.j. hypotéza normálneho rozdelenia je zrušená. Ak< , то распределение является нормальным.

Romanovského kritérium.

Vypočíta sa Pearsonovo kritérium;

Počet stupňov.

Ak s<3, то распределение близко к нормальному.

Kolmogorovovo kritérium

, D- maximálna hodnota medzi akumulovanými empirickými a teoretickými frekvenciami. Nevyhnutná podmienka na použitie Kolmogorova: Počet pozorovaní je viac ako 100. Podľa špeciálnej pravdepodobnostnej tabuľky, s ktorou možno tvrdiť, že toto rozdelenie je normálne.

§päť. Praktická hodnota modelovania distribučných sérií.

  1. schopnosť aplikovať zákony normálneho rozdelenia na empirické rozdelenie.
  2. schopnosť používať pravidlo 3 x sigma.
  3. Schopnosť vyhnúť sa dodatočným časovo náročným a nákladným výpočtom skúmaním populácie s vedomím, že rozdelenie je normálne.

Téma 7: Selektívne pozorovanie.

§jedna. Koncept selektívneho pozorovania. Dôvody jeho použitia.

§2. Typy selektívneho pozorovania.

§3. Chyby pri odbere vzoriek.

§4. Vzorové pozorovacie úlohy

§päť. Distribúcia údajov z pozorovania vzorky bežnej populácii.

§6. Malá vzorka.

§jedna. Koncept selektívneho pozorovania. Dôvody jeho použitia.

Selektívne pozorovanie - také nekontinuálne pozorovanie, pri ktorom sa určitým spôsobom vybrané jednotky skúmanej populácie podrobia štatistickému skúmaniu.

Účel (úloha) výberového pozorovania: pre skúmanú časť charakterizovať celú populáciu jednotiek pri dodržaní všetkých pravidiel a zásad štatistického pozorovania.

Dôvody použitia selektívneho pozorovania:

  1. úspora materiálu, nákladov práce a času;
  2. možnosť podrobnejšie a detailnejšie študovať jednotlivé jednotky štatistickej populácie a ich skupiny.
  3. niektoré špecifické problémy je možné vyriešiť len pomocou selektívneho pozorovania.
  4. kompetentné a dobre organizované selektívne pozorovanie poskytuje vysokú presnosť výsledkov.

Všeobecná populácia je súbor jednotiek, z ktorých sa robí výber.

Rámec výberu je súbor jednotiek vybraných pre prieskum. V štatistike je zvykom rozlišovať parametre bežnej populácie a výberovej populácie.

Typy odberu vzoriek

Podľa spôsobu výberu:

Opakované

Jednotka, ktorá je zaradená do vzorky, sa po zaregistrovaní sledovaných charakteristík vracia bežnej populácii, aby sa zúčastnila na ďalšom výberovom konaní.

Objem všeobecnej populácie zostáva nezmenený, čo vedie k konštantnému zásahu vo vzorke ktorejkoľvek jednotky.

Neopakujúce sa

Jednotka vo vzorke sa nevracia do populácie, z ktorej sa robí výber.

Spôsob výberu:

Vlastne-náhodne je vo vzťahu k jednotkám zo všeobecnej populácie náhodne alebo náhodne bez akýchkoľvek prvkov konzistentnosti. Pred vykonaním takejto vzorky sa však treba uistiť, že všetky jednotky bežnej populácie majú rovnakú šancu byť zaradené do vzorky, t. v úplnom zozname jednotiek štatistickej populácie nie sú žiadne opomenutia alebo neznalosti jednotlivých jednotiek. Je tiež potrebné jasne stanoviť hranice bežnej populácie. Technicky stanovený výber sa uskutočňuje žrebovaním alebo použitím tabuľky náhodných čísel.

Mechanický odber vzoriek (každý 5 v zozname) sa používa v prípadoch, keď je všeobecná populácia nejako usporiadaná, t.j. existuje určitá postupnosť v rozložení jednotiek. Pri vykonávaní mechanického odberu vzoriek sa určuje podiel výberu, ktorý je stanovený pomerom všeobecnej populácie a populácie vzorky.

Nebezpečenstvo chyby pri mechanickom odbere vzoriek sa môže objaviť v dôsledku: náhodnej zhody zvoleného intervalu a cyklických vzorcov v usporiadaní jednotiek všeobecnej populácie.

Zónový odber vzoriek sa používa vtedy, keď všetky jednotky všeobecnej populácie možno rozdeliť do skupín (regiónov, krajín) podľa nejakého atribútu.

Kombinovaná vzorka.

Výber jednotiek je možné vykonať:

  1. alebo v pomere k veľkosti skupiny
  2. alebo v pomere k vnútroskupinovej diferenciácii znaku
  3. , kde n je veľkosť vzorky, N je veľkosť všeobecnej populácie, n i veľkosť vzorky i- skupiny, N i objem i vzorky.
  4. - táto metóda je presnejšia, ale v priebehu odberu vzoriek je veľmi ťažké vopred určiť odchýlku. (pred pozorovaním).

sériový výber.

Používa sa, keď sú ECC spojené do malých skupín (sérií), napríklad balenie s hotovými výrobkami, študentské skupiny. Podstatou sériového odberu vzoriek je, že série sa vyberú buď náhodne, alebo mechanicky a následne sa v rámci vybranej série vykoná kontinuálny prieskum.

Kombinovaný výber.

Ide o kombináciu vyššie diskutovaných spôsobov výberu, častejšie sa používa kombinácia typických a sériových sérií, t.j. výber sérií z niekoľkých typických skupín.

Výber môže byť aj viacstupňový a jednofázový, viacfázový a jednofázový.

Viacstupňový výber: zo všeobecnej populácie sa najskôr vyberú veľké skupiny, potom menšie atď., až kým sa nevyberú jednotky, ktoré sú predmetom prieskumu.

Výber z viacerých fráz: zahŕňa zachovanie rovnakej jednotky výberu vo všetkých fázach jej implementácie. Výberové jednotky vybrané v každom ďalšom stupni zároveň podliehajú skúške, ktorej program sa rozširuje (Príklad: študenti celého ústavu, potom študenti niektorých fakúlt).

§3. Chyby pri odbere vzoriek.

Systematický

Chyby reprezentatívnosti sa vyskytujú iba pri selektívnom pozorovaní. Vznikajú v dôsledku skutočnosti, že vzorová populácia nemôže presne reprodukovať všeobecnú populáciu. Nedá sa im vyhnúť, no dajú sa ľahko predvídať a v prípade potreby ich možno minimalizovať.

Výberová chyba je rozdiel medzi hodnotou parametra vo všeobecnej populácii a jeho hodnotou vypočítanou z výsledkov výberového pozorovania. Dх=-m+ , Dх – hraničná chyba vo vzorke, m – všeobecný priemer; - vzorový priemer.

Hraničná výberová chyba je náhodná hodnota.Čebyševove práce sa venujú štúdiu vzorcov náhodných výberových chýb. Čebyševova veta dokazuje, že Dx nepresahuje: - priemernú výberovú chybu t-koeficient spoľahlivosti udáva pravdepodobnosť tejto chyby. s. 42-43.

V prípade, že je potrebné určiť t zo známej F(t), vezmeme najbližšiu veľkú F(t) a určíme z nej t.

Limit zlomok chyby

P - podiel.

Ak bol výber vykonaný neopakovateľným spôsobom, pridajú sa vzorce pre limitné chyby

Oprava pre neopakovanie sa.

Pre každý typ pozorovania vzorky sa prezentovaná chyba vypočítava inak:

  1. správne náhodné a mechanické pozorovanie;
  2. Zónový dohľad
  3. sériové odbery vzoriek

r je počet sérií vo vzorke;

R je počet sérií vo všeobecnej populácii;

Medziskupinový rozptyl proporcií.

§4. Vzorové pozorovacie úlohy

Používa sa na nasledujúce úlohy:

  1. n-? na určenie veľkosti vzorky zo známych F(t), Dx.
  2. stanovenie vzorky Dx zo známych F(t), n
  3. stanovenie F(t) zo známych Dx a n

1 úloha n - ? Po prvé, n je určené vzorcom opätovného výberu pre neopakovateľný výber:

Spôsoby, ako určiť rozptyl:

  1. je prevzatý z predchádzajúcich podobných štúdií.
  2. RMS s normálnou distribúciou » 1/6 rozsahu variácie.
  3. ak je rozdelenie zjavne asymetrické, potom RMS » 1/5 rozsahu variácie
  4. Pre podiel sa použije maximálny možný rozptyl p(1-p)=0,25
  5. s n³100, potom s 2 \u003d S 2 - výberový rozptyl

30 £ n 100 GBP, potom s 2 \u003d S 2 (n / n-1), s 2 - všeobecný rozptyl

n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

Pri výpočte n by sme nemali sledovať veľkú hodnotu t a malé hraničné chyby, pretože to vedie k zvýšeniu n a tým k zvýšeniu nákladov. Nasledujúci zákon je podobný.

§päť. Distribúcia údajov z pozorovania vzorky bežnej populácii.

Konečným cieľom každého VN je charakterizovať všeobecnú populáciu.

Hodnoty vypočítané z výsledkov VN sa rozdelia medzi všeobecnú populáciu, pričom sa zohľadní hranica ich hraničnej chyby.

Predpokladajme spotrebu jogurtu za mesiac jednou osobou.

250-20 miliónov £250+20; 230 miliónov £ 270

A len 1000 ľudí

230 000 miliónov £ 270 000

48 % - 5 % £ p £ 48 % + 5 %

§6. Malá vzorka.

V praxi štatistického výskumu v moderných podmienkach je stále viac potrebné zaoberať sa malými vzorkami.

Malá vzorka - počet jednotiek pozorovacej vzorky z toho nepresahuje 30, n £ 30 /

Rozvinutie teórie malého vzorkovania urobil anglický štatistik Gosset, ktorý v roku 1908 napísal pod pseudonymom študent.

Dokázal, že odhad nezrovnalosti medzi priemerom malej vzorky a všeobecnou vzorkou má osobitný distribučný zákon. Pri výpočte pre malú vzorku sa hodnota s 2 nepočíta. t st pre možné limity chýb použite študentské kritérium. Strany 44-45. je pravdepodobnosť opačnej udalosti.

Počet stupňov voľnosti

obmedzenie malej chyby vzorky

chyba marginálneho podielu

Téma 8: Korelačno-regresná analýza a modelovanie.

§jedna. Koncept korelácie a CRA.

§2. Podmienky používania a obmedzenia KRA.

§3. Párová regresia založená na metóde najmenších štvorcov.

§4. Aplikácia párovej lineárnej regresnej rovnice.

§päť. Indikátory tesnosti spojenia a pevnosti spojenia.

§6. Viacnásobná korelácia.

§jedna. Koncept korelácie a CRA.

Funkčné spojenie y=5x

korelácia

Medzi rôznymi javmi a ich znakom existujú 2 typy súvislostí, funkčné a štatistické.

Takéto spojenie sa nazýva funkčné, keď sa pri zmene hodnoty jednej z premenných presne definovaným spôsobom zmení aj druhá, tj hodnota jednej premennej zodpovedá jednej alebo viacerým presne špecifikovaným hodnotám inej premennej. . Funkčné spojenie je možné len vtedy, keď premenná y závisí od premennej x a nezávisí od iných faktorov, ale v reálnom živote je to nemožné.

Štatistický vzťah existuje, keď pri zmene hodnoty jednej z premenných môže druhá nadobudnúť akékoľvek hodnoty v určitých medziach, ale jej štatistické charakteristiky sa menia podľa určitého zákona.

Najdôležitejším konkrétnym prípadom štatistického vzťahu je korelačný vzťah. Pri korelácii zodpovedajú rôzne hodnoty jednej premennej rôznym priemerným hodnotám inej premennej, t.j. so zmenou hodnoty atribútu x sa prirodzeným spôsobom mení priemerná hodnota atribútu y.

Slovo korelácia zaviedol anglický biológ a štatistik Francis Gal (korelácia)

Korelácia môže vzniknúť rôznymi spôsobmi:

  • kauzálna závislosť variácie výsledného znaku od variácie faktorového znaku.
  • Korelácia môže nastať medzi 2 účinkami rovnakej príčiny (požiare, počet hasičov, veľkosť požiaru)
  • Vzťah znakov, z ktorých každý je príčinou aj následkom súčasne (produktivita práce a plat)

V štatistike je obvyklé rozlišovať medzi nasledujúcimi typmi závislosti:

  1. párová korelácia - vzťah medzi 2 znakmi výslednice a faktoriálu, alebo medzi dvoma faktoriálmi.
  2. parciálna korelácia - vzťah medzi efektívnym a jedným faktorom faktora s pevnou hodnotou atribútu iného faktora.
  3. viacnásobná korelácia - závislosť výsledného znaku od dvoch alebo viacerých faktorových znakov zahrnutých do štúdie.

Úlohou korelačnej analýzy je kvantifikovať blízkosť vzťahu medzi znakmi. Koncom 19. storočia Galton a Pearson skúmali vzťah medzi výškou otcov a detí.

Regresia skúma formu spojenia. Úlohou regresnej analýzy je určiť analytické vyjadrenie vzťahu.

Korelačno-regresná analýza ako všeobecný pojem zahŕňa zmenu tesnosti spojenia a stanovenie analytického vyjadrenia spojenia.

§2. Podmienky používania a obmedzenia KRA.

  1. prítomnosť hromadných údajov, pretože korelácia je štatistická
  2. vyžaduje sa kvalitatívna homogenita populácie.
  3. podriadenie rozdelenia obyvateľstva podľa výsledných a faktorových charakteristík zákonu normálneho rozdelenia, s ktorým je spojené použitie metódy najmenších štvorcov.

§3. Párová regresia založená na metóde najmenších štvorcov.

Regresná analýza spočíva v určení analytického vyjadrenia vzťahu. Forma rozlišuje lineárnu regresiu, ktorá je vyjadrená rovnicou priamky a nelineárnu regresiu resp.

Podľa smeru komunikácie sa rozlišujú v priamke, t.j. Keď sa x zvyšuje, zvyšuje sa y.

obrátene

Reverzne t.j. ako x rastie, y klesá.

  1. grafická metóda - vynesením empirických údajov do korelačného poľa, ale presnejší odhad sa robí metódou najmenších štvorcov.

X - skutočný znak

U - znak efektívnosti

Rozdiel medzi skutočnou hodnotou a hodnotou vypočítanou na základe rovnice druhej mocniny by mal smerovať k minimu.

Pri LSM min je súčet štvorcových odchýlok empirických hodnôt y od teoretických hodnôt získaných podľa zvolenej regresnej rovnice.

Pre lineárny vzťah

Þ a,b

pre parabolu

Pre hyperbolu

do rovnice sa zapíšu parametre a,b,c, potom výslednú rovnicu dosadíme empirickou hodnotou x i a nájdite teoretickú hodnotu y i . Potom porovnávame y i teoretické a y i empirický. Súčet druhých mocnín rozdielu medzi nimi by mal byť minimálny. Vyberáme typ závislosti, v ktorej sa táto závislosť vykonáva.

V rovnici párovej lineárnej regresie:

b je koeficient párovej lineárnej regresie, meria pevnosť väzby, t.j. charakterizuje priemernú odchýlku populácie y od jej priemernej hodnoty na akceptovanú jednotku merania.

b\u003d 20, keď sa x zmení o 1 znamienko, y sa odchyľuje od svojej priemernej hodnoty v priemere o 20 v populácii.

Kladné znamienko pri regresnom koeficiente označuje priamy vzťah medzi znakmi, znak „-“ označuje spätnú väzbu medzi znakmi.

§4. Aplikácia párovej lineárnej regresnej rovnice.

Hlavnou aplikáciou je prognózovanie podľa regresnej rovnice. Prognózovanie je limitované podmienkami stability iných faktorov a podmienok procesu. Ak sa v ňom prudko zmení prostredie prebiehajúceho procesu, tak táto regresná rovnica neprebehne.

Bodová predpoveď sa získa dosadením očakávanej hodnoty faktora do regresnej rovnice. Pravdepodobnosť presnej implementácie takejto prognózy je extrémne malá.

Ak je bodová predpoveď sprevádzaná hodnotou priemernej chyby predpovede, potom sa takáto predpoveď nazýva intervalová predpoveď.

Priemerná chyba prognózy sa skladá z dvoch typov chýb:

  1. chyby typu 1 - chyba regresnej čiary
  2. chyba 2. druhu - chyba spojená s chybou variácie.

Priemerná chyba predpovede.

Chyba v polohe regresnej priamky v bežnej populácii

n - veľkosť vzorky

x k - chybná hodnota faktora

RMS výsledného znaku z regresnej priamky vo všeobecnej populácii

Korelačná analýza zahŕňa posúdenie tesnosti spojenia. Indikátory:

  1. lineárny korelačný koeficient - charakterizuje tesnosť a smer vzťahu medzi dvoma znakmi v prípade lineárneho vzťahu medzi nimi

pri =-1 je spojenie funkčne inverzné, =1 je spojenie funkčné priame, pri =0 nie je spojenie.

Používa sa len pre lineárne vzťahy, používa sa na hodnotenie vzťahov medzi kvantitatívnymi charakteristikami. Vypočítané len na jednotlivé hodnoty.

Korelačný pomer:

Empirický: oba typy rozptylu sa počítajú podľa výsledného atribútu.

teoreticky:

Disperzia hodnôt efektívnej funkcie vypočítaná regresnou rovnicou

Rozptyl empirickej hodnoty výsledného znaku

  • vysoký stupeň presnosti
  • vhodný na posúdenie blízkosti vzťahu medzi popisným a kvantitatívnym znakom, ale kvantitatívny by mal byť účinný
  • vhodné pre všetky typy pripojení

Spearmanov korelačný koeficient

hodnosti - poradové čísla jednotiek obyvateľstva v zoradenej sérii. Je potrebné zoradiť obe funkcie v rovnakom poradí od najmenšieho po najväčší alebo naopak. Ak sú poradie jednotiek populácie označené p x a p y, potom korelačný koeficient radov bude mať nasledujúci tvar:

Výhody koeficientu korelačného radu:

  1. Hodnotiť môžete aj podľa popisných znakov, ktoré sa nedajú vyjadriť číselne, preto je výpočet Spearmanovho koeficientu možný pre tieto dvojice znakov: číslo - číslo; popisný – kvantitatívny; Opisný – opisný. (vzdelanie je popisný atribút)
  2. ukazuje smer spojenia

Nevýhody Spearmanovho koeficientu.

  1. identické rozdiely v poradí môžu zodpovedať úplne odlišným rozdielom v hodnote vlastnosti (v prípade kvantitatívnych vlastností). Príklad: Výroba elektriny v krajine za rok

USA 2400 kWh 1

RF 800 kWh 2

Kanada 600 kWh 3

Ak sa medzi Spearmanovými hodnotami vyskytuje niekoľko rovnakých hodnôt, vytvoria sa súvisiace hodnosti, t.j. rovnaké stredné čísla

V tomto prípade sa Spearmanov koeficient vypočíta takto:

j- počet odkazov v poradí pre prvok x

Aj- počet rovnakých poradí v j odkazoch x

k-čísla väziva v poradí podľa znaku y

Bk- počet rovnakých radov v ktorý kopa

  1. 4. Kendallov koeficient poradovej korelácie

Maximálna výška hodnosti

S je skutočný súčet poradí

Poskytuje presnejší odhad ako Spearmanov koeficient.

Pre výpočet sú všetky jednotky zoradené podľa atribútu x podľa atribútu pri pre každú hodnosť sa vypočíta počet nasledujúcich hodností presahujúcich daný súčet, označený P a počet nasledujúcich hodností pod týmto označením Q.

P+Q= 1/2 n(n-1)

  1. Fechnerov koeficient poradovej korelácie.

Fechnerov koeficient - miera tesnosti spojenia vo forme pomeru rozdielu v počte párov zhodných a nezhodných znakov k súčtu týchto čísel.

  1. výpočet priemerov pre x a y
  2. jednotlivé hodnoty x i y i sa porovnávajú s priemernými hodnotami s povinným označením znamienka „+“ alebo „-“. Ak sa znamienka zhodujú v x a y, potom ich odkazujeme na číslo „C“, ak nie, potom na „H“.
  3. spočítajte počet zhodných a nezhodných párov.

Úloha merania vzťahu stojí pred štatistikom vo vzťahu k deskriptívnym znakom, čo je dôležitý špeciálny prípad takejto úlohy, meranie vzťahu medzi 2 alternatívnymi znakmi, z ktorých jeden je príčinou druhého následku.

Tesnosť vzťahu medzi 2 alternatívnymi vlastnosťami možno merať pomocou 2 koeficientov:

  1. asociačný koeficient
  2. kontingenčný faktor

Koeficient podmienenosti má nevýhodu: keď sa jedna z dvoch heterogénnych kombinácií Av alebo Ba rovná nule, koeficient sa zmení na jeden. Veľmi liberálne posudzuje tesnosť spojenia – preceňuje ho.

Pearsonov pomer

Ak neexistujú dve, ale viac možných hodnôt každej zo vzájomne súvisiacich vlastností, vypočítajú sa tieto koeficienty:

  1. Pearsonov pomer
  2. Chuprov koeficient pre popisný znak

Pearsonov koeficient sa vypočíta zo štvorcových matíc

Pod normálom

do 1 a do 2 - číslo skupiny podľa znakov 1 a 2, resp. Nevýhodou Pearsonovho koeficientu je, že ani pri zvýšení počtu skupín nedosahuje 1.

Čuprov koeficient (1874–1926)

Chuprov koeficient dôslednejšie odhaduje tesnosť spoja.

§6. Viacnásobná korelácia.

Štúdium vzťahu medzi výslednicou a dvoma alebo viacerými faktorovými charakteristikami sa nazýva viacnásobná regresia. Pri štúdiu závislostí metódami viacnásobnej regresie sú stanovené 2 úlohy.

  1. stanovenie analytického vyjadrenia vzťahu medzi efektívnym znakom y a skutočnými znakmi x 1 , x 2 , x 3 , ... x k, t.j. nájdite funkciu y \u003d f (x 1, x 2, ... x k)
  2. Hodnotenie tesnosti vzťahu medzi efektívnym a každým z faktorových znakov.

Korelačno-regresný model (CRM) je regresná rovnica, ktorá zahŕňa hlavné faktory, ktoré ovplyvňujú variáciu výsledného atribútu.

Vytvorenie viacnásobného regresného modelu zahŕňa nasledujúce kroky:

  1. výber formy komunikácie
  2. výber faktorových vlastností
  3. Zabezpečenie dostatočnej veľkosti populácie na poskytnutie správnych odhadov.

I. celá množina vzťahov medzi premennými, s ktorými sa v praxi stretávame, je celkom úplne opísaná funkciami 5 typov:

  1. lineárny:
  2. moc:
  3. orientačné:
  4. parabola:
  5. hyperbola:

aj keď je v praxi CRA prítomných všetkých 5 funkcií, najčastejšie sa používa lineárna závislosť, ako najjednoduchšia a najľahšie interpretovateľná rovnica lineárnej závislosti: , k - súbor faktorov zahrnutých v rovnici, b j

0 - pretože >0,7 preto im venujeme osobitnú pozornosť

EKO. Stupnica tesnosti komunikácie:

Ak je spojenie 0 - 0,3 - slabé spojenie

0,3 - 0,5 - znateľné

0,3 - 0,5 - zavrieť

0,7 - 0,9 - vysoká

viac ako 0,9 - veľmi vysoká

potom porovnáme dve funkcie (príjem a pohlavie)<0,7, то включаем в уравнение множественной регрессии.

Výber faktorov, ktoré sa majú zahrnúť do rovnice viacnásobnej regresie:

  1. medzi účinnými a skutočnými znakmi musí existovať príčinná súvislosť.
  2. účinné a skutočné znaky musia byť vo vzájomnom úzkom vzťahu, inak vzniká jav multikolinearita (>06) , t.j. faktory faktorov zahrnuté v rovnici ovplyvňujú nielen výsledok, ale navzájom, čo vedie k nesprávnej interpretácii číselných údajov.

Metódy výberu faktorov, ktoré sa majú zahrnúť do rovnice viacnásobnej regresie:

1. expertná metóda – založené na intuitívnej logickej analýze vykonanej vysoko kvalifikovanými odborníkmi.

2. použitie matíc párových korelačných koeficientov sa vykonáva paralelne s prvou metódou, matica je symetrická vzhľadom na jednotkovú uhlopriečku.

3. postupná regresná analýza - postupné zahrnutie faktorových vlastností do regresnej rovnice a testovanie významnosti sa vykonáva na základe hodnôt dvoch ukazovateľov v každom kroku. Korelačný, regresný ukazovateľ.

Korelačné skóre: Vypočítajte zmenu v teoretickej korelácii pomeru alebo zmenu priemerného reziduálneho rozptylu. Regresný ukazovateľ je zmena podmienene čistého regresného koeficientu.

Celkom

31

32

22

85