Büyük petrol ve gaz ansiklopedisi. Bir regresyon modelinin kalitesini veya hangi modelin iyi hangisinin daha iyi olduğunu değerlendirmek için kriterler

  • 03.05.2019

Regresyon denklemleri temelinde oluşturulmuş, Student's t-testini kullanarak her regresyon katsayısının önemini kontrol ederek başlar.

İkili bir doğrusal model için, F- ve /-kriterlerini kullanarak önemi kontrol etmenin her iki yönteminin de eşdeğer olduğu gösterilebilir, çünkü bu kriterler F \u003d / 2 ilişkisiyle ilişkilidir.

Temel varsayımlar karşılanmazsa, OLS'nin modelini değiştirerek düzeltmesi, bazı faktörleri eklemesi (hariç tutması), tarafsızlık özelliğine sahip regresyon katsayılarının tahminlerini elde etmek için ilk verileri dönüştürmesi, daha düşük olması gerekir. kalıntıların varyansının değeri ve bu nedenle, regresyon parametrelerinin önemi için daha verimli bir istatistiksel test sağlar. Bu amaca, daha önce belirtildiği gibi, Bölüm 3.11'de devam ettiğimiz genelleştirilmiş en küçük kareler yönteminin uygulanmasıyla da hizmet edilmektedir.

İlgili tekniklerde uygulanan teknolojik zincirlerin ve işlemlerin önerilen bilgi modelleme yöntemleri, korelasyon-regresyon analizinden farklı değildir. Modellerin hesaplanması ve gerekçelendirilmesi, klasik şemaya, denklem sistemlerinin çözümüne, katsayıların öneminin değerlendirilmesine, modelin kimliğinin doğrulanmasına göre gerçekleştirilir. Tipik olarak, modeller yardımıyla çözülen görevler, TP'nin parametreleri arasındaki ilişkilerin değerlendirilmesi, en büyük normatifliğe sahip olan veya diğer parametreler üzerinde etkisi olan parametrelerin belirlenmesi, birlikte çalışma toleranslarının hesaplanması olasılığıdır. Bununla birlikte, teknolojik süreçlerin kontrolü açısından, bilgi modelleri daha basit, daha özlü ve bu nedenle, yönetim amaçları için daha kabul edilebilirdir.

Anlamlılık testinin "tek yönlü" veya "iki yönlü" olup olmayacağına karar vermemiz gerekiyor. Bu karar, durgunluğun sonuçları bilinmeden önce verilmelidir. Seçim, durgunluk kullanılarak doğrulanan X ve Y arasındaki ilişki modelinin teorik gerekçesiyle belirlenir.

Düzeltilmiş L2'nin önemini test etmek, bağımlı değişken Y ile bağımsız değişkenler X, - arasındaki ilişkinin önemini de test etmektedir. Nitekim, regresyon modeli ilişkinin oluşumu için yüksek derecede bir açıklamaya sahipse, bağımlı değişkendeki değişiklik bağımsız değişkenlerdeki değişikliklerden kaynaklanır ve regresyonla açıklanan kare sapmaların (TFR) toplamları nispeten daha büyük olacaktır. karesel sapmaların kalan toplamından (RMS) daha fazla. Modelin düşük derecede bir açıklaması varsa, bağımlı değişkendeki değişiklik, hata değerindeki bir değişiklikten kaynaklanmaktadır ve standart sapma, TFR'den nispeten daha büyük olacaktır.

Elde edilen regresyon denkleminin önemini (uygunluğunu) kontrol etmek için özel teknikler kullanılır. Buna model doğrulama denir.

İki değişkenli regresyon analizinin doğasını ve yöntemlerini açıklayın ve modeli, parametre tahmin prosedürlerini, regresyon katsayısı normalizasyonunu, anlamlılık testini, tahmin doğruluğu prosedürünü, kalıntı analizini ve model çapraz doğrulamasını açıklayın.

Merhaba) (i) ve (it) 'de açıklanan eksiklikleri bir dereceye kadar gidermek amacıyla, kesilmiş bir tarihsel veri setine dayalı bir tahmin modeli geliştirebiliriz. Örneğin, 1990-1997 dönemi için satış rakamlarımız varsa, yalnızca 1990-1996 değerlerine dayalı bir model oluşturabiliriz. Göstergelerin geri kalanı, yani 1997 göstergeleri, bu model kullanılarak elde edilen tahmin göstergeleri ile karşılaştırma yapmak için kullanılabilir. Bu tür bir kontrol daha gerçekçidir çünkü aslında tahmin durumunu simüle eder. Bu yöntemin dezavantajı, en yeni ve dolayısıyla en önemli göstergelerin ilk modeli oluşturma sürecinden çıkarılmış olmasıdır.

Bu listeye devam edilebilir, sadece bazı olası faktörleri verdik. Tüm faktörlerin önemini analiz ettikten ve kontrol ettikten sonra, zeminden izsiz elektrikli araçlara olan ihtiyacı belirlemek için çok değişkenli ekonomik ve matematiksel modele dahil edilmesi gereken en önemlileri seçilir. Bu hesaplama yönteminin uygulanması bu durumda en uygun gibi görünmektedir. Uzun vadeli tahminlerde, bilimsel ve teknolojik ilerlemenin faktörleri de hesaba katılmalıdır; belirleme ve muhasebeleştirme yöntemi, içinde yaygın olarak açıklanmıştır.

Önerilen hipotezlerin test edilmesi, önemli sayıda ilginç ve çelişkili sonuç verdi, bu da genellikle tahmin edilenlere zıt ilişkilerin varlığını gösterdi. Regresyon modeli, ana bağımlı değişkenle ilişkili olarak yeterince önemli olduğu kanıtlanan tüm ilişkileri gösterir, yani. aktif teknoloji transfer yöntemlerinin kullanılması.

Bir analistin vermesi gereken en önemli karar, modellenmekte olan süreci açıklamak için bir dizi değişken seçimidir. Farklı değişkenler arasındaki olası ilişkileri hayal etmek için problemin özünü iyi anlamanız gerekir. Bu konuda konu alanında tecrübeli bir uzmanla görüşmek çok faydalı olacaktır. Seçtiğiniz değişkenlerle ilgili olarak, bunların kendi içlerinde önemli olup olmadıklarını veya sadece diğer, gerçekten önemli değişkenleri yansıtıp yansıtmadıklarını anlamanız gerekir. Önem testi, çapraz korelasyon analizini içerir. Yardımıyla, örneğin, iki sıra arasındaki gecikme türünün (gecikme) zaman ilişkisini ortaya çıkarmak mümkündür. Doğrusal bir modelle olgunun ne ölçüde açıklanabileceği, en küçük kareler (OLS) yöntemi kullanılarak regresyon kullanılarak test edilir. Optimizasyondan sonra elde edilen artık R, 0 (tam uyumsuzluk) ile 1 (tam eşleşme) arasındaki değerleri alabilir. Doğrusal sistemler için OLS yönteminin bu tür sonuçlar verdiği sıklıkla görülür.

Genel olarak, bir dizi değişken oluşturarak ve bunların önemini kontrol ederek ön işlemenin modelin kalitesini önemli ölçüde artırdığını söyleyebiliriz. Teorik doğrulama yöntemleri mevcut değilse, değişkenler deneme yanılma yoluyla veya genetik algoritmalar gibi resmi yöntemler kullanılarak seçilebilir.

Bir başka iyi bilinen teknik, sistemin ve elemanlarının yeni koşullarda davranışını incelemek için aşırı bağlanmış bir grafikteki bağlantıların silinmesidir. Sistemin kararlılığı, hipotezin doğru olduğu anlamına gelebilir. Modelin bir veya başka bir bağlantısını yok etme kararı, bir istatistiksel anlamlılık kriteri temelinde veya nedensel etki katsayısının değeri için keyfi olarak belirlenmiş bir eşik kriteri temelinde verilebilir. Hipotezlerin doğrulanması ve modelin doğruluğu, kontrol verileri üzerinde test edilerek doğrulanmalıdır.

Şek. 6.3, olasılıklı modeller durumunda, (6.7) ve (6.8) ifadelerini kullanarak regresyon katsayılarının hesaplanması, Y değerinin bir tahminini verir, yani E (Yt). Regresyon katsayısı tahminlerinin de normal olarak dağıldığı varsayılır. Bu oranların istatistiksel önemini bilmemiz gerekiyor. Bu problem, regresyon katsayılarının sıfırdan önemli ölçüde farklı olup olmadığı kontrol edilerek çözülür.

Kaldor'un The Economic Growth Model makalesindeki analizinden, (bir ilk yaklaşımla) sw ve Sp'yi uzun süreler boyunca sabitler olarak ele aldığı açık görünüyor. Elbette, Kaldor'un teorisinin, sp ve s sık sık değişse bile ampirik olarak geçerli olması mümkündür. Bu durumda teorinin testi, sp / sw ve I / Y kovaryansının dinamiklerini gözlemlemek olacaktır. Bununla birlikte, sp ve sw için farklı zamanlarda gözlemlere sahip değiliz ve bu nedenle, teori zaman serilerinde test edilirse, sw ve sp'nin sabit olduğunu varsaymak gerekir. Elbette, ilgili veriler mevcut olduğunda, bu teorinin, sp ve s'deki zamansal dalgalanmalardan bağımsız olarak, göreceli oranlardaki uluslararası veya bölgeler arası değişiklikleri açıklamada yararlı olabilmesi de mümkündür.

Yukarıdakilerin bir sonucu olarak, karşılık gelen t- ve F-istatistiklerinden ve ayrıca aralık tahminlerinden elde edilen tüm sonuçlar güvenilmez olacaktır. Sonuç olarak, tahminlerin standart kalite kontrolleri sırasında elde edilen istatistiksel sonuçlar hatalı olabilir ve oluşturulan modele göre yanlış sonuçlara yol açabilir. Muhtemelen katsayıların standart hataları hafife alınacak ve bu nedenle t-istatistikleri fazla tahmin edilecektir. Bu, gerçekte olmayan istatistiksel olarak önemli katsayıların tanınmasına yol açabilir.

Genel olarak, zaman aralığını parçalara bölmekten bahsederken, a parametrelerinin değerlerinin zaman içinde değiştiği (bu, doğrusal regresyon modelinin değişmezliği hakkındaki önermesini ihlal ettiği) durumlarda gerekli olduğunu not ediyoruz. Az ya da çok aniden değiştiyse, zaman aralığını bu tür "sıçramaların" anlarına bölerek, onu her biri modelin varsayımlarının yerine getirildiği birkaç aralığa bölebiliriz. fark, katsayılar

Sıklıkla, neoklasik büyüme modelinin yakınsama hipotezi, bir ülkenin bölgeleri örneği üzerinde test edilir. Teknoloji gelişimi, tercihler vb. Açılarından bölgeler arasında farklılıklar olabileceği gerçeğine rağmen, bu farklılıklar ülkeler arasındaki farklılıklardan önemli ölçüde daha az olacaktır. Bu nedenle, bölgeler arasında mutlak yakınlaşma olasılığı, ülkeler arasında olduğundan çok daha yüksektir. Aynı zamanda, bölgeler mutlak yakınsama hipotezini test etmek için kullanıldığında, neoklasik büyüme modelinin önemli bir ön koşulu, kapalı ekonomi ihlal edilir. Faktörlerin hareketinin önündeki kültürel, dilsel, kurumsal ve resmi engellerin bir ülkenin bir grup bölgesi için daha az önemli olduğu açıktır. Bununla birlikte, faktörlerin hareketliliği ve dolayısıyla orijinal modelin varsayımlarının ihlali durumunda bile, kapalı bir ekonominin dinamik özelliklerinin ve serbest bir ekonominin olduğu gösterilmiştir.

Tahmin edilen katsayılar istatistiksel olarak anlamlıdır, belirleme katsayısı yüksektir ve yeterlilik testi, klasik doğrusal regresyon modelinin standart varsayımlarının ihlallerini ortaya çıkarmaz.

Kukla değişkenler teriminin Rusça çevirisinin bir kukla değişken olarak tamamen başarılı olmadığı unutulmamalıdır. İlk olarak, regresyon analizi modelinde, Po\u003e katsayısı her zaman bire eşit olan bir X kukla değişkenine zaten sahibiz. İkincisi, ve asıl mesele bu, regresyon analizinin tüm prosedürleri (regresyon modelinin parametrelerinin tahmini, katsayılarının öneminin kontrol edilmesi, vb.), Kukla değişkenlerin dahil edilmesi ile sıradan değişkenlerle aynı şekilde gerçekleştirilir. , kantitatif açıklayıcı değişkenler. 2 / değişkenlerinin kurgusallığı, yalnızca nitel bir özelliği nicel olarak tanımlamaları gerçeğinden oluşur.

Tüm modelin önemini kontrol etmenin yanı sıra, Regresyon katsayılarının önemini Student's / -criterion'a göre kontrol etmek gerekir. Br regresyon katsayısının minimum değeri, bifob-t koşuluna karşılık gelmelidir; burada bi, i-inci faktör özelliği ab ile doğal bir ölçekte regresyon denkleminin katsayısının değeridir. her katsayının kök ortalama kare hatasıdır.

Genel (Gauss olmayan) duruma dönelim. Çok değişkenli istatistiksel analiz uygulaması, (1.22) - (1.23) ilişkileri tarafından tanımlanan kısmi korelasyon katsayılarının, kural olarak, x (1) arasındaki saflaştırılmış doğrusal ilişkinin tatmin edici ölçümleri olduğunu ve kalanların sabit değerlerinde olduğunu göstermiştir. değişkenler ve analiz edilen göstergelerin dağılımının ((0), x (l. .., x (p\u003e)) normalden farklı olması durumunda. formül (1.22) yardımıyla kısmi korelasyon katsayısı belirlendikten sonra özelliklerin herhangi bir ilk dağılımı durumunda (x (0 x (1. .., x (p))), bunu doğrusal modellerin korelasyon analizinin genel matematiksel araç setine dahil edeceğiz. Aynı zamanda, yorumlanabilirler. arıtılmış bağlantının sıkılığının göstergeleri olarak, belirli seviyelerde sabitlenmiş müdahale eden değişkenlerin tüm olası değerlerinin ortalaması alınır.1.2.3. Örnek kısmi korelasyon katsayılarının istatistiksel özellikleri (sıfırdan farklarının istatistiksel anlamlılığını kontrol edin, güven aralıkları) Örneklemin istatistiksel özelliklerini incelerken k derecesinin kısmi korelasyon katsayısı (yani yani, k müdahale eden değişkenin dolaylı etkisini ortadan kaldırırken), tek bir düzeltme ile aynı değişkenler arasında olağan (ikili) örnek korelasyon katsayısı ile aynı şekilde dağıtıldığı gerçeği (örneğin bakınız) kullanılmalıdır. , örneklem büyüklüğü k birim azaltılmalıdır, yani I'e değil n'ye eşit olduğunu varsaymak için. bu nedenle

Probit- veya / için, katsayılar üzerindeki kısıtlamaların varlığına ilişkin hipotezler, özellikle bir veya bir grup katsayıların önemi hakkındaki hipotezler, üç testten herhangi biri kullanılarak gerçekleştirilebilir - Wald, olasılık oranı, Lagrange çarpanları Bölüm 10 (Bölüm 10.6) ... Probit veya / o uygulayan çoğu ekonometrik paket

Sadece k ana etkiyi içeren bir modelin yeterli olduğunu veya regresyon analizi terminolojisinde birinci dereceden bir modelimiz olduğunu varsayarak deneye başlayalım. Doygun bir çözünürlük planı III alırsanız, modeli doğru bir şekilde yerleştirebilirsiniz, ancak yeterliliğini doğrulayamazsınız. Bununla birlikte, (k + 1) dördün katı değilse, çözüm planı III doyurulmayacaktır veya yine de (k + 1) dördün katı ise, çözüm planı IV alınabilir. Her iki durumda da, birkaç (karışık) ilk etkileşimi değerlendirebileceğiz. Ayrıca, bir veya birkaç deney noktası yinelenmişse, bağımsız olarak a2'yi tahmin ederiz ve eşleştirilmiş etkileşimlerimizin önemini kontrol edebiliriz. Bazı etkileşimlerin anlamlı olmasına ve bazılarının olmamasına izin verin. O zaman tüm etkileşimlerin olduğu bir model almak mantıklı olabilir. Bazı etkileşimlerin önemsiz olmasına rağmen, tarafsız en az varyans en az varyans en az varyans tahminleri sıfır değildir (küçük de olsa). Dolayısıyla, tüm faktörler nicel ise, birinci dereceden bir model yerine ikinci dereceden bir polinom alabiliriz (tüm ikili etkileşimler artı tam kareler ile). Ayrıca, tek tek parametreleri kontrol etme uygulamasını açıklayan içerideki ve içerisindeki tartışmalarla da karşılaştırın. Böylece, etkileri ayrı ayrı kontrol etmek yerine, toplam (birleşik) kareler toplamını alabilir ve ortalama karesini bağımsız bir σ2.20 tahminiyle karşılaştırabiliriz.

Modelimizin doğru olduğu hipotezini bir kenara bırakırsak, o zaman genellikle daha yüksek düzey bir model 21'e gideriz. Bu tutarlı bir planlamaya götürür. Çok az sayıda deneyle başlayabiliriz. Daha sonra, eğer N dördün katı ise, III nolu çözüm planlarının toplam k faktörünü N \u003d k + 1 deneylerinde incelemek için uygun olduğunu göreceğiz, aksi takdirde Nlt ile bir sonraki tasarımı dördün katı alacağız. AG dördün katı değilse veya bazı ek deneyler varsa, birinci dereceden modelin yeterli olup olmadığını kontrol edebiliriz.Bunun için bazı etkileşim karelerinin toplamını veya kalan karelerin toplamını hesaplayabiliriz. Varsa a2'nin bağımsız bir tahminidir (paralel veya ön deneylerden) / "" - kriterini kullanabilirsiniz. Etkileşimler önemli çıkarsa, çözüm planı IV'e gidebiliriz. f Neyse ki, bunun olduğunu görüyoruz Çözüm planı III'den çözüm planı IV oluşturmak zor değil Sadece plan çözümü III'ü zıt işaretlerle tekrar etmemiz gerekiyor, yani daha önce gerçekleştirmiş olduğumuz çözüm planı III'ün Nr deneylerinin yanı sıra, NI deneyleri de yapıyoruz. Tanım gereği, çözümleme planı IV, çift etkileşimlerle karıştırılmayan ana etkilerin tahminlerini verir. IV, herhangi bir faktörün ana etkiye sahip olup olmadığına güvenilir bir şekilde karar verebiliriz (üç veya daha fazla faktörün etkileşimi olmaması koşuluyla, bu koşul Bu, izin planı IV) 'ün yeterliliği kontrol edilerek doğrulanabilir. Ana etkileri olmayan faktörlerin de etkileşimleri olmadığını varsayarsak, çözüm planı IV'e dayanarak bazı faktörleri hariç tutmamız oldukça olasıdır. Daha az faktör olması, bir deney için gerekli deney sayısının azalması anlamına gelir (bkz. Tablo 8). Kalan faktörler çözüm V. açısından incelenebilir.

Logit modeli doğrusal olmayan bir model olduğundan, tahmin edilen katsayıların doğrusal modeldeki katsayıların yorumlanmasından farklı bir yorumu olduğunu hatırlayın (bkz. Bölüm 1.4. Bölüm 1). Bu bağlamda, tablonun üçüncü sütununda. 1, incelenen dönem için açıklayıcı değişkenlerin ortalama değerleri ile hesaplanan, katsayıların istatistiksel olarak anlamlı tahminlerine sahip değişkenler için marjinal etki değerlerini gösterir. Bu nedenle, kukla değişken dönem sonu için marjinal etkinin 0,060'lık değeri, rezervler için gerekliliklerin yerine getirilmesine ilişkin kontroller arasındaki sürenin sonunda açık artırmanın yapılması durumunda (kalan değerlerle) anlamına gelir. açıklayıcı değişkenler değişmedi) bankanın ihaleye katılma şansı, bankanın ihaleye katılmamasına aykırıdır, ortalama olarak yaklaşık% 6 oranında artmaktadır.

Çoklu regresyon denkleminin parametrelerinin önemini değerlendirmek için Student t testi kullanılır. Hatırlamak parametrelerin önemi, sıfırdan farkı anlamına gelir yüksek derecede olasılıkla. Bu durumda boş hipotez, ifadedir

T kriterinin gerçek değeri formülle belirlenir

(2.27)

Formül (2.27) 'de, parametre tahmini hem regresyon katsayısı hem de serbest terim (at) olarak anlaşılır. Tahmin edilen parametrenin standart sapmasının değeri, formül (2.25) ile hesaplanan varyansın kökü olarak belirlenir. Miktar denir standart hata parametre.

Regresyon katsayısını tahmin etme formülü (yani için) forma indirgenebilir

(2.28)

sonuçta ortaya çıkan değişkenin standart sapması nerede; - katsayının bir faktörü olan açıklayıcı değişkenin standart sapması; - Bir değişkenin değişkenlere bağımlılığının denklemi için bulunan belirleme katsayısı; - Değişkenin, dikkate alınan çoklu regresyon modeline dahil edilen diğer değişkenlere bağımlılığının denklemi için bulunan belirleme katsayısı.

T-testinin teorik değeri, Öğrenci testinin a anlamlılık düzeyi ve serbestlik derecesi sayısı için değerler tablosundan bulunur. Anlamlılık düzeyi a, bir Tip I hatanın olasılığıdır, yani. Bir hipotezi doğru olduğunda reddetme olasılığı. Kural olarak, a 0.1'e eşit seçilir; 0.05 veya 0.01.

Parametrenin önemsiz olduğuna dair boş hipotez: eşitsizlik varsa reddedilir

(2.29)

Öğrenci testinin teorik değeri nerede.

İfadeye (2.29) dayanarak, tahmin edilen parametre için bir güven aralığı oluşturmak da mümkündür:

İfade (2.30), hem parametrenin önemini tahmin etmeye hem de ekonomik yorumlamasına izin verir (eğer regresyon katsayısı tahmin ediliyorsa). Açıktır ki, güven aralığı (2.30) sıfırı içermiyorsa parametre anlamlı olacaktır, yani. yüksek olasılıkla tahmin edilen parametre sıfır değildir.

Regresyon katsayısı, ilişkinin gücünün mutlak bir göstergesi olduğundan, bunun için güven aralığının sınırları da benzer şekilde yorumlanabilir: bağımsız değişkendeki tek bir değişiklik olasılığı, bağımlı değişken -de en az ve en çok değişecek.

Örneğin 2.1 gibi parametrelerin önemini değerlendirmenin sonuçlarını düşünün. Parametrelerin standart hataları

Köşeli parantez içindeki kök işaretinin altında matrisin kesişme noktasında bulunan bir öğesi olduğunu hatırlayın.

nii j'inci satır ve j'inci sütun, sayı; değerlendirilen parametrenin sayısına eşittir.

Öğrenci kriterinin gerçek değeri

T-testinin tablo değeri ve anlamlılık seviyesi 2.0153'tür, bu nedenle, serbest terim dışındaki tüm parametreler anlamlıdır.

Regresyon katsayıları için güven aralıklarının sınırlarını bulun.

Güven aralıklarının sınır değerlerinin rehberliğinde, regresyon katsayılarının önemi hakkında aynı sonuçlara varılabileceğine dikkat edin (sıfır güven aralığına girmediğinden). Formül (2.30), formül (2.29) 'un bir sonucudur, bu durumda sonuçlar Öğrenci kriterinin gerçek ve tablo değerlerini karşılaştırmaktan farklı olamaz. Regresyon katsayıları için güven aralıklarının sınırlarının ekonomik bir yorumunu verelim.

Katsayı, vergi makbuzlarının hacmi ile çalışan sayısı arasındaki ilişkinin gücünün bir özelliğidir. Güven aralığı sınırlarının değerleri dikkate alındığında, 1000 kişi başına istihdam edilen sayısındaki bir değişikliğin, vergi makbuzlarında bir değişikliğe (0,95 () olasılıkla) yol açacağı söylenebilir. en az 3,56 milyon ruble. ve 21,34 milyon ruble'den fazla değil. üretim ve enerji üretiminde sabit bir sevkiyat hacmi ile. Diğer iki regresyon katsayısı için sonuçlar aşağıdaki gibidir.

İmalatta sevkiyat hacminde 1 milyon ruble değişiklik. vergi makbuzlarında en az 0,028 milyon ruble değişikliğe (0,95 () olasılıkla) yol açacaktır. ve 0,092 milyon ruble'den fazla değil. çalışan sayısı ve enerji üretiminin sabit değerleri ile.

Enerji üretiminde 1 milyon ruble değişiklikle. vergi makbuzları (0,95 () olasılıkla) en az 0,13 milyon ruble değişecektir. ve en fazla 0,18 milyon ruble. üretimde çalışan sayısı ve sevkiyat hacminin değişmeyen değerleri ile.

Bölüm 2.2'de belirtildiği gibi, kullanarak bir regresyon modeli oluştururken merkezli değişkenler regresyon katsayıları ayni regresyon katsayılarından farklı değildir. Bu ifade aynı zamanda regresyon katsayılarının standart hatalarının büyüklüğü ve dolayısıyla Öğrenci testinin gerçek değerleri için de geçerlidir.

Kullanma standartlaştırılmış değişkenler orijinal regresyondan farklı olan ölçüm değişikliklerinin ölçeği, parametrelerin değerleri (standartlaştırılmış regresyon katsayıları) ve bunların standart hataları. Bununla birlikte, standardize bir ölçekte denklem parametreleri için Öğrenci kriterinin gerçek değerleri, doğal bir ölçekte denklemden elde edilen değerlerle çakışmaktadır.

Tüm regresyon denkleminin önemini bir bütün olarak değerlendirmek için kullanırız fisher's testi (F testi), bu durumda aynı zamanda ortak F kriteri. Regresyon denkleminin önemsizliği, genel popülasyondaki tüm regresyon katsayılarının eşzamanlı olarak sıfıra eşitliği (yüksek olasılıkla) anlamına gelir:

F kriterinin gerçek değeri, regresyon denklemi kullanılarak hesaplanan ve serbestlik derecesi sayısı için düzeltilen, faktöriyel ve artık karelerin toplamlarının oranı olarak belirlenir:

(2.31)

karelerin faktöriyel toplamı nerede; - Artık kareler toplamı.

F kriterinin teorik değeri, anlamlılık seviyesi α, serbestlik derecesi sayısı, vb. İçin Fisher kriterinin değerler tablosundan bulunur. Boş hipotez reddedilirse

fisher kriterinin teorik değeri nerede.

Model önemsiz ise, bu model kullanılarak hesaplanan korelasyon göstergelerinin de önemsiz olduğunu unutmayın. Gerçekten, eğer

ve regresyon çizgisi apsis eksenine paraleldir. Ek olarak, en küçük kareler yöntemi (2.8) ile elde edilen normal denklem sisteminden bunu takip eder.

Tüm regresyon katsayılarının sıfır değerlerinde, ifadeye sahibiz

şunlar. tüm regresyon katsayıları sıfıra eşitse (istatistiksel anlamsızlıkları), belirleme katsayısı da sıfıra eşit olacaktır (istatistiksel olarak anlamsız).

F kriterini hesaplamak için formül (2.31), faktöriyel ve artık kareler toplamını toplam kareler toplamına bölerek dönüştürülebilir:

Basit dönüşümlerden sonra ifadeyi alıyoruz

Genel F kriterinin hesaplanması, bir varyans analizi tablosu şeklinde resmileştirilebilir (Tablo 2.2).

Tablo 2.2.Çoklu regresyon modelinin istatistiksel öneminin analizi

Varyasyon kaynakları

Serbestlik derecesi sayısı df

Karelerin toplamı SS

Serbestlik derecesi başına dağılım MS \u003d SS / df

Fisher's F testi

gerçek değer

a \u003d 0,05 için tablo değeri

Bilgisayar veri işleme sonuçlarında da benzer bir varyans analizi tablosu görülebilir. Farkı

yukarıdaki tablodan son sütunun içeriğidir. Bizim durumumuzda bu, Fisher kriterinin teorik değeridir. Bilgisayar sürümlerinde, son sütun, F kriterinin gerçek değerine karşılık gelen birinci türden bir hata yapma olasılığının değerini verir (doğru boş hipotezi reddederek). İÇİNDE Excel bu değere "anlamlılık F" adı verilir. ANOVA tablosunda bilgisayarın ürettiği değeri olarak gösterelim. Değeri şu şekilde yorumlanabilir: F kriterinin teorik değeri gerçek değerine eşitse, o zaman tip I hatanın olasılığı (anlamlılık düzeyi) eşittir.

Kriterin tablo değerini belirlemek için belirli bir önem düzeyi seçerek, eşit bir hata değerini kabul ediyoruz. Bu nedenle, eğer, o zaman gerçek hata planlanandan daha az olacaktır ve regresyon denkleminin belirli bir anlamlılık düzeyinde önemi hakkında konuşabiliriz.

İstatistiksel anlamlılık için örnek 2.1'de elde edilen regresyon denklemini kontrol edelim. F kriterinin gerçek değeri

Fisher kriterinin tablo değeri için a \u003d 0,05, serbestlik derecesi sayısı ve 2,82'ye eşittir. F kriterinin gerçek değeri tablo olandan daha büyük olduğu için, regresyon denklemi olasılıkla anlamlıdır.Bu nedenle, belirleme katsayısı da önemlidir, yani. büyük olasılıkla sıfırdan farklıdır.

RFP'de "Regresyon" seçeneğini kullanırken Excel bu örnek için aşağıdaki varyans analizi tablosu elde edilmiştir (Tablo 2.3).

Tablo 2.3.RFP'de "Regresyon" seçeneği kullanılırken elde edilen ANOVA tablosu Excel

F testinin gerçek değeri bu tablonun sondan bir önceki sütununda yer almaktadır. Bu değerin yuvarlama hataları nedeniyle yukarıdakinden farklı olduğuna dikkat edin. Tablonun son sütununda. 2.3, tip I hata yapma olasılığını gösterir. 1.10224E -12'ye eşittir, yani. 0.00000000000110224. Bu olasılığın maksimum değerini 0,05 olarak belirledik. Birinci türden bir hata yapma olasılığının gerçek değeri, tarafımızdan belirlenen maksimum değerden daha az (çok daha az) olduğundan, regresyon denkleminin önemsiz olduğu şeklindeki boş hipotez reddedilmelidir.

Belirleme katsayısı, değerleri gözlemlenen verilerden hesaplandığı için bir istatistiktir. Belirleme katsayısına bağlı olarak, faktörler arasındaki doğrusal ilişkinin ne kadar önemli olduğunu kontrol eden istatistiksel bir prosedür oluşturulur.

Tüm regresyon denkleminin önemini kontrol eden istatistik şudur:

Biz alırız:

İstatistiklerin artan değerleri, artan istatistik değerlerine karşılık gelir, bu nedenle, \u003d 'de kabul edilmeyen bir hipotez, eşitsizlik devam ederse kabul edilmez.

Bir hipotezi yanlışlıkla reddetme olasılığıdır.

Farklı sayıda gözlem için kritik değerleri hesaplayalım.

Basit bir doğrusal regresyon düşünün,

Gözlem sayısına bağlı olarak elde edilen kritik değerler:

Yani, önemli sayıda gözlemle, gerçek değerin 0'dan küçük sapmaları bile, anlamlı bir açıklayıcı değişkenle regresyon katsayısının istatistiksel öneminin tanınması için önemli hale gelir.

Değer, değişkenler arasındaki korelasyon katsayısının karesiyle çakışır, korelasyon katsayısı için de aynı sonuç geçerlidir:

Şimdi tam ve indirgenmiş modeller için R 2 belirleme katsayılarını ele alalım. Tam modelde, R2'nin değeri her zaman azaltılmış olandan daha yüksektir, çünkü m açıklayıcı değişkenli tam modelde, toplamı

katsayıların tüm değerleri için. İndirgenmiş bir model düşünüldüğünde, örneğin m'inci açıklayıcı değişken olmadan, toplamın minimum değeri aranır.

katsayıların tüm değerleri için, ortaya çıkan minimum değer, değerler dahil olmak üzere tüm değerler için sapmaların toplamını en aza indirirken elde edilen değerden daha büyük olamaz. Dolayısıyla katsayının özelliği aşağıdaki gibidir.

Kullanarak bir model seçme prosedürünün rahatlığı için, bunun yerine ayarlanmış formunun kullanılması önerilir.

bu, açıklayıcı değişkenlerin sayısındaki artışla ilişkili bir ceza getirir. Biz alırız:

Bu nedenle, en iyisi, mümkün olan en yüksek değeri aldığı rakip modellerden biridir.

Rakip modelleri karşılaştırırken, tahmin aynı sayıda gözlem kullanılarak yapılırsa, modellerin değer bakımından karşılaştırılması, bu modelleri değer olarak karşılaştırmaya eşdeğerdir veya. Bu durumda, minimum değere (veya) sahip alternatif bir model seçilir.

Ayarlanmış belirleme katsayılarına ek olarak, birkaç alternatif modelden birini seçerken, Schwarz kriteri, Akaike kriteri, açıklayıcı değişkenleri arttırmak için "cezalandırma" gibi, ancak biraz farklı yöntemler kullanarak bilgi kriterleri kullanılır.

Akaike "sinformationcriterion-AIC. Bu kriteri kullanarak, gözlemlerden oluşturulan açıklayıcı faktörlere sahip doğrusal bir model, değer ile karşılaştırılır.

Artık kareler toplamı. Çünkü Açıklayıcı değişkenlerin sayısındaki artışla ilk terim azalır, ikinci terim artar, ardından alternatif modellerden en küçük değere sahip modeli seçeriz.Böylece artık kareler toplamı ve sayısı arasında bir uzlaşmaya varılır. açıklayıcı faktörler.

Schwarz "sinformationcriterion-SC, SIC. Bu kriteri kullanarak, gözlemlerden oluşturulan açıklayıcı faktörlere sahip doğrusal bir model, değer ile karşılaştırılır.

Ve burada, tıpkı Akaike kriterini kullanırken olduğu gibi, açıklayıcı faktörlerin sayısının artması, sağ tarafta birinci terimde azalmaya, ikincide de artışa yol açmaktadır. En düşük değere sahip model, eksiksiz ve indirgenmiş alternatif modellerden seçilir.

Ders 2. Korelasyon-regresyon analizi. İkili regresyon

1. Korelasyon-regresyon analizinin özü ve görevleri.

2. Regresyonun tanımı ve türleri.

3. Model spesifikasyonunun özellikleri. Rastgele bir değişkenin varlığının nedenleri.

4. Eşleştirilmiş regresyonu seçme yöntemleri.

5. En küçük kareler yöntemi.

6. İletişimin sıkılığını ve gücünü ölçmek için göstergeler.

7. İstatistiksel anlamlılık tahminleri.

8. y değişkeninin tahmin edilen değeri ve tahminin güven aralıkları.

1. Korelasyon-regresyon analizinin özü ve görevleri.Çok çeşitli olan ekonomik fenomenler, bu süreçlerin ve fenomenlerin belirli özelliklerini yansıtan ve birbirine bağlı değişikliklere tabi olan birçok özellikle karakterize edilir. Bazı durumlarda, özellikler arasındaki ilişkinin çok yakın olduğu ortaya çıkarken (örneğin, bir çalışanın saatlik üretimi ve ücreti), diğer durumlarda böyle bir ilişki hiç ifade edilmez veya aşırı derecede zayıftır (örneğin, cinsiyet öğrenci ve akademik performansları). Bu işaretler arasındaki bağlantı ne kadar yakınsa, alınan kararlar o kadar doğru olur.

Olgular ve işaretleri arasında iki tür bağımlılık vardır:

    işlevsel (deterministik, nedensel) bağımlılık ... Bir değişkenin her bir değerine başka bir değişkenin kesin olarak tanımlanmış bir değerini atayan bir formül biçiminde ayarlanır (bu durumda rastgele faktörlerin etkisi ihmal edilir). Diğer bir deyişle, işlevsel bağımlılık Bağımsız değişken x'in her bir değerinin, bağımlı değişken y'nin iyi tanımlanmış bir değerine karşılık geldiği bir ilişkidir. Ekonomide, değişkenler arasındaki işlevsel ilişkiler genel kuralın istisnalarıdır;

    istatistiksel (stokastik, deterministik olmayan) bağımlılık - bu, rastgele faktörlerin etkisinin üzerine bindirildiği bir değişken bağlantısıdır, yani. bağımsız değişken x'in her bir değerinin, bağımlı değişken y'nin bir dizi değerine karşılık geldiği bir ilişkidir ve y'nin hangi değeri alacağı önceden bilinmemektedir.

Korelasyon, istatistiksel bağımlılığın özel bir durumudur.

Korelasyon bağımlılığı Bağımsız değişken x'in her bir değerinin, bağımlı değişken y'nin belirli bir matematiksel beklentisine (ortalama değer) karşılık geldiği bir ilişkidir.

Korelasyon bağımlılığı, her bir vakada değil, yeterince büyük sayıda vaka için yalnızca ortalama değerlerde kendini gösteren "eksik" bir bağımlılıktır. Örneğin, bir çalışanın niteliklerinin iyileştirilmesinin işgücü verimliliğinde artışa yol açtığı bilinmektedir. Bu ifade genellikle pratikte doğrulanır, ancak benzer bir süreçle uğraşan aynı kategori / düzeydeki iki veya daha fazla işçinin aynı emek üretkenliğine sahip olacağı anlamına gelmez.

Korelasyon bağımlılığı, korelasyon ve regresyon analizi yöntemleri kullanılarak araştırılır.

Korelasyon-regresyon analizi değişkenler arasındaki sıkılığı, ilişkinin yönünü ve bu ilişkinin şeklini oluşturmanıza olanak sağlar, örn. analitik ifadesi.

Korelasyon analizinin ana görevi ikili bir ilişkideki iki işaret arasındaki ve çok faktörlü bir ilişkideki etkili ve birkaç faktör işareti arasındaki ilişkinin sıkılığının nicel olarak belirlenmesinden ve kurulan ilişkinin güvenilirliğinin istatistiksel bir değerlendirmesinden oluşur.

2. Regresyonun tanımı ve türleri.Regresyon analizi, ekonometride temel matematiksel ve istatistiksel araçtır. Regresyon herhangi bir niceliğin (y) ortalama değerinin başka bir niceliğe veya birkaç niceliklere (x i) bağımlılığını çağırmak gelenekseldir.

Regresyon denklemine dahil edilen faktörlerin sayısına bağlı olarak, basit (çiftli) ve çoklu regresyon arasında ayrım yapmak gelenekseldir.

Basit (ikili) regresyon bağımlı (açıklanan) değişken y'nin ortalama değerinin bağımsız (açıklayıcı) bir değişken x'in bir fonksiyonu olarak kabul edildiği bir modeldir. Örtük olarak, eşleştirilmiş regresyon, formun bir modelidir:

Açıkça:

,

burada a ve b, regresyon katsayılarının tahminleridir.

Çoklu regresyon bağımlı (açıklanan) değişken y'nin ortalama değerinin birkaç bağımsız (açıklayıcı) değişken x 1, x 2, ... x n'nin bir fonksiyonu olarak kabul edildiği bir modeldir. Örtük olarak, eşleştirilmiş regresyon, formun bir modelidir:

.

Açıkça:

nerede a ve b 1, b 2, b n - regresyon katsayılarının tahminleri.

Böyle bir modelin bir örneği, bir çalışanın ücretinin yaşına, eğitimine, niteliklerine, hizmet süresine, sektöre vb. Bağlı olmasıdır.

Bağımlılık biçimiyle ilgili olarak:

      doğrusal regresyon;

      doğrusal olmayan regresyon, faktörler arasında doğrusal olmayan ilişkilerin varlığını varsayarak, karşılık gelen doğrusal olmayan fonksiyonla ifade edilir. Görünüşte doğrusal olmayan modeller, genellikle doğrusal olarak sınıflandırılmalarına izin veren doğrusal bir biçime indirgenebilir.

3. Model spesifikasyonunun özellikleri. Rastgele bir değişkenin varlığının nedenleri.Herhangi bir ekonometrik çalışma şununla başlar: model özellikleri yani değişkenler arasındaki ilişkinin karşılık gelen teorisine dayalı olarak model tipinin formülasyonu ile.

Her şeyden önce, etkili işareti etkileyen tüm faktörlerden, en önemli etkileyen faktörleri ayırmak gerekir. Açıklayıcı değişken olarak kullanılan baskın bir faktör varsa ikili regresyon yeterlidir. Basit regresyon denklemi, iki değişken arasındaki ilişkiyi karakterize eder ve bu, kendisini yalnızca ortalama olarak bir dizi gözlem üzerinden belirli bir model olarak gösterir. Regresyon denkleminde korelasyon, karşılık gelen matematiksel fonksiyonla ifade edilen fonksiyonel bir bağımlılık olarak temsil edilir. Hemen hemen her durumda, y'nin değeri iki terimin toplamıdır:

,

burada y, etkin özelliğin gerçek değeridir;

- regresyon denklemi temelinde bulunan etkili göstergenin teorik değeri;

- etkili göstergenin gerçek değerinin teorik olandan sapmasını karakterize eden, regresyon denklemi tarafından bulunan rastgele bir değişken.

Rastgele değer kızgınlık olarak da adlandırılır. Modelde dikkate alınmayan faktörlerin etkisini, rastgele hataları ve ölçüm özelliklerini içerir. Modelde rastgele bir değişkenin varlığı üç kaynak tarafından oluşturulur:

    model Şartnamesi,

    ilk verilerin seçici niteliği,

    değişkenleri ölçme özellikleri.

Spesifikasyon hataları, yalnızca belirli bir matematiksel fonksiyonun yanlış seçimini değil, aynı zamanda regresyon denklemindeki herhangi bir önemli faktörün eksik tahminini de içerecektir (çoklu regresyon yerine ikili regresyon kullanarak).

Spesifikasyon hatalarının yanı sıra, örnekleme hataları da ortaya çıkabilir, çünkü araştırmacı özellikler arasında ilişkiler kurarken çoğunlukla örnek verilerle ilgilenir. Örnekleme hataları, bir kural olarak ekonomik süreçleri incelerken gerçekleşen ilk istatistiksel popülasyondaki verilerin heterojenliğinden de kaynaklanmaktadır. Popülasyon heterojen ise, regresyon denkleminin pratik bir anlamı yoktur. İyi bir sonuç elde etmek için, incelenen özelliklerin anormal değerlerine sahip birimler genellikle popülasyondan çıkarılır. Yine, regresyon sonuçları örnek özelliklerdir. İlk veri

Bununla birlikte, regresyon yöntemlerinin pratik kullanımındaki en büyük tehlike, ölçüm hataları ile temsil edilmektedir. Modelin şeklini değiştirerek (matematiksel bir formül biçimi) ve ilk veri miktarını artırarak hataları örnekleyerek spesifikasyon hataları azaltılabiliyorsa, ölçüm hataları, özellikler arasındaki ilişkiyi ölçmek için tüm çabaları pratik olarak geçersiz kılar.

4. Eşleştirilmiş regresyonu seçme yöntemleri.Ölçüm hatalarının en aza indirildiğini varsayarsak, ekonometrik araştırma model spesifikasyon hatalarına odaklanır. İkili regresyonda, matematiksel fonksiyon türünün seçimi
üç şekilde yapılabilir:

    grafik;

    analitik, yani incelenen ilişkinin teorisine dayanarak;

    deneysel.

İki işaret arasındaki ilişkiyi incelerken grafik yöntem regresyon denkleminin biçiminin seçimi oldukça açıklayıcıdır. Korelasyon alanına dayanmaktadır. İlişkilerin ölçülmesinde kullanılan ana eğri türleri




İki değişkenin ilişkisini açıklamak için matematiksel fonksiyonlar sınıfı oldukça geniştir; diğer eğri türleri de kullanılır.

Analitik metod regresyon denklemi türünün seçimi, incelenen özelliklerin ilişkisinin maddi doğasının incelenmesine ve ilişkinin doğasının görsel bir değerlendirmesine dayanır. Şunlar. Vergilendirmenin ilerleyişi ile bütçe gelirleri arasındaki ilişkiyi gösteren Laffer eğrisinden bahsediyorsak, o zaman parabolik bir eğriden bahsediyoruz ve mikroanalizde izokantlar hiperbollerdir.

5. En küçük kareler yöntemi.Doğrusal regresyon, ekonometride parametrelerinin net bir ekonomik yorumu açısından yaygın olarak kullanılmaktadır ve formun bir denklemini bulmaya indirgenmiştir:

,

burada x - açıklayıcı (bağımsız) değişken - rastgele olmayan değer;

y - açıklanmış (bağımlı) değer;

- rastgele üye (regresyon hatası);

 ve β denklemin parametreleridir.

Teorik değerler regresyon çizgisini temsil eder. Doğrusal regresyonun yapısı, denklemin a ve b parametrelerini tahmin etmeye indirgenmiştir.
.

Doğrusal regresyon parametresi tahminleri farklı şekillerde bulunabilir.

En küçük kareler yöntemi (OLS) - Doğrusal regresyon parametrelerini tahmin etmeye yönelik klasik yaklaşım.

Korelasyon alanına dönelim.

Grafikten parametre değerleri belirlenebilir. A parametresi, Oy ekseni ile regresyon çizgisinin kesişme noktasıdır ve b parametresi, regresyon çizgisinin eğimine göre tahmin edilir. burada dy, y faktörünün artışı ve dx, x faktörünün artışıdır.

OLS, hesaplanan (teorik) değerlerden etkili y özniteliğinin gerçek değerlerinin sapmalarının karelerinin toplamının olduğu a ve b parametrelerinin bu tür tahminlerinin elde edilmesine izin verir. en az:

Şunlar. regresyon doğrusu, noktalar ve bu çizgi arasındaki dikey mesafelerin karelerinin toplamı minimum olacak şekilde seçilir.

nerede
.

A ve b parametrelerinin her birine göre kısmi türevleri hesaplayalım.

Denklemlerin her iki tarafını n'ye böler ve her iki parametrenin hesaplanabileceği bir denklem sistemi elde ederiz.

LSM'den, b parametresini bulmak için iki başka formül elde edilebilir:

1.

2.
veya

A parametresi her durumda aynı şekilde tahmin edilir:

.

Parametre b, regresyon katsayısı olarak adlandırılır ve x değişkeni 1 birim artırıldığında y değişkeninin ortalama kaç birim değişeceğini gösterir. Regresyon katsayısındaki işaret, ilişkinin yönünü gösterir: b'de< 0 – связь обратная, при b > 0 - doğrudan bağlantı.

A parametresi resmi olarak x \u003d 0'daki y'nin değeridir. X'in sıfır değeri yoksa veya olamıyorsa, a'nın anlamı yoktur. Ekonomik bir anlam ifade etmeyebilir. Bir<0 экономическая интерпретация может оказаться абсурдной.

Bir parametrenin işaretini yorumlayabilirsiniz. A\u003e 0 ise, sonuçtaki göreceli değişiklik faktördeki değişiklikten daha yavaştır. Eğer bir<0, то изменение результата опережает изменение фактора.

6. Sızdırmazlık ve bağlantı mukavemetinin ölçüm göstergeleri... Regresyon denklemi her zaman ilişkinin sıkılığının bir göstergesi ile desteklenir.

Eşleştirilmiş regresyonun kalitesi, eşleştirilmiş doğrusal korelasyon katsayısı kullanılarak belirlenir:

veya

,

nerede
,

- x ve y değerleri kümesindeki değerlerin yayılmasını gösteren standart sapmalar. Standart sapmanın büyük bir değeri, kümenin ortalama değeriyle birlikte sunulan kümede büyük bir değer yayılımını gösterir; buna göre küçük bir değer, kümedeki değerlerin ortalama etrafında gruplandığını gösterir.

Doğrusal korelasyon katsayısı şu değerdedir:

1 < < 1.

Korelasyon katsayısı pozitifse (Şekil A), özellikler arasındaki ilişki doğrudandır, yani. x arttıkça (azaldıkça), y özelliği artar (azalır). Korelasyon katsayısı negatifse (Şekil B), özellikler arasındaki ilişki tersidir, yani. x'te bir artış (azalma) ile y özelliği azalır (artar).

Korelasyon katsayısı 1'e ne kadar yakınsa, ilişki o kadar yakın (Şekil B), 0'a o kadar yakın, daha zayıf (Şekil A).

0 ise< || <0,3, то связь между признаками практически отсутствует,

eğer 0.3< || <0,5, то связь слабая,

0,5 ise< || <0,7, то связь умеренная,

0,7 ise< || <1, то связь сильная.

Ve son olarak, r \u003d 0'da doğrusal bir korelasyon yoktur. Bu durumda, regresyon çizgisi Ox eksenine paraleldir.

Doğrusal korelasyon katsayısının değerinin, dikkate alınan özelliklerin doğrusal formundaki ilişkisinin yakınlığını tahmin ettiği unutulmamalıdır. Bu nedenle, korelasyon katsayısının mutlak değerinin sıfıra yakın olması, özellikler arasında bağlantı olmadığı anlamına gelmez. Farklı bir model spesifikasyonuyla, özellikler arasındaki ilişki oldukça yakın olabilir.

Doğrusal bir fonksiyona uymanın kalitesini değerlendirmek için doğrusal korelasyon katsayısının karesi hesaplanır R 2 aranan determinasyon katsayısı ... Etkili özelliğin toplam varyansında regresyon ile açıklanan etkili özellik y varyansının oranını karakterize eder.

Buna göre 1 - R 2 modelde dikkate alınmayan diğer faktörlerin etkisinin neden olduğu varyans oranını karakterize eder.

Tanımı gereği R 2 0 ile 1 arasındaki değerleri alır, yani

0 ≤ R 2 ≤ 1.

Eğer bir R 2 \u003d 0 ise bu, regresyonun hiçbir şey vermediği anlamına gelir, yani x, önemsiz tahminle karşılaştırıldığında y tahmininin kalitesini iyileştirmez
.

Başka bir aşırı seçenek R 2 \u003d 1, modelin tam uyumu anlamına gelir: tüm gözlem noktaları regresyon doğrusu üzerindedir (tümü \u003d 0). Daha yakın R 2 1'e kadar, modeli takma kalitesi ne kadar iyi ve o kadar doğru .

Regresyon parametresi b, x değişkenindeki 1 birim artışla y değişkeninin ortalama kaç birim değişeceğini gösterse de, faktör özelliğinin etkin olan üzerindeki etkisini doğrudan değerlendirmek için kullanılamaz. çalışılan göstergelerin ölçü birimleri. Bu amaçlar için kullanın esneklik katsayısı ... Esneklik katsayısı, faktör özniteliği x% 1 değiştiğinde etkin özniteliğin yüzde kaçının değiştiğini gösterir ve aşağıdaki formülle hesaplanır:

,

nerede
- Sonuçtaki kazançların oranını ve karşılık gelen iletişim biçimi için faktörü karakterize eden ilk türev.

Doğrusal bir fonksiyon için esneklik katsayısının sabit bir değer olmaması, ancak karşılık gelen x değerine bağlı olması nedeniyle, ortalama esneklik katsayısı genellikle hesaplanır:

.

Ekonometride esneklik katsayılarının geniş kullanımına rağmen, hesaplamalarının ekonomik mantıklı olmadığı durumlar vardır. Bu, söz konusu özellikler için, değerlerdeki değişimi yüzde olarak belirlemenin anlamsız olduğu durumlarda olur (örneğin, toprağın kalitesi% 1 artarsa, buğdayın verimi yüzde kaç değişir).

Birkaç Matematiksel Fonksiyon için Esneklik Katsayıları

7. İstatistiksel anlamlılık tahminleri.Regresyon denklemi bulunduktan sonra, hem bir bütün olarak denklemin hem de tek tek parametrelerinin önemi değerlendirilir.

Denklemin bir bütün olarak öneminin tahmini. Regresyon denkleminin bir bütün olarak öneminin değerlendirilmesi, Fisher'in F kriteri kullanılarak verilir ve belirleme katsayısının elde edilen değerinin bulunmasına hizmet eder.
tesadüf değil, yani değişkenler arasındaki ilişkiyi ifade eden matematiksel modelin deneysel verilere karşılık gelip gelmediği ve denklemde yer alan açıklayıcı değişkenlerin (bir veya daha fazla) bağımlı değişkeni tanımlamak için yeterli olup olmadığı.

İkili doğrusal regresyonda, regresyon ve korelasyon katsayılarının önemi hakkındaki hipotezleri test etmek, lineer regresyon denkleminin önemi hakkındaki hipotezi test etmekle eş değerdir.

Bir bütün olarak regresyon denkleminin önemini test etmek için Fisher's F-testi kullanılır. Çiftli doğrusal regresyon durumunda, regresyon modelinin önemi aşağıdaki formül kullanılarak test edilir:

,

m, açıklayıcı faktör işaretlerinin sayısıdır, yani. x.

Gözlenen değerler tablo değerleriyle karşılaştırılır.

,

α, güven aralığına karşılık gelen anlamlılık düzeyidir;

Belirli bir anlamlılık düzeyinde F obs\u003e F crit, o zaman model önemli kabul edilir, değerlendirilen özelliklerin rastgele doğası hakkındaki hipotez reddedilir ve istatistiksel önemi ve güvenilirliği kabul edilir.

Eğer F gözlem

Regresyon denklemini tahmin etmenin standart hatası. OLS bize en az varyasyonu sağlayan bir regresyon çizgisi verse de, tüm gözlemler regresyon çizgisiyle eşleşmez. Bu nedenle, y'nin gerçek değerlerinin tahmin edilen değerlerden değişiminin istatistiksel bir ölçüsü gereklidir. ... Regresyon çizgisine göre varyasyon ölçüsü denir standart tahmin hatası .

Tahminin standart hatası şu şekilde tanımlanır:

,

burada y, bağımsız değişkenin verilen değerleri için bağımlı değişkenin gerçek değerleridir;

- bağımsız değişkenin verilen değerleri için bağımlı değişkenin teorik / tahmin edilen değerleri;

m, açıklayıcı değişkenlerin sayısıdır x.

Bu katsayı, regresyon çizgisi etrafındaki gerçek verilerdeki değişim ölçüsünü karakterize eder.

Parametrelerin önemini kontrol etmek. Ek olarak, regresyon parametrelerinin önemi kontrol edilir. Bireysel regresyon katsayılarının parametrelerinin önemini kontrol etmek, her regresyon katsayısının sıfıra eşit olduğu hipotezini test ederek Student t-testi kullanılarak gerçekleştirilir. Bu durumda parametrelerden elde edilen değerlerin rastgele değişkenlerin etkisinin sonucu olup olmadığı öğrenilir.

Regresyon katsayılarının önemi, aşağıdaki formüller kullanılarak kontrol edilir. B katsayısı için:

,

burada S b, b katsayısının standart hatasıdır ve bu da şu şekilde tanımlanır:

.

A katsayısı için benzer şekilde:

,

burada S a, serbest terimin standart hatasıdır ve ayrıca aşağıdaki formülle bulunur:

.

T-testinin hesaplanan değerleri, kriterin tablo değeri ile karşılaştırılır. burada k \u003d n - m - 1 serbestlik derecesi ve karşılık gelen önem seviyesi α.

T kriterinin hesaplanan değeri tablo değerini aşarsa, o zaman parametre önemli kabul edilir, yani. yanlışlıkla bulunmaz.

8. y değişkeninin tahmin edilen değeri ve tahminin güven aralıkları.Nokta tahmini, regresyon denklemine ikame ile belirlenen tahmini Y * değerinin elde edilmesinden oluşur.
karşılık gelen tahmini değer X *:

.

Bir nokta tahminini gerçekleştirme olasılığı pratikte sıfırdır, bu nedenle tahmin güven aralığı daha yüksek güvenilirlikle hesaplanır.

Aralık tahmini, tahmin için bir güven aralığı oluşturmayı içerir, yani alt ve üst - belirli bir olasılıkla öngörülen Y * değeri için kesin değeri içeren aralığın minimum ve maksimum olası sınırları, yani:

Min

Tahmin için güven aralıkları aşağıdaki formüllerle belirlenir:

nerede
Eşleştirilmiş regresyon için standart tahmin hatasıdır.

Regresyon katsayıları için güven aralıkları şu şekilde tanımlanır:

Ekonometrik çalışmalardaki regresyon katsayısının net bir ekonomik yorumu olduğundan, regresyon katsayısı aralığının güven sınırları çelişkili sonuçlar içermemelidir, örneğin, -10b40 - bu tür bir kayıt, gerçek değerin regresyon katsayısı eşzamanlı olarak pozitif ve negatif değerleri ve hatta sıfırı içerir ki bu olamaz. Daha sonra parametre sıfıra eşit alınır.

Parametrelerin hesaplanması ve regresyon modellerinin oluşturulması

Korelasyon analizi

Amacı tanımlamaktır bağlantının doğası(ileri, geri) ve bağlanma kuvveti (bağlantı yok, bağlantı zayıf, orta, göze çarpan, güçlü, çok güçlü, tam bağlantı). Korelasyon analizi, önemli faktörleri seçmek ve regresyon denklemlerinin parametrelerini hesaplamak için etkili bir sıra planlamak için kullanılan ilişkinin doğası ve ciddiyeti (korelasyon katsayısı) hakkında bilgi oluşturur. Bir faktörle, korelasyon katsayısı hesaplanır ve birkaç faktörün varlığında, iki tür ilişkinin açıklığa kavuşturulduğu bir korelasyon matrisi oluşturulur: (1) bağımlı değişkenin bağımsız değişkenlerle ilişkisi, ( 2) bağımsız olanların kendi aralarındaki ilişki.

Matrisin dikkate alınması, öncelikle, faktörleri belirle araştırılan bağımlı değişkeni gerçekten etkilemek ve bunları azalan ilişki sırasına göre oluşturmak (sıralamak); İkincisi, faktör sayısını en aza indirin modelde, güçlü veya işlevsel olarak diğer faktörlerle ilişkili bazı faktörleri hariç tutarak (bağımsız değişkenlerin birbirleriyle olan ilişkilerinden bahsediyoruz).

Pratikte en güvenilir olanının bir ve iki faktörlü modeller olduğu bilinmektedir.

İki faktörün birbiriyle güçlü veya tam bir ilişkisi olduğu tespit edilirse, bunlardan birini regresyon denklemine dahil etmek yeterli olacaktır.

Burada en iyisini bulmaya çalışıyorlar kesin ölçü Tanımlanan ilişki, tahmin edebilmek için, bağımsız büyüklükler X 1'in değerleri biliniyorsa, bağımlı büyüklük Y'nin değerlerini tahmin eder, X 2, .... X n

Bu ölçü genellikle doğrusal çoklu regresyon bağımlılığının matematiksel bir modeli ile ifade edilir:

Y \u003d bir 0 + b 1 X 1 + b 2 X 2 + ... + b n X n

Bilgisayar, modelin parametrelerini hesaplar: serbest terim a 0 (sabit veya kesişim) ve katsayılar b p (regresyon katsayıları). Miktar -de yanıt olarak adlandırılır ve X 1, X 2, ..., X n - faktörler veya yordayıcılar.

Denklemin her bir versiyonunu elde ettikten sonra, temel amaç en yüksek anlamlı denklemi elde etmek olduğundan, zorunlu bir prosedür onun istatistiksel önemini değerlendirmektir. Ancak hesaplamaların bilgisayar tarafından yapılması ve araştırmacının denklemin öneminin değerlendirilmesine dayanarak karar vermesi (denklemi kabul et ya da at) nedeniyle bu insan-makine teknolojisinin üçüncü aşaması olabilir. geleneksel olarak akıllı bir makine olmayan aşama olarak ayırt edilir; neredeyse hepsi Denklemin öneminin değerlendirilmesine ilişkin veriler bir bilgisayar tarafından hazırlanır.

İstatistiksel anlamlılık, yani, kabul edilen modelin yanıt değerlerini tahmin etmede kullanım için uygunluğu. Elde edilen modelin kalitesini değerlendirmek için, program ayrıca araştırmacının dikkate alması gereken bir dizi katsayı hesapladı, bunları bilinen istatistiksel kriterlerle karşılaştırdı ve modeli sağduyu açısından değerlendirdi.



Bu aşamada, regresyonun öneminin belirlenme katsayısı ve F kriteri son derece önemli bir rol oynar.

R kare (R 2) - belirleme katsayısı - gözlemlenen değer arasındaki çoklu korelasyon katsayısının karesidir Y ve teorik değeri, belirli faktörlere sahip bir model temelinde hesaplanır. Belirleme katsayısı modelin geçerliliğini ölçer. 0 ile 1 arasında değişebilir. Bu değer özellikle bir dizi farklı modeli karşılaştırmak ve en iyi modeli seçmek için kullanışlıdır.

R2, modele dahil edilen faktörlerle açıklanan, Y'nin gözlemlenen değerlerine göre tahmin edilen (teorik) Y değerinin varyasyonunun oranıdır. Eğer çok iyi R 2\u003e \u003d % 80. Y'nin teorik değerlerinin geri kalanı, modelde yer almayan diğer faktörlere bağlıdır. Araştırmacının görevi, artan faktörleri bulmaktır. R 2, k İdeal denklemi elde etmek için tahmin değişimlerini açıklar. Ancak katsayı R 2 faktörlerin tüm değerleri farklı olduğunda en fazla 1 (veya% 100) değerine ulaşabilir. Verilerde tekrarlanan deneyler varsa, değer R 2 model ne kadar iyi olursa olsun 1'e ulaşamaz. Bu nedenle, regresyon hesaplamasına başlamadan önce orijinal tablodan yinelenen veriler çıkarılmalıdır. Bazı yazılım paketleri, yalnızca benzersiz veriler bırakarak kopyayı otomatik olarak kaldırır. Aynı verilerin tekrarlanması, model tahminlerinin güvenilirliğini azaltır. R 2 \u003d 1 sadece deneysel (gözlemlenen) ve teorik (hesaplanan) veriler tam uyum içindeyse, yani teorik değerler gözlemlenenlerle tam olarak örtüştüğünde. Ancak, bu pek olası olmayan bir olay olarak kabul edilir.

Regresyon analizi aracılığıyla, dahil. Excel, hesaplandı Bir bütün olarak denklem için regresyonun öneminin F testi. Gözlemlenen verilerden hesaplanan bu değer Fp (F hesaplanır, gözlemlenir) karşılık gelen kritik Fk değeri ile karşılaştırılmalıdır, (F kritik, tablo) (bkz. Ek A). Araştırmacı, belirli bir olasılık düzeyinde (modelin parametrelerinin hesaplandığı, örneğin% 95) yayınlanmış istatistiksel tablolardan Fk'yi seçer.

Gözlenen değer Fp Fk kritik değerinden daha küçük olduğu ortaya çıktığında, denklem önemli olarak kabul edilemez. Diğer terminolojide, aynı şey söylenebilir: varsayılan modeldeki tüm regresyon katsayılarının önemi ile ilgili sıfır hipotezi reddedilmez, yani katsayılar pratik olarak sıfırdır.

Hesaplanan veriler tam olarak yorumlanmazsa, elektronik korelasyon ve regresyon analizi teknolojisi tamamen işe yaramaz hale gelir.

Elde edilen model istatistiksel olarak önemliyse, tahmin (tahmin), kontrol veya açıklama için kullanılır.

Önemsizlik bulunursa, aranması gereken başka bir bağlantı türünün doğru olacağı varsayılarak model reddedilir.