Bir regresyon grafiği nasıl oluşturulur. Basit Doğrusal Regresyon

  • 21.09.2019

AT mükemmel lineer bir regresyon (ve hatta lineer olmayan regresyonların ana türleri bile, aşağıya bakınız) çizmenin daha da hızlı ve daha uygun bir yolu vardır. Bu şu şekilde yapılabilir:

1) veri içeren sütunları seçin X ve Y(bu sırayla olmalılar!);

2) aramak Grafik Sihirbazı ve bir grupta seçin Bir çeşitnoktalı ve hemen basın Hazır;

3) diyagramın seçimini kaldırmadan görünen ana menü öğesini seçin Diyagram, öğeyi seçmeniz gereken Trend çizgisi ekle;

4) görünen iletişim kutusunda eğilim çizgisi sekme Bir çeşit Seç Doğrusal;

5) sekmesi Seçenekler anahtarı etkinleştirilebilir Denklemi grafikte göster katsayıların (4.5) hesaplanacağı lineer regresyon denklemini (4.4) görmenizi sağlayacaktır.

6) Aynı sekmede anahtarı etkinleştirebilirsiniz Yaklaşık güvenin (R^2) değerini diyagrama koyun. Bu değer korelasyon katsayısının (4.3) karesidir ve hesaplanan denklemin deneysel bağımlılığı ne kadar iyi tanımladığını gösterir. Eğer bir R 2 birliğe yakındır, o zaman teorik regresyon denklemi deneysel bağımlılığı iyi tanımlar (teori deneyle iyi uyum sağlar) ve eğer R 2 sıfıra yakınsa, bu denklem deneysel bağımlılığı tanımlamak için uygun değildir (teori deneyle aynı fikirde değildir).

Açıklanan eylemleri gerçekleştirmenin bir sonucu olarak, bir regresyon grafiği ve denklemi içeren bir diyagram elde edeceksiniz.

§4.3. Doğrusal olmayan regresyonun ana türleri

Parabolik ve polinom regresyon.

Parabolik değerin bağımlılığı Y değerden X ikinci dereceden bir fonksiyon tarafından ifade edilen bağımlılığa (2. dereceden parabol) denir:

Bu denklem denir parabolik regresyon Yüzerinde X. Seçenekler a, b, İle birlikte aranan parabolik regresyon katsayıları. Parabolik regresyon katsayılarının hesaplanması her zaman zahmetlidir, bu nedenle hesaplamalar için bir bilgisayar kullanılması önerilir.

Parabolik regresyonun (4.8) denklemi, polinom adı verilen daha genel bir regresyonun özel bir halidir. polinom değerin bağımlılığı Y değerden X polinom tarafından ifade edilen bağımlılık denir n-inci sıra:

sayılar nerede bir ben (i=0,1,…, n) arandı polinom regresyon katsayıları.

Güç regresyonu.

Güç değerin bağımlılığı Y değerden X formun bağımlılığı denir:

Bu denklem denir güç regresyon denklemi Yüzerinde X. Seçenekler a ve b aranan güç regresyon katsayıları.

ln=ln a+b içinde x. (4.11)

Bu denklem, düzlemde logaritmik koordinat eksenleri ln olan düz bir çizgiyi tanımlar. x ve ln. Bu nedenle, güç regresyonunun uygulanabilirliği için kriter, ampirik verilerin logaritmalarının noktalarının ln olması şartıdır. x ben ve ln i düz çizgiye (4.11) en yakın olanlardır.

üstel regresyon.

örnek(veya üstel) miktarın bağımlılığı Y değerden X formun bağımlılığı denir:

(veya ). (4.12)

Bu denklem denir üstel denklem(veya üstel) regresyon Yüzerinde X. Seçenekler a(veya k) ve b aranan üstel(veya üstel) gerileme.

Güç regresyon denkleminin her iki tarafının logaritmasını alırsak, denklemi elde ederiz.

ln = x içinde a+ln b(veya ln = kx+ln b). (4.13)

Bu denklem, bir ln niceliğinin logaritmasının başka bir niceliğe lineer bağımlılığını tanımlar. x. Bu nedenle, güç regresyonunun uygulanabilirliği için kriter, aynı büyüklükteki ampirik veri noktalarının gerekliliğidir. x ben ve başka bir ln değerinin logaritmaları i düz çizgiye en yakındı (4.13).

logaritmik regresyon.

Logaritmik değerin bağımlılığı Y değerden X formun bağımlılığı denir:

=a+b içinde x. (4.14)

Bu denklem denir logaritmik regresyon Yüzerinde X. Seçenekler a ve b aranan logaritmik regresyon katsayıları.

hiperbolik regresyon.

hiperbolik değerin bağımlılığı Y değerden X formun bağımlılığı denir:

Bu denklem denir hiperbolik regresyon denklemi Yüzerinde X. Seçenekler a ve b aranan hiperbolik regresyon katsayıları ve en küçük kareler yöntemi ile belirlenir. Bu yöntemin uygulanması aşağıdaki formüllere yol açar:

Formüllerde (4.16-4.17), toplama indeks üzerinden yapılır. i birden gözlem sayısına n.

Ne yazık ki, içinde mükemmel hiperbolik regresyon katsayılarını hesaplayan bir fonksiyon yoktur. Ölçülen değerlerin ters orantılı olarak ilişkili olduğunun kesin olarak bilinmediği durumlarda, hiperbolik regresyon denklemi yerine güç regresyon denkleminin aranması önerilir, bu nedenle mükemmel bulmak için bir prosedür var. Ölçülen değerler arasında hiperbolik bir bağımlılık varsayılırsa, yardımcı hesaplama tabloları ve formüller (4.16-4.17) kullanılarak toplama işlemleri kullanılarak regresyon katsayılarının hesaplanması gerekecektir.

Bence bir öğrenci olarak ekonometri, üniversitemin duvarları içinde tanımayı başardığım tüm bilimlerin en uygulamalı bilimlerinden biridir. Onun yardımıyla, gerçekten de, uygulamalı sorunları kurumsal ölçekte çözmek mümkündür. Bu çözümlerin ne kadar etkili olacağı üçüncü sorudur. Sonuç olarak, bilginin çoğu teori olarak kalacak, ancak ekonometri ve regresyon analizi hala özel bir dikkatle çalışmaya değer.

Gerilemeyi ne açıklar?

MS Excel'in bu sorunları çözmemize izin veren işlevlerini incelemeye başlamadan önce, regresyon analizinin özünde ne olduğunu size parmak uçlarınızla açıklamak istiyorum. Böylece sınava girmeniz daha kolay olacak ve en önemlisi konuyu incelemek daha ilgi çekici olacaktır.

Umarım, matematikten bir fonksiyon kavramına aşinasınızdır. Fonksiyon, iki değişken arasındaki ilişkidir. Bir değişken değiştiğinde, diğerine bir şey olur. Sırasıyla X ve Y değişikliklerini değiştiririz. Fonksiyonlar çeşitli yasaları tanımlar. Fonksiyonu bilerek, X için isteğe bağlı değerleri değiştirebilir ve Y'nin nasıl değiştiğini görebiliriz.

Bu çok önemlidir, çünkü regresyon, görünüşte sistematik olmayan ve kaotik süreçleri belirli bir işlevin yardımıyla açıklama girişimidir. Yani örneğin Rusya'da dolar kuru ile işsizlik arasındaki ilişkiyi ortaya koymak mümkün.

Bu örüntü tespit edilebilirse, o zaman hesaplamalar sırasında elde ettiğimiz fonksiyona göre, doların ruble karşısında N'inci döviz kurunda işsizlik oranının ne olacağını tahmin edebileceğiz.
Bu ilişki korelasyon olarak adlandırılacaktır. Regresyon analizi, dikkate aldığımız değişkenler (dolar kuru ve iş sayısı) arasındaki ilişkinin sıkılığını açıklayacak olan korelasyon katsayısının hesaplanmasını içerir.

Bu katsayı pozitif veya negatif olabilir. Değerleri -1 ile 1 arasında değişmektedir. Buna göre yüksek bir negatif veya pozitif korelasyon gözlemleyebiliriz. Olumlu ise, dolardaki artışı yeni işlerin ortaya çıkması izleyecektir. Negatif ise, döviz kurundaki artışı işlerde bir azalma takip edecektir.

Regresyon birkaç çeşittir. Doğrusal, parabolik, üstel, üstel vb. olabilir. Hangi regresyonun bizim durumumuza özel olarak karşılık geleceğine, hangi modelin korelasyonumuza mümkün olduğunca yakın olacağına bağlı olarak model seçimini yapıyoruz. Sorunun örneği üzerinde düşünelim ve MS Excel'de çözelim.

MS Excel'de doğrusal regresyon

Doğrusal regresyon problemlerini çözmek için Veri Analizi işlevine ihtiyacınız vardır. Sizin için etkinleştirilmemiş olabilir, bu nedenle etkinleştirmeniz gerekir.

  • "Dosya" düğmesine tıklayın;
  • "Seçenekler" öğesini seçin;
  • Sol taraftaki "Eklentiler" sondan bir önceki sekmeye tıklayın;



  • Aşağıda "Yönetim" yazısını ve "Git" düğmesini göreceğiz. Üzerine basıyoruz;
  • "Analiz Paketi"ne bir onay işareti koyun;
  • "Tamam" a basıyoruz.



Görev örneği

Toplu analiz işlevi etkinleştirilir. Aşağıdaki problemi çözelim. İşletmenin topraklarındaki acil durumların sayısı ve istihdam edilen işçi sayısı hakkında birkaç yıla ait bir veri örneğine sahibiz. Bu iki değişken arasındaki ilişkiyi tanımlamamız gerekiyor. Çalışan sayısı olan X açıklayıcı değişkeni ve acil durum sayısı olan Y açıklayıcı değişkeni vardır. İlk verileri iki sütuna dağıtalım.

"Veri" sekmesine gidin ve "Veri Analizi" ni seçin

Görünen listeden "Regresyon"u seçin. Y ve X giriş aralıklarında uygun değerleri seçin.

"Tamam" a basıyoruz. Analiz yapıldı ve yeni sayfada sonuçları göreceğiz.

Bizim için en önemli değerler aşağıdaki şekilde işaretlenmiştir.

Çoklu R, belirleme katsayısıdır. Karmaşık bir hesaplama formülüne sahiptir ve korelasyon katsayılarımıza ne kadar güvenebileceğimizi gösterir. Buna göre, bu değer ne kadar büyük olursa, güven o kadar büyük olur, modelimiz bir bütün olarak o kadar başarılı olur.

Y-Kesme ve X1 Kesişme, regresyonumuzun katsayılarıdır. Daha önce de belirtildiği gibi, regresyon bir fonksiyondur ve belirli katsayıları vardır. Böylece fonksiyonumuz şöyle görünecektir: Y = 0.64 * X-2.84.

Bize ne veriyor? Bu bize bir tahmin yapma fırsatı verir. Diyelim ki bir işletme için 25 kişiyi işe almak istiyoruz ve acil durum sayısının ne kadar olacağını kabaca hayal etmemiz gerekiyor. Bu değeri fonksiyonumuzun yerine koyarız ve Y = 0.64 * 25 - 2.84 sonucunu alırız. Yaklaşık 13 olağanüstü hal yaşanacak.

Nasıl çalıştığını görelim. Aşağıdaki resme bir göz atın. İlgili çalışanlar için gerçek değerler, elde ettiğimiz fonksiyona ikame edilir. Değerlerin gerçek oyunculara ne kadar yakın olduğunu görün.

Ayrıca y ve x alanını vurgulayarak, "ekle" sekmesine tıklayarak ve dağılım grafiğini seçerek bir korelasyon alanı oluşturabilirsiniz.

Noktalar dağınıktır ancak genellikle ortada düz bir çizgi varmış gibi yukarı doğru hareket eder. Ayrıca bu satırı MS Excel'de "Düzen" sekmesine gidip "Trend Çizgisi" öğesini seçerek de ekleyebilirsiniz.

Görünen satıra çift tıklayın ve daha önce ne söylendiğini göreceksiniz. İlişki alanınızın nasıl göründüğüne bağlı olarak regresyon türünü değiştirebilirsiniz.

Noktaların düz bir çizgi yerine bir parabol çizdiğini görebilirsiniz ve farklı bir regresyon türü seçmeniz daha iyi olabilir.


Çözüm

Umarım, bu makale size regresyon analizinin ne olduğunu ve ne için olduğunu daha iyi anlamıştır. Bütün bunlar büyük pratik öneme sahiptir.

Regresyon çizgisi, fenomenler arasındaki ilişkinin grafiksel bir yansımasıdır. Excel'de kolayca bir regresyon çizgisi oluşturabilirsiniz.

Bunun için ihtiyacınız olan:

1.Excel programını açın

2. Verilerle sütunlar oluşturun. Örneğimizde, birinci sınıf öğrencilerinde saldırganlık ve kendinden şüphe duyma arasında bir regresyon çizgisi veya ilişki kuracağız. Deney 30 çocuğu içeriyordu, veriler Excel tablosunda sunuldu:

1 sütun - konunun numarası

2 sütun - saldırganlık puan olarak

3 sütun - özgüven eksikliği puan olarak

3. Ardından her iki sütunu da seçmeniz gerekir (sütun adı olmadan), sekmeye basın sokmak , Seç puan ve önerilen düzenlerden ilkini seçin işaretli nokta .

4. Böylece regresyon çizgisi için bir boşluk elde ettik - sözde - dağılım grafiği. Regresyon çizgisine gitmek için ortaya çıkan şekle tıklamanız, sekmeye tıklamanız gerekir. yapıcı, panelde bul grafik düzenleri ve Seç M a ket9 , ayrıca diyor f(x)

5. Yani, bir regresyon çizgimiz var. Grafik ayrıca denklemini ve korelasyon katsayısının karesini de gösterir.

6. Grafiğin adını, eksenlerin adını eklemek için kalır. Ayrıca istenirse göstergeyi kaldırabilir, yatay ızgara çizgilerinin sayısını azaltabilirsiniz (sekme Yerleşim , sonra Kafes ). Ana değişiklikler ve ayarlar sekmede yapılır Düzen

Regresyon çizgisi MS Excel'de oluşturulmuştur. Artık eserin metnine eklenebilir.

28 Ekim

İyi günler, sevgili blog okuyucuları! Bugün lineer olmayan regresyonlardan bahsedeceğiz. Doğrusal regresyonların çözümü LINK'te görüntülenebilir.

Bu yöntem esas olarak ekonomik modelleme ve tahminde kullanılır. Amacı, iki gösterge arasındaki ilişkiyi gözlemlemek ve belirlemektir.

Doğrusal olmayan regresyonların ana türleri şunlardır:

  • polinom (kuadratik, kübik);
  • hiperbolik;
  • güç;
  • gösteri;
  • logaritmik.

Çeşitli kombinasyonlar da kullanılabilir. Örneğin bankacılık, sigortacılık, demografik çalışmalarda zaman serisi analitiği için bir tür logaritmik regresyon olan Gompzer eğrisi kullanılır.

Doğrusal olmayan regresyonları kullanarak tahmin yaparken asıl mesele, iki parametre arasında yakın bir ilişki olup olmadığını bize gösterecek olan korelasyon katsayısını bulmaktır. Kural olarak, korelasyon katsayısı 1'e yakınsa, o zaman bir bağlantı vardır ve tahmin oldukça doğru olacaktır. Doğrusal olmayan regresyonların bir diğer önemli unsuru, ortalama bağıl hatadır ( ANCAK ) aralığında ise<8…10%, значит модель достаточно точна.

Bu konuda belki teorik bloğu bitirip pratik hesaplamalara geçeceğiz.

15 yıllık bir dönem için araba satış tablomuz var (X olarak gösterelim), ölçüm adımlarının sayısı n argümanı olacak, bu dönemler için de gelirimiz var (Y ile gösterelim), tahmin etmemiz gerekiyor gelecekte gelir ne olacak. Aşağıdaki tabloyu oluşturalım:

Çalışma için şu denklemi çözmemiz gerekiyor (Y'nin X'e bağımlılığı): y=ax 2 +bx+c+e. Bu bir çift ikinci dereceden regresyondur. Bu durumda, bilinmeyen argümanları bulmak için en küçük kareler yöntemini uygularız - a, b, c. Formun bir cebirsel denklem sistemine yol açacaktır:

Bu sistemi çözmek için örneğin Cramer yöntemini kullanıyoruz. Sisteme dahil edilen toplamların bilinmeyenlerin katsayıları olduğunu görüyoruz. Bunları hesaplamak için tabloya birkaç sütun (D, E, F, G, H) ekleriz ve bunları hesaplamaların anlamına göre imzalarız - D sütununda x'in karesini, E'de bir küpün içine, F'de 4. güç, G'de x ve y göstergelerini çarparız, H'de x'i kareleriz ve y ile çarparız.

Denklemi çözmek için gerekli olanlarla doldurulmuş formun bir tablosunu ortaya çıkaracaktır.

bir matris oluşturalım A denklemlerin sol tarafında bilinmeyenler için katsayılardan oluşan bir sistem. A22 hücresine koyalım ve adını verelim" bir=". Regresyonu çözmek için seçtiğimiz denklem sistemini takip ediyoruz.

Yani, B21 hücresinde, X göstergesini dördüncü güce yükselttiğimiz sütunun toplamını yerleştirmeliyiz - F17. Sadece hücreye atıfta bulunalım - "=F17". Sonra, X'in küp olduğu sütunun toplamına ihtiyacımız var - E17, sonra kesinlikle sisteme göre gidiyoruz. Bu nedenle, matrisin tamamını doldurmamız gerekecek.

Cramer'in algoritmasına göre, A'ya benzer bir A1 matrisi toplayacağız, ilk sütunun elemanları yerine, sistemin denklemlerinin sağ kısımlarının elemanlarının yerleştirilmesi gerekir. Yani, X sütununun karesi çarpı Y'nin toplamı, XY sütununun toplamı ve Y sütununun toplamı.

Ayrıca iki matrise daha ihtiyacımız olacak - ikinci ve üçüncü sütunların denklemlerin sağ taraflarının katsayılarından oluşacağı A2 ve A3 diyelim. Resim bu şekilde olacak.

Seçilen algoritmanın ardından elde edilen matrislerin determinantlarının (determinant, D) değerlerini hesaplamamız gerekecek. MOPRED formülünü kullanalım. Sonuçlar J21:K24 hücrelerine yerleştirilecektir.

Formüle göre karşılık gelen belirleyicilerin karşısındaki hücrelerde Cramer'e göre denklemin katsayılarını hesaplayacağız: a(M22 hücresinde) - "=K22/K21"; b(M23 hücresinde) — "=K23/K21"; İle birlikte(M24 hücresinde) - "=K24 / K21".

İstediğimiz çift ikinci dereceden regresyon denklemini elde ederiz:

y=-0.074x2 +2.151x+6.523

Doğrusal ilişkinin sıkılığını korelasyon indeksi ile tahmin edelim.

Hesaplamak için tabloya ek bir J sütunu ekleyin (buna y* diyelim). Hesaplama şu şekilde olacaktır (aldığımız regresyon denklemine göre) - "=$m$22*B2*B2+$M$23*B2+$M$24". J2 hücresine koyalım. Geriye kalan tek şey, otomatik doldurma işaretçisini J16 hücresine sürüklemektir.

Toplamları hesaplamak için (Y-Y ortalaması) 2, karşılık gelen formüllerle tabloya K ve L sütunlarını ekleyin. ORTALAMA işlevini kullanarak Y sütununun ortalamasını hesaplıyoruz.

K25 hücresine korelasyon indeksini hesaplama formülünü yerleştiriyoruz - "=ROOT(1-(K17/L17))".

0,959 değerinin 1'e çok yakın olduğunu görüyoruz, bu da satışlar ile yıllar arasında doğrusal olmayan yakın bir ilişki olduğu anlamına geliyor.

Elde edilen ikinci dereceden regresyon denkleminin (belirleme indeksi) uydurma kalitesini değerlendirmek için kalır. Korelasyon indeksinin karesi formülü ile hesaplanır. Yani K26 hücresindeki formül çok basit olacaktır - "=K25*K25".

0,920 katsayısı 1'e yakındır, bu da yüksek kaliteli bir uyumu gösterir.

Son adım, bağıl hatayı hesaplamaktır. Bir sütun ekleyip oraya formülü girelim: “=ABS((C2-J2)/C2), ABS — modül, mutlak değer. İşaretçiyi aşağı sürükleyelim ve M18 hücresinde ortalama değeri (ORTALAMA) görüntüleyeceğiz, hücrelere yüzde biçimini atayacağız. Elde edilen sonuç - %7,79 kabul edilebilir hata değerleri içinde<8…10%. Значит вычисления достаточно точны.

Gerekirse, elde edilen değerlere göre bir grafik oluşturabiliriz.

Örnek bir dosya ektedir - LINK!

Kategoriler:// 28 Ekim 2017 tarihli

Regresyon analizi, bir parametrenin bir veya daha fazla bağımsız değişkene bağımlılığını göstermenizi sağlayan istatistiksel bir araştırma yöntemidir. Bilgisayar öncesi dönemde, özellikle büyük miktarda veri söz konusu olduğunda kullanımı oldukça zordu. Bugün, Excel'de bir regresyon oluşturmayı öğrendikten sonra, karmaşık istatistiksel sorunları sadece birkaç dakika içinde çözebilirsiniz. Aşağıda ekonomi alanından özel örnekler verilmiştir.

gerileme türleri

Kavramın kendisi 1886'da matematiğe girdi. Gerileme olur:

  • doğrusal;
  • parabolik;
  • güç;
  • üstel;
  • hiperbolik;
  • gösterici;
  • logaritmik.

örnek 1

6 sanayi kuruluşunda emekli ekip üyelerinin sayısının ortalama maaşa bağımlılığını belirleme problemini düşünün.

Bir görev. Altı işletmede aylık ortalama maaş ve kendi isteğiyle ayrılan çalışan sayısını inceledik. Tablo şeklinde elimizde:

Ayrılan kişi sayısı

Aylık maaş

30000 ruble

35000 ruble

40000 ruble

45000 ruble

50000 ruble

55000 ruble

60000 ruble

6 işletmede emekli işçi sayısının ortalama maaşa bağımlılığını belirleme problemi için, regresyon modeli Y = a 0 + a 1 x 1 +…+a k x k denklemi biçimindedir, burada x i etkileyen değişkenlerdir , a i regresyon katsayılarıdır, a k faktör sayısıdır.

Bu görev için Y, ayrılan çalışanların göstergesidir ve etkileyen faktör, X ile gösterdiğimiz maaştır.

"Excel" elektronik tablosunun yeteneklerini kullanma

Excel'deki regresyon analizinden önce, yerleşik işlevlerin mevcut tablo verilerine uygulanması gerekir. Ancak, bu amaçlar için, çok kullanışlı "Analiz Araç Takımı" eklentisini kullanmak daha iyidir. Etkinleştirmek için ihtiyacınız olan:

  • "Dosya" sekmesinden "Seçenekler" bölümüne gidin;
  • açılan pencerede "Eklentiler" satırını seçin;
  • "Yönetim" satırının sağında bulunan "Git" düğmesine tıklayın;
  • "Analiz Paketi" adının yanındaki kutuyu işaretleyin ve "Tamam"a tıklayarak işlemlerinizi onaylayın.

Her şey doğru yapılırsa, Excel çalışma sayfasının üzerinde bulunan Veri sekmesinin sağ tarafında istenen düğme görünecektir.

Excel'de

Artık ekonometrik hesaplamalar yapmak için gerekli tüm sanal araçlara sahip olduğumuza göre, problemimizi çözmeye başlayabiliriz. Bunun için:

  • "Veri Analizi" düğmesine tıklayın;
  • açılan pencerede "Regresyon" düğmesine tıklayın;
  • görünen sekmede Y (işten ayrılan çalışan sayısı) ve X (maaşları) için değer aralığını girin;
  • "Tamam" butonuna basarak işlemlerimizi onaylıyoruz.

Sonuç olarak, program otomatik olarak elektronik tablonun yeni bir sayfasını regresyon analizi verileriyle dolduracaktır. Not! Excel, bu amaç için tercih ettiğiniz konumu manuel olarak ayarlama yeteneğine sahiptir. Örneğin, Y ve X değerlerinin olduğu aynı sayfa veya hatta bu tür verileri depolamak için özel olarak tasarlanmış yeni bir çalışma kitabı olabilir.

R-kare için regresyon sonuçlarının analizi

Excel'de, ele alınan örneğin verilerinin işlenmesi sırasında elde edilen veriler şöyle görünür:

Öncelikle R-kare değerine dikkat etmelisiniz. Belirleme katsayısıdır. Bu örnekte, R-kare = 0,755 (%75,5), yani modelin hesaplanan parametreleri, dikkate alınan parametreler arasındaki ilişkiyi %75.5 ile açıklamaktadır. Belirleme katsayısının değeri ne kadar yüksek olursa, belirli bir görev için seçilen model o kadar uygulanabilir olur. 0,8'in üzerinde bir R-kare değeri ile gerçek durumu doğru bir şekilde tanımladığına inanılmaktadır. R-kare ise<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Oran analizi

64.1428 sayısı, ele aldığımız modeldeki tüm xi değişkenleri sıfıra ayarlanırsa Y'nin değerinin ne olacağını gösterir. Başka bir deyişle, analiz edilen parametrenin değerinin, belirli bir modelde tanımlanmayan diğer faktörlerden de etkilendiği söylenebilir.

B18 hücresinde bulunan bir sonraki katsayı -0.16285, X değişkeninin Y üzerindeki etkisinin ağırlığını gösterir. Bu, söz konusu modeldeki çalışanların ortalama aylık maaşının -0.16285 ağırlıklı, yani bırakanların sayısını etkilediği anlamına gelir. etkisinin derecesi hiç de küçük değil. "-" işareti, katsayının negatif bir değere sahip olduğunu gösterir. Bu açıktır, çünkü herkes bilir ki işletmedeki maaş ne kadar yüksek olursa, iş sözleşmesini feshetme veya işten ayrılma arzusu o kadar az kişi ifade eder.

Çoklu regresyon

Bu terim, formun birkaç bağımsız değişkenine sahip bir bağlantı denklemini ifade eder:

y \u003d f (x 1 + x 2 + ... x m) + ε, burada y etkin özelliktir (bağımlı değişken) ve x 1 , x 2 , ... x m faktör faktörleridir (bağımsız değişkenler).

Parametre Tahmini

Çoklu regresyon (MR) için en küçük kareler yöntemi (OLS) kullanılarak gerçekleştirilir. Y = a + b 1 x 1 +…+b m x m + ε biçimindeki doğrusal denklemler için, bir normal denklem sistemi oluştururuz (aşağıya bakın)

Yöntemin ilkesini anlamak için iki faktörlü durumu düşünün. O zaman formülle açıklanan bir durumumuz var

Buradan şunu elde ederiz:

burada σ, indekste yansıtılan karşılık gelen özelliğin varyansıdır.

LSM, standartlaştırılabilir bir ölçekte MP denklemine uygulanabilir. Bu durumda denklemi elde ederiz:

burada t y , t x 1, … t xm ortalama değerleri 0 olan standartlaştırılmış değişkenlerdir; β i standartlaştırılmış regresyon katsayılarıdır ve standart sapma 1'dir.

Lütfen bu durumda tüm β i'nin normalleştirilmiş ve merkezileştirilmiş olarak ayarlandığını unutmayın, bu nedenle birbirleriyle karşılaştırmaları doğru ve kabul edilebilir olarak kabul edilir. Ek olarak, en küçük βi değerlerine sahip olanları atarak faktörleri filtrelemek gelenekseldir.

Doğrusal regresyon denklemini kullanma sorunu

Belirli bir N ürününün son 8 aydaki fiyat dinamiklerinin bir tablosu olduğunu varsayalım. Partisini 1850 ruble/ton fiyattan satın almanın tavsiye edilebilirliği konusunda bir karar vermek gerekiyor.

ay numarası

ay adı

N öğesinin fiyatı

Ton başına 1750 ruble

ton başına 1755 ruble

ton başına 1767 ruble

ton başına 1760 ruble

ton başına 1770 ruble

ton başına 1790 ruble

ton başına 1810 ruble

ton başına 1840 ruble

Excel elektronik tablosundaki bu sorunu çözmek için yukarıdaki örnekte zaten bilinen Veri Analizi aracını kullanmanız gerekir. Ardından, "Regresyon" bölümünü seçin ve parametreleri ayarlayın. "Giriş aralığı Y" alanına bağımlı değişken için bir değer aralığı (bu durumda, bir ürünün yılın belirli aylarındaki fiyatı) girilmesi gerektiği ve "Girdi" alanına girilmesi gerektiği unutulmamalıdır. X" aralığı - bağımsız değişken için (ay numarası). "Tamam" ı tıklayarak işlemi onaylayın. Yeni bir sayfada (eğer belirtilmişse), regresyon için veri alıyoruz.

Onlara dayanarak, a ve b parametrelerinin, ay numarası ve katsayıları olan satırın katsayıları ve "Y-kesişim" satırının bulunduğu satırın katsayıları olduğu y=ax+b biçiminde doğrusal bir denklem oluşturuyoruz. regresyon analizinin sonuçlarını içeren sayfa. Böylece, problem 3 için lineer regresyon denklemi (LE) şu şekilde yazılır:

Ürün fiyatı N = 11.714* ay numarası + 1727.54.

veya cebirsel gösterimde

y = 11.714 x + 1727.54

Sonuçların analizi

Elde edilen lineer regresyon denkleminin yeterli olup olmadığına karar vermek için, Fisher testi ve Student testinin yanı sıra çoklu korelasyon katsayıları (MCC) ve belirleme katsayıları kullanılır. Regresyon sonuçlarının olduğu Excel tablosunda, sırasıyla birden çok R, R-kare, F-istatistiği ve t-istatistiği adları altında görünürler.

KMC R, bağımsız ve bağımlı değişkenler arasındaki olasılıksal ilişkinin sıkılığını değerlendirmeyi mümkün kılar. Yüksek değeri, "Ayın sayısı" ve "1 ton başına ruble cinsinden N mal fiyatı" değişkenleri arasında oldukça güçlü bir ilişki olduğunu gösterir. Ancak, bu ilişkinin doğası bilinmemektedir.

R2 (RI) belirleme katsayısının karesi, toplam dağılım payının sayısal bir özelliğidir ve dağılım, deneysel verilerin hangi kısmının, yani dağılımını gösterir. bağımlı değişkenin değerleri lineer regresyon denklemine karşılık gelir. Ele alınan problemde bu değer %84,8'e eşittir, yani istatistiksel veriler elde edilen SD ile yüksek derecede doğrulukla tanımlanır.

Fisher testi olarak da adlandırılan F-istatistikleri, doğrusal bir ilişkinin önemini değerlendirmek, varlığının hipotezini reddetmek veya doğrulamak için kullanılır.

(Öğrenci kriteri), doğrusal bir ilişkinin bilinmeyen veya serbest terimiyle katsayının önemini değerlendirmeye yardımcı olur. t-kriterinin değeri > t cr ise, lineer denklemin serbest teriminin önemsizliği hipotezi reddedilir.

Serbest üye için ele alınan problemde, Excel araçlarını kullanarak, t = 169.20903 ve p = 2.89E-12 olduğu elde edildi, yani, serbest üyenin önemsizliğine ilişkin doğru hipotezin sıfır olasılığına sahibiz. reddedilmek. Bilinmeyendeki katsayı için t=5.79405 ve p=0.001158. Başka bir deyişle, bilinmeyen için katsayının önemsizliğine ilişkin doğru hipotezin reddedilme olasılığı %0,12'dir.

Böylece elde edilen lineer regresyon denkleminin yeterli olduğu söylenebilir.

Bir hisse bloğu satın almanın uygunluğu sorunu

Excel'de çoklu regresyon, aynı Veri Analizi aracı kullanılarak gerçekleştirilir. Belirli bir uygulamalı sorunu düşünün.

NNN yönetimi, MMM SA'da %20 hisse satın almanın tavsiye edilebilirliği konusunda bir karar vermelidir. Paketin (JV) maliyeti 70 milyon ABD dolarıdır. NNN uzmanları, benzer işlemler hakkında veri topladı. Milyonlarca ABD doları olarak ifade edilen bu parametrelere göre hisse bloğunun değerinin şu şekilde değerlendirilmesine karar verildi:

  • ödenecek hesaplar (VK);
  • yıllık ciro (VO);
  • alacak hesapları (VD);
  • sabit kıymetlerin maliyeti (SOF).

Ayrıca, işletmenin bordro borçları (V3 P) parametresi bin ABD doları cinsinden kullanılmaktadır.

Excel elektronik tablosunu kullanarak çözüm

Her şeyden önce, bir başlangıç ​​verileri tablosu oluşturmanız gerekir. Şuna benziyor:

  • "Veri Analizi" penceresini çağırın;
  • "Gerileme" bölümünü seçin;
  • "Giriş aralığı Y" kutusuna, G sütunundan bağımlı değişkenlerin değer aralığını girin;
  • "Giriş aralığı X" penceresinin sağındaki kırmızı oklu simgeye tıklayın ve sayfadaki B, C, D, F sütunlarından tüm değerlerin aralığını seçin.

"Yeni Çalışma Sayfası"nı seçin ve "Tamam"a tıklayın.

Verilen problem için regresyon analizini alın.

Sonuçların ve sonuçların incelenmesi

Excel elektronik tablo sayfasında yukarıda sunulan yuvarlatılmış verilerden “toplarız”, regresyon denklemi:

SP \u003d 0.103 * SOF + 0.541 * VO - 0.031 * VK + 0.405 * VD + 0.691 * VZP - 265.844.

Daha tanıdık bir matematiksel formda şu şekilde yazılabilir:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

JSC "MMM" verileri tabloda sunulmaktadır:

Bunları regresyon denkleminde yerine koyduğumuzda 64,72 milyon ABD doları rakamı elde ediyorlar. Bu, JSC MMM'nin hisselerinin, 70 milyon ABD doları değerindeki değeri oldukça abartıldığı için satın alınmaması gerektiği anlamına gelir.

Gördüğünüz gibi, Excel elektronik tablosunun ve regresyon denkleminin kullanımı, çok özel bir işlemin fizibilitesi konusunda bilinçli bir karar vermeyi mümkün kıldı.

Artık regresyonun ne olduğunu biliyorsunuz. Yukarıda tartışılan Excel'deki örnekler, ekonometri alanındaki pratik sorunları çözmenize yardımcı olacaktır.