1. kamerák
  2. Car Audio & Electronics
  3. Home Audio
  4. Personal Audio
  5. TV-k
  6. Okos otthon
  >> Elektronikai Technológia Online >  >> Okos otthon >> Okos élet

A többszörös regresszió használata az Excelben

Az Excel hatékony eszköz az adatelemzéshez, akár egy független változó és egy függő változó közötti egyszerű kapcsolattal dolgozik, akár több független változót kell figyelembe venni. Ha bonyolult adatokat kell feldolgoznia, elengedhetetlen, hogy megtanulja, hogyan kell többváltozós elemzést végezni Excelben – többszörös regresszió formájában – és értelmezni az eredményeket. A jó hír az, hogy az Excel jól be van állítva ezeknek a feladatoknak a kezelésére, és csak egy függvény működését kell megtanulnia ahhoz, hogy megértse adatait.

Mi az a többszörös regresszió?

A többszörös regresszió egy módja annak, hogy több független változót egyetlen függő változóhoz kapcsoljunk úgy, hogy egy egyenletet találunk, amely leírja, hogyan változik a kérdéses változó mindegyikével. Egy alapvetőbb, de hasonló eszköz a lineáris regresszió, amelynek célja egy független változó, például az elhízás közötti kapcsolat vizsgálata egy olyan függő változóval, mint a rák kockázata, de a dolgok ritkán ilyen egyszerűek. Folytatva a példát, a naponta elszívott cigaretták száma is összefügg a rák kockázatával, csakúgy, mint az elfogyasztott alkohol mennyisége. Ahhoz, hogy megbízható előrejelzést adjon az egyén rákkockázatáról, figyelembe kell vennie ezeket a tényezőket (és még többet).

A többszörös regresszióhoz használt egyenlet általános formája:

I ^ =a + b x + b x + b x

Tehát az Y ^ a megfigyelés várható értéke, a b és így tovább az x közötti egyenes kapcsolat meredekségét jelenti és I ^ és az x és így tovább az elemzésben szereplő változók. Az a elmondja az y lényegét -elfogni. A többszörös regresszió magában foglalja az együtthatók értékének kiválasztását (b és így tovább), amelyek minimalizálják az Y várható érték közötti különbséget ^ és a megfigyelt Y érték , amely a legjobb illeszkedést biztosítja a modell és az adatok között.

Mit mond Önnek a többszörös regresszió?

A többszörös regresszió numerikus értékeket ad a változók sokasága és az eredmény közötti összefüggésre, így felhasználhatja előrejelzésekhez, a különböző változók relatív hozzájárulásának becsléséhez az eredményhez, vagy néhány más célra, például a legrelevánsabb változók kiválasztására. matematikai modellben használni.

Tegyük fel például, hogy rendelkezik adatokkal egy adott városban lévő házak árairól (az Ön függő változója), valamint olyan információkkal, mint például, hogy van-e medencéje, hány négyzetláb, hány hálószobája van, hány fürdőszobája van. , és hány garázsa van. A többszörös regresszió lehetővé teszi, hogy megvizsgálja, hogy az egyes tényezők hogyan kapcsolódnak a ház árához, így – miután megvizsgálta, hogyan viszonyulnak az árhoz – az egyenlet segítségével megjósolhatja egy ház árát ezek alapján. pontokat egyedül.

Használhatja ezt a fajta regressziós elemzést az Excelben is, hogy megvizsgálja, hogy egy adott tényező sok közül – például, hogy a háznak van-e medence – hogyan befolyásolja a függő változót (lakásárak), ha az összes többi változó állandó marad. Ha az együtthatókat (úgynevezett "részleges regressziós együtthatóknak") szabványos részleges regressziós együtthatókká alakítja át, amelyek azt jelzik, hogy hány szórást I változna, ha a megfelelő változót egy szórással módosítaná, akkor az egyenlet azt is megmondja, hogy mely tényezők fontosabbak az eredmény meghatározásában.

Többszörös regresszió végrehajtása Excelben

Többváltozós regressziót hajthat végre az Excelben egy beépített függvény használatával, amely az Adatelemzés segítségével érhető el. eszközt az Adatok alatt és az Elemzés lapon csoport. Kattintson az Adatelemzés lehetőségre és keresse meg a regresszió lehetőséget a felugró ablakban jelölje ki, és kattintson az OK gombra . Kattintson a cellák kiválasztása elemre ikont az Input Y tartomány mellett mezőben, majd válassza ki a függő változó eredményeit tartalmazó oszlopot. Ezután tegye ugyanezt az Input X Range esetén mezőt, de válassza ki a több oszlopot a független változókhoz. Ezeknek az oszlopoknak egymás mellett kell lenniük, tehát ha nem, akkor a regresszió létrehozása előtt át kell helyezni őket.

A Regresszió ablak számos további opciót tartalmaz, amelyek segítségével a folyamatot az Ön igényeihez igazíthatja. Például beállíthat 95 százaléktól eltérő megbízhatósági szintet, kiválaszthatja a maradékok megjelenítését, és megadhatja, hová kerüljön a kimenet a munkafüzetben. Ez utóbbi lehetőség automatikusan Új munkalapréteg értékre van állítva így az eredmények új lapon jelennek meg, de ezt vagy bármely más lehetőséget igény szerint módosíthatja. Ezenkívül ellenőrizze a címkéket jelölőnégyzetet, ha a független változók oszlopai tetején vannak címkék, így ezek megjelennek a kimenetben.

Kattintson az OK gombra a regressziós elemzés elkészítéséhez Excelben, és az új munkalapra kerüljön.

A regressziós kimenet az Excelből

Az Excelben többszöri regresszió végrehajtása után megjelenő kimenetnek három fő része van:regressziós statisztikák, ANOVA és a becsült regressziós egyenes részletei. A regressziós statisztika tartalmazza a többszörös korrelációs együtthatót ("Multiple R"), amely a korreláció irányát és erősségét mutatja –1 és +1 között. A determinációs együttható, az "R négyzet", megmutatja, hogy a függő változó változásának hány százalékát (tizedesben) magyarázzák a független változók. A „Korrigált R-négyzet” a magyarázó erőt jelzi, de nem egyszerű értelmezni, a „Standard Error” pedig a megfigyelt eredmények és a regressziós egyenes közötti eltérés mértékét adja meg.

Az ANOVA szakasz statisztikai információkat tartalmaz a regressziós egyenes által magyarázott eltérés mértékéről, ahol az „SS Regression” a sor által magyarázott összeget, az „SS Residual” pedig a nem magyarázott összeget jelzi. Az „MS” szakaszok az „átlagos négyzet” rövidítése, az „F statisztika” pedig a szignifikáns eredmény tesztelésére használt tesztstatisztika, a „Szignifikancia F” szakasz pedig a P-értéket adja meg.

Végül, az utolsó rész ismerteti a becsült regressziós egyenes jellemzőit, különös tekintettel az együtthatók értékére, hogy szignifikánsan kapcsolódnak-e a függő változóhoz, és mekkora eltérés lehet bennük. A pozitív együtthatók pozitív kapcsolatot mutatnak a kérdéses változó és a függő változó között, tehát amikor az egyik nő, akkor a másik is. A negatív értékek azt jelentik, hogy a függő változó a független változó növekedésével csökken. Tehát, ha egy ház ára többszörös regressziós "négyzetméter" együtthatója 300, ez azt jelenti, hogy egy további négyzetláb terület átlagosan 300 dollárral növeli a ház költségét.

A többszörös regresszió feltételezései és korlátai

Fontos megjegyezni, hogy a többszörös regresszió csak egy eszköz, és a legtöbb eszközhöz hasonlóan csak bizonyos körülmények között használhatja, és vannak dolgok, amelyeket egyszerűen nem tud.

Az egyik legfontosabb korlát, hogy az eredmények alapján nehéz az ok-okozati összefüggést megállapítani. Például, ha többszörösen visszaesik a tűz által okozott kár és sok potenciálisan releváns tényező, akkor valószínűleg jelentős összefüggést talál a jelenlévő tűzoltók száma és az okozott kár között. Ez nem jelenti azt, hogy a tűzoltók okoztak a kár, mert egy másik tényező, például a tűz mérete, amely nem szerepel a modellben, mindkét megfigyelést megmagyarázhatja.

Az ilyen típusú Excel többváltozós elemzésének két fontos feltételezése a linearitás és a normalitás. Lineáris kapcsolatot feltételez a függő és független változók között, ezért az elemzés elvégzése előtt ellenőriznie kell, hogy ez valószínűleg érvényes-e. Az egyes változók közötti kapcsolatot külön-külön is megvizsgálhatja, de ez nem tökéletes stratégia. Hasonlóképpen, a teszt azt feltételezi, hogy a változók normális eloszlásúak, ezért a teszt elvégzése előtt ellenőriznie kell az egyes változók eredményeit a normalitás szempontjából.


  1. Hogyan használjuk több RFID olvasók?
  2. Hogyan használjuk Excel fájlokat a Blackberry
  3. A Wingdings használata Excelben
  4. Az álváltozók használata az Excel regresszióban
  5. A mínusz függvény használata az Excelben