A kiugró értékek eltávolítása az SPSS-ben
A statisztikai elemzésekben a kiugró értékek szélsőséges értékek, amelyek úgy tűnik, nem illeszkednek az adathalmaz többségéhez. Ha nem távolítják el, ezek a szélső értékek nagy hatással lehetnek a kérdéses adatokból levonható következtetésekre, mert rossz irányba torzíthatják a korrelációs együtthatókat és a legjobban illeszkedő vonalakat. Az SPSS egyike a számos statisztikai elemző szoftvernek, amelyek használhatók egy adathalmaz értelmezésére, valamint a kiugró értékek azonosítására és eltávolítására.
Feltáró adatok elemzése
1. lépés
Kattintson az "Elemzés" gombra. Válassza a „Leíró statisztikák”, majd az „Explore” lehetőséget.
2. lépés
Húzza át a függő változó adatait tartalmazó oszlopokat a „Függő lista” mezőbe. Kattintson az „OK” gombra.
3. lépés
Az egyes adatpontok törlésével távolítson el minden, az SPSS által azonosított kiugró értéket a szár- és levéldiagramokból vagy dobozdiagramokból. Alternatív megoldásként beállíthat egy szűrőt, amely kizárja ezeket az adatpontokat.
4. lépés
Válassza az „Adatok”, majd a „Select Cases” elemet, és kattintson egy olyan feltételre, amelynél vannak kihagyni kívánt értékek. Határozzon meg egy értéket ennek a feltételnek, amely csak a kiugró értékeket zárja ki, a nem kiugró adatpontok egyikét sem.
5. lépés
A "Kiválasztás" mezőben válassza a "Ha a feltétel kielégítő" lehetőséget, majd kattintson az alatta lévő "Ha" gombra. Írja be az előző lépésben meghatározott kiugró értékek kizárására vonatkozó szabályt a jobb felső sarokban található mezőbe. Ha például kizárja a 74,5 hüvelyk feletti méreteket a „magasság” feltételből, akkor a „magasság <=74,5” értéket kell megadnia. Kattintson a "Folytatás" és az "OK" gombra a szűrő aktiválásához.
Regressziós elemzés
1. lépés
Az „Elemzés” menüben válassza a „Regresszió”, majd a „Lineáris” lehetőséget. Válassza ki az elemezni kívánt függő és független változókat.
2. lépés
Kattintson a "Mentés" gombra, majd válassza a "Főzési távolság" lehetőséget. A Cook-távolságra kiszámított értékek „COO-1” címkével ellátott változókként kerülnek az adatfájlba.
3. lépés
Futtasson egy boxplotot a „Grafikonok”, majd a „Boxplot” kiválasztásával. Kattintson az "Egyszerű" elemre, és válassza a "Különálló változók összefoglalása" lehetőséget. Írja be a "COO-1" kifejezést a "Boxes Represent" feliratú mezőbe, majd adjon meg egy azonosítót vagy nevet, amely alapján azonosíthatja az eseteket a "Cases by" mezőben.
4. lépés
Nagyítsa ki a boxplotot a kimeneti fájlban dupla kattintással. Jegyezze fel azokat az eseteket, amelyek a fekete vonalakon túl vannak – ezek a kiugró értékek. Dönthet úgy, hogy eltávolítja az összes kiugró értéket, vagy csak a szélső kiugró értékeket, amelyeket csillag (*) jelöl.
5. lépés
Menjen vissza az adatfájlba, és keresse meg a törölni kívánt eseteket. Alulról felfelé haladva jelölje ki a bal szélső számot a szürke oszlopban, így a teljes sor ki van jelölve. Kattintson a "Szerkesztés" gombra, és válassza a "Törlés" lehetőséget. Ismételje meg ezt a lépést minden kiugró értéknél, amelyet a boxplotban azonosított.
Figyelmeztetés
A 2. szakasz 5. lépésében szereplő esetek törlésekor mindig az adatfájl aljától kezdődően haladjon felfelé, mert az azonosítószámok megváltoznak az esetek törlésekor. Ha felülről lefelé dolgozik, akkor a végén a rossz eseteket törli.