Nupjautinis vidurkis

Straipsnis iš Vikipedijos, laisvosios enciklopedijos.

Nupjautinis vidurkis (angl. truncated mean), apkirptinis vidurkis (angl. trimmed mean) – statistinis centrinės tendencijos matas, artimas aritmetiniam vidurkiui ir medianai. Skaičiuojant nupjautinį vidurkį naudojamas skirstinys arba imtis, kurių galuose pašalinta vienoda dalis duomenų (paprastai nurodoma procentais, kartais tiesiog taškų skaičiumi).

Daugeliu atvejų galuose nupjaunami 5–25% duomenų. Taip pašalinus 25% mažiausių ir 25% didžiausių duomenų gaunamas nupjautinis vidurkis, kuris vadinamas tarpkvartilinis vidurkis (angl. interquartile mean).

Pvz., imtis iš 8 duomenų apkerpama po 12,5%, nupjautinio vidurkio skaičiavimui lieka 6 skaičiai, nes atmetami minimumas ir maksimumas (mažiausia ir didžiausia reikšmės).

Mediana gali būti interpretuojama kaip visiškai nupjautinis vidurkis. Kaip ir daugelio kitų apkirptinių įverčių angl. trimmed estimators) apkirptinio vidurkio pagrindinis pranašumas yra robastiškumas (angl. robustness) ir didesnis efektyvumas dirbant su mišriaisiais skirstiniais (angl. mixed distributions) ir „sunkiauodegiais“ (angl. heavy-tailed distribution) skirstiniais (kaip kad Cauchy skirstinys), nors mažiau efektyvus kai kuriems mažiau „sunkiauodegiams“ skirstiniams (pvz., normalusis skirstinys). Tarpiniams skirstiniams aritmetinio vidurkio ir medianos efektyvumų skirtumas nėra labai didelis. Pvz., Stjudento t skirstiniui su 2 laisvės laipsniais aritmetinis vidurkis ir mediana beveik lygūs.

Terminija[redaguoti | redaguoti vikitekstą]

Kai kuriose Centrinės Europos šalyse nupjautinius vidurkius dar vadina Vindzoro aritmetiniu vidurkiu (angl. Windsor mean). Nors taip ir vadinamas, bet nupjautinis vidurkis yra kitokia statistinė charakteristika nei vinzorizuotas aritmetinis vidurkis (angl. Winsorized mean). Skaičiuojant vinzorizuotą skirstinį imties duomenys apdorojami kitaip: numatytas procentas duomenų ne pašalinamas, o pakeičiamas didžiausiais ar mažiausiais likusiais skaičiais.

Nupjautinis vidurkis, kai pašalinami tik minimumas ir maksimumas, dar vadinamas angl. modified mean 'modifikuotas aritmetinis vidurkis', ypač vadybos statistikoje.[1]

Interpoliacija[redaguoti | redaguoti vikitekstą]

Kai norimas nupjauti duomenų procentas nėra sveikas taškų skaičius, nupjautinis vidurkis gali būti skaičiuojamas naudojant interpoliaciją (paprastai – tiesinę) tarp artimiausių sveikų skaičių. Pavyzdžiui, reikia paskaičiuoti po 15% apkirptą nupjautinį vidurkį iš 10 duomenų imties. Numetant po 1 kraštinį tašką paskaičiuojamas po 10% apkirptas vidurkis. Numetant po 2 kraštinius taškus paskaičiuojamas po 20% apkirptas vidurkis. Tada panaudojami šie du nupjautiniai vidurkiai ir interpoliuojant (čia paskaičiuojant 10% ir 20% nupjautinių vidurkių vidurkį) gaunamas 15% nupjautinis vidurkis. Panašiai būtų skaičiuojamas ir 12% apkirptinis vidurkis, tik reikėtų skaičiuoti svertinį vidurkį: 10% apkirptinis vidurkis įeitų su 0,8 svertiniu koeficientu, o 20% apkirptinis vidurkis – su koeficientu 0,2.

Pranašumas[redaguoti | redaguoti vikitekstą]

Nupjautinis (apkirptinis) aritmetinis vidurkis yra naudingas, nes mažiau jautrus riktams nei paprastas aritmetinis vidurkis, bet patenkinamai atspindi centrinę tendenciją (aritmetinį vidurkį) daugelio statistinių modelių atvejais. Dėl to jis priskiriamas robastiniams įverčiams.

Nuorodos[redaguoti | redaguoti vikitekstą]

  1. Arulmozhi, G.; Statistics For Management, 2nd Edition, Tata McGraw-Hill Education, 2009, p. 458