Excel'de Outliers İşlevini Nasıl Kullanılır (ve Neden)
Bir aykırı değer, verilerinizdeki değerlerin çoğundan önemli ölçüde daha yüksek veya daha düşük bir değerdir. Verileri analiz etmek için Excel kullanırken, aykırı sonuçlar sonuçları çarpıtabilir. Örneğin, bir veri kümesinin ortalama ortalaması gerçekten değerlerinizi yansıtıyor olabilir. Excel, aykırılıklarınızı yönetmenize yardımcı olacak birkaç kullanışlı işlev sunar..
Hızlı Bir Örnek
Aşağıdaki resimde, aykırı değerler, Eric’e atanan ikisinin değerini ve Ryan’a atanan 173 değerini bulmak oldukça kolaydır. Bunun gibi bir veri setinde, bu aykırı değerlerin manuel olarak tespit edilip ele alınması kolaydır..
Daha büyük bir veri kümesinde, bu böyle olmayacak. Aykırı olanları tanımlayabilmek ve bunları istatistiksel hesaplamalardan çıkarabilmek önemlidir - ve bu makalede nasıl yapacağımıza bakacağız..
Verilerinizdeki Aykırı Değerleri Nasıl Bulunur?
Aykırı verileri bir veri kümesinde bulmak için aşağıdaki adımları kullanırız:
- 1. ve 3. Çeyrekleri hesaplayın (biraz neler içinde olduklarından bahsedeceğiz).
- Bölümler arası aralığı değerlendirin (bunları biraz daha aşağıda açıklayacağız).
- Veri aralığımızın üst ve alt sınırlarını döndür.
- Temel veri noktalarını tanımlamak için bu sınırları kullanın.
Aşağıdaki resimde görülen veri setinin sağındaki hücre aralığı bu değerleri saklamak için kullanılacaktır..
Başlayalım.
Birinci Adım: Çeyrekleri Hesapla
Verilerinizi çeyreklere bölerseniz, bu kümelerin her birine çeyreklik denir. Aralıktaki sayıların en az% 25'i 1. çeyreği, sonraki% 25'i ikinci çeyreği vb. Oluşturur. İlk önce bu adımı atıyoruz, çünkü en sık kullanılan bir tanımlayıcı tanımı, 1. çeyreğin altında 1.5 çeyrek aralığın (IQR) ve 3. çeyreğin üstünde 1.5 çeyrek aralığın üzerindeki bir veri noktasıdır. Bu değerleri belirlemek için önce çeyreklerin ne olduğunu bulmak zorundayız..
Excel, çeyrekleri hesaplamak için QUARTILE işlevi sağlar. İki bilgi parçası gerektirir: dizi ve çeyrek.
= QUARTILE (dizi, çeyrek)
dizi Değerlendirdiğiniz değerlerin aralığıdır. Ve kuartet geri dönmek istediğiniz çeyreği temsil eden bir sayıdır (ör. 1st Çeyrek, 2. Çeyrek için 2, vb.).
Not: Excel 2010'da, Microsoft, QUARTILE.INC ve QUARTILE.EXC işlevlerini, QUARTILE işlevinde iyileştirmeler olarak yayımladı. QUARTILE, Excel'in birden çok sürümünde çalışırken daha geriye uyumludur.
Örnek tablomıza dönelim.
1 hesaplamak içinst Quartile, aşağıdaki formülü F2 hücresinde kullanabiliriz..
= QUARTILE (B2: B14,1)
Formülü girerken, Excel, quart argümanı için bir seçenekler listesi sunar.
3 hesaplamak içinrd dörtte bir, F3 hücresindeki öncekine benzer bir formül girebiliriz, ancak bir yerine üç.
= QUARTILE (B2: B14,3)
Şimdi, hücrelerde görüntülenen dörtlü veri noktalarına sahibiz..
İkinci Adım: çeyrekler arası aralığı değerlendirin
Çeyrekler arası aralık (veya IQR), verilerinizdeki değerlerin orta% 50'sidir. 1. çeyreklik değer ile 3. çeyreklik değer arasındaki fark olarak hesaplanır..
Basit bir formülü 1'i çıkartan F4 hücresine kullanacağız.st 3 çeyrekrd çeyrek:
= F3 F2
Artık çeyrekler arası çeşitlerimizin görüntülendiğini görebiliyoruz..
Üçüncü Adım: Alt ve Üst Sınırları Geri Dönün
Alt ve üst sınırlar, kullanmak istediğimiz veri aralığının en küçük ve en büyük değerleridir. Bu sınır değerlerden daha küçük veya daha büyük olan değerler, aykırı değerlerdir..
IQR değerini 1,5 ile çarpıp ardından Q1 veri noktasından çıkartarak F5 hücresindeki alt sınır limitini hesaplayacağız:
= F2- (1.5 x F4)
Not: Bu formülün içindeki parantezler gerekli değildir çünkü çarpma bölümü çıkarma bölümünden önce hesaplanır, ancak formülü okunmasını kolaylaştırır..
F6 hücresindeki üst sınırı hesaplamak için IQR'yi tekrar 1,5 ile çarpacağız, ancak bu kez eklemek Q3 veri noktasına göre:
= F3 + (1.5 x F4)
Dördüncü Adım: Aykırı Değerleri Belirleyin
Artık tüm temel verilerimizi ayarladık, artık temel veri noktalarımızı belirleme zamanı - alt sınır değerden düşük veya üst sınır değerden yüksek olanlar.
VEYA işlevini bu mantıksal testi gerçekleştirmek için ve aşağıdaki ölçütleri C2 hücresine girerek bu kriterleri karşılayan değerleri göstermek için kullanacağız:
= VEYA (B2 $ F $ 6)
Daha sonra bu değeri C3-C14 hücrelerimize kopyalayacağız. Bir TRUE değeri bir aykırı gösterir ve gördüğünüz gibi verilerimizde iki tane var.
Ortalama Ortalamayı Hesaplarken Aykırı Değerleri Yoksayma
QUARTILE işlevini kullanarak IQR'yi hesaplayalım ve bir sık kullanılanın en yaygın kullanılan tanımıyla çalışalım. Bununla birlikte, bir değer aralığı için ortalama ortalamayı hesaplarken ve aykırı değerleri dikkate almazsanız, kullanımı daha hızlı ve daha kolay bir işlevdir. Bu teknik daha önce olduğu gibi bir ayracı tanımlamayacak, ancak aykırı sayımızı düşündüğümüz şeylerle esnek olmamızı sağlayacak.
İhtiyacımız olan fonksiyon TRIMMEAN olarak adlandırılır ve bunun sözdizimini aşağıda görebilirsiniz:
= TRIMMEAN (dizi, yüzde)
dizi ortalamak istediğiniz değerlerin aralığıdır. yüzde veri kümesinin üst ve altından hariç tutulacak veri noktalarının yüzdesidir (bunu yüzde veya ondalık değer olarak girebilirsiniz).
Ortalamayı hesaplamak ve aykırı değerlerin% 20'sini dışlamak için örneğimizde aşağıdaki formülü D3 hücresine girdik..
= TRIMMEAN (B2: B14,% 20)
Aykırı değerlerin ele alınması için iki farklı fonksiyonunuz vardır. Bazı raporlama ihtiyaçları için onları tanımlamak ya da ortalamalar gibi hesaplamaların dışında bırakmak istediğinizde, Excel ihtiyaçlarınızı karşılayacak bir işleve sahiptir..