Çarpıklık

Sıfır olmayan çarpıklık gösteren deneysel veri örneği

Çarpıklık (İngilizce: skewness; Fransızca: asymétrie) olasılık kuramı ve istatistik bilim dallarında bir reel-değerli rassal değişkenin olasılık dağılımının simetrik olamayışının ölçülmesidir.

Giriş

Grafikte gösterilen dağılım incelensin. Dağılımın sağ tarafında bulunan çubukların küçülmelerinin şekli sol taraftaki çubukların küçülmelerinden farklı bir görünüm vermektedir. Çubuk yüksekliklerinin küçüldükleri taraflara kuyruk adı verilir. Genel olarak iki çeşit olan çarpıklığın bilinmektedir.

Grafikteki kuyrukların görüntüsü dağılım için hangi tip çarpıklık olduğunu gösterir. Bu iki türlü çarpıklık ve bunu açıklayan grafiğin kuyruk konumu şunlardır:

  • Pozitif çarpıklık: Bu halde sağdaki kuyruk daha uzundur. Dağılımın kütlesi grafiğin sol tarafında konsantre olmuştur. Bu türlü dağılım sağdan çarpık olarak anılır.
  • Negatif çarpıklık: Bu halde soldaki kuyruk daha uzundur ve dağılımın kütlesi grafiğin sağ tarafında konsantre olmuştur. Bu türlü dağılım soldan çarpık olarak anılır.

Tanımlama

Çarpıklık üçüncü standardize edilmiş moment olup bu matematik notasyonla

γ 1 {\displaystyle \gamma _{1}}

olarak ifade edilmekte ve şöyle tanımlanmaktadır

γ 1 = μ 3 σ 3 , {\displaystyle \gamma _{1}={\frac {\mu _{3}}{\sigma ^{3}}},\!}

Burada μ 3 {\displaystyle \mu _{3}} üçüncü ortalama etrafındakı moment olarak ve σ {\displaystyle \sigma } standart sapma olarak ifade edilmektedirler. Aynı şekilde, çarpıklık üçüncü kümülant olan γ 1 {\displaystyle \gamma _{1}} ile ikinci kümülantın (yani κ 2 {\displaystyle \kappa _{2}} nın) kare kökünün üçüncü üssü olarak tanımlanmaktadır.

Bu tanımlama, basıklık tanımlanmasına bir analog benzetmedir; çünkü basıklık dördüncü kümülant ile ikinci kümülantın kare kökünün dördüncü üssü ifadesine bölümü arasındaki orantı ile ifade edilmektedir.

n sayıda gözlemi bulunan bir örneklem için örneklem çarpıklığı şöyle tanımlanır:

g 1 = m 3 m 2 3 / 2 = n i = 1 n ( x i x ¯ ) 3 ( i = 1 n ( x i x ¯ ) 2 ) 3 / 2 , {\displaystyle g_{1}={\frac {m_{3}}{m_{2}^{3/2}}}={\frac {{\sqrt {n\,}}\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{3}}{\left(\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}\right)^{3/2}}},\!}

burada x i {\displaystyle x_{i}} ith örneklem değeri, x ¯ {\displaystyle {\bar {x}}} örneklem ortalaması, m 3 {\displaystyle m_{3}} örneklem üçüncü merkezsel momenti ve m 2 {\displaystyle m_{2}} örneklem varyans olur

Eğer veriler örneklem içinse ve bilinen bir anakütleden gelmekte iseler, yukarıdaki formülleri kullanarak elde edilen örneklem çarpıklık ölçüleri için g 1 {\displaystyle g_{1}} bilinmeyen reel anakütle çarpıklık ölçüsünün bir yanlı kestiricisi olduğu bilinmaktedir. Bu nedenle bazı istatistikçiler yanlı olmayan çarpıklık kestiricisi olarak şu formülün kullanılmasını tavsiye ederler:

G 1 = k 3 k 2 3 / 2 = n ( n 1 ) n 2 g 1 , {\displaystyle G_{1}={\frac {k_{3}}{k_{2}^{3/2}}}={\frac {\sqrt {n\,(n-1)}}{n-2}}\;g_{1},\!}

Burada k 3 {\displaystyle k_{3}} üçüncü kümülantin tek simetrik yanlı olmayan kestricisi ve k 2 {\displaystyle k_{2}} ikinci kümülantın simetrik yansız kestiricisi olur. Ne yazıktır ki, buna rağmen G 1 {\displaystyle G_{1}} de genel olarak yanlı bir kestiricidir. Bu kestiricinin beklenen değeri gerçek anakütle çarpıklık ölçüsünün ters işaretinde bile olabilmesi mümkündür.

Bir rassal değişken olan X için çarpıklık matematik kısaltma ile Çarp[X] olarak ifade edilsin. Eğer Y n tane bağımsız rassal değişkenlerin toplamından oluşuyorsa ve her bir X dağılımı birbiri ile ayni ise, Y nin çarpıklığı şöyle gösterilebilir

Çarp[Y] = Çarp[X] / √n.

Çarpıklık özelliği birçok alanda pratik yarar sağlamaktadır. Pratik sorun çözümleri elde etmek için çok defa basitleştirilmiş model kullanılıp verilerin normal dağılım gösterdiği varsayılır. Bu varsayıma göre veriler ortalama etrafında simetrik olarak dağılmaktadırlar. Halbuki pratikte veriler çok defa kusursuzca simetrik değildirler. Böylece, verilerin çarpıklığını anlamak, kullanılan ortalamanın ne kadar simetriklikten uzak olabileceğini ve ne yönde veri merkezinin kullanılan ortalamadan değişik olacağını anlamaya yol açacaktır.

Pearson'un çarpıklık katsayıları

Karl Pearson çarpıklık ölçülmesi için iki basit şekilde kestirim ölçüsü önermiştir. Bunlar

  • 3 (ortalama - mod) / standard sapma
  • 3 (ortalama - medyan) / standard sapma

Ancak aynı veriler için, bu iki kestirim ölçüsünün aynı işarette olacağına ve eğrilerinin işaretinin grafikle görülebilen artı/eksi çarpıklık özelliğine benzeyeceğine hiçbir garanti bulunmamaktadır.

Yeni Bir Öneri

2014 yılında yayınlanan İstatistikte Altın Oran adlı bir kitapta, yeni bir çarpıklık katsayısı önerilmiştir.[1][2]

Coefficient of Skewness (G)

Hesaplama; medyanın sol tarafındaki elemanların medyandan farklarının toplamının, medyanın sağ tarafındaki elemanların medyandan farklarının toplamına oranıdır. Eğer veri dizisinde, medyanın son tarafındaki elemanların medyandan farklarının toplamı (sol tarafın yükü), medyanın sağ tarafındaki elemanların medyandan farklarının toplamına (sağ tarafın yükü) eşitse, G = -1 olmaktadır. G = -1, tam simetri durumunu işaret eder. veri dizisinin medyana göre solu ile sağı, yük bakımından dengelidir. G, -1'den küçükse, medyanın sol tarafının yükü sağ tarafının yükünden fazladır dolayısıyla veri dizisi sola çarpıktır (veri dizisinin kuyruğu soldadır). G, -1'den büyükse, medyanın sağ tarafının yükü sol tarafının yükünden fazladır dolayısıyla veri dizisi sağa çarpıktır (veri dizisinin kuyruğu sağdadır). İstatistik literatüründe kullanılan diğer çarpıklık belirleme metodlarından farkı, veri dizisinin eleman sayısından bağımsız çalışabilmesi ve üstel (logaritmik vs) operatör içermediği için veri dizisinin formasyonundan bağımsız olmak üzere, çarpıklığı nicel olarak hesaplamaya olanak sağlamasıdır.

Ayrıca bakınız

Kaynakça

  1. ^ Www.goldenratioinstatistics.com/calculate.aspx
  2. ^ Gunver, Mehmet Guven; Senocak, Mustafa Sukru; Vehid, Suphi (2017)  "To determine skewness, mean and deviation with new approach to contiuous data" PONTE International Journal of Sciences and Research Cilt:73/2 (Subat), " 2 Haziran 2018 tarihinde Wayback Machine sitesinde arşivlendi. doi:10.21506/j.ponte.2017.2.34

Dış kaynaklar

  • Spiegel, Murray R ve Stephens, Larry J. (Tr.Çev.: Çelebioğlu, Salih) (2013) Istatistik, İstanbul: Nobel Akademik Yayıncılık ISBN 9786051337043
  • Günver, Mehmet Güven; Șenocak, Mustafa Şükrü ve Vehid, Suphi (2014) İstatistikte Altın Oran, İstanbul:Türkmen Kitabevi, ISBN : 976054749409
  • g
  • t
  • d
İstatistik
Betimsel istatistik
Sürekli veriler
Merkezî konum
Yayılma
Dağılım şekli
Varyans • Çarpıklık • Basıklık • Moment (matematik)
İstatistiksel tablolar
Sıklık dağılımı  • Çoklu sayılı özetleme tabloları  • İlişki tablosu  • Çoklu-yönlü sınıflandırma tabloları
İstatistiksel grafikler
Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı
Veri toplama
Örnek tasarımı
Deneysel tasarım
Anakütle • İstatistiksel deneysel tasarım tipleri  • Deneysel hata  • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları
Örneklem büyüklüğü • Sınama gücü  • Etki büyüklüğü • Örnekleme dağılımı •Standart hata
Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler
Çıkarımsal analiz tipleri
Kestirim  • Parametrik çıkarımsal analiz  •Parametrik olmayan çıkarımsal analiz  • Bayesci çıkarımsal analiz  • Meta-analiz
Çıkarımsal kestirim
Genel kestirim kavramları
Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl  • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim
Kestirim  • Güven aralığı  • İnanılır aralık
Hipotez testi
İstatistiksel test ana kavramları
Sıfır hipotez  • I.Tür ve II.Tür hata  • Anlamlılık seviyesi  •p-değeri
Basit tek-değişkenli ve iki-değişkenli
parametrik hipotez testi
μ için testi •

π için test • μ12 için test • π12 için test  •

σ12 için test
Tek-değişkenli ve iki-değişkenli
parametrik olmayan test analizi
Medyan testi  • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı  • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi
Korelasyon
ve
Regresyon analizi
Korelasyon
Doğrusal regresyon
Regresyon analizi  • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon
Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi
Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni
Çokdeğişkenli istatistik
Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi  •Kanonik korelesyon  • Uygunluk analizi  • Kümeleme analizi
Zaman serileri analizi
Yapısal model tanımlanması
Zaman serisi yapisal model ögeleri  • Zaman serisi ögeleri saptanması  • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri
Dekompozisyon • Trend uygulama kestirimi  • Üssel düzgünleştirme  • ARIMA modelleri  • Box–Jenkins  • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi
Zaman seri kestirim değerlendirmesi
Sağkalım analizi
Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli
Kategori • Outline • Endeks