Rehber İstatistik nedir?



İstatistik, nicel verilerin toplanması, tanımlanması, analizi ve bunlardan sonuç çıkarılmasını içeren uygulamalı matematiğin bir dalıdır. İstatistiğin arkasındaki matematiksel teoriler büyük ölçüde diferansiyel ve integral hesap, doğrusal cebir ve olasılık teorisine dayanır.

İstatistik yapan kişiler istatistikçi olarak adlandırılır. Özellikle küçük örneklerin davranışlarından ve diğer gözlemlenebilir özelliklerinden büyük gruplar ve genel olaylar hakkında güvenilir sonuçların nasıl çıkarılacağını belirlemekle ilgilenirler. Bu küçük örnekler, büyük grubun bir bölümünü veya genel bir olgunun sınırlı sayıda örneğini temsil eder.

İstatistiği Anlama​

İstatistik, fiziksel ve sosyal bilimlerin yanı sıra iş dünyası, beşeri bilimler, hükümet ve üretim gibi neredeyse tüm bilimsel disiplinlerde kullanılmaktadır. İstatistik temelde, kalkülüs ve doğrusal cebir gibi matematiksel araçların olasılık teorisine uygulanmasıyla gelişen uygulamalı matematiğin bir dalıdır.

Uygulamada istatistik, daha az sayıda benzer nesne veya olayın (bir örneklem) özelliklerini inceleyerek büyük nesne veya olay kümelerinin (bir popülasyon) özellikleri hakkında bilgi edinebileceğimiz fikridir. Popülasyonun tamamı hakkında kapsamlı veri toplamak çok maliyetli, zor veya çoğu durumda imkansızdır, bu nedenle istatistik, uygun veya ekonomik olarak gözlemlenebilen bir örneklemle başlar.

İstatistikçiler bir örneklemdeki bireyler veya unsurlar hakkında ölçüm yapar ve veri toplar, ardından bu verileri analiz ederek tanımlayıcı istatistikler oluştururlar. Daha sonra örneklem verilerinin "istatistik" olarak adlandırılan bu gözlemlenmiş özelliklerini, parametreler olarak bilinen daha geniş popülasyonun ölçülmemiş (veya ölçülmemiş) özellikleri hakkında çıkarımlar veya eğitimli tahminler yapmak için kullanabilirler.

Bilgi: İstatistik gayri resmi olarak yüzyıllar öncesine dayanır. Fransız matematikçiler Pierre de Fermat ve Blaise Pascal arasında 1654 yılında yapılan yazışmaların erken bir kaydı, istatistiksel olasılık analizinin erken bir örneği olarak gösterilir.

Tanımlayıcı ve Çıkarımsal İstatistikler​

İstatistiğin iki ana alanı, örneklem ve popülasyon verilerinin özelliklerini tanımlayan tanımlayıcı istatistikler ve bu özellikleri hipotezleri test etmek ve sonuçlar çıkarmak için kullanan çıkarımsal istatistikler olarak bilinir. Tanımlayıcı istatistikler ortalama, varyans, çarpıklık ve basıklığı içerir. Çıkarımsal istatistikler doğrusal regresyon analizi, varyans analizi (ANOVA), Logit/Probit modelleri ve boş hipotez testlerini içerir.

Tanımlayıcı İstatistikler

Tanımlayıcı istatistikler çoğunlukla örneklem verilerinin merkezi eğilimine, değişkenliğine ve dağılımına odaklanır. Merkezi eğilim, bir örneklemin veya popülasyonun tipik bir unsuru olan özelliklerin tahmini anlamına gelir. Ortalama, medyan ve mod gibi tanımlayıcı istatistikleri içerir.

Değişkenlik, ölçülen özellikler boyunca bir örneklemin veya popülasyonun unsurları arasında ne kadar fark olduğunu gösteren bir dizi istatistiği ifade eder. Aralık, varyans ve standart sapma gibi ölçütleri içerir.

Dağılım, histogram veya nokta grafiği gibi bir grafik üzerinde gösterilebilen ve olasılık dağılım fonksiyonu, çarpıklık ve basıklık gibi özellikleri içeren verilerin genel "şeklini" ifade eder. Tanımlayıcı istatistikler, bir veri kümesinin öğelerinin gözlemlenen özellikleri arasındaki farklılıkları da tanımlayabilir. Bir veri örneğinin unsurlarının kolektif özelliklerini anlamamıza yardımcı olabilir ve hipotezleri test etmek ve çıkarımsal istatistikleri kullanarak tahminler yapmak için temel oluşturabilirler.

Çıkarımsal İstatistik


Çıkarımsal istatistikler, istatistikçilerin bir örneklemin özelliklerinden yola çıkarak bir popülasyonun özellikleri hakkında sonuçlar çıkarmak ve bu sonuçların güvenilirliğinden ne kadar emin olabileceklerini belirlemek için kullandıkları araçlardır. İstatistikçiler, örneklem büyüklüğü ve dağılımına dayanarak, bir veri örneğindeki merkezi eğilimi, değişkenliği, dağılımı ve özellikler arasındaki ilişkileri ölçen istatistiklerin, örneğin alındığı tüm popülasyonun karşılık gelen parametrelerinin doğru bir resmini sağlama olasılığını hesaplayabilirler.

Çıkarımsal istatistikler, tüketicilerin satın alma alışkanlıklarından oluşan bir örneklem üzerinde anket yaparak bir ürüne yönelik ortalama talebi tahmin etmek veya gelecekteki olayları tahmin etmeye çalışmak gibi büyük gruplar hakkında genellemeler yapmak için kullanılır. Bu, bir örneklem dönemindeki getirilere dayanarak bir menkul kıymetin veya varlık sınıfının gelecekteki getirisini tahmin etmek anlamına gelebilir.

Regresyon analizi, bir bağımlı değişken ile bir veya daha fazla açıklayıcı (bağımsız) değişken arasındaki ilişkinin (korelasyon) gücünü ve doğasını belirlemek için kullanılan yaygın bir istatistiksel çıkarım tekniğidir. Bir regresyon modelinin çıktısı genellikle istatistiksel anlamlılık için analiz edilir, bu da test veya deneyle elde edilen bulgulardan elde edilen bir sonucun rastgele veya tesadüfen meydana gelme olasılığının düşük olduğu iddiasını ifade eder. Veriler tarafından açıklanan belirli bir nedene atfedilebilir olması muhtemeldir.

Tanımlayıcı ve Çıkarımsal İstatistik Arasındaki Fark Nedir?

Tanımlayıcı istatistikler, bir değişkenin ortalaması, standart sapması veya sıklığı gibi bir örneklemin veya veri setinin özelliklerini tanımlamak veya özetlemek için kullanılır. Çıkarımsal istatistikler, bir veri setindeki değişkenleri birbiriyle ilişkilendirmek için herhangi bir sayıda teknik kullanır. Korelasyon veya regresyon analizinin kullanılması buna bir örnektir. Bunlar daha sonra tahminleri tahmin etmek veya nedenselliği çıkarmak için kullanılabilir.

Ortalama, Medyan ve Mod

Ortalama, medyan ve mod terimleri merkezi eğilim şemsiyesi altında yer alır. Belirli bir örneklem grubunda tipik olan bir unsuru tanımlarlar. Ortalama tanımlayıcıyı, gruptaki sayıları toplayıp sonucu veri seti gözlemlerinin sayısına bölerek bulabilirsiniz.

Kümedeki orta sayı medyandır. Dahil edilen tüm sayıların yarısı medyandan yüksek, yarısı da düşüktür. Bir mahallede 500.000$, 400.000$, 350.000$, 325.000$ ve 300.000$ değerinde beş ev bulunuyorsa, bu mahalledeki medyan ev değeri 350.000$ olacaktır. İki değer daha yüksek ve iki değer daha düşüktür.

Mod, en yüksek ve en düşük değerler arasında kalan sayıyı tanımlar. Veri setinde en sık görülen sayıdır.

İstatistiksel Verileri Anlama​

İstatistiğin kökeni değişkenlere dayanır. Değişken, bir öğenin bir özelliğini veya niteliğini işaret eden sayılabilen bir veri kümesidir. Örneğin, bir arabanın markası, modeli, yılı, kilometresi, rengi veya durumu gibi değişkenleri olabilir. İstatistikler, belirli bir park yerindeki tüm arabaların renkleri gibi bir dizi verideki değişkenleri birleştirerek, eğilimleri ve sonuçları daha iyi anlamamızı sağlar.

İki ana değişken türü vardır. İlk olarak, nitel değişkenler genellikle sayısal olmayan belirli niteliklerdir. Araba örneğinde verilen örneklerin çoğu nitelikseldir. İstatistikteki diğer nitel değişken örnekleri cinsiyet, göz rengi veya doğum şehridir. Nitel veriler çoğunlukla herhangi bir nitel değişken için bir sonucun yüzde kaçının gerçekleştiğini belirlemek için kullanılır. Nitel analiz genellikle sayılara dayanmaz. Örneğin, kadınların yüzde kaçının bir iş sahibi olduğunu belirlemeye çalışmak nitel verileri analiz eder.

İstatistikteki ikinci değişken türü nicel değişkenlerdir. Nicel değişkenler sayısal olarak incelenir ve yalnızca sayısal olmayan bir tanımlayıcı ile ilgili olduklarında ağırlığa sahiptirler. Niceliksel analize benzer şekilde, bu bilgi sayılara dayanır. Yukarıdaki araba örneğinde, katedilen kilometre nicel bir değişkendir ancak 60.000 sayısının katedilen toplam kilometre sayısı olduğu anlaşılmadıkça hiçbir değeri yoktur.

Nicel değişkenler ayrıca iki kategoriye ayrılabilir. İlk olarak, kesikli değişkenler istatistikte sınırlamalara sahiptir ve potansiyel kesikli değişken değerleri arasında boşluklar olduğu sonucunu çıkarır. Bir futbol maçında atılan sayı ayrık bir değişkendir çünkü:
  • Ondalık sayılar olamaz ve
  • Bir takımın sadece bir puan alması imkansızdır
İstatistik ayrıca sürekli nicel değişkenlerden de yararlanır. Bu değerler bir ölçek boyunca ilerler. Kesikli değerlerin sınırlamaları vardır ancak sürekli değişkenler genellikle ondalık sayılarla ölçülür. Futbolcuların boyları ölçülürken olası sınırlar dahilinde herhangi bir değer elde edilebilir ve boylar daha fazla olmasa da bir inçin 1/16'sına kadar ölçülebilir.

İstatistiksel Ölçüm Düzeyleri​

Değişkenleri ve sonuçları analiz ettikten sonra ortaya çıkan birkaç ölçüm seviyesi vardır. İstatistikler sonuçları dört şekilde ölçebilir.

Nominal Düzeyde Ölçüm
Sayısal veya nicel bir değer yoktur ve nitelikler sıralanmaz. Nominal düzeydeki ölçümler bunun yerine diğer değişkenlere atanan etiketler veya kategorilerdir. Nominal düzeydeki ölçümleri bir değişken hakkındaki sayısal olmayan gerçekler olarak düşünmek en kolay yoldur.

Örnek: 2020'de seçilen Başkanın adı Joseph Robinette Biden, Jr. idi.

Ordinal Düzeyde Ölçüm
Sonuçlar bir sıraya göre düzenlenebilir ancak tüm veri değerleri aynı değere veya ağırlığa sahiptir. Sayısal olmasına rağmen, sıralı düzeydeki ölçümler istatistikte birbirlerinden çıkarılamaz çünkü yalnızca veri noktasının konumu önemlidir. Sıra düzeyleri genellikle parametrik olmayan istatistiklere dahil edilir ve toplam değişken grubuyla karşılaştırılır.

Örnek: Amerikalı Fred Kerley, 100 metre sprint sürelerine göre 2020 Tokyo Olimpiyatları'nda en hızlı 2. adamdı.

Aralık Düzeyinde Ölçüm
Sonuçlar sırayla düzenlenebilir ancak veri değerleri arasındaki farkların artık bir anlamı olabilir. İki veri noktası genellikle geçen zamanı veya bir veri setindeki değişen koşulları karşılaştırmak için kullanılır. Veri değerleri aralığı için genellikle bir "başlangıç noktası" yoktur ve takvim tarihleri veya sıcaklıklar anlamlı bir içsel sıfır değerine sahip olmayabilir.

Örnek: Enflasyon Mayıs 2022'de %8,6'ya ulaştı. Enflasyonun bu kadar yüksek olduğu en son tarih Aralık 1981'dir.

Oran Düzeyinde Ölçüm
Sonuçlar sırayla düzenlenebilir ve veri değerleri arasındaki farklar artık anlamlıdır ancak istatistiksel bir değere daha fazla değer katmak için kullanılabilecek bir başlangıç noktası veya "sıfır değeri" vardır. Veri değerleri arasındaki oranın, sıfırdan uzaklığı da dahil olmak üzere bir anlamı vardır.

Örnek: Kaydedilen en düşük meteorolojik sıcaklık Antarktika'da -128,6 Fahrenheit derecedir.

İstatistik Örnekleme Teknikleri​

İstatistiksel bilgi toplamak için bir popülasyondaki her veri noktasından veri toplamak genellikle mümkün olmaz. İstatistik bunun yerine, analiz edilmesi daha kolay olan popülasyonun temsili bir alt kümesini oluşturmak için farklı örnekleme tekniklerine dayanır. İstatistikte birkaç temel örnekleme türü vardır.

Basit Rastgele Örnekleme
Popülasyondaki her üyenin analiz için eşit seçilme şansına sahip olmasını gerektirir. Tüm popülasyon örnekleme için temel olarak kullanılır ve şansa dayalı herhangi bir rastgele üretici örnek öğeleri seçebilir. Örneğin, 100 birey sıraya dizilir ve 10 tanesi rastgele seçilir.

Sistemik Örnekleme
Rastgele bir örneklem gerektirir ancak yürütülmesini kolaylaştırmak için tekniği biraz değiştirilmiştir. Tek bir rastgele sayı üretilir ve daha sonra örneklem büyüklüğü tamamlanana kadar bireyler belirli bir düzenli aralıkla seçilir. Örneğin, 100 birey sıraya dizilir ve numaralandırılır. Örneklem için 7. birey seçilir ve ardından 10 örneklem öğesi seçilene kadar her 9. birey seçilir.

Tabakalı Örnekleme

Örnekleminiz üzerinde daha fazla kontrol gerektirir. Nüfus, benzer özelliklere göre alt gruplara ayrılır. Daha sonra her bir alt gruptan kaç kişinin tüm popülasyonu temsil edeceğini hesaplarsınız. Örneğin, 100 kişi cinsiyet ve ırka göre gruplandırılır. Daha sonra her alt gruptan, o alt grubun popülasyonu ne kadar temsil ettiği ile orantılı bir örneklem alınır.

Küme Örneklemesi
Alt gruplar gerektirir ancak her alt grup popülasyonu temsil etmelidir. Bir alt grup içindeki bireylerin rastgele seçilmesi yerine tüm alt grup rastgele seçilir.

İstatistiğin Kullanım Alanları​

İstatistik; finans, yatırım, iş dünyası ve dünyada öne çıkan bir konudur. Gördüğünüz bilgilerin ve size verilen verilerin çoğu, bir işin tüm yönlerinde kullanılan istatistiklerden türetilmiştir.
  • Yatırım alanındaki istatistikler arasında ortalama işlem hacmi, 52 haftanın en düşük, 52 haftanın en yüksek değeri, beta ve varlık sınıfları veya menkul kıymetler arasındaki korelasyon yer alır.
  • Ekonomideki istatistikler GSYİH, işsizlik, tüketici fiyatlandırması, enflasyon ve diğer ekonomik büyüme ölçütlerini içerir.
  • Pazarlama alanındaki istatistikler dönüşüm oranlarını, tıklama oranlarını, arama miktarlarını ve sosyal medya metriklerini içerir.
  • Muhasebe alanındaki istatistikler zaman içinde likidite, ödeme gücü ve karlılık ölçütlerini içerir.
  • Bilgi teknolojisindeki istatistikler bant genişliğini, ağ yeteneklerini ve donanım lojistiğini içerir.
  • İnsan kaynakları istatistikleri arasında çalışan devri, çalışan memnuniyeti ve piyasaya göre ortalama ücret yer alır.

İstatistik Neden Önemlidir?​

İstatistikler, işlerin nasıl yürüdüğüne dair bilgi sağlar. Araştırma yapmak, sonuçları değerlendirmek, eleştirel düşünmeyi geliştirmek ve bilinçli kararlar almak için kullanılırlar. İstatistik, olayların neden meydana geldiğini, ne zaman meydana geldiğini ve tekrar meydana gelmesinin öngörülebilir olup olmadığını araştırmak için hemen hemen her çalışma alanını sorgulamak için kullanılabilir.

İstatistiği Kimler Kullanır?​

İstatistik, bir dizi uygulama ve meslekte yaygın olarak kullanılmaktadır. İstatistik, veriler toplandığında ve analiz edildiğinde yapılır. Bu, devlet kurumlarından akademik araştırmalara ve yatırımların analizine kadar uzanabilir.

İstatistik Ekonomi ve Finansta Nasıl Kullanılır?
Ekonomistler tüketici harcamalarından konut başlangıçlarına, enflasyondan GSYH büyümesine kadar her türlü veriyi toplar ve inceler. Finans alanında ise analistler ve yatırımcılar şirketler, sektörler, duyarlılık, fiyat ve hacme ilişkin piyasa verileri hakkında veri toplar. Bu alanlarda çıkarımsal istatistiklerin kullanımı ekonometri olarak bilinir. CAPM'den Modern Portföy Teorisine (MPT) ve Black-Scholes opsiyon fiyatlandırma modeline kadar birçok önemli finansal model istatistiksel çıkarımlara dayanmaktadır.

Sonuç​

İstatistik, ilk bakışta ve yüzeyde çelişkili veya ilgisiz görünebilecek bilgi parçalarını analiz etme uygulamasıdır. Sağlam bir kariyer sağlayabilir, günlük yaşamda da kullanışlı bir ölçüt olabilir.
 
Bu siteyi kullanmak için çerezler gereklidir. Siteyi kullanmaya devam etmek için çerezleri kabul etmelisiniz. Daha Fazlasını Öğren.…