İstatistikçi ve veri bilimcisi: fark nedir?


İstatistikçiler ve veri bilimcileri verilerle çok çalışırlar ancak iki meslek arasında birkaç önemli fark vardır:

Fark #1 (Veri Türleri) – Veri bilimcileri kusurlu verileri toplamak ve temizlemek için daha fazla zaman harcama eğilimindeyken istatistikçiler genellikle düzenli verilere sahiptir.

Fark #2 (Nihai Hedefler) – Veri bilimciler sonuçları tahmin eden modeller oluşturmaya odaklanırken istatistikçiler değişkenler arasındaki ilişkiyi doğru bir şekilde tanımlayan modeller oluşturmaya odaklanma eğilimindedir.

Fark #3 (Üretim) – Veri bilimcileri işletmelerde üretime konulan modeller oluşturma eğilimindeyken istatistikçiler, olgu hakkında içgörü veya açıklamalar sağlayabilecek modeller oluşturma eğilimindedir.

Bu farklılıkların ayrıntılı bir açıklaması için okumaya devam edin.

Fark #1: Veri Türleri

Genel olarak veri bilimcileri genellikle istatistikçilerin kullandığı veri türünden daha karmaşık, çıkarılması daha zor ve çok daha büyük verilerle çalışır.

Örneğin, bir emlak şirketinde çalışan bir veri bilimcinin, hepsi farklı formatlarda olmak üzere birkaç farklı harici sunucudan milyonlarca satır içeren veri setlerini çıkarması gerekebilir.

Verileri çıkarmak ve modellemeye uygun bir formatta paketlemek için kapsamlı SQL bilgisine ve en az bir programlama diline ( R veya Python gibi) ihtiyacı olacaktı.

Buna karşılık istatistikçiler, halihazırda düzgün bir formatta sunulan daha küçük veri kümeleriyle çalışma eğilimindedir.

Örneğin, bir biyomedikal şirketinde çalışan bir istatistikçi, 50 farklı hastanın kan basıncı, kalp atış hızı ve kolesterol düzeylerine ilişkin bilgileri içeren 50 satırlık bir Excel dosyası alabilir.

Zamanlarını verileri çıkarmak ve temizlemek yerine, verilere uyacak uygun bir hipotez testi veya modeli üzerinde karar vermek ve seçilen test veya model istatistiğininvarsayımlarına uyulduğunu doğrulamak için muhtemelen daha fazla zaman harcayacaklardır.

Fark #2: Nihai Hedefler

Çoğu durumda, bir veri bilimcinin nihai hedefi, belirli sonuçları doğru bir şekilde tahmin edebilecek bir tür model oluşturmaktır.

Örneğin, bir finans şirketinde çalışan bir veri bilimci, belirli kişilerin bir krediyi temerrüde düşürüp düşürmeyeceğini doğru bir şekilde tahmin edebilecek bir lojistik regresyon modeli oluşturmaya çalışabilir.

Tahmin edici değişkenlerin farklı kombinasyonlarını kullanarak çeşitli modeller uyduracaklar ve en doğru tahminleri üreten modeli bulmaya çalışacaklar.

Nihai hedefleri, her öngörücü değişkenin yanıt değişkeniyle nasıl ilişkili olduğunu tam olarak ölçmek yerine doğru bir model oluşturmaktır.

Buna karşılık istatistikçiler, yordayıcı değişkenler ile yanıt değişkeni arasındaki ilişkiyi doğru bir şekilde tanımlayabilen modeller oluşturmaya daha fazla odaklanma eğilimindedir.

Örneğin, bir üniversitede çalışan bir istatistikçi, farklı çalışma alışkanlıklarının sınav puanlarını tam olarak nasıl etkilediğini ölçen bir çalışmaya katılmak üzere 30 öğrenciyi işe alabilir.

Bu senaryoda istatistikçi, regresyon modeli katsayılarını yorumlamak ve yanıt değişkeni ile istatistiksel olarak anlamlı bir ilişkiye sahip olup olmadıklarını anlamak için bunlara karşılık gelen p değerlerini analiz etmekle daha fazla ilgilenecektir.

Fark #3: Üretim

Genel olarak veri bilimcileri, istatistikçilerden çok daha sık olarak işletmelerde üretime alınan istatistiksel modeller oluşturma eğilimindedir.

Örneğin, büyük bir market zincirinde çalışan bir veri bilimci, çeşitli ürünlerin satışlarını doğru bir şekilde tahmin edebilecek bir model oluşturabilir.

Nihai hedefi, modelini her gece çalışan ve her yeni gün için ürün satışlarını tahmin edebilen bir sunucuya yerleştirmesine yardımcı olabilecek şirketteki geliştiricilerle çalışmak olacaktır.

Öte yandan istatistikçiler nadiren bir üretim türüne entegre edilmiş modeller yaratırlar.

Örneğin, bir sağlık şirketinde çalışan bir istatistikçi, çeşitli yaşam tarzı faktörleri (sigara içme, egzersiz, diyet vb.) arasındaki ilişkiyi açıklayan bir model oluşturabilir, ancak nihai hedefi, bu faktörler ile bir yanıt değişkeni arasındaki ilişkiyi ölçmektir . . ömrü gibi.

Nihai hedefleri, üretim ortamına yerleştirilmiş bir model yerine onlara bilgi sağlayan bir model yaratmaktır.

Çözüm

İstatistikçiler ve veri bilimcileri, günlük rollerinde verilerle çalışırlar ancak bunu farklı şekillerde yaparlar.

Veri bilimcileri genellikle karmaşık ve işlenmesi gereken daha geniş çeşitlilikte verilerle çalışma eğilimindeyken istatistikçiler genellikle daha küçük, daha düzenli veri kümeleriyle çalışır.

Veri bilimcileri ayrıca sonuçları doğru bir şekilde tahmin edebilecek modeller oluşturmaya daha fazla odaklanma eğilimindeyken istatistikçiler değişkenler arasındaki ilişkiyi doğru bir şekilde açıklayabilen modeller oluşturma eğilimindedir.

Son olarak, veri bilimcileri işletmelerde modelleri üretime koyma eğilimindeyken istatistikçiler gerçek dünya olgularına dair içgörü sağlamak için sonuçlarını sıklıkla özetleyip rapor ederler.

Ek kaynaklar

Aşağıdaki makaleler çeşitli alanlarda istatistiğin önemini açıklamaktadır:

İstatistikler neden önemlidir? (İstatistiğin önemli olmasının 10 nedeni!)
İşletmelerde istatistiğin önemi
Eğitimde istatistiğin önemi
Sağlıkta istatistiğin önemi
Finansta istatistiğin önemi

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir