R istatistiksel hesaplama veya grafikleri için bilgisayar programı olup aynı zamanda programlama dilidir. Yeni Zelanda Auckland Üniversitesinden Ross Ihaka ve Robert Gentleman tarafından ortaya çıkarılan R hali hazırda R Geliştirme Çekirdek Ekibi tarafından geliştirilmektedir. S programlama dilinin açık kaynak kodlu versiyonu olan R bundan dolayı bazen GNU S olarak da anılmaktadır.
İstatistiki yazılım geliştirme için istatistikçiler arasında de fakto standart haline gelen R istatistiki yazılım geliştirme ve veri analizi alanında kullanılmaktadır. GNU projesinin bir parçası olan R nin kaynak kodları GNU Genel Kamu Lisansı altında olup değişik işletim sistemleri için sürümleri mevcuttur. R komut satırı arayüzü kullanıyor olsa da değişik grafik kullanıcı arayüzleride bulunmaktadır.
Python
Python, Guido Van rossum adlı hollandalı bir programcı tarafından yazılmış bir programlama dilidir. Geliştirilmesine 1990 yılında geliştirmeye başlanmıştır . Son 5-6 senede kullanımı ve topluluğu oldukça gelişerek popüler bir dil haline gelmiştir.
Hangisini Kullanmalıyız
İkiside İşe başvururken ikisini bilmenizde fayda var ayrıca veri biliminde ilerleyecek olan kişiler temelde bu ikisini kullanacaktır. Eğer programlama dili geçmişiniz varsa çok kısa sürede pythonu öğrenebilirsiniz. Eğer yoksa yine pythonu hemen öğrenebilirsiniz veya R yi öğrenmeye başlayabilirsiniz. Hangisi daha kolay, o daha zor, bunun şusu var gibi muhabbetler dönüyor ortalıkta. Arkadaşlar; dilleri öğrenmek marifet değil her yerde dersler var üşenmeden, eğitim videolarına ücretsiz ulaşabilirsiniz. Özellikle de zorluk kısmında R ye büyük bir stem var. Ben R ve python dahil belli başlı dilleri kullanan birisi olarak R nin zor olmadığını gönül rahatlığıyla söylenebilinir. Dillerin yazımı farklıdır oysaki mantık aynı. O yüzden bir dili öğrendiğiniz zaman diğerlerini daha kolay öğreniyorsunuz. Veri biliminde dilleri kıyaslamaktan ziyade dilin kullandığı kütüphaneleri kıyaslamamız gerekli işimiz kütüphanelerle. R de şöyle bir fark var ki R derslerine başladığınız zaman matrislerle işlemlere daha emekleme aşamasında geçeceksiniz, python için iş değişik önce dili öğrenip sonra veri bilimi konusuna geçeceksiniz. Çünkü R istatistik için geliştirildi ancak python genel amaçlı bir programlama dilidir. R de oyun yapamazsınız ama pythonda yaparsınız, R de virüs yazamazsınız ancak pythonda yazarsınız. Bazılarının R den pythona göç etmesinin sebebinin bu olduğunu düşünüyorum açıkcası. Bizim işimiz ne oyun yapmak nede virüs yazmak. Burda, gerçek veri bilimci ne yapmalı onu öğrenmeliyiz.Bir veriyi hemen işlemek istiyorsanız size R yi önerebilirim çünkü kullanacağınız fonksiyonların birazı gömülü olarak geliyor zaten. Pythonda numpy, pandas, matplotlib kullanmak yerine R da veriyi kolayca içe aktarıp veriyi görselleştirebilirsiniz. R daha kullanışlı gibi gelmiş olabilir. İş aslında biraz karışık ileri düzey görselleştirmeler için ggplot2 kullanmanız önerilir. Pythonda ise seborn kullanmanız gerekli. İkisini de öğrenmek aslına bakarsanız kolay ve eğlenceli R de adapte olma süreciniz var ilk derslerde alışık olmadığınız şekillerde kod yazacaksınız ancak bir şekilde atlatacaksınız bu durumu, ikisini de öğrenmek zorundasınız.
Modüller Paketler
Python modülleri; R paketleri kullanır, aslında aynı şeylerdir.
Pythonda öncelikle matematiksel işler için Numpy modülünü bilmeniz gereklidir, veri işlemleri için Pandas, veri görselleştirmek için Matplotlib, Makine öğrenmesi algoritmaları kullanacaksanız Scitlearn bilmeniz gerekiyor. İşi daha da büyütmek için Seaborn, Keras, Pytorch, Tensorflow kullanabilirsiniz.
R için kullanacağınız paketler dplyr, tidyr, ggplot2, lubridate, lattice, mlr, caret, esquisse, shinny, Rcrawler, DT, plotly gibi paketlerdir.