Veri Bilimi için Python
Python, Veri Bilimi, Makine Öğrenimi ve Derin Öğrenmede kullanılan en popüler dildir. Anlaması oldukça kolay. Bu yüzden, dile kendinizi aşina olarak başlamanızı öneririm. Yine de anlaşılması gereken en önemli kavramlar, veri yapıları ve Python işlevleridir.
Sayısal Hesaplama için NumPy
Python'u öğrendikten sonra, şimdi NumPy'yi öğrenmeye devam edebilirsiniz. NumPy, ortalama gibi sayısal hesaplamalar için kullanılan bir pakettir. Diğer veri bilimi paketlerinin çoğu da bunun üzerine inşa edilmiştir, Bu yüzden bu sahip olunması gereken bir beceridir. Burada anlaşılması gereken en temel öğe NumPy dizileri ve bunlar üzerindeki işlemlerdir.
Pandalarla Veri Manipülasyonu
Ardından, veri temizleme ve işleme için bir araca ihtiyacınız var . Pandas, tam da bunu yapan NumPy'nin üzerine inşa edilmiş bir araçtır. Çoğu veri genellikle temiz olmadığından, bu cephaneliğinizde bulundurmanız gereken bir araçtır. Burada anlaşılması gereken en önemli şey, Pandas DataFrameler ve bunların nasıl değiştirilmesi gerektiğidir.
Matplotlib ile görselleştirme
Artık verilerinizi temizleyip işleyebildiğinize göre, analizlerinizi görselbir şekilde paylaşabilmeniz iyi olur . Matplotlib'e girin. Bu, veri analizinizin sonuçlarını görselleştirmek için kullanabileceğiniz bir araçtır. Sadece birkaçını belirtmek için kategorileri , dağılımları , ilişkileri görselleştirmek için kullanabilirsiniz .
Seaborn ile Güzel Görselleştirmeler
Seaborn, Matplotlib üzerine inşa edilmiştir ve size Matplotlib'den daha iyi görünen görseller verecektir. Aracın kullanımı çok kolaydır. Ancak, çok karmaşık görseller gerçekleştirmek istemeniz durumunda, Matplotlib'e geri dönmeniz gerekebileceğini unutmamak önemlidir.
Plotly ile Etkileşimli Görselleştirmeler
Ploty, birinin etkileşime girebileceği görseller oluşturmanıza olanak tanır. Örneğin, bir alanın üzerine geldiğinizde daha fazla bilgi ve görselleştirmelerinizi yakınlaştırıp uzaklaştırma yeteneğini görün . Plotly ile entegre olan Mapbox'ı kullanarak haritalama gibi gelişmiş görselleştirmeler de yapabilirsiniz .
Dash ile Etkileşimli Web Uygulamaları
Dash,Plotly kullanarak etkileşimli veri bilimi uygulamaları oluşturmanıza olanak tanıyan bir web çerçevesidir . Plotly'de yapılan herhangi bir görselleştirme Dash'de de yapılabilir. Araç, Dash HTML bileşenleri aracılığıyla etiketler aracılığıyla tüm Html'leri sağlar . Dash Core Bileşenleri aracılığıyla gelişmiş etkileşimli görseller sağlamalıdır . Dash Callbacks ilkesine göre çalışır . Genellikle bu geri aramalara bazı Girdi ve Çıktılar sağlarsınız. Giriş değiştiğinde, Dash geri arama işlevlerini çalıştırır. İnanılmaz, değil mi?
Streamlit ile Veri Bilimi Uygulamaları
Dash alternatifleri arıyorsanız, akıcı ışık budur. Veri bilimcilerin ve makine öğrenimi mühendislerinin yalnızca birkaç saat içinde güzel , yüksek performanslı uygulamalar oluşturmaları için açık kaynaklı bir çerçevedir .
Power BI Desktop ile Gösterge Panoları oluşturun
Herhangi bir kod yazmak istemiyorsanız , muhtemelen Power BI Desktop'a bakabilirsiniz . Yine de, verilerinizi Powe BI Desktop'a aktarmadan önce temizlemenin bir yolunu bulmanız gerekecek, bunu yapmanın Python kullanmaktan daha iyi bir yolunu bulamıyorum.
Makine öğrenme
Yapabileceğiniz bir sonraki şey, makine öğrenimi dünyasına dalmaktır. Burada, denetimli ve denetimsiz makine öğrenimi yapmak için en harika becerileri öğreneceksiniz . Açık kaynaklı Scikit-Learn paketi, bunun için ihtiyacınız olan tüm araçları sağlayacaktır. İşte odak anlamak olacaktır veri edilmektedir hazırlanan makine öğrenme modelleri için veri bölünme yanı sıra değerlendirerek modelleri öğrenme makinenizi.
Dernek Kural Madenciliği
Bu, ürünler arasındaki ilişkiyi bulmak için kullanılan bir tekniktir. Süpermarketler gibi perakende satış alanlarında çalışıyorsanız, bunu faydalı bulacaksınız. Bu beceri, sık sık birlikte satın alınan ürünleri tanımlayarak satışları artırmanıza yardımcı olabilir . Örneğin, bir Eczanede, A ilacını alan bir hastanın aynı zamanda kazılan B'yi de satın aldığını görebilirsiniz. A ilacını alan bir hastaya reçetesinde de B ilacı olup olmadığını sormak mantıklıdır. Çevrimiçi mağazalarda veya öğrenme platformlarında sıkça satın alınan bir bölüm şeklinde kullanılan bu tekniği gördünüz .
Doğal Dil İşleme
Günümüzde metin biçiminde çok fazla veriye sahibiz . Bu veriler bloglardan ve Twitter gibi sosyal sitelerden elde edilebilir. Bu yüzyılın vazgeçilmez becerisinde bu verilerden anlam çıkarma yeteneği. Bununla birlikte, metin verilerinin işlenmesi parkta yürüyüş değildir. Metin verilerini sayısal bir biçimde temsil etmenin bir yolunu bulmalısınız . İyi haber şu ki, bunu yapmanızı sağlayacak çok sayıda araç var.
Derin Öğrenme
Makine öğreniminin karmaşıklıklarını anladıktan sonra, şimdi Derin Öğrenmeye bakma zamanınız geldi. Bu, sinir ağlarının uygulanmasını içeren bir makine öğrenimi uygulamasıdır . Bu ağlar, insan beyninin çalışmasını taklit eder. Derin Öğrenme, büyük bir veri kümeniz olduğunda büyük ölçüde kullanılır. Ayrıca görüntü sınıflandırma, görüntü bölümleme ve nesne algılama gibi bilgi işlem yoğunluklu işlemlerde de yaygın olarak kullanılmaktadır . Bunu yapmak için en popüler araçlardır TensorFlow, Keras ve Pytorch.
Otomatik Makine Öğrenimi
Bu oldukça yeni bir alan ama dünyayı bir fırtına gibi kasıp kavuruyor. Verilerinizi bir modele besleyebildiğinizi ve bunun sizin için her şeyi yapacağını bir an için hayal edin. Bu, en iyi sonuçları elde etmek için veri işlemeyi ve modelin ayarlanmasını içerir . Bu, AutoML nin vaadidir . AutoSklearn ve AutoKeras dahil bunu yapmanızı sağlayan araçlardır.