Etkili Veri Bilimcilerden Öğrendiğim 15 Alışkanlık
Veri bilimi alanına girme söz konusu olduğunda, sizi bitiş çizgisine iten bir avantajı kendinize vermek için kitaptaki her numarayı kullanmanız gerekir.
Öyleyse neden sektördekilerin alışkanlıklarını taklit etmeye çalışmıyorsunuz?
Bu makale, verimli bir veri bilimcisi olmak için “hızlı bir şekilde zengin olma” yöntemi değildir. Bunun yerine, en iyi veri bilimcilerinin bulundukları yere ulaşmalarına yardımcı olan alışkanlıklarını gösterir.
Bir veri bilimcinin değerinin, bir kuruluş üzerinde sahip olabileceği etkiye göre belirlendiği sıklıkla söylenir. Bu etki, iyi alışkanlıklar geliştirerek verimli ve etkili bir veri bilimcisi olmakla başlar.
1. Teknolojiyle güncel kalın.
Sadece son on yılda kaç tane güncel veri bilimi teknolojisi ortaya çıktı? Neredeyse hepsi.
İyi bir hamle yapacağınız motivasyonuyla veri bilimi alanına girerek, kendinizi ömür boyu sürekli öğrenmeye mahkum ettiniz. Merak etmeyin, göründüğü kadar kasvetli değil.
Bununla birlikte, her zaman aklınızda tutmanız gereken şey, işgücünde kalabilmek için güncel teknolojiye hakim olmalısınız. Öyleyse, kariyeriniz boyunca MATLAB ile veri analizi yapıyorsanız, Python’da kodlamayı öğrenmeyi deneyin. Görselleştirmelerinizi Matplotlib ile oluşturuyorsanız, Plotly’yi yeni bir şey için kullanmayı deneyin.
Bu alışkanlık nasıl uygulanır: Her hafta bir saat ayırın (veya ayırabildiğiniz kadar zaman ayırın) ve yeni teknolojileri deneyin. Blog gönderilerini okuyarak hangi teknolojilerin alakalı olduğunu öğrenin ve yığına eklemek istediğiniz bir çift seçin. Ardından, yeni teknolojileri yeteneklerinin en iyi şekilde nasıl kullanacaklarını öğrenmek için bazı kişisel projeler oluşturun.
2. Düzgün dokümantasyon
Her zaman korkunç belgelere sahip olan ve neler olup bittiğini anlamama yardımcı olacak destekleyici yorumlar içermeyen kodu okuyup bunlarla başa çıkma konusunda mutlu görünüyorum. Bir gün bunun kötü bir programcının işareti olduğunu fark ettim.
İlgilendiğim tüm iyi programcılar, çalışmalarını desteklemek için açık, özlü belgeler sağlayan ve programlarını belirli kod satırlarının ne yaptığını açıklamak için yararlı yorumlarla dolduranlardır. Bu, özellikle sorunları çözmek için karmaşık algoritmalar ve makine öğrenimi modelleri kullanan veri bilimcileri için geçerlidir.
Bu alışkanlık nasıl uygulanır: İyi kod belgelerini veya iyi kod belgelerinin nasıl yazılacağına ilişkin makaleleri okumak için biraz zaman ayırın. Pratik yapmak için eski kişisel projeler için belgeler yazın veya mevcut projelerinizin belgelerini yenilemek için biraz zaman ayırın.
3. Veri bilimi topluluklarına dahil olun.
Geliştiricilerin, dünya hakimiyetine yönelik kod yazmak için kendilerini yalnızlığa kilitleyen, macun gibi tenli sosyal dışlanmış klişesi, teknoloji endüstrisinin modern karmaşıklıklarını bir bütün olarak yansıtmayan modası geçmiş bir genellemedir.
“Kimse ada değildir.”- birçok veri bilimcinin en sevdiği alıntı
Veri biliminin karmaşıklığı, veri bilimcilerini gerekli kılan çeşitli sorunları çözmek için veri bilimi topluluğunun hem içinde hem de dışında büyük bir profesyonel destek ağının gerekli olmasını sağlamıştır.
Ancak, topluluğun önemi sadece profesyonel düzeyde bitmiyor. Veri bilimi alanı genişlerken, geleceğin analistlerinin ve mühendislerinin önünü açmaya yardımcı olmak gerekir, böylece onlar da bir etki yaratabilir ve diğer veri bilimcilerini daha fazla destekleyebilir.
Veri bilimi alanının “seksiliği” azalırken, gerekli değişiklikleri yapmanın tek yolu, sektöre daha iyisi için değişmesi için ilham veren topluluk çapında bir hareket başlatmak olacaktır.
Bu alışkanlık nasıl uygulanır: Bir akıl hocası olun, bilgilendirici blog yazıları yazın, veri bilimi forumlarına katılın ve soruları yanıtlamaya yardımcı olun, deneyimlerinizi paylaşmak için bir Youtube kanalı başlatın, Kaggle yarışmalarına ve hackathonlara katılın veya gelecekteki veri bilimcilerin becerileri öğrenmesine yardımcı olacak kurslar oluşturun sektöre girmeleri gerekiyor.
4. Kodunuzu düzenli olarak yeniden düzenleyin.
Yeniden düzenleme, orijinal işlevini değiştirmeden kodunuzu temizleme işlemidir. Yeniden düzenleme, yazılım geliştirme durumlarındaki gereklilikten doğan bir süreç olsa da, yeniden düzenleme, veri bilimcileri için yararlı bir alışkanlık olabilir.
Yeniden düzenleme konusundaki mantram “az çoktur”.
Veri bilimi problemlerini çözmek için başlangıçta kod yazdığımda, ihtiyacım olduğunda işe yarayan kod yazma lehine genellikle iyi kodlama uygulamalarını kapıdan attığımı görüyorum. Başka bir deyişle, çok fazla spagetti kodu gerçekleşir. Ardından, çözümümü çalıştırdıktan sonra geri dönüp kodumu temizliyorum.
Bu alışkanlık nasıl uygulanır: Eski koda bir göz atın ve aynı kodun daha verimli bir şekilde yazılıp yazılamayacağını sorun. Öyleyse, en iyi kodlama uygulamaları konusunda kendinizi eğitmek için biraz zaman ayırın ve kodunuzu kısaltabileceğiniz, optimize edebileceğiniz ve netleştirebileceğiniz yollar arayın.
5. Çalışma alanınızı, araçlarınızı ve iş akışınızı optimize edin.
IDE’ler için üretkenliği artıran o kadar çok uzantı var ki, şaşırtıcı bir şekilde, bazı insanlar iş akışlarını optimize etmeyi henüz seçmemişler.
Bu alışkanlık herkes için o kadar benzersizdir ki, hangi araçların, çalışma alanlarının ve iş akışlarının sizi olabileceğiniz en etkili ve verimli veri bilimcisi yaptığını belirlemek gerçekten aşağıya iner.
Bu alışkanlığı nasıl uygulayabilirsiniz: Yılda bir kez (veya bu sizin için daha iyi çalışıyorsa daha sık olarak), genel etkinliğinizin ve verimliliğinizin bir değerlendirmesini yapın ve nerede iyileştirebileceğinize karar verin. Belki de bu, sabah ilk iş olarak makine öğrenimi algoritmalarınız üzerinde çalışmak veya sandalye yerine bir egzersiz topu üzerinde oturmak veya IDE’nize sizin için kodunuzu bırakacak yeni bir uzantı eklemek anlamına gelir. En uygun formunuza girene kadar farklı çalışma alanları, araçlar ve iş akışlarıyla denemeler yapın.
6. İşle ilgili sorunları anlamaya odaklanın.
Gördüğüm kadarıyla, veri biliminin %75’i iş sorunlarını anlıyor ve %25’i nasıl çözüleceğini anlamak için modeller yazıyor.
Kodlama, algoritmalar ve matematik işin kolay kısmı. Bunların nasıl uygulanacağını anlamak, böylece belirli bir iş problemini çözebilmek, çok da kolay değil. İş problemini ve çözmeye çalıştığınız hedefleri anlamak için daha fazla zaman ayırdığınızda, sürecin geri kalanı çok daha sorunsuz olacaktır.
İçinde çalıştığınız sektörün karşı karşıya olduğu sorunları anlamak için, çözmeye çalıştığınız problemler hakkındaki bilginizi destekleyecek bir bağlam toplamak için biraz araştırma yapmanız gerekir. Örneğin, belirli bir işletmenin müşterilerini neyin harekete geçirdiğini veya bir mühendislik firmasının ulaşmaya çalıştığı belirli hedefleri anlamanız gerekir.
Bu alışkanlık nasıl uygulanır: Çalıştığınız belirli şirketi ve içinde bulundukları sektörü araştırmak için biraz zaman ayırın. Şirketin ana hedeflerini ve bununla ilgili konuları içeren, başvurabileceğiniz bir kopya kağıdı yazın. Kendi özel endüstrisi içinde karşılaşabilir. İşle ilgili sorunları çözmek için kullanmak isteyebileceğiniz algoritmaları veya gelecekte faydalı olabilecek makine öğrenimi modellerine yönelik fikirleri eklemeyi unutmayın. Yararlı bir şey keşfettiğinizde ve kısa bir süre sonra sektörle ilgili bilgilerden oluşan bir hazineye sahip olduğunuzda bu kısa nota ekleyin.
7. Minimalist bir tarz benimseyin.
Hayır, hayatta değil. Kodunuzda ve iş akışınızda.
Çoğu zaman, en iyi veri bilimcilerinin işi bitirmek için en az miktarda kod, en az miktarda veri ve en basit algoritmaları kullandıkları tartışılır.
Minimalist olarak hemen kıtlık varsaymanızı istemiyorum. Çoğu zaman, birisi kodda minimalizmin önemini tartıştığında, insanları yalnızca birkaç satır kod kullanan çirkin çözümler geliştirmeye yönlendirir. Evet, etkileyici, ama gerçekten zamanınızın en iyi kullanımı bu mu?
Bunun yerine, veri bilimi kavramlarına alıştığınızda, kodunuzu basit, temiz ve kısa hale getirmek için optimize edebileceğiniz yollar aramaya başlayın. İşi tamamlamak için basit algoritmalar kullanın ve fazlalıkları ortadan kaldırmak için yeniden kullanılabilir işlevler yazmayı unutmayın.
Bu alışkanlık nasıl uygulanır: Bir veri bilimcisi olarak ilerledikçe, daha verimli çözümler yazmaya, daha az kod yazmaya ve işi yapmak için daha basit algoritmalar ve modeller kullanmaya başlayın. Etkisini azaltmadan kodunuzu nasıl kısaltacağınızı öğrenin ve kodun sözleşmeli sürümlerinin nasıl çalıştığını açıklamak için bol miktarda yorum bırakın.
8. Karmaşıklığı ve fazlalığı ortadan kaldırmak için işlevleri kullanın.
Veri analizi kodunu ilk kez yazarken işlevleri ciddi şekilde ihmal ettiğimi ilk itiraf eden ben olacağım. Spagetti kodu, farklı analizler yoluyla yolumu bulmaya çalışırken IDE’mi dolduruyor. Koduma bakarsanız, muhtemelen çok ileri gittiğini düşünür ve sefaletinden kurtulmak için onu ahırın arkasından çıkarmaya gönüllü olursunuz.
Yarı iyi bir sonucu bir araya getirmeyi başardıktan sonra, kötü bir kazanın eşdeğerini düzeltmek için geri döneceğim. Kodumu işlevler halinde paketleyerek, gereksiz karmaşıklıkları ve fazlalıkları hızla ortadan kaldırırım. Koduma yaptığım tek şey buysa, çözümü yeniden inceleyebileceğim ve o noktaya nasıl geldiğimi anlayabileceğim bir noktaya kadar basitleştirmiş olacağım.
Bu alışkanlık nasıl uygulanır: Kod yazarken işlevlerin önemini unutmayın. Çoğu zaman en iyi geliştiricilerin tembel geliştiriciler olduğu söylenir çünkü çok fazla çalışma gerektirmeyen çözümleri nasıl yaratacaklarını bulurlar. Bir çözüm yazdıktan sonra, kodunuzu düzenlemenize ve basitleştirmenize yardımcı olması için geri dönün ve yedekli veya karmaşık kodu işlevler halinde bir araya getirin.
9. Test odaklı geliştirme yöntemlerini uygulayın.
Test odaklı geliştirme (TDD), sürekli test edilen iyileştirmelerle kod yazmaya odaklanan bir yazılım geliştirme ilkesidir. TDD, geliştiricileri bir test paketi oluşturmaya, uygulama kodu yazmaya ve ardından kod tabanını optimize etmeye teşvik eden bir “Kırmızı, Yeşil, Yeniden Düzenleme” sistemi üzerinde çalışır.
TDD, analitik ardışık düzenler üretmek, bir kavram kanıtı geliştirmek, veri alt kümeleriyle çalışmak ve geliştirme sürecinde işleyen kodun bozulmamasını sağlamak için veri bilimcileri tarafından başarıyla uygulanabilir.
Bu alışkanlık nasıl uygulanır: Test odaklı geliştirmeye çalışın ve bu tekniğin iş akışınıza bir şeyler ekleyip ekleyemeyeceğini belirleyin. TDD, her problem için mükemmel bir cevap değildir, ancak dikkatli bir şekilde uygulanırsa faydalı olabilir.
10. Küçük, sık taahhütler yapın.
Hiçbir çekme isteği yaptınız ve bilgisayarınızın hata mesajları ve wazoo’dan gelen sorunlarla patladığını gördünüz mü? Ben gördüm.
Yumruğunuza bu kadar büyük bir taahhütte bulunan kişiyi tanıtmak istediğiniz anlarda, derin bir nefes alın ve bu kişinin açıkça büyümekte olan iyi alışkanlıkları uygulamaya zaman ayırmadığını hatırlayın.
Takım tabanlı yazılım geliştirmenin altın kuralı nedir? Küçük, sık taahhütler yapın.
Bu alışkanlık nasıl uygulanır: Kod değişikliklerinizi sık sık uygulamaya başlayın ve en son kodu almak için düzenli olarak çekme talepleri yapın. Sizin veya başka bir kişinin yaptığı her değişiklik tüm projeyi bozabilir, bu nedenle geri döndürülmesi kolay ve muhtemelen projenin yalnızca bir bölümünü veya katmanını etkileyen küçük değişiklikler yapmak önemlidir.
11. Kişisel gelişime öncelik verin.
Kime sorduğunuza bağlı olarak, endüstride ya çok fazla veri bilimcisi var ya da çok az.
Endüstrinin doygun mu yoksa kurak mı olduğuna bakılmaksızın, tek bir iş için tonlarca yüksek nitelikli ve genellikle aşırı nitelikli aday ile rekabet edeceksiniz. Bu, iş başvurusunda bulunmaya giden yolda, kişisel gelişim alışkanlığını zaten geliştirmiş olmanız gerektiği anlamına gelir. Bugün herkes beceri geliştirmeye kafayı takmış durumda ve bunun iyi bir nedeni var. Bu eğilim, veri bilimcileri için bir istisna olmamalıdır.
Bu alışkanlık nasıl uygulanır: Bir beceri envanteri oluşturun ve işverenlerin iş ilanlarına dahil ettikleri gereksinimleri nasıl karşıladığınızı görün. Keras, NumPy, Pandas, PyTorch, TensorFlow, Matplotlib, Seaborn ve Plotly gibi ilgili kitaplıkları verimli bir şekilde kullanabilen bir Python yazılımcısı mısınız? En son bulgularınızı ve bunların şirketinizin verimliliğini %25 oranında nasıl artırabileceklerini detaylandıran bir not yazabilir misiniz? Bir projeyi tamamlamak için bir ekibin parçası olarak çalışmaktan memnun musunuz? Tüm eksiklikleri belirleyin ve becerilerinizi güçlendirecek bazı iyi çevrimiçi kurslar veya kaynaklar bulun.
12. Bir projeye sonunu düşünerek başlayın.
Çok Etkili İnsanların 7 Alışkanlığı’nda Stephen Covey, “akılda sonla başlama” ilkesini tartışıyor.
Bunu veri bilimi projeleriyle etkili bir şekilde ilişkilendirmek için, bir projenin planlama aşamasında kendinize projenin istenen sonucunun ne olduğunu sormanız gerekir. Bu, projenin yolunu şekillendirmeye yardımcı olacak ve size nihai hedefe ulaşmak için karşılanması gereken sonuçların bir yol haritasını verecektir. Sadece bu değil, projenin sonucunu belirlemek size projenin bir bütün olarak uygulanabilirliği ve sürdürülebilirliği hakkında fikir verecektir.
Bu alışkanlık nasıl uygulanır: Her projeye, geliştirme döneminin sonunda tam olarak neyi başarmayı umduğunuzu ortaya koyan bir planlama oturumu ile başlayın. Hangi sorunu çözmeye çalışacağınızı veya hangi kanıtı toplamaya çalıştığınızı belirleyin. Ardından, projenizin kilometre taşlarını ve sonuçlarını şekillendirecek fizibilite ve sürdürülebilirlik sorularını yanıtlamaya başlayabilirsiniz. Buradan, projenizin sonuna kadar size rehberlik edecek net bir planla kod ve makine öğrenimi modelleri yazmaya başlayabilirsiniz.
13. Anlaşılabilmek için anlayın.
Richard Feynman, spin-V2 parçacıklarının neden Fermi-Dirac istatistiklerine uyduğuna dair bir birinci sınıf dersi hazırlamak için başarısız bir şekilde girişimde bulunduktan sonra, “Bunu birinci sınıf seviyesine indiremedim. Bu, onu gerçekten anlamadığımız anlamına geliyor. ” “Büyük Açıklayıcı” olarak bilinen Feynman, veri bilimcilerin yalnızca taklit etmeyi umabilecekleri bir miras bıraktı.
İlgi çekici bir hikaye anlatmak için verileri kullanma sanatı olan veri bilimi, ancak hikaye anlatıcısı anlatmaya çalıştığı hikayeyi anlarsa başarılı olabilir. Başka bir deyişle, anlaşılabilmeniz için anlamak sizin görevinizdir. Neyi başarmaya çalıştığınızı erken anlamak için bu alışkanlığı geliştirmek, öyle ki bunu bir başkasıyla adil bir kavrayış düzeyinde paylaşabilirsiniz, sizi bu odadaki en etkili veri bilimcisi yapacaktır.
Bu alışkanlık nasıl uygulanır: Keşfetmeye çalıştığınız kavramları ve çözmeye çalıştığınız problemleri derinlemesine anlamak için Feynman Tekniğini kullanın. Bu yöntem, verileri analiz etme ve ardından sonuçları genellikle veri bilimi olmayan paydaşlara açıklamaya yönelik veri bilimi süreciyle uyumludur. Kısacası, konuyla ilgili açıklamanızı, herhangi biri tarafından anlaşılabilecek basit, jargon olmayan terimlerle açıklayabileceğiniz bir noktaya kadar iyileştiriyorsunuz.
14. Araştırma makalelerini okuyun.
Araştırma kağıtları, başkalarının sorunları nasıl çözdüğünü görmenin, bakış açımızı genişletmenin ve en son trendleri takip etmenin yararlı bir yoludur.
Bu alışkanlık nasıl uygulanır: Her hafta, mevcut işinizle veya takip etmek ya da çalışmakla ilgilendiğiniz teknolojilerle alakalı bir veya iki araştırma makalesi seçin. Bunu bir öncelik haline getirmek için her hafta bu literatür taraması için zaman ayırmaya çalışın. İlgili bilgileri hızlı bir şekilde toplamanıza yardımcı olan araştırma makalelerini okumaya yönelik Üç Geçişli Yaklaşıma aşina olun. Makaleler hakkındaki anlayışınızı gerçekten sağlamlaştırmak için, okurken öğrendiğiniz bir şeyi kişisel bir projeye uygulamaya çalışın veya öğrendiklerinizi iş arkadaşlarınızla paylaşın.
15. Değişime açık olun.
Veri bilimi dünyası, kullanılan teknolojilerden ulaşılan hedeflere kadar hızla değişiyor. Yollarına saplanmış, değişmeye isteksiz olan o veri bilimcisi olmayın.
Değişime açık olmak sizi bir profesyonel olarak gelişmeye devam etmeye zorlamakla kalmaz, aynı zamanda geride kaldığınız anda sizi tükürecek olan hızla değişen bir sektörde alakalı kalmanızı sağlar.
Bu alışkanlık nasıl uygulanır: Yeni bir teknoloji veya uygulama ne zaman haber verirse, bir test sürüşü yapın ve bu yeni teknolojinin veya uygulamanın masaya ne getirdiğini görün. Belgeleri henüz okusanız bile, sektörün değişen eğilimleri konusunda kendinizi güncel tutabilirsiniz. Ayrıca, şirketinize teknoloji hakkında bir bakış açısı getirebilir ve teknolojik değişiklikleri ve ilerlemeleri yönlendirmelerine yardımcı olabilirsiniz. Ofiste kulağınızı yere koyan o kişi olmak, rakiplerinizin önüne geçmenize yardımcı olabilir ve ayrıca ekibinizi ve şirketinizi daha iyi, daha verimli çözümlere yönlendirmenize yardımcı olabilir.
Veri bilimi kariyerinizin herhangi bir aşamasında iyi alışkanlıklar geliştirmek, çözmeye çalıştıkları sorun üzerinde büyük bir etki yaratan ekibin etkili bir üyesi olma potansiyelinizi gerçekleştirmenize olanak tanır.
Kendinizi gelecekteki başarıya hazırlamak için şu andan daha iyi bir zaman olamaz.