100 Link Notebook Data Science Pilihan Datasans Untuk Portofolio Dan Ide Skripsi Lengkap Dengan Dataset & Code

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 30

100 Link Notebook Data Science Pilihan

Datasans Untuk Portofolio dan Ide Skripsi


Lengkap dengan Dataset & Code
Disusun oleh Tim Datasans
@datasans.book
Peringatan

Materi dalam ebook cheatsheet ini telah divalidasi, namun bagaimanapun juga, ebook ini
tidak luput dari kesalahan baik definisi, konten secara umum, maupun syntax. Segala
masukkan dari kamu sangat terbuka. DM kami di instagram @datasans.book

Himbauan

1. Tidak menjadikan ebook ini satu-satunya sumber pegangan, cross check dan validasi
segala informasi dari sumber lain.
2. Tidak membagikan atau mencetaknya untuk diperbanyak, kecuali untuk pribadi.
3. Disarankan untuk merekomendasikan langsung ke instagram @datasans.book jika
temanmu berminat agar ilmu yang bermanfaat bisa tersebar semakin luas.
Daftar Isi

Kata pengantar, baca dulu lur!..............................................................................................5


Bab 1. Machine Learning & Algoritma Supervisi.............................................................. 7
Machine Learning with Iris Dataset............................................................................. 7
Machine Learning with Supervised Algorithm............................................................. 7
Predicting House Prices with Machine Learning.......................................................... 7
Structuring a Supervised Learning Project................................................................... 7
6 Classification Methods in Machine Learning............................................................. 8
Machine Learning Titanic Notebook for Beginners.......................................................8
Machine Learning Classification................................................................................. 8
Predicting Customer Churn with Machine Learning..................................................... 8
Glass Type Classification with Machine Learning......................................................... 8
Machine Learning Tutorial for Beginners.................................................................... 9
Math - Linear Algebra for Machine Learning................................................................9
SVM Classifier Tutorial............................................................................................... 9
Decision-Tree Classifier Tutorial................................................................................. 9
Linear Regression Tutorial..........................................................................................9
Bab 2. Ensemble Learning & Optimasi Hyperparameter................................................ 10
🎯Hyperparameter Optimization for Machine Learning............................................. 10
Ensemble Learning Techniques Tutorial (x2)..............................................................10
Machine Learning 6 Basic Ensemble Learning........................................................... 10
Ensemble ML Algorithms: Bagging, Boosting, Voting..................................................10
A Guide on XGBoost Hyperparameters Tuning........................................................... 10
Hyperparameter Tuning Tutorial...............................................................................11
Optuna Tutorial for Hyperparameter Optimization.....................................................11
Bab 3. Analisis Time Series dan Forecasting.................................................................. 12
Complete Guide on Time Series Analysis in Python.................................................... 12
Tutorial: Time Series Forecasting with XGBoost..........................................................12
Tutorial: Time Series Forecasting with Prophet.......................................................... 12
Tutorial: Time Series Analysis and Forecasting...........................................................12
Time Series Prediction Tutorial with EDA...................................................................12
Intro to Time Series Forecasting................................................................................ 13
Bab 4. EDA, Data Cleaning, dan Visualisasi.....................................................................14
Abalone: Exploratory Data Analysis........................................................................... 14
Heart Disease - Exploratory Data Analysis.................................................................. 14
Exploratory Data Analysis......................................................................................... 14
Beautiful UMAP - Tutorial on 100-Dimensional Data................................................... 14
Visualization Tutorial with Seaborn........................................................................... 14
Data Cleaning and EDA Tutorial.................................................................................15
Data Cleaning Challenge: Scale and Normalize Data................................................... 15
2D and 3D Plotting Tutorial in Python........................................................................ 15
Data Visualization(2D/3D): 35+ Exercises....................................................................15
Visualization 3D Map Using Pydeck........................................................................... 15
Bab 5. Unsupervised Learning & Clustering...................................................................16
KMeans Clustering: Machine Learning...................................................................... 16
Complete Guide to Clustering Techniques.................................................................. 16
Tutorial: K-Means Clustering..................................................................................... 16
Tutorial: Clustering Wines with K-Means................................................................... 16
Unsupervised Learning Tutorial................................................................................ 16
Unsupervised Learning: Clustering Tutorial............................................................... 17
Unsupervised Learning-Clustering | Complete Guide.................................................. 17
Bab 6. Reduksi Dimensi.................................................................................................18
Tutorial-Dimensionality Reduction + PCA (Maths)...................................................... 18
Interactive Intro to Dimensionality Reduction............................................................ 18
PCA - Beginner's Guide to Dimensionality Reduction.................................................. 18
Bab 7. Natural Language Processing.............................................................................. 19
Getting Started with NLP for Absolute Beginners........................................................ 19
Beginner to Intermediate NLP Tutorial...................................................................... 19
Analisis Sentimen dengan Machine Learning............................................................. 19
Bab 8. Graph Neural Networks.......................................................................................20
Tutorial: Graph Neural Networks on Social Networks..................................................20
Introduction to Graph Neural Network with PyTorch.................................................. 20
Graph Neural Network Starter for Beginners.............................................................. 20
Node Classification with Graph Neural Networks........................................................20
Pengantar Graph Neural Network dengan PyTorch..................................................... 20
Panduan Awal Graph Neural Network untuk Pemula...................................................21
Klasifikasi Node dengan Graph Neural Networks........................................................ 21
Bab 9. Deteksi Anomali................................................................................................. 22
Tutorial- Local Outlier Factor Anomaly Detection....................................................... 22
ECG Anomaly Detection using Autoencoders..............................................................22
Simple Anomaly Detection using Unsupervised KNN..................................................22
Bab 10. Generasi Data Sintetis....................................................................................... 23
Generasi Data Sintetis | Tutorial SDV..........................................................................23
Generasi Data Sintetis dengan GaussianMixture......................................................... 23
Generasi Data Sintetis dan Clustering Penguin........................................................... 23
Bab 11. Statistik dan Analisis Matematis........................................................................24
Statistics Tutorial......................................................................................................24
Guide to Complete Statistical Analysis........................................................................24
Tutorial on Inferential Statistics................................................................................ 24
Bab 12. PySpark dan Big Data........................................................................................ 25
PySpark Tutorial for Beginners..................................................................................25
A PySpark Tutorial with Titanic................................................................................. 25
PySpark Tutorial.......................................................................................................25
Bab 13. Interpretabilitas Model dan Teknik-teknik Spesifik........................................... 26
Cirrhosis I Model Interpretability- eli5, Lime, shap..................................................... 26
Interpreting ML models- ELI5, LIME, SHAP, Yellowbrick............................................ 26
Model Explainability with SHAP: Only Guide U Need.................................................. 26
Bab 14. Proyek dan Studi Kasus Spesifik......................................................................... 27
Proyek Machine Learning dari Awal hingga Akhir.......................................................27
Prediksi Penyakit Menggunakan Machine Learning.................................................... 27
Membuka Misteri Sekuensing DNA dengan Machine Learning.................................... 27
Bank Full Machine Learning..................................................................................... 27
Hands-on Machine Learning - Chapter #2.................................................................. 28
Churn - EDA, Balancing and Machine Learning.......................................................... 28
Customer Segmentation Using Machine Learning...................................................... 28
Titanic, a Step-by-Step Intro to Machine Learning...................................................... 28
Deteksi XSS dengan Machine Learning...................................................................... 28
Peramalan GDP dengan Machine Learning.................................................................28
Peramalan Seri Waktu dengan Machine Learning....................................................... 29
Prediksi Penyakit Jantung Menggunakan Machine Learning....................................... 29
EDA, Feature Engineering, Machine Learning............................................................ 29
Prediksi Keterlambatan Penerbangan - Tutorial..........................................................29
Analisis Prediktif dengan Berbagai Pendekatan.......................................................... 29
Prediksi Performa Siswa - Analisis Lengkap............................................................... 29
Kata pengantar, baca dulu lur!
Dalam deretan halaman digital yang tak terhingga di dunia maya, terdapat sebuah oasis
pengetahuan yang siap memperkaya wawasanmu di bidang data science dan machine
learning: kumpulan link Kaggle Notebook pilihan Datasans. Kompilasi ini tidak hanya
merupakan kumpulan script code Python yang dirancang untuk menjawab berbagai
pertanyaan di ranah analitik data, tetapi juga sebagai jembatan penghubung antara teori
dan praktik, mengantarmu melalui labirin data menuju ke solusi yang elegan dan efisien.

Setiap notebook telah disaring dengan cermat, memastikan bahwa kamu mendapatkan
konten yang berkualitas, relevan, dan tentunya, inspiratif. Setiap notebook umumnya
menggunakan dataset yang bisa kamu lihat langsung pada menu bar "Input" di halaman
Kaggle masing-masing notebook. Inilah pintu gerbang menuju petualangan ilmiahmu
selanjutnya—sebuah sumber daya yang tidak hanya mengedukasi tetapi juga menginspirasi
para penjelajah data untuk menemukan dan menerapkan solusi inovatif dalam pekerjaan
para expert.
Bab 1. Machine Learning & Algoritma
Supervisi
Machine Learning with Iris Dataset
Penjelasan: Notebook ini membahas tentang dataset Iris untuk mempelajari dasar-dasar
machine learning. Melalui analisis eksploratif data, pemrosesan data, dan penerapan
beberapa model klasifikasi, kamu akan belajar tentang langkah-langkah penting dalam
pembelajaran mesin.
Skill: Analisis data, visualisasi data, pemrosesan data, dan penerapan model klasifikasi
(Logistic Regression, KNN, SVM, dan lain-lain).
Link: https://www.kaggle.com/code/jchen2186/machine-learning-with-iris-dataset

Machine Learning with Supervised Algorithm


Penjelasan: Notebook ini fokus pada algoritma supervised learning untuk menyelesaikan
masalah klasifikasi. Dengan dataset yang berbeda, kamu akan diajarkan bagaimana
memilih dan menerapkan algoritma yang tepat untuk prediksi yang akurat.
Skill: Pemilihan fitur, model selection, klasifikasi, dan evaluasi model menggunakan
metrics seperti accuracy, precision, dan recall.
Link: https://www.kaggle.com/code/suademre/machine-learning-with-supervised-algorithm

Predicting House Prices with Machine Learning


Penjelasan: Notebook ini membahas tentang prediksi harga rumah menggunakan teknik
machine learning. Meliputi analisis data awal, feature engineering, dan penerapan berbagai
model regresi untuk menemukan model terbaik.
Skill: Eksplorasi data, feature engineering, regresi linear, Decision Tree, Random Forest,
dan evaluasi model.
Link: https://www.kaggle.com/code/erick5/predicting-house-prices-with-machine-learning

Structuring a Supervised Learning Project


Penjelasan: Notebook ini memberikan panduan tentang bagaimana menyusun proyek
pembelajaran mesin terstruktur, meliputi pemahaman masalah, pemilihan data,
pemodelan, dan evaluasi.
Skill: Manajemen proyek ML, pemahaman masalah, seleksi fitur, model selection, dan
evaluasi model.
Link: https://www.kaggle.com/code/eliekawerk/structuring-a-supervised-learning-project
6 Classification Methods in Machine Learning
Penjelasan: Eksplorasi enam metode klasifikasi berbeda dalam machine learning, termasuk
Logistic Regression, K-Nearest Neighbors, dan Support Vector Machines, dengan
implementasi praktis dan perbandingan performa.
Skill: Pemahaman dan implementasi berbagai algoritma klasifikasi, evaluasi performa.
Link:
https://www.kaggle.com/code/alihantabak/6-classification-methods-in-machine-learning

Machine Learning Titanic Notebook for Beginners


Penjelasan: Panduan langkah demi langkah untuk pemula dalam memprediksi
kelangsungan hidup penumpang Titanic menggunakan machine learning, termasuk
analisis data, visualisasi, dan pemodelan.
Skill: Analisis dan visualisasi data, pemrosesan data, pembuatan model klasifikasi.
Link:
https://www.kaggle.com/code/naciener/machine-learning-titanic-notebook-for-beginners

Machine Learning Classification


Notebook ini menjelaskan konsep klasifikasi dalam machine learning dengan menggunakan
dataset nyata. Mempelajari bagaimana melakukan preprocessing data, memilih fitur, dan
menggunakan berbagai algoritma klasifikasi.
Link: https://www.kaggle.com/code/sibelkcansu/machine-learning-classification

Predicting Customer Churn with Machine Learning


Fokus pada prediksi churn pelanggan menggunakan data historis. Meliputi eksplorasi data,
pemrosesan, hingga penerapan model prediktif untuk mengidentifikasi pelanggan yang
kemungkinan besar akan churn.
Link:
https://www.kaggle.com/code/korfanakis/predicting-customer-churn-with-machine-learnin
g

Glass Type Classification with Machine Learning


Memperkenalkan proyek klasifikasi jenis kaca menggunakan algoritma machine learning,
termasuk eksplorasi dan pemrosesan data, serta evaluasi model yang digunakan untuk
klasifikasi.
Link:
https://www.kaggle.com/code/eliekawerk/glass-type-classification-with-machine-learning
Machine Learning Tutorial for Beginners
Penjelasan: Tutorial ini menyajikan dasar-dasar machine learning untuk pemula, meliputi
berbagai algoritma dan teknik seperti regresi, klasifikasi, dan k-means clustering.
Skill: Dasar ML, regresi, klasifikasi, clustering
Link: https://www.kaggle.com/code/kanncaa1/machine-learning-tutorial-for-beginners

Math - Linear Algebra for Machine Learning


Penjelasan: Memfokuskan pada konsep-konsep penting aljabar linear yang diperlukan
untuk machine learning, seperti matriks, vektor, dan transformasi.
Skill: Aljabar linear
Link:
https://www.kaggle.com/code/deepakdeepu8978/math-linear-algebra-for-machine-learning

SVM Classifier Tutorial


Penjelasan: Tutorial ini mendalam tentang Support Vector Machine (SVM), termasuk cara
kerja, implementasi, dan optimasi model SVM.
Skill: SVM, implementasi model, optimasi
Link: https://www.kaggle.com/code/prashant111/svm-classifier-tutorial

Decision-Tree Classifier Tutorial


Penjelasan: Tutorial ini memberikan panduan komprehensif tentang Decision Tree
Classifier, termasuk konsep, implementasi, dan optimasi.
Skill: Decision Tree, implementasi, optimasi
Link: https://www.kaggle.com/code/prashant111/decision-tree-classifier-tutorial

Linear Regression Tutorial


Penjelasan: Tutorial ini menjelaskan dasar-dasar regresi linier, cara kerjanya, dan
bagaimana mengimplementasikannya untuk memprediksi data.
Skill: Regresi linier, prediksi data, implementasi
Link: https://www.kaggle.com/code/sudhirnl7/linear-regression-tutorial
Bab 2. Ensemble Learning & Optimasi
Hyperparameter
🎯Hyperparameter Optimization for Machine Learning
Penjelasan: Memperkenalkan teknik untuk mengoptimalkan hyperparameter dalam ML,
termasuk grid search dan random search.
Skill: Hyperparameter optimization
Link:
https://www.kaggle.com/code/faressayah/hyperparameter-optimization-for-machine-learni
ng

Ensemble Learning Techniques Tutorial (x2)


Penjelasan: Menjelaskan teknik ensemble learning, seperti bagging, boosting, dan stacking,
untuk meningkatkan performa model ML.
Skill: Ensemble learning
Link: https://www.kaggle.com/code/pavansanagapati/ensemble-learning-techniques-tutorial

Machine Learning 6 Basic Ensemble Learning


Penjelasan: Memperkenalkan konsep dasar ensemble learning dan penerapannya dalam
ML.
Skill: Basic ensemble learning
Link:
https://www.kaggle.com/code/fengdanye/machine-learning-6-basic-ensemble-learning

Ensemble ML Algorithms: Bagging, Boosting, Voting


Penjelasan: Memperdalam pada algoritma ensemble ML termasuk bagging, boosting, dan
voting.
Skill: Bagging, boosting, voting techniques
Link:
https://www.kaggle.com/code/faressayah/ensemble-ml-algorithms-bagging-boosting-voting

A Guide on XGBoost Hyperparameters Tuning


Penjelasan: Panduan lengkap untuk tuning hyperparameter pada XGBoost, mencakup
teknik dan strategi untuk optimasi.
Skill: XGBoost, hyperparameter tuning
Link:
https://www.kaggle.com/code/prashant111/a-guide-on-xgboost-hyperparameters-tuning

Hyperparameter Tuning Tutorial


Penjelasan: Tutorial yang mendalam tentang tuning hyperparameter menggunakan
berbagai teknik dan alat.
Skill: Hyperparameter tuning, alat tuning
Link: https://www.kaggle.com/code/shreayan98c/hyperparameter-tuning-tutorial

Optuna Tutorial for Hyperparameter Optimization


Penjelasan: Memperkenalkan Optuna, sebuah kerangka kerja optimasi hyperparameter
dengan contoh praktis.
Skill: Optuna, optimasi hyperparameter
Link:
https://www.kaggle.com/code/corochann/optuna-tutorial-for-hyperparameter-optimization
Bab 3. Analisis Time Series dan
Forecasting
Complete Guide on Time Series Analysis in Python
Penjelasan: Tutorial menyeluruh tentang analisis seri waktu menggunakan Python, meliputi
konsep dasar hingga teknik lanjutan.
Skill: Analisis seri waktu
Link:
https://www.kaggle.com/code/prashant111/complete-guide-on-time-series-analysis-in-pytho
n

Tutorial: Time Series Forecasting with XGBoost


Penjelasan: Cara menggunakan XGBoost untuk ramalan seri waktu, termasuk pengolahan
data sebelumnya.
Skill: XGBoost, forecasting
Link:
https://www.kaggle.com/code/robikscube/tutorial-time-series-forecasting-with-xgboost

Tutorial: Time Series Forecasting with Prophet


Penjelasan: Prophet untuk forecasting seri waktu, dengan penjelasan langkah demi
langkah.
Skill: Prophet, forecasting
Link:
https://www.kaggle.com/code/prashant111/tutorial-time-series-forecasting-with-prophet

Tutorial: Time Series Analysis and Forecasting


Penjelasan: Panduan analisis dan peramalan seri waktu menggunakan ARIMA dan SARIMA.
Skill: ARIMA, SARIMA
Link:
https://www.kaggle.com/code/satishgunjal/tutorial-time-series-analysis-and-forecasting

Time Series Prediction Tutorial with EDA


Penjelasan: Eksplorasi data dan prediksi seri waktu dengan analisis komponen utama.
Skill: EDA, PCA
Link: https://www.kaggle.com/code/kanncaa1/time-series-prediction-tutorial-with-eda
Intro to Time Series Forecasting
Penjelasan: Pendahuluan ke peramalan seri waktu, termasuk teknik dan alat.
Skill: Forecasting basics
Link: https://www.kaggle.com/code/iamleonie/intro-to-time-series-forecasting
Bab 4. EDA, Data Cleaning, dan
Visualisasi
Abalone: Exploratory Data Analysis
Penjelasan: Analisis data mendalam pada dataset Abalone untuk memahami distribusi dan
hubungan antar fitur.
Skill: EDA
Link: https://www.kaggle.com/code/rodolfomendes/abalone-exploratory-data-analysis

Heart Disease - Exploratory Data Analysis


Penjelasan: Eksplorasi dataset penyakit jantung untuk identifikasi pola dan faktor risiko.
Skill: EDA
Link: https://www.kaggle.com/code/microvision/heart-disease-exploratory-data-analysis

Exploratory Data Analysis


Penjelasan: EDA umum pada berbagai dataset untuk mengungkap insight dan pola
tersembunyi.
Skill: EDA
Link: https://www.kaggle.com/code/mukeshchoudhary/exploratory-data-analysis

Beautiful UMAP - Tutorial on 100-Dimensional Data


Penjelasan: Tutorial UMAP untuk visualisasi data berdimensi tinggi, menggunakan dataset
sintetis.
Skill: UMAP, visualisasi data
Link:
https://www.kaggle.com/code/bextuychiev/beautiful-umap-tutorial-on-100-dimensional-data

Visualization Tutorial with Seaborn


Penjelasan: Panduan visualisasi data menggunakan Seaborn, termasuk berbagai jenis plot.
Skill: Seaborn
Link: https://www.kaggle.com/code/rafetcan/visualization-tutorial-with-seaborn
Data Visualization Tutorial | Matplotlib Seaborn
Penjelasan: Tutorial visualisasi menggunakan Matplotlib dan Seaborn, mencakup teknik
dasar hingga lanjutan.
Skill: Matplotlib, Seaborn
Link:
https://www.kaggle.com/code/imsanjoykb/data-visualization-tutorial-matplotlib-seaborn

Data Cleaning and EDA Tutorial


Penjelasan: Memperkenalkan teknik pembersihan data dan analisis data eksploratif.
Skill: Data cleaning, EDA
Link: https://www.kaggle.com/code/regivm/data-cleaning-and-eda-tutorial

Data Cleaning Challenge: Scale and Normalize Data


Penjelasan: Tantangan membersihkan data dengan skala dan normalisasi.
Skill: Scaling, normalization
Link:
https://www.kaggle.com/code/rtatman/data-cleaning-challenge-scale-and-normalize-data

2D and 3D Plotting Tutorial in Python


Penjelasan: Tutorial tentang plotting 2D dan 3D menggunakan Matplotlib dan Plotly.
Skill: Plotting, Matplotlib, Plotly
Link: https://www.kaggle.com/code/imoore/2d-and-3d-plotting-tutorial-in-python

Data Visualization(2D/3D): 35+ Exercises


Penjelasan: Kumpulan latihan visualisasi data 2D dan 3D untuk meningkatkan
keterampilan.
Skill: Data visualization, exercises
Link: https://www.kaggle.com/code/abhi8923shriv/data-visualization-2d-3d-35-exercises

Visualization 3D Map Using Pydeck


Penjelasan: Tutorial tentang cara membuat peta 3D interaktif menggunakan Pydeck.
Skill: 3D mapping, Pydeck
Link: https://www.kaggle.com/code/jeongbinpark/visualization-3d-map-using-pydeck
Bab 5. Unsupervised Learning &
Clustering
KMeans Clustering: Machine Learning
Penjelasan: Demonstrasi KMeans untuk clustering, termasuk pemilihan jumlah
cluster dan visualisasi.
Skill: KMeans, visualisasi data
Link: https://www.kaggle.com/code/umerkk12/kmeans-clustering-machine-learning

Complete Guide to Clustering Techniques


Penjelasan: Panduan umum tentang teknik clustering, termasuk KMeans,
hierarchical, dan DBSCAN.
Skill: Clustering techniques
Link: https://www.kaggle.com/code/gireeshs/complete-guide-to-clustering-techniques

Tutorial: K-Means Clustering


Penjelasan: Pengenalan K-Means clustering dengan penjelasan konsep dan aplikasi
praktis.
Skill: K-Means, clustering
Link: https://www.kaggle.com/code/satishgunjal/tutorial-k-means-clustering

Tutorial: Clustering Wines with K-Means


Penjelasan: Aplikasi K-Means untuk mengelompokkan jenis-jenis wine berdasarkan
fitur.
Skill: K-Means, aplikasi praktis
Link: https://www.kaggle.com/code/xvivancos/tutorial-clustering-wines-with-k-means

Unsupervised Learning Tutorial


Penjelasan: Pengantar ke unsupervised learning, fokus pada clustering dan principal
component analysis (PCA).
Skill: Unsupervised learning, clustering, PCA
Link: https://www.kaggle.com/code/sashr07/unsupervised-learning-tutorial
Unsupervised Learning: Clustering Tutorial
Penjelasan: Mendalam tentang clustering dengan K-Means, termasuk penjelasan
langkah-langkah dan visualisasi hasil.
Skill: Clustering, K-Means
Link:
https://www.kaggle.com/code/maximgolovatchev/unsupervised-learning-clustering-tutorial

Unsupervised Learning-Clustering | Complete Guide


Penjelasan: Panduan komprehensif tentang berbagai teknik clustering dalam unsupervised
learning.
Skill: Clustering techniques
Link:
https://www.kaggle.com/code/berkayalan/unsupervised-learning-clustering-complete-guide
Bab 6. Reduksi Dimensi
Tutorial-Dimensionality Reduction + PCA (Maths)
Penjelasan: Menjelaskan matematika di balik PCA untuk pengurangan dimensi, termasuk
langkah-langkah dan penerapannya.
Skill: PCA, matematika
Link:
https://www.kaggle.com/code/paulrohan2020/tutorial-dimensionality-reduction-pca-maths

Interactive Intro to Dimensionality Reduction


Penjelasan: Pendekatan interaktif untuk memahami pengurangan dimensi, menggunakan
t-SNE dan PCA, termasuk visualisasi.
Skill: t-SNE, PCA, interaktivitas
Link: https://www.kaggle.com/code/arthurtok/interactive-intro-to-dimensionality-reduction

PCA - Beginner's Guide to Dimensionality Reduction


Penjelasan: Panduan pemula untuk PCA, termasuk dasar-dasar, cara kerja, dan aplikasinya
dalam pengurangan dimensi.
Skill: PCA, pengurangan dimensi
Link:
https://www.kaggle.com/code/vipulgandhi/pca-beginner-s-guide-to-dimensionality-reductio
n
Bab 7. Natural Language Processing
Getting Started with NLP for Absolute Beginners
Penjelasan: Tutorial ini memberikan pengantar kepada pemula dalam NLP, membahas
dasar-dasar pengolahan bahasa dan penerapannya.
Skill: Dasar NLP
Link:
https://www.kaggle.com/code/jhoward/getting-started-with-nlp-for-absolute-beginners/

Beginner to Intermediate NLP Tutorial


Penjelasan: Membangun dari dasar ke tingkat menengah dalam NLP, tutorial ini
mengeksplorasi teknik dan alat yang lebih kompleks.
Skill: Dasar dan menengah NLP
Link: https://www.kaggle.com/code/ashishpatel26/beginner-to-intermediate-nlp-tutorial

Analisis Sentimen dengan Machine Learning


Penjelasan: Analisis sentimen teks menggunakan teknik ML.
Skill: NLP, analisis sentimen
Link:
https://www.kaggle.com/code/ashokkumarpalivela/sentiment-analysis-with-machine-learni
ng
Bab 8. Graph Neural Networks
Tutorial: Graph Neural Networks on Social Networks
Menjelajahi penerapan GNN dalam analisis jaringan sosial, memberikan wawasan tentang
arsitektur dan kegunaannya.
Skill: GNNs, social network analysis
Link:
https://www.kaggle.com/code/awadelrahman/tutorial-graph-neural-networks-on-social-net
works

Introduction to Graph Neural Network with PyTorch


Menawarkan pengenalan langsung tentang GNN menggunakan PyTorch, yang mencakup
konsep dasar dan implementasi.
Skill: GNNs, PyTorch
Link:
https://www.kaggle.com/code/iogbonna/introduction-to-graph-neural-network-with-pytorch

Graph Neural Network Starter for Beginners


Panduan ramah bagi pemula untuk memulai GNN, dengan fokus pada konsep dasar dan
implementasi sederhana.
Skill: GNN basics
Link: https://www.kaggle.com/code/validmodel/graph-neural-network-starter-for-beginners

Node Classification with Graph Neural Networks


Mengulas klasifikasi node menggunakan GNN, menunjukkan pendekatan dan teknik
praktis.
Skill: Node classification, GNNs
Link:
https://www.kaggle.com/code/widhiwinata/node-classification-with-graph-neural-networks

Pengantar Graph Neural Network dengan PyTorch


Penjelasan: Memberikan pengenalan terhadap Graph Neural Networks (GNN)
menggunakan PyTorch, mencakup konsep dasar dan implementasinya.
Skill: GNN, PyTorch
Link:
https://www.kaggle.com/code/iogbonna/introduction-to-graph-neural-network-with-pytorch
Panduan Awal Graph Neural Network untuk Pemula
Penjelasan: Tutorial bagi pemula untuk memulai dengan GNN, memfokuskan pada
konsep-konsep dasar dan implementasi sederhana.
Skill: Dasar GNN
Link: https://www.kaggle.com/code/validmodel/graph-neural-network-starter-for-beginners

Klasifikasi Node dengan Graph Neural Networks


Penjelasan: Menjelaskan pendekatan praktis untuk klasifikasi node menggunakan GNN,
termasuk teknik dan metode yang digunakan.
Skill: Klasifikasi node, GNN
Link:
https://www.kaggle.com/code/widhiwinata/node-classification-with-graph-neural-networks
Bab 9. Deteksi Anomali
Tutorial- Local Outlier Factor Anomaly Detection
Penjelasan: Tutorial ini memperkenalkan metode Local Outlier Factor (LOF) untuk deteksi
anomali, termasuk langkah-langkah implementasinya.
Skill: Deteksi anomali, LOF
Link:
https://www.kaggle.com/code/thomaskonstantin/tutorial-local-outlier-factor-anomaly-detect
ion

ECG Anomaly Detection using Autoencoders


Penjelasan: Demonstrasi autoencoder untuk deteksi anomali pada data ECG, termasuk
pembangunan dan pelatihan model.
Skill: Autoencoder, deteksi anomali pada ECG
Link:
https://www.kaggle.com/code/devavratatripathy/ecg-anomaly-detection-using-autoencoders

Simple Anomaly Detection using Unsupervised KNN


Penjelasan: Pendekatan sederhana untuk deteksi anomali menggunakan algoritma KNN
yang tidak diawasi, termasuk eksplorasi data dan evaluasi.
Skill: KNN, deteksi anomali
Link:
https://www.kaggle.com/code/kimchanyoung/simple-anomaly-detection-using-unsupervise
d-knn
Bab 10. Generasi Data Sintetis
Generasi Data Sintetis | Tutorial SDV
Penjelasan: Memperkenalkan SDV (Synthetic Data Vault) untuk generasi data sintetis,
termasuk fitur dan cara nya.
Skill: Generasi data sintetis
Link: https://www.kaggle.com/code/mcarujo/synthetic-data-generation-sdv-tutotial

Generasi Data Sintetis dengan GaussianMixture


Penjelasan: Menjelaskan bagaimana menggunakan Gaussian Mixture Models untuk
generasi data sintetis.
Skill: Model campuran Gaussian
Link:
https://www.kaggle.com/code/yairhadad1/synthetic-data-generation-with-gaussianmixture

Generasi Data Sintetis dan Clustering Penguin


Penjelasan: Demonstrasi generasi data sintetis dan clustering menggunakan dataset
penguin.
Skill: Generasi data sintetis, clustering
Link:
https://www.kaggle.com/code/navin1221/penguins-synthetic-data-generation-and-clustering
Bab 11. Statistik dan Analisis
Matematis
Statistics Tutorial
Penjelasan: Tutorial statistik yang mencakup dasar-dasar, termasuk distribusi, probabilitas,
dan pengujian hipotesis.
Skill: Dasar statistik
Link: https://www.kaggle.com/code/carlolepelaars/statistics-tutorial

Guide to Complete Statistical Analysis


Penjelasan: Panduan menyeluruh untuk analisis statistik, termasuk EDA, inferensi, dan
visualisasi data.
Skill: Analisis statistik
Link: https://www.kaggle.com/code/shivanirana63/guide-to-complete-statistical-analysis

Tutorial on Inferential Statistics


Penjelasan: Fokus pada statistik inferensial, menjelaskan cara membuat kesimpulan dari
sampel data.
Skill: Statistik inferensial
Link: https://www.kaggle.com/code/dssant85/tutorial-on-inferential-statistics
Bab 12. PySpark dan Big Data
PySpark Tutorial for Beginners
Penjelasan: Panduan PySpark untuk pemula, menjelaskan dasar-dasar termasuk RDDs,
DataFrames, dan operasi dasar.
Skill: Dasar PySpark
Link: https://www.kaggle.com/code/nilaychauhan/pyspark-tutorial-for-beginners

A PySpark Tutorial with Titanic


Penjelasan: Memanfaatkan dataset Titanic untuk menjelaskan konsep PySpark, termasuk
pembersihan dan analisis data.
Skill: PySpark dengan dataset nyata
Link: https://www.kaggle.com/code/masumrumi/a-pyspark-tutorial-with-titanic

PySpark Tutorial
Penjelasan: Tutorial menyeluruh tentang PySpark, mencakup transformasi data, agregasi,
dan visualisasi.
Skill: PySpark lanjutan
Link: https://www.kaggle.com/code/sercanyesiloz/pyspark-tutorial
Bab 13. Interpretabilitas Model dan
Teknik-teknik Spesifik
Cirrhosis I Model Interpretability- eli5, Lime, shap
Penjelasan: Menjelaskan interpretasi model ML dalam kasus sirosis menggunakan ELI5,
LIME, dan SHAP.
Skill: Interpretasi model
Link:
https://www.kaggle.com/code/byteliberator/cirrhosis-i-model-interpretability-eli5-lime-shap

Interpreting ML models- ELI5, LIME, SHAP, Yellowbrick


Penjelasan: Panduan komprehensif untuk interpretasi model ML dengan alat seperti ELI5,
LIME, SHAP, dan Yellowbrick.
Skill: Interpretasi model ML
Link:
https://www.kaggle.com/code/ankitp013/interpreting-ml-models-eli5-lime-shap-yellowbrick

Model Explainability with SHAP: Only Guide U Need


Penjelasan: Fokus pada SHAP untuk penjelasan model, memberikan panduan menyeluruh
tentang nya.
Skill: Penjelasan model dengan SHAP
Link:
https://www.kaggle.com/code/bextuychiev/model-explainability-with-shap-only-guide-u-nee
d
Bab 14. Proyek dan Studi Kasus
Spesifik
Proyek Machine Learning dari Awal hingga Akhir
Penjelasan: Tutorial lengkap tentang pembangunan proyek ML, termasuk pengumpulan
data, pemrosesan, model, dan evaluasi.
Skill: Proses pengembangan ML
Link: https://www.kaggle.com/code/ali01lulu/end-to-end-machine-learning-project

Prediksi Penyakit Menggunakan Machine Learning


Penjelasan: Menggunakan ML untuk prediksi penyakit berdasarkan data klinis, termasuk
pemrosesan data dan model prediksi.
Skill: Prediksi klinis dengan ML
Link:
https://www.kaggle.com/code/anirudhchauhan/disease-prediction-using-machine-learning

Membuka Misteri Sekuensing DNA dengan Machine Learning


Penjelasan: Menerapkan ML untuk analisis dan interpretasi sekuens DNA, termasuk teknik
pemrosesan dan model klasifikasi.
Skill: Analisis DNA dengan ML
Link:
https://www.kaggle.com/code/nageshsingh/demystify-dna-sequencing-with-machine-learni
ng

Bank Full Machine Learning


Penjelasan: Studi kasus tentang ML dalam sektor perbankan untuk analisis data nasabah
dan prediksi perilaku.
Skill: ML dalam perbankan
Link: https://www.kaggle.com/code/vinicius150987/bank-full-machine-learning
Hands-on Machine Learning - Chapter #2
Membahas langkah-langkah dasar dalam proyek ML menggunakan California housing
prices dataset.
Skill: Dasar ML
Link: https://www.kaggle.com/code/victorvianaom/hands-on-machine-learning-chapter-2

Churn - EDA, Balancing and Machine Learning


Analisis eksploratif data, balancing, dan penerapan ML untuk prediksi churn pelanggan.
Skill: EDA, balancing data, prediksi churn
Link:
https://www.kaggle.com/code/raphaelmarconato/churn-eda-balancing-and-machine-learnin
g

Customer Segmentation Using Machine Learning


Menggunakan ML untuk segmentasi pelanggan berdasarkan fitur-fitur tertentu.
Skill: Segmentasi pelanggan
Link:
https://www.kaggle.com/code/vidhirana10/customer-segmentation-using-machine-learning

Titanic, a Step-by-Step Intro to Machine Learning


Pengenalan langkah demi langkah ke ML melalui dataset Titanic.
Skill: Pengenalan ML
Link: https://www.kaggle.com/code/ydalat/titanic-a-step-by-step-intro-to-machine-learning

Deteksi XSS dengan Machine Learning


Penjelasan: Membahas penerapan ML dalam deteksi serangan Cross-Site Scripting (XSS).
Skill: Keamanan siber, ML
Link: https://www.kaggle.com/code/princeroy15/xss-detection-by-machine-learning

Peramalan GDP dengan Machine Learning


Penjelasan: Menggunakan ML untuk memprediksi GDP berdasarkan data historis.
Skill: Peramalan ekonomi, ML
Link: https://www.kaggle.com/code/davidchilders/gdp-forecasting-with-machine-learning
Peramalan Seri Waktu dengan Machine Learning
Penjelasan: Penerapan ML dalam peramalan seri waktu.
Skill: Seri waktu, ML
Link:
https://www.kaggle.com/code/robikscube/time-series-forecasting-with-machine-learning-yt

Prediksi Penyakit Jantung Menggunakan Machine Learning


Tutorial ini menjelaskan langkah-langkah membangun model ML untuk prediksi penyakit
jantung.
Skill: ML untuk prediksi kesehatan
Link:
https://www.kaggle.com/code/chayandatta/heart-disease-prediction-using-machine-learnin
g

EDA, Feature Engineering, Machine Learning


Fokus pada analisis data eksploratif, engineering fitur, dan penerapan ML.
Skill: EDA, engineering fitur, ML
Link:
https://www.kaggle.com/code/keitazoumana/eda-feature-engineering-machine-learning

Prediksi Keterlambatan Penerbangan - Tutorial


Tutorial mendalam tentang prediksi keterlambatan penerbangan menggunakan data
historis.
Skill: Prediksi keterlambatan
Link: https://www.kaggle.com/code/fabiendaniel/predicting-flight-delays-tutorial

Analisis Prediktif dengan Berbagai Pendekatan


Menjelaskan penerapan analisis prediktif menggunakan berbagai model ML pada dataset
umum.
Skill: Analisis prediktif, ML
Link: https://www.kaggle.com/code/zoupet/predictive-analysis-with-different-approaches

Prediksi Performa Siswa - Analisis Lengkap


Tutorial ini memberikan analisis lengkap terhadap performa siswa menggunakan teknik
ML.
Skill: Prediksi performa, analisis data
Link:
https://www.kaggle.com/code/devassaxd/student-performance-prediction-complete-analysis
Terimakasih, semangat belajarnya!

Anda mungkin juga menyukai