Tentang Proyek
Credit Default Prediction
Sistem decision-support untuk penilaian risiko gagal bayar berbasis Machine Learning. Dibangun sebagai Final Project mata kuliah Machine Learning (COMP6577001) BINUS University.
Latar Belakang
Penilaian kelayakan kredit (credit scoring) adalah salah satu aplikasi Machine Learning yang paling berdampak nyata. Tantangan utamanya: dataset tidak seimbang (18.4% default), banyak fitur correlated, dan model perlu bisa dijelaskan ke staf non-teknis.
Proyek ini mengimplementasikan end-to-end credit scoring pipeline — dari raw data Lending Club 826k baris hingga sistem prediksi yang dapat diakses via web dengan penjelasan SHAP.
Arsitektur Sistem
Lending Club parquet
↓ EDA + Cleaning + Feature Engineering
↓ 7 Model × 2 Imbalance Strategy × Optuna Tuning
↓ Best: LightGBM (AUC 0.71, F1 0.41, KS 0.30)
↓ Bundle (pipeline + thresholds) → Hugging Face
↓ FastAPI inference API (SHAP + risk band)
↓ Next.js frontend (NIM lookup + decision panel)
826k baris data
Dataset Lending Club 2007–2015 dengan 18.4% default rate
7 model diuji
LogReg, KNN, RF, XGB, CatBoost, LightGBM, SVM + Optuna tuning
Dual threshold
THR_RECALL (F2-optimal) + THR_F1 (balanced), tuning OOF leak-free
SHAP explainability
Top-6 faktor penjelas aggregated dari one-hot ke fitur original
Full pipeline
EDA → Cleaning → IV/WoE → Modeling → Threshold → Deploy HF
Human-in-the-loop
Rekomendasi AI + keputusan final oleh staf kredit