Tentang Proyek

Credit Default Prediction

Sistem decision-support untuk penilaian risiko gagal bayar berbasis Machine Learning. Dibangun sebagai Final Project mata kuliah Machine Learning (COMP6577001) BINUS University.

Latar Belakang

Penilaian kelayakan kredit (credit scoring) adalah salah satu aplikasi Machine Learning yang paling berdampak nyata. Tantangan utamanya: dataset tidak seimbang (18.4% default), banyak fitur correlated, dan model perlu bisa dijelaskan ke staf non-teknis.

Proyek ini mengimplementasikan end-to-end credit scoring pipeline — dari raw data Lending Club 826k baris hingga sistem prediksi yang dapat diakses via web dengan penjelasan SHAP.

Arsitektur Sistem

Lending Club parquet

↓ EDA + Cleaning + Feature Engineering

↓ 7 Model × 2 Imbalance Strategy × Optuna Tuning

↓ Best: LightGBM (AUC 0.71, F1 0.41, KS 0.30)

↓ Bundle (pipeline + thresholds) → Hugging Face

↓ FastAPI inference API (SHAP + risk band)

↓ Next.js frontend (NIM lookup + decision panel)

826k baris data

Dataset Lending Club 2007–2015 dengan 18.4% default rate

7 model diuji

LogReg, KNN, RF, XGB, CatBoost, LightGBM, SVM + Optuna tuning

Dual threshold

THR_RECALL (F2-optimal) + THR_F1 (balanced), tuning OOF leak-free

SHAP explainability

Top-6 faktor penjelas aggregated dari one-hot ke fitur original

Full pipeline

EDA → Cleaning → IV/WoE → Modeling → Threshold → Deploy HF

Human-in-the-loop

Rekomendasi AI + keputusan final oleh staf kredit