Ensemble Learning - XGBoost vs CatBoost

📋 Project Overview

Comparative analysis of two powerful Gradient Boosting Decision Tree algorithms:

XGBoost: Optimized gradient boosting with regularization and sparsity awareness
CatBoost: Ordered boosting with native categorical feature support

This project implements both algorithms on multiple datasets with hyperparameter tuning using Optuna.

🧠 Key Differences

Aspect	XGBoost	CatBoost
Split Finding	Exact greedy / Histogram-based	Ordered splits
Categorical Features	Requires One-Hot Encoding	Native support via Target Encoding
Tree Type	Standard	Symmetric (Balanced)
Training Speed	Fast (numerical data)	Moderate
Inference Speed	Moderate	Fast
Robustness	Sensitive to hyperparameters	More robust defaults

📊 Datasets

Breast Cancer Classification: Binary classification dataset
Real Estate: Regression task for price prediction
Additional datasets for comprehensive evaluation

🔬 Evaluation Metrics

Classification: AUC-ROC, LogLoss, F1-Score Regression: RMSE, MAE Efficiency: Training time, Inference time

📁 Project Structure

classification/: Classification notebooks and models
assets/: Dataset files
catboost_info/: Training artifacts and logs

📚 Key Findings

Categorical Data: CatBoost excels with high-cardinality features
Hyperparameter Tuning: XGBoost requires careful tuning; CatBoost more stable
Trade-offs: XGBoost faster training vs CatBoost faster inference

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
Regression		Regression
assets		assets
classification		classification
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Ensemble Learning - XGBoost vs CatBoost

📋 Project Overview

🧠 Key Differences

📊 Datasets

🔬 Evaluation Metrics

📁 Project Structure

📚 Key Findings

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

Languages

ThanhDang-Vn/ensemble-catboost-xgboost

Folders and files

Latest commit

History

Repository files navigation

Ensemble Learning - XGBoost vs CatBoost

📋 Project Overview

🧠 Key Differences

📊 Datasets

🔬 Evaluation Metrics

📁 Project Structure

📚 Key Findings

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Languages

Packages