Skip to content

Runar-Olsen/customer-segmentation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🧩 Customer Segmentation using K-Means Clustering

Dette prosjektet viser hvordan man kan segmentere kunder basert på alder, inntekt og kjøpsatferd ved hjelp av K-Means clustering.

Dataene kommer fra Mall Customers-datasettet (Kaggle).


🎯 Hva prosjektet demonstrerer

  • Databehandling og skalering (StandardScaler)
  • Usupervisert læring (K-Means)
  • Elbow-metoden for valg av antall klynger
  • Visualisering av segmentene
  • Eksport av segmenterte kunder til CSV
  • Lagre K-Means-modellen for videre bruk

🗂️ Prosjektstruktur

customer-segmentation/
├─ data/
│  └─ Mall_Customers.csv
│
├─ models/
│  └─ kmeans_model.joblib
│
├─ reports/
│  └─ clustered_customers.csv
│
├─ src/
│  ├─ train_kmeans.py
│  └─ utils.py
│
├─ notebooks/
│  └─ kmeans_segmentation.ipynb
│
├─ requirements.txt
└─ README.md

▶️ Kom i gang

python -m venv .venv
.\.venv\Scripts\Activate.ps1
pip install -r requirements.txt
python -m src.train_kmeans
  • Resultater lagres automatisk i /models og /reports

📊 Viktige konsepter

  • Clustering
  • Sentroidberegning
  • Distansescore
  • Visualisering av klustre

🚀 Videre arbeid

  • Test DBSCAN eller Agglomerative Clustering
  • Legg til PCA for visualisering i 2D
  • Lag Streamlit-app for dynamisk klusteranalyse

👤 Forfatter

  • Runar Olsen

  • Data Analyst – Python | Power BI | Machine Learning

About

Customer segmentation using K-Means clustering in Python (unsupervised learning, data preprocessing, visualization)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages