Dette prosjektet viser hvordan man kan segmentere kunder basert på alder, inntekt og kjøpsatferd ved hjelp av K-Means clustering.
Dataene kommer fra Mall Customers-datasettet (Kaggle).
- Databehandling og skalering (StandardScaler)
- Usupervisert læring (K-Means)
- Elbow-metoden for valg av antall klynger
- Visualisering av segmentene
- Eksport av segmenterte kunder til CSV
- Lagre K-Means-modellen for videre bruk
customer-segmentation/
├─ data/
│ └─ Mall_Customers.csv
│
├─ models/
│ └─ kmeans_model.joblib
│
├─ reports/
│ └─ clustered_customers.csv
│
├─ src/
│ ├─ train_kmeans.py
│ └─ utils.py
│
├─ notebooks/
│ └─ kmeans_segmentation.ipynb
│
├─ requirements.txt
└─ README.md
python -m venv .venv
.\.venv\Scripts\Activate.ps1
pip install -r requirements.txt
python -m src.train_kmeans- Resultater lagres automatisk i /models og /reports
- Clustering
- Sentroidberegning
- Distansescore
- Visualisering av klustre
- Test DBSCAN eller Agglomerative Clustering
- Legg til PCA for visualisering i 2D
- Lag Streamlit-app for dynamisk klusteranalyse
- Data Analyst – Python | Power BI | Machine Learning