Skip to content

[EVAL-1] Coder eval.py : charger le modèle + 100 épisodes #13

@Celz-Pch

Description

@Celz-Pch

Objectif

Evaluation finale de l'agent entraîné.

Tasks

  • Charger checkpoints/best_model.pt avec torch.load()
  • Jouer 100 épisodes avec epsilon = 0 (pure exploitation)
  • Calculer : mean score, std, min, max
  • Afficher la distribution des scores

Critère de succès

Mean score ≥ 200 sur 100 épisodes consécutifs.

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions