Objectif
Implémentation du réseau de neurones dans agent.py.
Architecture
Input (8) → Linear(256) → ReLU → Linear(256) → ReLU → Output(4)
Tasks
Critère de succès
net = QNetwork(state_dim=8, action_dim=4)
out = net(torch.randn(64, 8))
assert out.shape == (64, 4)
Objectif
Implémentation du réseau de neurones dans
agent.py.Architecture
Tasks
QNetwork(nn.Module)avec PyTorchforward(state)→ Q-values pour les 4 actions(batch_size, 8)Critère de succès