Skip to content

Prioritized Experience Replay #17

@sarrrrry

Description

@sarrrrry

一言でいうと

ANMLの中のリプレイ法で紹介された論文
↓ 詳細は以下の記事がわかりやすかった
https://qiita.com/d-ogawa/items/38dcdfda926739b49d55

リプレイ法とは,以前の経験を保存し、新たに遭遇したデータと混合する事で忘却を軽減する手法で,タスクをスケーリングしていくことは計算コストや記憶の点で,出来ない

論文リンク

https://arxiv.org/abs/1511.05952

著者/所属機関

Tom Schaul, John Quan, Ioannis Antonoglou and David Silver
Google DeepMind
{schaul,johnquan,ioannisa,davidsilver}@google.com

投稿日付(yyyy/MM/dd)

[v1] Wed, 18 Nov 2015 20:54:44 UTC (1,194 KB)

概要

新規性・差分

手法

結果

コメント

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type
No fields configured for issues without a type.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions