Skip to content

feat: SQS DLQ 設定と Worker のエラーハンドリング(maxReceiveCount, タイムアウト) #27

@Asheze1127

Description

@Asheze1127

Why

AI 推論が失敗し続けたとき無限リトライで詰まるのを防ぐ。

Scope

  • LocalStack / AWS に DLQ キュー作成(question-new-dlq, progress-dlq
  • maxReceiveCount=3 設定
  • Worker 内で Bonsai タイムアウト 30秒の設定
  • Onyx タイムアウト 3秒の設定(将来の Phase 2 用に今から入れる)
  • DLQ にメッセージが来たときのログアラート

Out of scope

CloudWatch アラーム本番設定

Dependencies

Acceptance Criteria

  • 3回失敗したジョブが DLQ に移動する
  • Bonsai が 30秒以上かかるとタイムアウトして fallback に移行する
  • DLQ にメッセージが入ったことをログで確認できる

Size: S | Parallelizable: Yes(#D-01 完了後)

Metadata

Metadata

Assignees

No one assigned

    Labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions