Digdag運用している方にとって大変なのが、度々起こるシンクでの Fail (以下画像より)。毎日Webからポチッと Retryボタン を押して、またFailが来る…エラー見てもjavaのエラーなのでまったくわからず..

ちなみに以下のように _retry を入れても再Retryして失敗しまくりです。原因としてはBigQueryにシンクしまくると怒られるので、要は間隔があればOK!

今回Digdag v0.9.28から Retry Interval 機能が追加されて、インターバルが指定できるようになってからRetry時の実行時間の感覚を指定できるようになりました。チームでバージョンアップだ!ということでやってみたところ、うまくいったのでブログします!


■Retrying failed tasks automatically

https://docs.digdag.io/workflow_definition.html#retrying-failed-tasks-automatically


■Digdag version up


■Digdag setting file

  • retry.dig

  • run.dig


■後日

FailしてもRetryされていました!!!


■まとめ

とりあえず手動で実行することがなくなりました。digdagのバージョンアップについては追わないと新機能がわからん!ということでRSS入れよう。

カテゴリー: digdag

adachi.ryo

1989年生まれのFindy/SRE。ホスティングから大規模なアドテクなどのインフラエンジニアとして携わる。現在はサービスの信頼性向上、DevOps、可用性、レイテンシ、パフォーマンス、モニタリング、オブザーバビリティ、緊急対応、AWSでのインフラ構築、Docker開発環境の提供、IaC、新技術の検証、リファクタリング、セキュリティ強化、分析基盤の運用などを担当している。 個人事業主では数社サーバー保守とベンチャー企業のインフラコンサルティングを行うほか、TechBullを創業し、未経験者向けにSREのコーチングやコミュニティ運営、LT大会の開催、 会員管理システム「Members」の開発をリードしている。さらに、エンジニア向けYouTubeメディア「TECH WORLD」ではSRE関連の動画に出演し、過去には脆弱性スキャナ「Vuls」のOSS活動にも貢献。

0件のコメント

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください