[BigQuery][Digdag][SQL][embulk-filter-column]年と月を保持するためのカラム追加はembulkでできる!

前回のブログにbirthdayカラムにcolumn_optionstimestamp_formatを指定していますが、なぜこんな書き方をしているのか説明していなかったので今回紹介します。今日もembulkの設定ファイルを作成しているときにハマってしまったのでいい加減覚えます。ちなみにエラーは以下


■TIMESTAMP

例ですが、上記のようなSQLの出力をBigQueryに同期したい場合、dateはDATE型に指定するとBigQueryにぶち込めません。(embulkでエラー出るはず)従って以下のようにTIMESTAMP型にしてしまうと入りますが何時何分秒まで表記されてしまいます。

・hoge.json

・BigQuery

これを回避するためにtimestamp_formatで日付型に変換するというわけです。


■timestamp_format

・hoge.yml.liquid

・hoge.json

・BigQuery


■まとめ

BigQueryの仕様だからしゃーない。もう覚えた。


adachi.ryo

1989年生まれのFindy/SRE サブマネージャー。ホスティングから大規模なアドテクなどのインフラエンジニアとして携わる。 現在はサービスの信頼性向上、DevOps、可用性、レイテンシ、パフォーマンス、モニタリング、オブザーバビリティ、 緊急対応、AWSでのインフラ構築、Docker開発環境の提供、IaC、新技術の検証、リファクタリング、セキュリティ強化、分析基盤の運用、チームマネジメントを担当している。 個人事業主では数社サーバー保守とベンチャー企業のインフラコンサルティングを行うほか、TechBullを創業し、ジュニアエンジニアのコミュニティを運営している。さらに、エンジニア向けYouTubeメディア「TECH WORLD」ではSRE関連の動画に出演し、過去には脆弱性スキャナ「Vuls」のOSS活動にも貢献。 ガジェット系エンジニアYouTuberとしても発信。

0件のコメント

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください