[BigQuery][Digdag][SQL][embulk-filter-column]年と月を保持するためのカラム追加はembulkでできる!

前回のブログにbirthdayカラムにcolumn_optionstimestamp_formatを指定していますが、なぜこんな書き方をしているのか説明していなかったので今回紹介します。今日もembulkの設定ファイルを作成しているときにハマってしまったのでいい加減覚えます。ちなみにエラーは以下


■TIMESTAMP

例ですが、上記のようなSQLの出力をBigQueryに同期したい場合、dateはDATE型に指定するとBigQueryにぶち込めません。(embulkでエラー出るはず)従って以下のようにTIMESTAMP型にしてしまうと入りますが何時何分秒まで表記されてしまいます。

・hoge.json

・BigQuery

これを回避するためにtimestamp_formatで日付型に変換するというわけです。


■timestamp_format

・hoge.yml.liquid

・hoge.json

・BigQuery


■まとめ

BigQueryの仕様だからしゃーない。もう覚えた。



adachin

1989年生まれのFindy/SRE。ホスティングから大規模なアドテクなどのインフラエンジニアとして携わる。現在はサービスの信頼性向上、DevOps、可用性、レイテンシ、パフォーマンス、モニタリング、オブザーバビリティ、緊急対応、AWSでのインフラ構築、Docker開発環境の提供、IaC、新技術の検証、リファクタリング、セキュリティ強化、分析基盤の運用などを担当している。個人事業主では数社サーバー保守とベンチャー企業のSREインフラコンサルティングやMENTA/TechBullで未経験者にインフラのコーチング/コミュニティマネージャーとして立ち上げと運営をしている。また、過去「脆弱性スキャナVuls」のOSS活動もしており、自称エバンジェリスト/技術広報/テクニカルサポート/コントリビュータでもある。

0件のコメント

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください