[BigQuery]すべてのviewテーブルのクエリをバックアップしてみた！

BigQueryのテーブルを間違えて消しても復元できるの知ってた！？

BigQueryのテーブルは謝って削除しても復元可能です。しかし、重要なのはviewテーブルのクエリら定期的に全バックアップをしないと死亡するため、頑張ってシェル芸してみました。

■bq show

https://cloud.google.com/bigquery/bq-command-line-tool?hl=ja#listdatasets

bq ls

$ bq ls --format=pretty adachin:views01

+--------------+------+--------+-------------------+

+--------------+------+--------+-------------------+

+--------------+------+--------+-------------------+

bq show

1	$ bq show --format=prettyjson adachin:views.test > test.json

test.json

{

"creationTime": "1551424833736",

"etag": "S/xxxxxxxxxxxxxxx==",

"id": "adachin:views.test",

"kind": "bigquery#table",

"lastModifiedTime": "1551424833967",

"location": "US",

"numBytes": "0",

"numLongTermBytes": "0",

"numRows": "0",

"schema": {

"fields": [

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "INTEGER"

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "INTEGER"

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "STRING"

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "INTEGER"

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "STRING"

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "INTEGER"

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "STRING"

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "STRING"

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "DATETIME"

{

"mode": "NULLABLE",

"name": "xxxxxxxx",

"type": "DATE"

}

]

"selfLink": "https://www.googleapis.com/bigquery/v2/xxxxxxxx",

"tableReference": {

"datasetId": "views",

"projectId": "adachin",

"tableId": "test"

"type": "VIEW",

"view": {

"query": "SELECT\n id\nFROM\n `adachin.xxxxxx.works`",

"useLegacySql": false

}

bq showで全ての情報がjsonで返ってくるので、一番下のqueryをいい感じに取ってきます。

■backup-all-views.sh

https://stackoverflow.com/questions/48814065/bigquery-backup-all-view-definitions

#!/bin/bash

DIR=/home/adachin/backup/views/

DATE_YEAR=`date +%Y`

DATE=`date +%m%d`

OLD_DATE=`date +%m%d --date "5 days ago"`

DATASETS=$(bq ls --format=sparse | tail -n+3)

mkdir -p $DIR/$DATE_YEAR/$DATE

for d in $DATASETS; do

TABLES=$(bq ls --format=prettyjson "$d" | jq '.[] | "\(.id), \(.type)"')

IFS=$'\n'

for table in $TABLES; do

[[ ! "$table" == *VIEW* ]] && continue

view=$(echo "$table" | sed -e 's/"//g' | cut -d , -f 1)

query=$(bq show --format=prettyjson "$view" | jq -r '.view.query')

echo -e "$query" > "$DIR/$DATE_YEAR/$DATE/$view.sql"

rm -rf "$DIR/$DATE_YEAR/$OLD_DATE"

done

aws s3 cp /home/adachin/backup s3://xxxxxxxx/backup --recursive

上記参考にしましたが、全viewテーブルのクエリをsqlで日付ごとに保存し、世代は5日で十分かと思います。実行すると以下のようにsqlファイルが出来上がり、クエリが保存されています。
※jqコマンド必須!

$ tree backup/

backup/

└── views

└── 2019

└── 0305

├── adachin:views.test.sql.20190305

├── adachin:views.xxxx.sql.20190305

~省略~

$ cat adachin:views.test.sql.20190305

SELECT

FROM

`adachin.xxxxx.works`

cron

1 2	# run backup-all-views.sh 00 01 * * * sudo -u adachin bash -l /scripts/backup-all-views.sh

S3にコピーすればOK！

■まとめ

これで削除しても復元可能！！バックアップ大事。

[BigQuery]すべてのviewテーブルのクエリをバックアップしてみた！

投稿者: adachi.ryo 投稿日: 2019/03/052019/03/05

■bq show

■backup-all-views.sh

■まとめ

adachi.ryo

0件のコメント

コメントを残すコメントをキャンセル

[DigitalOcean]APIを使って毎月の請求をSlackに通知させてみた

[BigQuery][Embulk][Digdag][MySQL]差分更新で高速シンクをするときのテクニックと注意点

[embulk][Google Analytics]view_idをdigdagのfor_eachで回すのに苦労した件

[BigQuery]すべてのviewテーブルのクエリをバックアップしてみた！

投稿者: adachi.ryo 投稿日: 2019/03/052019/03/05

■bq show

■backup-all-views.sh

■まとめ

adachi.ryo

0件のコメント

コメントを残すコメントをキャンセル

関連投稿

[DigitalOcean]APIを使って毎月の請求をSlackに通知させてみた

[BigQuery][Embulk][Digdag][MySQL]差分更新で高速シンクをするときのテクニックと注意点

[embulk][Google Analytics]view_idをdigdagのfor_eachで回すのに苦労した件