#DuckDBの記事一覧
-
DuckDBでSQLクエリを叩くときにCSV形式よりもApache Parquet形式のほうが早い理由
先に理由を書きますが、ParquetのRow Group単位で並列処理できるしフルスキャンを避けれるからです。 システムでも分析タスクでもSQLクエリを叩く(問い合わせ)したらなる早でレスポンス欲しいですよね。この記事で […]
-
DuckDBでデータをParquet形式に出力する方法 🦆
こんにちはkyuitaです。 皆様は業務でBigQueryなどのデータ分析用にParquet形式でのデータを求められることはないでしょうか。今回はDuckDBをデータフォーマット変換のツールとして利用してみます。 Par […]
-
DuckDB を使ってクラウドストレージに置かれたデータを解析してみる
こんにちは kyuita です。皆様はシステムエンジニアとして働いているとこんな場面に身に覚えがないでしょうか。 ・クラウドストレージ(GCS, S3 など)にログデータをアーカイブとして残している。だけど一度も中身を見 […]


