Skill

materialized-view

Create and manage materialized views using DataFusion. Persist SQL query results as Parquet files for fast repeated access. Track source dependencies and refresh when data changes.

database

data-engineering

npx claudepluginhub datafusion-contrib/datafusion-skills --plugin datafusion-skills

Tool Access

This skill is limited to using the following tools:

Bash

Preview

You are helping the user create and manage materialized views using Apache DataFusion.

SKILL.md

Similar Skills

clickhouse-materialized-views

Provides 10+ patterns and rules for ClickHouse Materialized Views using SummingMergeTree and AggregatingMergeTree for real-time aggregation, ETL pipelines, and query optimization.

clickhouse

query

Runs SQL queries or natural language questions against registered tables or ad-hoc on Parquet, CSV, JSON, Arrow IPC files using datafusion-cli.

1 tool

datafusion-skills

databricks-pipelines

100

Develop Lakeflow Spark Declarative Pipelines (formerly Delta Live Tables) on Databricks. Use when building batch or streaming data pipelines with Python or SQL. Invoke BEFORE starting implementation.

20 files

databricks-skills

Stats

Stars11

Forks0

Last CommitMar 21, 2026

Actions

View Source View Plugin View on GitHub View README

Help us improve

Share bugs, ideas, or general feedback.

STATE_DIR="" test -f .datafusion-skills/state.sql && STATE_DIR=".datafusion-skills" PROJECT_ROOT="$(git rev-parse --show-toplevel 2>/dev/null || echo "$PWD")" PROJECT_ID="$(echo "$PROJECT_ROOT" | tr '/' '-')" test -f "$HOME/.datafusion-skills/$PROJECT_ID/state.sql" && STATE_DIR="$HOME/.datafusion-skills/$PROJECT_ID"

cat >> "$STATE_DIR/state.sql" <<SQL -- Materialized view: <view_name> -- Source SQL: $SQL CREATE EXTERNAL TABLE IF NOT EXISTS <view_name> STORED AS PARQUET LOCATION '$STATE_DIR/views/<view_name>.parquet'; SQL

python3 -c " import json, datetime manifest_path = '$STATE_DIR/views/manifest.json' with open(manifest_path) as f: manifest = json.load(f) manifest['views']['<view_name>'] = { 'sql': '''$SQL''', 'parquet_path': '$STATE_DIR/views/<view_name>.parquet', 'created_at': datetime.datetime.now().isoformat(), 'last_refreshed': datetime.datetime.now().isoformat(), 'source_tables': [] # extracted from SQL } with open(manifest_path, 'w') as f: json.dump(manifest, f, indent=2) "

python3 -c " import json with open('$STATE_DIR/views/manifest.json') as f: manifest = json.load(f) view = manifest['views'].get('<view_name>') if view: print(view['sql']) else: print('ERROR: view not found') "

python3 -c " import json, os, datetime with open('$STATE_DIR/views/manifest.json') as f: manifest = json.load(f) for name, view in manifest['views'].items(): parquet = view['parquet_path'] size = os.path.getsize(parquet) if os.path.exists(parquet) else 0 size_mb = size / (1024 * 1024) print(f\"{name}:\") print(f\" SQL: {view['sql'][:80]}...\") print(f\" Last refreshed: {view['last_refreshed']}\") print(f\" File size: {size_mb:.2f} MB\") print(f\" Path: {parquet}\") print() "

python3 -c " import json with open('$STATE_DIR/views/manifest.json') as f: manifest = json.load(f) for name in sorted(manifest['views']): view = manifest['views'][name] print(f\" {name} — refreshed {view['last_refreshed'][:10]}\") "

rm -f "$STATE_DIR/views/<view_name>.parquet" python3 -c " import json with open('$STATE_DIR/views/manifest.json') as f: manifest = json.load(f) manifest['views'].pop('<view_name>', None) with open('$STATE_DIR/views/manifest.json', 'w') as f: json.dump(manifest, f, indent=2) "

materialized-view

Tool Access

Preview

SKILL.md

Similar Skills

Help us improve

Help us improve

materialized-view

Tool Access

Preview

SKILL.md

Step 1 — Check datafusion-cli is installed

Step 2 — Resolve state directory

Step 3 — Parse the command

Command: CREATE

3a — Generate SQL if needed

3b — Derive a view name

3c — Validate the query

3d — Materialize as Parquet

3e — Register as external table

3f — Update the manifest

3g — Verify

Command: REFRESH

Refresh a specific view

Command: STATUS

Command: LIST

Command: DROP

Error handling

Suggest next steps

Similar Skills

Help us improve

Step 1 — Check datafusion-cli is installed

Step 2 — Resolve state directory

Step 3 — Parse the command

Command: CREATE

3a — Generate SQL if needed

3b — Derive a view name

3c — Validate the query

3d — Materialize as Parquet

3e — Register as external table

3f — Update the manifest

3g — Verify

Command: REFRESH

Refresh a specific view

Command: STATUS

Command: LIST

Command: DROP

Error handling

Suggest next steps