Skill

read-file

Reads and explores Parquet, CSV, JSON, Arrow IPC, Avro files locally, from S3/GCS using datafusion-cli for schema inspection, row counts, and data previews.

Bash

AWS

GCP

data-engineering

npx claudepluginhub datafusion-contrib/datafusion-skills --plugin datafusion-skills

Tool Access

This skill is limited to using the following tools:

Bash

Preview

You are helping the user read and analyze a data file using Apache DataFusion.

SKILL.md

Similar Skills

read-file

412

Reads data files (CSV, JSON, Parquet, Avro, Excel, spatial, SQLite) or remote S3/HTTPS URLs using DuckDB. Activates for file references, 'what's in this file' queries, or dataset previews.

1 tool

duckdb-skills

query

Runs SQL queries or natural language questions against registered tables or ad-hoc on Parquet, CSV, JSON, Arrow IPC files using datafusion-cli.

1 tool

datafusion-skills

explore-data

10.9k

Profiles tables or files (CSV, Excel, Parquet, JSON) to reveal shape, null rates, column distributions, top values, percentiles, data quality issues, and column categories.

data

Stats

Stars11

Forks0

Last CommitMar 21, 2026

Actions

View Source View Plugin View on GitHub View README

Help us improve

Share bugs, ideas, or general feedback.

Extension	Format	DataFusion support
`.parquet`, `.pq`	Parquet	Direct query: `SELECT * FROM 'file.parquet'`
`.csv`, `.tsv`, `.txt`	CSV	Direct query: `SELECT * FROM 'file.csv'`
`.json`, `.jsonl`, `.ndjson`	JSON	Direct query: `SELECT * FROM 'file.json'`
`.arrow`, `.ipc`, `.feather`	Arrow IPC	`CREATE EXTERNAL TABLE` with `STORED AS ARROW`
`.avro`	Avro	`CREATE EXTERNAL TABLE` with `STORED AS AVRO`

Extension

Format

DataFusion support

.parquet, .pq

Parquet

Direct query: SELECT * FROM 'file.parquet'

.csv, .tsv, .txt

CSV

Direct query: SELECT * FROM 'file.csv'

.json, .jsonl, .ndjson

JSON

Direct query: SELECT * FROM 'file.json'

.arrow, .ipc, .feather

Arrow IPC

CREATE EXTERNAL TABLE with STORED AS ARROW

.avro

Avro

CREATE EXTERNAL TABLE with STORED AS AVRO

cat > /tmp/_df_preview.sql << 'SQL' CREATE EXTERNAL TABLE _preview STORED AS CSV LOCATION 'RESOLVED_PATH' OPTIONS ('has_header' 'false', 'delimiter' '\t'); DESCRIBE _preview; SELECT COUNT(*) AS row_count FROM _preview; SELECT * FROM _preview LIMIT 10; SQL datafusion-cli --file /tmp/_df_preview.sql

cat > /tmp/_df_preview.sql << 'SQL' CREATE EXTERNAL TABLE _preview STORED AS ARROW LOCATION 'RESOLVED_PATH'; DESCRIBE _preview; SELECT COUNT(*) AS row_count FROM _preview; SELECT * FROM _preview LIMIT 10; SQL datafusion-cli --file /tmp/_df_preview.sql

cat > /tmp/_df_preview.sql << 'SQL' CREATE EXTERNAL TABLE _preview STORED AS AVRO LOCATION 'RESOLVED_PATH'; DESCRIBE _preview; SELECT COUNT(*) AS row_count FROM _preview; SELECT * FROM _preview LIMIT 10; SQL datafusion-cli --file /tmp/_df_preview.sql

Extension	Format	DataFusion support
`.parquet`, `.pq`	Parquet	Direct query: `SELECT * FROM 'file.parquet'`
`.csv`, `.tsv`, `.txt`	CSV	Direct query: `SELECT * FROM 'file.csv'`
`.json`, `.jsonl`, `.ndjson`	JSON	Direct query: `SELECT * FROM 'file.json'`
`.arrow`, `.ipc`, `.feather`	Arrow IPC	`CREATE EXTERNAL TABLE` with `STORED AS ARROW`
`.avro`	Avro	`CREATE EXTERNAL TABLE` with `STORED AS AVRO`

Extension

Format

DataFusion support

.parquet, .pq

Parquet

Direct query: SELECT * FROM 'file.parquet'

.csv, .tsv, .txt

CSV

Direct query: SELECT * FROM 'file.csv'

.json, .jsonl, .ndjson

JSON

Direct query: SELECT * FROM 'file.json'

.arrow, .ipc, .feather

Arrow IPC

CREATE EXTERNAL TABLE with STORED AS ARROW

.avro

Avro

CREATE EXTERNAL TABLE with STORED AS AVRO

read-file

Tool Access

Preview

SKILL.md

Similar Skills

Help us improve

Help us improve

read-file

Tool Access

Preview

SKILL.md

Step 1 — Classify and resolve the path

Local files

Remote files

Step 2 — Check datafusion-cli is installed

Step 3 — Detect file format and read

For Parquet, CSV, and JSON files (direct query):

For Arrow IPC files:

For Avro files:

Unknown format

Step 4 — Handle errors

Step 5 — Answer the question

Step 6 — Suggest next steps

Cross-skill integration

Similar Skills

Help us improve

Step 1 — Classify and resolve the path

Local files

Remote files

Step 2 — Check datafusion-cli is installed

Step 3 — Detect file format and read

For Parquet, CSV, and JSON files (direct query):

For Arrow IPC files:

For Avro files:

Unknown format

Step 4 — Handle errors

Step 5 — Answer the question

Step 6 — Suggest next steps

Cross-skill integration