Skill

spark-consumption-cli

Analyzes Fabric lakehouse data interactively via Livy API sessions using PySpark and Spark SQL for advanced analytics, DataFrames, cross-joins, Delta time-travel, and JSON data.

Python

SQL

data-engineering

npx claudepluginhub microsoft/skills-for-fabric --plugin skills-for-fabric

Tool Access

This skill uses the workspace's default tool permissions.

Preview

> **Update Check — ONCE PER SESSION (mandatory)**

SKILL.md

Similar Skills

spark-authoring-cli

338

Manages Microsoft Fabric workspaces, lakehouses, and notebooks; authors PySpark, Scala, SparkR, SQL code in cells for data engineering workflows, pipelines, and infrastructure provisioning.

4 files

fabric-skills

fabric-cli

Manages Microsoft Fabric resources including workspaces, semantic models, reports, notebooks, lakehouses using fab CLI for deployment, job execution, data querying, OneLake file management, and automation.

20 files

data-goblin-fabric-cli-plugin

databricks-python-sdk

1.4k

Guides Databricks development with Python SDK, Databricks Connect for local Spark, CLI, and REST API. Use for databricks-sdk, databricks-connect, or APIs.

6 files

databricks-ai-dev-kit

Stats

Parent Repo Stars338

Parent Repo Forks69

Last CommitMay 5, 2026

Actions

View Source View Plugin View on GitHub View README

Help us improve

Share bugs, ideas, or general feedback.

Task	Reference	Notes
Fabric Topology & Key Concepts	COMMON-CORE.md § Fabric Topology & Key Concepts
Environment URLs	COMMON-CORE.md § Environment URLs
Authentication & Token Acquisition	COMMON-CORE.md § Authentication & Token Acquisition	Wrong audience = 401; read before any auth issue
Core Control-Plane REST APIs	COMMON-CORE.md § Core Control-Plane REST APIs
Pagination	COMMON-CORE.md § Pagination
Long-Running Operations (LRO)	COMMON-CORE.md § Long-Running Operations (LRO)
Rate Limiting & Throttling	COMMON-CORE.md § Rate Limiting & Throttling
OneLake Data Access	COMMON-CORE.md § OneLake Data Access	Requires `storage.azure.com` token, not Fabric token
Job Execution	COMMON-CORE.md § Job Execution
Capacity Management	COMMON-CORE.md § Capacity Management
Gotchas & Troubleshooting	COMMON-CORE.md § Gotchas & Troubleshooting
Best Practices	COMMON-CORE.md § Best Practices
Tool Selection Rationale	COMMON-CLI.md § Tool Selection Rationale
Finding Workspaces and Items in Fabric	COMMON-CLI.md § Finding Workspaces and Items in Fabric	Mandatory — READ link first [needed for finding workspace id by its name or item id by its name, item type, and workspace id]
Authentication Recipes	COMMON-CLI.md § Authentication Recipes	`az login` flows and token acquisition
Fabric Control-Plane API via `az rest`	COMMON-CLI.md § Fabric Control-Plane API via az rest	Always pass `--resource https://api.fabric.microsoft.com` or `az rest` fails
Pagination Pattern	COMMON-CLI.md § Pagination Pattern
Long-Running Operations (LRO) Pattern	COMMON-CLI.md § Long-Running Operations (LRO) Pattern
OneLake Data Access via `curl`	COMMON-CLI.md § OneLake Data Access via curl	Use `curl` not `az rest` (different token audience)
SQL / TDS Data-Plane Access	COMMON-CLI.md § SQL / TDS Data-Plane Access	`sqlcmd` (Go) connect, query, CSV export
Job Execution (CLI)	COMMON-CLI.md § Job Execution
OneLake Shortcuts	COMMON-CLI.md § OneLake Shortcuts
Capacity Management (CLI)	COMMON-CLI.md § Capacity Management
Composite Recipes	COMMON-CLI.md § Composite Recipes
Gotchas & Troubleshooting (CLI-Specific)	COMMON-CLI.md § Gotchas & Troubleshooting (CLI-Specific)	`az rest` audience, shell escaping, token expiry
Quick Reference: `az rest` Template	COMMON-CLI.md § Quick Reference: az rest Template
Quick Reference: Token Audience / CLI Tool Matrix	COMMON-CLI.md § Quick Reference: Token Audience ↔ CLI Tool Matrix	Which `--resource` + tool for each service
Relationship to SPARK-AUTHORING-CORE.md	SPARK-CONSUMPTION-CORE.md § Relationship to SPARK-AUTHORING-CORE.md
Data Engineering Consumption Capability Matrix	SPARK-CONSUMPTION-CORE.md § Data Engineering Consumption Capability Matrix
OneLake Table APIs (Schema-enabled Lakehouses)	SPARK-CONSUMPTION-CORE.md § OneLake Table APIs (Schema-enabled Lakehouses)	Unity Catalog-compatible metadata; requires `storage.azure.com` token
Lakehouse Livy Session Management	SPARK-CONSUMPTION-CORE.md § Livy Session Management	Lakehouse Livy API: session creation, states, lifecycle, termination
Interactive Data Exploration	SPARK-CONSUMPTION-CORE.md § Interactive Data Exploration	Statement execution, output retrieval, data discovery
PySpark Analytics Patterns	SPARK-CONSUMPTION-CORE.md § PySpark Analytics Patterns	Cross-lakehouse 3-part naming, performance optimization
Must/Prefer/Avoid	SKILL.md § Must/Prefer/Avoid	MUST DO / AVOID / PREFER checklists
Quick Start	SKILL.md § Quick Start	CLI-specific Lakehouse Livy session setup and data exploration
Key Fabric Patterns	SKILL.md § Key Fabric Patterns	Spark pattern quick-reference table
Session Cleanup	SKILL.md § Session Cleanup	Clean up idle Lakehouse Livy sessions via CLI

Task

Reference

Notes

Fabric Topology & Key Concepts

COMMON-CORE.md § Fabric Topology & Key Concepts

Environment URLs

COMMON-CORE.md § Environment URLs

Authentication & Token Acquisition

COMMON-CORE.md § Authentication & Token Acquisition

Wrong audience = 401; read before any auth issue

Core Control-Plane REST APIs

COMMON-CORE.md § Core Control-Plane REST APIs

Pagination

COMMON-CORE.md § Pagination

Long-Running Operations (LRO)

COMMON-CORE.md § Long-Running Operations (LRO)

Rate Limiting & Throttling

COMMON-CORE.md § Rate Limiting & Throttling

OneLake Data Access

COMMON-CORE.md § OneLake Data Access

Requires storage.azure.com token, not Fabric token

Job Execution

COMMON-CORE.md § Job Execution

Capacity Management

COMMON-CORE.md § Capacity Management

Gotchas & Troubleshooting

COMMON-CORE.md § Gotchas & Troubleshooting

Best Practices

COMMON-CORE.md § Best Practices

Tool Selection Rationale

COMMON-CLI.md § Tool Selection Rationale

Finding Workspaces and Items in Fabric

COMMON-CLI.md § Finding Workspaces and Items in Fabric

Mandatory — READ link first [needed for finding workspace id by its name or item id by its name, item type, and workspace id]

Authentication Recipes

COMMON-CLI.md § Authentication Recipes

az login flows and token acquisition

Fabric Control-Plane API via az rest

COMMON-CLI.md § Fabric Control-Plane API via az rest

Always pass --resource https://api.fabric.microsoft.com or az rest fails

Pagination Pattern

COMMON-CLI.md § Pagination Pattern

Long-Running Operations (LRO) Pattern

COMMON-CLI.md § Long-Running Operations (LRO) Pattern

OneLake Data Access via curl

COMMON-CLI.md § OneLake Data Access via curl

Use curl not az rest (different token audience)

SQL / TDS Data-Plane Access

COMMON-CLI.md § SQL / TDS Data-Plane Access

sqlcmd (Go) connect, query, CSV export

Job Execution (CLI)

COMMON-CLI.md § Job Execution

OneLake Shortcuts

COMMON-CLI.md § OneLake Shortcuts

Capacity Management (CLI)

COMMON-CLI.md § Capacity Management

Composite Recipes

COMMON-CLI.md § Composite Recipes

Gotchas & Troubleshooting (CLI-Specific)

COMMON-CLI.md § Gotchas & Troubleshooting (CLI-Specific)

az rest audience, shell escaping, token expiry

Quick Reference: az rest Template

COMMON-CLI.md § Quick Reference: az rest Template

Quick Reference: Token Audience / CLI Tool Matrix

COMMON-CLI.md § Quick Reference: Token Audience ↔ CLI Tool Matrix

Which --resource + tool for each service

Relationship to SPARK-AUTHORING-CORE.md

SPARK-CONSUMPTION-CORE.md § Relationship to SPARK-AUTHORING-CORE.md

Data Engineering Consumption Capability Matrix

SPARK-CONSUMPTION-CORE.md § Data Engineering Consumption Capability Matrix

OneLake Table APIs (Schema-enabled Lakehouses)

SPARK-CONSUMPTION-CORE.md § OneLake Table APIs (Schema-enabled Lakehouses)

Unity Catalog-compatible metadata; requires storage.azure.com token

Lakehouse Livy Session Management

SPARK-CONSUMPTION-CORE.md § Livy Session Management

Lakehouse Livy API: session creation, states, lifecycle, termination

Interactive Data Exploration

SPARK-CONSUMPTION-CORE.md § Interactive Data Exploration

Statement execution, output retrieval, data discovery

PySpark Analytics Patterns

SPARK-CONSUMPTION-CORE.md § PySpark Analytics Patterns

Cross-lakehouse 3-part naming, performance optimization

Must/Prefer/Avoid

SKILL.md § Must/Prefer/Avoid

MUST DO / AVOID / PREFER checklists

Quick Start

SKILL.md § Quick Start

CLI-specific Lakehouse Livy session setup and data exploration

Key Fabric Patterns

SKILL.md § Key Fabric Patterns

Spark pattern quick-reference table

Session Cleanup

SKILL.md § Session Cleanup

Clean up idle Lakehouse Livy sessions via CLI

# List workspaces az rest --method get --resource "$FABRIC_RESOURCE_SCOPE" --url "$FABRIC_API_URL/workspaces" --query "value[].{name:displayName, id:id}" --output table read -p "Workspace ID: " workspaceId # List lakehouses in workspace az rest --method get --resource "$FABRIC_RESOURCE_SCOPE" --url "$FABRIC_API_URL/workspaces/$workspaceId/items?type=Lakehouse" --query "value[].{name:displayName, id:id}" --output table read -p "Lakehouse ID: " lakehouseId

# Check for existing idle Lakehouse Livy session (avoid resource waste) sessionId=$(az rest --method get --resource "$FABRIC_RESOURCE_SCOPE" --url "$FABRIC_API_URL/workspaces/$workspaceId/lakehouses/$lakehouseId/$LIVY_API_PATH/sessions" --query "sessions[?state=='idle'][0].id" --output tsv) # Create if none available - FORCE STARTER POOL USAGE if [[ -z "$sessionId" ]]; then cat > /tmp/body.json << 'EOF' { "name":"analysis", "driverMemory":"56g", "driverCores":8, "executorMemory":"56g", "executorCores":8, "conf": { "spark.dynamicAllocation.enabled": "true", "spark.fabric.pool.name": "Starter Pool" } } EOF sessionId=$(az rest --method post --resource "$FABRIC_RESOURCE_SCOPE" --url "$FABRIC_API_URL/workspaces/$workspaceId/lakehouses/$lakehouseId/$LIVY_API_PATH/sessions" --body @/tmp/body.json --query "id" --output tsv) echo "⏳ Waiting for starter pool session to be ready..." # With starter pools, this should be 3-5 seconds timeout=30 # Reduced from 90s since starter pools are fast while [ $timeout -gt 0 ]; do state=$(az rest --resource "$FABRIC_RESOURCE_SCOPE" --url "$FABRIC_API_URL/workspaces/$workspaceId/lakehouses/$lakehouseId/$LIVY_API_PATH/sessions/$sessionId" --query "state" --output tsv) if [[ "$state" == "idle" ]]; then echo "✅ Session ready in starter pool!" break fi echo " Session state: $state (${timeout}s remaining)" sleep 3 timeout=$((timeout - 3)) done fi

# Execute statement (LLM knows Python/Spark syntax) cat > /tmp/body.json << 'EOF' { "code": "spark.sql(\"SHOW TABLES\").show(); df = spark.table(\"your_table\"); df.describe().show()", "kind": "pyspark" } EOF az rest --method post --resource "$FABRIC_RESOURCE_SCOPE" --url "$FABRIC_API_URL/workspaces/$workspaceId/lakehouses/$lakehouseId/$LIVY_API_PATH/sessions/$sessionId/statements" --body @/tmp/body.json

Pattern	Code	Use Case
Table Discovery	`spark.sql("SHOW TABLES")`	List available tables
Cross-Lakehouse	`spark.sql("SELECT * FROM other_workspace.table")`	Query across workspaces
Delta Features	`df.history()`, `df.readVersion(1)`	Time travel, versioning
Schema Evolution	`df.printSchema()`	Understand structure

Pattern

Code

Use Case

Table Discovery

spark.sql("SHOW TABLES")

List available tables

Cross-Lakehouse

spark.sql("SELECT * FROM other_workspace.table")

Query across workspaces

Delta Features

df.history(), df.readVersion(1)

Time travel, versioning

Schema Evolution

df.printSchema()

Understand structure

# Clean up idle Lakehouse Livy sessions (optional) az rest --method get --resource "$FABRIC_RESOURCE_SCOPE" --url "$FABRIC_API_URL/workspaces/$workspaceId/lakehouses/$lakehouseId/$LIVY_API_PATH/sessions" --query "sessions[?state=='idle'].id" --output tsv | xargs -I {} az rest --method delete --resource "$FABRIC_RESOURCE_SCOPE" --url "$FABRIC_API_URL/workspaces/$workspaceId/lakehouses/$lakehouseId/$LIVY_API_PATH/sessions/{}"

Task	Reference	Notes
Fabric Topology & Key Concepts	COMMON-CORE.md § Fabric Topology & Key Concepts
Environment URLs	COMMON-CORE.md § Environment URLs
Authentication & Token Acquisition	COMMON-CORE.md § Authentication & Token Acquisition	Wrong audience = 401; read before any auth issue
Core Control-Plane REST APIs	COMMON-CORE.md § Core Control-Plane REST APIs
Pagination	COMMON-CORE.md § Pagination
Long-Running Operations (LRO)	COMMON-CORE.md § Long-Running Operations (LRO)
Rate Limiting & Throttling	COMMON-CORE.md § Rate Limiting & Throttling
OneLake Data Access	COMMON-CORE.md § OneLake Data Access	Requires `storage.azure.com` token, not Fabric token
Job Execution	COMMON-CORE.md § Job Execution
Capacity Management	COMMON-CORE.md § Capacity Management
Gotchas & Troubleshooting	COMMON-CORE.md § Gotchas & Troubleshooting
Best Practices	COMMON-CORE.md § Best Practices
Tool Selection Rationale	COMMON-CLI.md § Tool Selection Rationale
Finding Workspaces and Items in Fabric	COMMON-CLI.md § Finding Workspaces and Items in Fabric	Mandatory — READ link first [needed for finding workspace id by its name or item id by its name, item type, and workspace id]
Authentication Recipes	COMMON-CLI.md § Authentication Recipes	`az login` flows and token acquisition
Fabric Control-Plane API via `az rest`	COMMON-CLI.md § Fabric Control-Plane API via az rest	Always pass `--resource https://api.fabric.microsoft.com` or `az rest` fails
Pagination Pattern	COMMON-CLI.md § Pagination Pattern
Long-Running Operations (LRO) Pattern	COMMON-CLI.md § Long-Running Operations (LRO) Pattern
OneLake Data Access via `curl`	COMMON-CLI.md § OneLake Data Access via curl	Use `curl` not `az rest` (different token audience)
SQL / TDS Data-Plane Access	COMMON-CLI.md § SQL / TDS Data-Plane Access	`sqlcmd` (Go) connect, query, CSV export
Job Execution (CLI)	COMMON-CLI.md § Job Execution
OneLake Shortcuts	COMMON-CLI.md § OneLake Shortcuts
Capacity Management (CLI)	COMMON-CLI.md § Capacity Management
Composite Recipes	COMMON-CLI.md § Composite Recipes
Gotchas & Troubleshooting (CLI-Specific)	COMMON-CLI.md § Gotchas & Troubleshooting (CLI-Specific)	`az rest` audience, shell escaping, token expiry
Quick Reference: `az rest` Template	COMMON-CLI.md § Quick Reference: az rest Template
Quick Reference: Token Audience / CLI Tool Matrix	COMMON-CLI.md § Quick Reference: Token Audience ↔ CLI Tool Matrix	Which `--resource` + tool for each service
Relationship to SPARK-AUTHORING-CORE.md	SPARK-CONSUMPTION-CORE.md § Relationship to SPARK-AUTHORING-CORE.md
Data Engineering Consumption Capability Matrix	SPARK-CONSUMPTION-CORE.md § Data Engineering Consumption Capability Matrix
OneLake Table APIs (Schema-enabled Lakehouses)	SPARK-CONSUMPTION-CORE.md § OneLake Table APIs (Schema-enabled Lakehouses)	Unity Catalog-compatible metadata; requires `storage.azure.com` token
Lakehouse Livy Session Management	SPARK-CONSUMPTION-CORE.md § Livy Session Management	Lakehouse Livy API: session creation, states, lifecycle, termination
Interactive Data Exploration	SPARK-CONSUMPTION-CORE.md § Interactive Data Exploration	Statement execution, output retrieval, data discovery
PySpark Analytics Patterns	SPARK-CONSUMPTION-CORE.md § PySpark Analytics Patterns	Cross-lakehouse 3-part naming, performance optimization
Must/Prefer/Avoid	SKILL.md § Must/Prefer/Avoid	MUST DO / AVOID / PREFER checklists
Quick Start	SKILL.md § Quick Start	CLI-specific Lakehouse Livy session setup and data exploration
Key Fabric Patterns	SKILL.md § Key Fabric Patterns	Spark pattern quick-reference table
Session Cleanup	SKILL.md § Session Cleanup	Clean up idle Lakehouse Livy sessions via CLI

Task

Reference

Notes

Fabric Topology & Key Concepts

COMMON-CORE.md § Fabric Topology & Key Concepts

Environment URLs

COMMON-CORE.md § Environment URLs

Authentication & Token Acquisition

COMMON-CORE.md § Authentication & Token Acquisition

Wrong audience = 401; read before any auth issue

Core Control-Plane REST APIs

COMMON-CORE.md § Core Control-Plane REST APIs

Pagination

COMMON-CORE.md § Pagination

Long-Running Operations (LRO)

COMMON-CORE.md § Long-Running Operations (LRO)

Rate Limiting & Throttling

COMMON-CORE.md § Rate Limiting & Throttling

OneLake Data Access

COMMON-CORE.md § OneLake Data Access

Requires storage.azure.com token, not Fabric token

Job Execution

COMMON-CORE.md § Job Execution

Capacity Management

COMMON-CORE.md § Capacity Management

Gotchas & Troubleshooting

COMMON-CORE.md § Gotchas & Troubleshooting

Best Practices

COMMON-CORE.md § Best Practices

Tool Selection Rationale

COMMON-CLI.md § Tool Selection Rationale

Finding Workspaces and Items in Fabric

COMMON-CLI.md § Finding Workspaces and Items in Fabric

Mandatory — READ link first [needed for finding workspace id by its name or item id by its name, item type, and workspace id]

Authentication Recipes

COMMON-CLI.md § Authentication Recipes

az login flows and token acquisition

Fabric Control-Plane API via az rest

COMMON-CLI.md § Fabric Control-Plane API via az rest

Always pass --resource https://api.fabric.microsoft.com or az rest fails

Pagination Pattern

COMMON-CLI.md § Pagination Pattern

Long-Running Operations (LRO) Pattern

COMMON-CLI.md § Long-Running Operations (LRO) Pattern

OneLake Data Access via curl

COMMON-CLI.md § OneLake Data Access via curl

Use curl not az rest (different token audience)

SQL / TDS Data-Plane Access

COMMON-CLI.md § SQL / TDS Data-Plane Access

sqlcmd (Go) connect, query, CSV export

Job Execution (CLI)

COMMON-CLI.md § Job Execution

OneLake Shortcuts

COMMON-CLI.md § OneLake Shortcuts

Capacity Management (CLI)

COMMON-CLI.md § Capacity Management

Composite Recipes

COMMON-CLI.md § Composite Recipes

Gotchas & Troubleshooting (CLI-Specific)

COMMON-CLI.md § Gotchas & Troubleshooting (CLI-Specific)

az rest audience, shell escaping, token expiry

Quick Reference: az rest Template

COMMON-CLI.md § Quick Reference: az rest Template

Quick Reference: Token Audience / CLI Tool Matrix

COMMON-CLI.md § Quick Reference: Token Audience ↔ CLI Tool Matrix

Which --resource + tool for each service

Relationship to SPARK-AUTHORING-CORE.md

SPARK-CONSUMPTION-CORE.md § Relationship to SPARK-AUTHORING-CORE.md

Data Engineering Consumption Capability Matrix

SPARK-CONSUMPTION-CORE.md § Data Engineering Consumption Capability Matrix

OneLake Table APIs (Schema-enabled Lakehouses)

SPARK-CONSUMPTION-CORE.md § OneLake Table APIs (Schema-enabled Lakehouses)

Unity Catalog-compatible metadata; requires storage.azure.com token

Lakehouse Livy Session Management

SPARK-CONSUMPTION-CORE.md § Livy Session Management

Lakehouse Livy API: session creation, states, lifecycle, termination

Interactive Data Exploration

SPARK-CONSUMPTION-CORE.md § Interactive Data Exploration

Statement execution, output retrieval, data discovery

PySpark Analytics Patterns

SPARK-CONSUMPTION-CORE.md § PySpark Analytics Patterns

Cross-lakehouse 3-part naming, performance optimization

Must/Prefer/Avoid

SKILL.md § Must/Prefer/Avoid

MUST DO / AVOID / PREFER checklists

Quick Start

SKILL.md § Quick Start

CLI-specific Lakehouse Livy session setup and data exploration

Key Fabric Patterns

SKILL.md § Key Fabric Patterns

Spark pattern quick-reference table

Session Cleanup

SKILL.md § Session Cleanup

Clean up idle Lakehouse Livy sessions via CLI

Pattern	Code	Use Case
Table Discovery	`spark.sql("SHOW TABLES")`	List available tables
Cross-Lakehouse	`spark.sql("SELECT * FROM other_workspace.table")`	Query across workspaces
Delta Features	`df.history()`, `df.readVersion(1)`	Time travel, versioning
Schema Evolution	`df.printSchema()`	Understand structure

Pattern

Code

Use Case

Table Discovery

spark.sql("SHOW TABLES")

List available tables

Cross-Lakehouse

spark.sql("SELECT * FROM other_workspace.table")

Query across workspaces

Delta Features

df.history(), df.readVersion(1)

Time travel, versioning

Schema Evolution

df.printSchema()

Understand structure

spark-consumption-cli

Tool Access

Preview

SKILL.md

Similar Skills

Help us improve

Help us improve

spark-consumption-cli

Tool Access

Preview

SKILL.md

Data Engineering Consumption — CLI Skill

Table of Contents

Must/Prefer/Avoid

MUST DO

PREFER

AVOID

Quick Start

Environment Setup

Workspace & Item Discovery

Lakehouse Livy Session Management

Data Exploration (Fabric-Specific Patterns)

Key Fabric Patterns

Lakehouse Livy Session Cleanup

Similar Skills

Help us improve

Data Engineering Consumption — CLI Skill

Table of Contents

Must/Prefer/Avoid

MUST DO

PREFER

AVOID

Quick Start

Environment Setup

Workspace & Item Discovery

Lakehouse Livy Session Management

Data Exploration (Fabric-Specific Patterns)

Key Fabric Patterns

Lakehouse Livy Session Cleanup