Skill

databricks-migration-deep-dive

Execute comprehensive platform migrations to Databricks from legacy systems. Use when migrating from on-premises Hadoop, other cloud platforms, or legacy data warehouses to Databricks. Trigger with phrases like "migrate to databricks", "hadoop migration", "snowflake to databricks", "legacy migration", "data warehouse migration".

From databricks-pack

Install

Run in your terminal

npx claudepluginhub nickloveinvesting/nick-love-plugins --plugin databricks-pack

Tool Access

This skill is limited to using the following tools:

ReadWriteEditBash(databricks:*)Grep

Supporting Assets

View in Repository

references/implementation.md

Skill Content

Similar Skills

payload

11 files

Guides Payload CMS config (payload.config.ts), collections, fields, hooks, access control, APIs. Debugs validation errors, security, relationships, queries, transactions, hook behavior.

payload

41.6k

analytics-tracking

Designs, audits, and improves analytics tracking systems using Signal Quality Index for reliable, decision-ready data in marketing, product, and growth.

antigravity-bundle-data-analytics

30.9k

ab-test-setup

Enforces A/B test setup with gates for hypothesis locking, metrics definition, sample size calculation, assumptions checks, and execution readiness before implementation.

antigravity-bundle-data-analytics

30.9k

Stats

Parent Repo Stars0

Parent Repo Forks0

Last CommitMar 20, 2026

Actions

View Source View Plugin View on GitHub View README

Databricks Migration Deep Dive

Overview
Prerequisites
Instructions
Output
Error Handling
Examples
Resources

Overview

Comprehensive migration strategies for moving to Databricks from Hadoop, Snowflake, Redshift, Synapse, or legacy data warehouses.

Prerequisites

Access to source and target systems
Understanding of current data architecture
Migration timeline and stakeholder alignment

Migration Patterns

Source	Pattern	Complexity	Timeline
On-prem Hadoop	Lift-and-shift + modernize	High	6-12 months
Snowflake	Parallel run + cutover	Medium	3-6 months
AWS Redshift	ETL rewrite + data copy	Medium	3-6 months
Legacy DW (Oracle/Teradata)	Full rebuild	High	12-18 months

Instructions

Step 1: Discovery and Assessment

Inventory all source tables with metadata (size, partitions, dependencies, data classification). Generate prioritized migration plan with wave assignments.

Step 2: Schema Migration

Convert source schemas to Delta Lake compatible types. Handle type conversions (char->string, tinyint->int). Enable auto-optimize on target tables.

Step 3: Data Migration

Batch large tables by partition. Validate row counts and schema match after each table migration.

Step 4: ETL/Pipeline Migration

Convert spark-submit/Oozie jobs to Databricks jobs. Update paths, remove Hive metastore references, adapt for Unity Catalog.

Step 5: Cutover Planning

Execute 6-step cutover: validate -> disable source -> final sync -> enable Databricks -> update apps -> monitor. Each step has rollback procedure.

See detailed implementation for assessment scripts, schema conversion, data migration with batching, ETL conversion, and cutover plan generation.

Output

Migration assessment with prioritized plan
Schema migration automated
Data migration pipeline with validation
Cutover plan with rollback procedures

Error Handling

Error	Cause	Solution
Schema incompatibility	Unsupported types	Use type conversion mappings
Data loss	Truncation during migration	Validate counts at each step
Performance issues	Large tables	Use partitioned migration
Dependency conflicts	Wrong migration order	Analyze dependencies first

Examples

Quick Validation

SELECT 'source' as system, COUNT(*) FROM hive_metastore.db.table
UNION ALL SELECT 'target' as system, COUNT(*) FROM migrated.db.table;

Resources

Completion

Provides coverage for Databricks platform migrations.

databricks-migration-deep-dive

databricks-migration-deep-dive

Databricks Migration Deep Dive

Contents

Overview

Prerequisites

Migration Patterns

Instructions

Step 1: Discovery and Assessment

Step 2: Schema Migration

Step 3: Data Migration

Step 4: ETL/Pipeline Migration

Step 5: Cutover Planning

Output

Error Handling

Examples

Quick Validation

Resources

Completion

Databricks Migration Deep Dive

Contents

Overview

Prerequisites

Migration Patterns

Instructions

Step 1: Discovery and Assessment

Step 2: Schema Migration

Step 3: Data Migration

Step 4: ETL/Pipeline Migration

Step 5: Cutover Planning

Output

Error Handling

Examples

Quick Validation

Resources

Completion