Skill

distributed-training-setup

From jeremylongshore-claude-code-plugins-plus-skills

Configures distributed training setups for ML models with PyTorch, TensorFlow, or scikit-learn. Generates code, configs, and best practices for multi-node training tasks.

Python

ai-ml

npx claudepluginhub jeremylongshore/claude-code-plugins-plus-skills --plugin framecraft

Tool Access

This skill is limited to using the following tools:

ReadWriteEditBash(python:*)Bash(pip:*)

Preview

This skill provides automated assistance for distributed training setup tasks within the ML Training domain.

SKILL.md

Similar Skills

Distributed Training

Guides distributed training across multiple GPUs/nodes for large models: DDP, FSDP, DeepSpeed ZeRO, model/data parallelism, gradient checkpointing. Grounds advice in patterns/sharp_edges/validations refs for creation/diagnosis/review.

3 files

omer-metin-skills-for-antigravity-2

tensorflow-model-trainer

2.0k

Builds TensorFlow model trainers with guidance on data preparation, training, hyperparameter tuning, and experiment tracking. Activates on TensorFlow trainer phrases.

5 tools

jeremylongshore-claude-code-plugins-plus-skills

ml-pipeline-workflow

682

Orchestrates end-to-end MLOps pipelines from data preparation, model training, validation, to deployment and monitoring. Use for ML workflow automation, DAG orchestration, and productionizing models.

rmyndharis-antigravity-skills

Stats

Stars2033

Forks274

Last CommitMar 22, 2026

Actions

View Source View Plugin View on GitHub View README

Help us improve

Share bugs, ideas, or general feedback.

Distributed Training Setup

Overview

This skill provides automated assistance for distributed training setup tasks within the ML Training domain.

When to Use

This skill activates automatically when you:

Mention "distributed training setup" in your request
Ask about distributed training setup patterns or best practices
Need help with machine learning training skills covering data preparation, model training, hyperparameter tuning, and experiment tracking.

Instructions

Provides step-by-step guidance for distributed training setup
Follows industry best practices and patterns
Generates production-ready code and configurations
Validates outputs against common standards

Examples

Example: Basic Usage Request: "Help me with distributed training setup" Result: Provides step-by-step guidance and generates appropriate configurations

Prerequisites

Relevant development environment configured
Access to necessary tools and services
Basic understanding of ml training concepts

Output

Generated configurations and code
Best practice recommendations
Validation results

Error Handling

Error	Cause	Solution
Configuration invalid	Missing required fields	Check documentation for required parameters
Tool not found	Dependency not installed	Install required tools per prerequisites
Permission denied	Insufficient access	Verify credentials and permissions

Resources

Official documentation for related tools
Best practices guides
Community examples and tutorials

Related Skills

Part of the ML Training skill category. Tags: ml, training, pytorch, tensorflow, sklearn