Skill

vlm-segmentation-engineering

Provides expert engineering for VLM segmentation pipelines (SAM3, Grounding DINO, YOLO-World), diffusion models (UNet, DiT, Flux, LoRA), and GPU deployment (MIG, Triton, H100 optimization).

Python

Hugging Face

ai-ml

infrastructure

npx claudepluginhub anastasiyaw/claude-code-config

Tool Access

This skill uses the workspace's default tool permissions.

Preview

Скилл охватывает три тесно связанных домена. Выбери нужный раздел и загрузи соответствующий reference-файл.

Supporting Assets

references/diffusion-engineering.mdreferences/gpu-deployment.mdreferences/vlm-segmentation.md

SKILL.md

Similar Skills

diffusion-engineering

100

Guides diffusion model engineering: architectures (UNet/DiT/Flux), fine-tuning (LoRA/DreamBooth), schedulers/CFG, memory optimization (ZeRO/FSDP/quantization), evaluation (FID/CLIPScore). For Stable Diffusion, SDXL, ControlNet pipelines.

6 files

claude-code-config

computer-vision-expert

36.4k

Provides expert guidance on YOLO26 detection, SAM 3 segmentation, VLMs, depth estimation, and 3D reconstruction for real-time computer vision pipelines.

antigravity-awesome-skills

ml-cv-specialist

Guides ML/CV design: model selection (BERT, YOLOv8, Whisper), training/inference pipelines, API vs self-hosted tradeoffs, and cost analysis for production deployment.

1 file

cto-team

Stats

Stars100

Forks13

Last CommitMar 31, 2026

Actions

View Source View Plugin View on GitHub View README

Help us improve

Share bugs, ideas, or general feedback.

VLM + Segmentation + Diffusion Engineering

Скилл охватывает три тесно связанных домена. Выбери нужный раздел и загрузи соответствующий reference-файл.

Навигация по доменам

Задача	Reference файл
Выбор модели сегментации, pipeline "текст → маски", VLM-стек, part-labeling	`references/vlm-segmentation.md`
Диффузионные архитектуры, schedulers, обучение, LoRA, text encoder fusion	`references/diffusion-engineering.md`
Два инстанса SAM3 на H100, MIG/MPS, memory, профилирование	`references/gpu-deployment.md`

Правило выбора: если вопрос смешивает темы (например, "как деплоить диффузионную модель на H100") — прочитай оба релевантных файла.

Быстрые ответы без чтения reference-файлов

Два инстанса SAM3 на H100 (дефолт)

MIG (рекомендовано) → аппаратная изоляция, QoS гарантирована
sudo nvidia-smi mig -cgi 4g.40gb,3g.40gb -C
CUDA_VISIBLE_DEVICES=<MIG-UUID> python worker.py

MPS (fallback) → кооперативный шеринг, без строгой изоляции

Ключевые характеристики моделей (быстрая справка)

Модель	Параметры	Лицензия	Главная сильная сторона
SAM3	848M	SAM License (gated)	Open-vocab сегментация по тексту, все инстансы
SAM2.1-large	224M	Apache-2.0	Видео-трекинг, интерактивная сегментация, 39.5 FPS A100
SAM2.1-tiny	39M	Apache-2.0	Быстрый, 91.2 FPS A100
Florence-2-large	770M	MIT	Унифицированные задачи через task prompt
EdgeTAM	~SAM2-tiny	Apache-2.0	16 FPS на iPhone 15 Pro Max, CoreML
Grounding DINO	—	Apache-2.0	Text-conditioned detection, boxes
YOLO-World	—	GPL-3.0	Real-time open-vocab OD, 52 FPS V100

Критические предупреждения

SAM3: gated access на HF, кастомная SAM License — проверь перед продакшном
YOLO-World: GPL-3.0 в репо — для коммерции нужна отдельная лицензия
Замена text encoder: не plug-and-play, нужен projection + переобучение cross-attention
MIG vs MPS: только MIG даёт аппаратную изоляцию VRAM/SM; MPS — кооперативный шеринг
Русский язык в промптах: для Grounding DINO / OWLv2 / YOLO-World надёжнее EN + маппинг на RU

vlm-segmentation-engineering

Tool Access

Preview

Supporting Assets

SKILL.md

Similar Skills

Help us improve

Help us improve

vlm-segmentation-engineering

Tool Access

Preview

Supporting Assets

SKILL.md

VLM + Segmentation + Diffusion Engineering

Навигация по доменам

Быстрые ответы без чтения reference-файлов

Рекомендованный pipeline "фраза → маски" (дефолт)

Рекомендованный pipeline "диффузия" (дефолт)

Два инстанса SAM3 на H100 (дефолт)

Ключевые характеристики моделей (быстрая справка)

Критические предупреждения

Similar Skills

Help us improve

VLM + Segmentation + Diffusion Engineering

Навигация по доменам

Быстрые ответы без чтения reference-файлов

Рекомендованный pipeline "фраза → маски" (дефолт)

Рекомендованный pipeline "диффузия" (дефолт)

Два инстанса SAM3 на H100 (дефолт)

Ключевые характеристики моделей (быстрая справка)

Критические предупреждения