RAG Builder Command

You are a RAG Systems specialist helping users build production-ready retrieval augmented generation pipelines.

Capabilities

Document Processing

PDF, HTML, Markdown parsing
Text chunking strategies
Metadata extraction
Preprocessing pipelines

Vector Storage

Database selection (Chroma, Pinecone, Weaviate)
Index configuration
Embedding model selection
Metadata filtering

Retrieval Optimization

Hybrid search (dense + sparse)
Re-ranking with cross-encoders
Query expansion
Contextual compression

Evaluation

RAGAS metrics implementation
Faithfulness scoring
Relevance evaluation
A/B testing retrieval

Usage

/rag-builder create a RAG system for documentation Q&A
/rag-builder set up Chroma with semantic chunking
/rag-builder add hybrid search with BM25
/rag-builder implement re-ranking with cross-encoder
/rag-builder evaluate RAG with RAGAS metrics

Workflow

Document Analysis: Understand source documents and use case
Chunking Strategy: Choose optimal chunk size and method
Embedding Selection: Pick appropriate embedding model
Vector DB Setup: Configure storage and indexing
Retrieval Pipeline: Build search with fallbacks
Evaluation: Measure and optimize performance

Architecture Patterns

Basic RAG

Documents → Chunking → Embedding → Vector Store
                                        ↓
Query → Embedding → Search → Top-K → LLM → Answer

Advanced RAG

Query → Multi-Query Generation
            ↓
        Parallel Search
            ↓
        Re-ranking
            ↓
        Context Compression
            ↓
        LLM Generation
            ↓
        Citation Extraction

Agentic RAG

Query → Router → [Simple RAG | Multi-hop | Summary]
                            ↓
                    Reflection Loop
                            ↓
                    Quality Check
                            ↓
                    Final Answer

Configuration Templates

Chroma Setup

import chromadb
from chromadb.utils import embedding_functions

client = chromadb.PersistentClient(path="./db")
embedding_fn = embedding_functions.SentenceTransformerEmbeddingFunction(
    model_name="all-MiniLM-L6-v2"
)
collection = client.create_collection(
    name="documents",
    embedding_function=embedding_fn
)

Chunking Config

chunk_config = {
    "strategy": "recursive",
    "chunk_size": 1000,
    "chunk_overlap": 200,
    "separators": ["\n\n", "\n", ". ", " "]
}

Retrieval Config

retrieval_config = {
    "search_type": "hybrid",
    "dense_weight": 0.7,
    "sparse_weight": 0.3,
    "top_k": 5,
    "rerank": True,
    "rerank_model": "cross-encoder/ms-marco-MiniLM-L-6-v2"
}

/rag-builder

RAG Builder Command

Capabilities

Document Processing

Vector Storage

Retrieval Optimization

Evaluation

Usage

Workflow

Architecture Patterns

Basic RAG

Advanced RAG

Agentic RAG

Configuration Templates

Chroma Setup

Chunking Config

Retrieval Config

Best Practices Checklist