Agentic AI Atlas

II.

Workflow overview

workflow:rag-pipeline-evaluation

Reference · live

RAG Pipeline Evaluation overview

Evaluates retrieval-augmented generation pipeline quality end-to-end — measuring retrieval precision@k and recall@k against ground-truth relevance judgments, scoring generation faithfulness and hallucination rates via LLM judges, benchmarking chunking and embedding strategies, profiling latency across retrieval and generation stages, and running regression suites before promoting pipeline changes. Excludes RAG architecture design and embedding model training.

WorkflowOutgoing · 13Incoming · 1

Attributes

displayName

RAG Pipeline Evaluation

workflowKind

data

triggerType

event-driven

typicalCadence

per-release

complexity

cross-team

description

Outgoing edges

applies_to_domain2

domain:ml-ops·DomainMLOps
domain:data-science·DomainData Science

involves_role3

role:ml-engineer·RoleMachine Learning Engineer
role:ai-champion·RoleAI Champion
role:data-scientist·RoleData Scientist

performed_by_org_unit3

org-unit:ai-enablement·OrgUnitAI Enablement
org-unit:ml-team·OrgUnitML Team
org-unit:research-engineering·OrgUnitResearch Engineering

requires_skill_area3

skill-area:retrieval-augmented-generation·SkillAreaRetrieval-Augmented Generation
skill-area:eval-driven-development·SkillAreaEval-Driven LLM Development
skill-area:prompt-engineering·SkillAreaPrompt Engineering

triggers_responsibility2

responsibility:ai-tooling-evaluation·ResponsibilityAI Tooling Evaluation
responsibility:data-quality-monitoring·ResponsibilityData quality monitoring

Incoming edges

follows_workflow1

stack-profile:agentic-rag·StackProfileAgentic RAG Stack (LlamaIndex, ChromaDB, LangChain, FastAPI, React)

RAG Pipeline Evaluation overview

WorkflowOutgoing · 13Incoming · 1

Attributes

displayName

RAG Pipeline Evaluation

workflowKind

data

triggerType

event-driven

typicalCadence

per-release

complexity

cross-team

description

Outgoing edges

applies_to_domain2

domain:ml-ops·DomainMLOps
domain:data-science·DomainData Science

involves_role3

role:ml-engineer·RoleMachine Learning Engineer
role:ai-champion·RoleAI Champion
role:data-scientist·RoleData Scientist

performed_by_org_unit3

org-unit:ai-enablement·OrgUnitAI Enablement
org-unit:ml-team·OrgUnitML Team
org-unit:research-engineering·OrgUnitResearch Engineering

requires_skill_area3

skill-area:retrieval-augmented-generation·SkillAreaRetrieval-Augmented Generation
skill-area:eval-driven-development·SkillAreaEval-Driven LLM Development
skill-area:prompt-engineering·SkillAreaPrompt Engineering

triggers_responsibility2

responsibility:ai-tooling-evaluation·ResponsibilityAI Tooling Evaluation
responsibility:data-quality-monitoring·ResponsibilityData quality monitoring

Incoming edges

follows_workflow1

stack-profile:agentic-rag·StackProfileAgentic RAG Stack (LlamaIndex, ChromaDB, LangChain, FastAPI, React)