🤖 SUJBOT2

Interactive Documentation - SOTA RAG System 2025

📥
Indexing Pipeline
Kompletní proces od PDF dokumentu k prohledávatelnému vektorovému indexu (Phase 1-5).
  • IBM Docling - Hierarchical extraction
  • Generic summaries (150 chars, bottom-up)
  • Contextual Retrieval (-67% failures)
  • 3-layer FAISS indexing
  • Hybrid Search + Knowledge Graph + Reranking
💬
User Search Pipeline
Jak funguje user query v CLI - od vstupu k AI odpovědi (Phase 7 + 16 Tools).
  • Interactive CLI s commands (/model, /stats, /help)
  • Claude 4.5 Haiku/Sonnet + GPT-5 Mini/Nano
  • 17 specialized tools (6+7+3+1)
  • Query expansion (+10-25% recall)
  • Streaming + Prompt caching (90% savings)
🗓️
4-Week Roadmap
Plán vylepšení pipeline pro další 4 týdny - personalizované úkoly pro každého člena týmu.
  • Týdenní breakdown pro všechny úkoly
  • Research → Testing → Implementation → Review
  • Docling, Embeddings, Search, KG, Frontend
  • Kolaborativní poznámky a tips
  • Měřitelné milestones a deliverables
7
Pipeline fází
17
Agent tools
-67%
Retrieval failures
+23%
Hybrid precision
90%
Cache savings