RAG-копилот для compliance-аналитиков
Задача. Аналитики тратили 30–60 минут на разбор каждого кейса. Open-source поиск выдавал нерелевантное, наивный RAG галлюцинировал.
Что сделали. Hybrid search (BM25 + embeddings) с cross-encoder ре-ранкером, чанкование с учётом структуры документов, отдельный fact-checker-pass на Claude, citation-aware UI. Eval на golden set из 1200 пар.
Результат. Faithfulness 0.94 (vs 0.71 у baseline), время разбора кейса упало с 40 до 6 минут, токен-cost ниже на 72 %.