Služby

Co děláme — podrobně

Dva směry: AI integrace a inženýrství highload systémů. Na většině projektů jdou spolu — protože AI funkci stejně musíte provozovat v produkci pod zátěží, a highload systém dnes často potřebuje chytrého asistenta nebo vyhledávání.

Směr 1

AI integrace a LLM systémy

Pomáháme vložit LLM do produktu tak, aby to fungovalo v produkci, nelhalo a nežralo rozpočet na tokenech.

/01

AI integrace do produktu

Vkládáme LLM funkce tam, kde dávají opravdový business outcome. Začínáme s nejlevnějším řešením: prompt + základní model. Komplikujeme jen když eval ukáže, že bez RAG / agentů / fine-tuningu se neobejdeme.

✓
Chat asistenti a kopilotiV produktu, v adminké, v IDE rozšíření. S kontextem z vaší systému a tool-use.
✓
Generování a summarizacePopisy produktů, zprávy, body z hovorů, šablony emailů — s kontrolou kvality a brand tónu.
✓
Chytré vyhledávání a automatické doplňováníSémantické hledání, přeformulování dotazů, intent klasifikace.
✓
Klasifikace a extrakceTéma ticketu, extrakce entit, parsování emailů a faktur.

/02

RAG a podnikové vyhledávání

Přeměňujeme vaše dokumenty, tickety a knowledge base na systém „otázka-odpověď" s citacemi a kontrolou halucinací. Chunking, hybrid search, re-ranking, fact-checking, eval — každou etapu měříme.

✓
Vector infrastrukturapgvector, Qdrant, Weaviate, Pinecone — vybíráme podle zátěže a operačních omezení.
✓
Hybrid searchKombinace BM25 a embeddings s fusion-strategií na váš doménu.
✓
Re-ranking a přeformulování dotazůCross-encoder re-ranking, HyDE, multi-query — to, co opravdu zvyšuje recall.
✓
Eval a kontrola kvalityRagas, golden datasets, faithfulness a context precision jako KPI releaseů.

/03

AI agenti a automatizace procesů

Vícekrokové AI agenti, které opravdu provádějí akce ve vašem systému přes tool-use a MCP. Hlavní pravidlo — human-in-the-loop kde je cena chyby velká.

✓
Orchestrace a graph agentiLangGraph, custom orchestration, stavové automaty — řídíme složitost bez "magie".
✓
Tool-use a MCPFunction calling, Model Context Protocol, bezpečné integraci s vaším API.
✓
Sagy a kompenzaceKdyž krok agenta selže — máte rollback, retry a jasný audit-trail.
✓
Human-in-the-loopApproval etapy, eskalace na support, průhledné UI pro operátora.

/04

LLMOps a AI infrastruktura

Production infrastruktura kolem modelů: gateway, cache, observability, ratelimit, eval, A/B testy, fine-tuning. Vrstva, kterou obvykle "zapomenou" dokud nepříjde první účet od providera.

✓
Model gatewaySměrování Claude / GPT / open-source, fallback, A/B testy, jednotné API.
✓
Cachování a batchingSémantický cache, prompt cache, request batching — typický úspora 40–70%.
✓
Observability a evalLangfuse, OpenTelemetry, traces, golden datasets, regresní testy.
✓
Fine-tuning a self-hostedLoRA, SFT, DPO. vLLM / TGI / Ollama on-prem kde data nelze posílat ven.

/05

Low-code automatizace a integrace

Když potřebujete rychle propojit několik systémů — CRM, messengery, dokumentové základny, formuláře — a pustit přes ně AI logiku, low-code platformy zvládnou za dny to, co by v kódu trvalo týdny.

Netvrdíme, že low-code nahrazuje inženýrství. Ale na správném místě je to nejrychlejší cesta od nápadu k funkčnímu procesu — a často první iterace, než se přepíše do kódu.

✓
Výběr platformyZapier, Make, n8n. Vybíráme podle compliance, on-prem požadavků, objemu operací a rozpočtu.
✓
AI flowLLM uzly, RAG volání, klasifikace a sumarizace přímo v toku Zapier / Make / n8n.
✓
Self-hosted n8nKdyž data nesmí ven: nasadíme n8n on-prem s auth, auditem a zálohováním.
✓
Migrace low-code → kódKdyž flow přeroste platformu, přesuneme jej do běžné služby bez ztráty historie a logiky.

Směr 2

Architektura a highload inženýrství

Paralelně děláme to, čím se tým zabývá od roku 2013: architektura, performance, migrace, infrastruktura a SRE. A pro AI služby, i pro klasické produkty.

/06

Highload architektura

Navrhujeme systémy, které zvládnou špičky a předvídatelně rostou pod zátěží. Od nuly nebo na existující kód — bez "přepsat všechno". Neidealizujeme mikroservisy ani se nemodlíme monolitu — řešení závisí na týmu a doméně.

✓
Navrhování od nulySystem design, výběr stacku, roadmapa od MVP k production-ready.
✓
Event-driven a CQRSOutbox pattern, saga orchestration, exactly-once semantika na Kafka / NATS.
✓
Multi-region a failoverActive-active a active-passive schéma, zkoušení disaster recovery v produkci.
✓
API designKontrakty gRPC / REST, verzování, BFF vrstvy, public API pro publikování.

/07

Performance audit a zátěžové testování

Vezmeme váš servis, metriky a traces — a za 2–4 týdny přineseme zprávu, kde vidíte: kde, na jakém RPS a proč "všechno padne". Počítáme specifická úzká místa, ne "obecně je to pomalé".

✓
Profilování služebpprof, async-profiler, eBPF nástroje, flame graphy horkých cest.
✓
Analýza DBEXPLAIN ANALYZE, pg_stat_statements, strategie indexů, lock contention.
✓
Zátěžové scénářek6, Gatling, JMeter — realistické profily, ne "zatížíme všechno najednou".
✓
Capacity planningCo dostanete za své $X v cloudu, a kde peníze zmizí bez užitku.

/08

Migrace a refaktoring

Víme, jak bezpečně rozřezat monolitý, vyndat služby a měnit sklady bez downtimu a bez "přepsat všechno od nuly". Přístup — strangler-fig: každý krok je měřitelný a rollbackovatelný.

✓
Dekompozice monolituRozdělení po doménách, vynětí bounded contexts, plynulé vyčlenění služeb.
✓
Online migrace DBVýměna enginu, sharding, změny schématu pod zátěží a bez downtimu.
✓
On-prem ↔ cloudPřesun do AWS/GCP, lift-and-shift s následnou optimalizací pro cloud.
✓
Snížení cloud-costRight-sizing, Spot/preemptible, FinOps přístup — obvykle −30…−50%.

/09

Infrastruktura, platforma a SRE

Stavíme Kubernetes platformy, nastavujeme GitOps, observability a on-call procesy. Tak aby to fungovalo ne na papíře, ale v 3 ráno. Dobrá platforma — je ta, kam se nový tým nasadí za den.

✓
Kubernetes platformaMulti-tenant clustery, namespace-as-a-product, rozumné výchozí nastavení pro týmy.
✓
GitOps a IaCTerraform, Argo CD, Flux. Infrastruktura — to kód, který se code-review.
✓
ObservabilityPrometheus, Grafana, OpenTelemetry, Loki/Tempo. Metriky, logy a traces.
✓
On-call a postmortemySLO, error budget, rotace, blameless postmortemy, kultura spolehlivosti.