Co děláme — podrobně
Dva směry: AI integrace a inženýrství highload systémů. Na většině projektů jdou spolu — protože AI funkci stejně musíte provozovat v produkci pod zátěží, a highload systém dnes často potřebuje chytrého asistenta nebo vyhledávání.
AI integrace a LLM systémy
Pomáháme vložit LLM do produktu tak, aby to fungovalo v produkci, nelhalo a nežralo rozpočet na tokenech.
AI integrace do produktu
Vkládáme LLM funkce tam, kde dávají opravdový business outcome. Začínáme s nejlevnějším řešením: prompt + základní model. Komplikujeme jen když eval ukáže, že bez RAG / agentů / fine-tuningu se neobejdeme.
- ✓Chat asistenti a kopilotiV produktu, v adminké, v IDE rozšíření. S kontextem z vaší systému a tool-use.
- ✓Generování a summarizacePopisy produktů, zprávy, body z hovorů, šablony emailů — s kontrolou kvality a brand tónu.
- ✓Chytré vyhledávání a automatické doplňováníSémantické hledání, přeformulování dotazů, intent klasifikace.
- ✓Klasifikace a extrakceTéma ticketu, extrakce entit, parsování emailů a faktur.
RAG a podnikové vyhledávání
Přeměňujeme vaše dokumenty, tickety a knowledge base na systém „otázka-odpověď" s citacemi a kontrolou halucinací. Chunking, hybrid search, re-ranking, fact-checking, eval — každou etapu měříme.
- ✓Vector infrastrukturapgvector, Qdrant, Weaviate, Pinecone — vybíráme podle zátěže a operačních omezení.
- ✓Hybrid searchKombinace BM25 a embeddings s fusion-strategií na váš doménu.
- ✓Re-ranking a přeformulování dotazůCross-encoder re-ranking, HyDE, multi-query — to, co opravdu zvyšuje recall.
- ✓Eval a kontrola kvalityRagas, golden datasets, faithfulness a context precision jako KPI releaseů.
AI agenti a automatizace procesů
Vícekrokové AI agenti, které opravdu provádějí akce ve vašem systému přes tool-use a MCP. Hlavní pravidlo — human-in-the-loop kde je cena chyby velká.
- ✓Orchestrace a graph agentiLangGraph, custom orchestration, stavové automaty — řídíme složitost bez "magie".
- ✓Tool-use a MCPFunction calling, Model Context Protocol, bezpečné integraci s vaším API.
- ✓Sagy a kompenzaceKdyž krok agenta selže — máte rollback, retry a jasný audit-trail.
- ✓Human-in-the-loopApproval etapy, eskalace na support, průhledné UI pro operátora.
LLMOps a AI infrastruktura
Production infrastruktura kolem modelů: gateway, cache, observability, ratelimit, eval, A/B testy, fine-tuning. Vrstva, kterou obvykle "zapomenou" dokud nepříjde první účet od providera.
- ✓Model gatewaySměrování Claude / GPT / open-source, fallback, A/B testy, jednotné API.
- ✓Cachování a batchingSémantický cache, prompt cache, request batching — typický úspora 40–70%.
- ✓Observability a evalLangfuse, OpenTelemetry, traces, golden datasets, regresní testy.
- ✓Fine-tuning a self-hostedLoRA, SFT, DPO. vLLM / TGI / Ollama on-prem kde data nelze posílat ven.
Low-code automatizace a integrace
Když potřebujete rychle propojit několik systémů — CRM, messengery, dokumentové základny, formuláře — a pustit přes ně AI logiku, low-code platformy zvládnou za dny to, co by v kódu trvalo týdny.
Netvrdíme, že low-code nahrazuje inženýrství. Ale na správném místě je to nejrychlejší cesta od nápadu k funkčnímu procesu — a často první iterace, než se přepíše do kódu.
- ✓Výběr platformyZapier, Make, n8n. Vybíráme podle compliance, on-prem požadavků, objemu operací a rozpočtu.
- ✓AI flowLLM uzly, RAG volání, klasifikace a sumarizace přímo v toku Zapier / Make / n8n.
- ✓Self-hosted n8nKdyž data nesmí ven: nasadíme n8n on-prem s auth, auditem a zálohováním.
- ✓Migrace low-code → kódKdyž flow přeroste platformu, přesuneme jej do běžné služby bez ztráty historie a logiky.
Architektura a highload inženýrství
Paralelně děláme to, čím se tým zabývá od roku 2013: architektura, performance, migrace, infrastruktura a SRE. A pro AI služby, i pro klasické produkty.
Highload architektura
Navrhujeme systémy, které zvládnou špičky a předvídatelně rostou pod zátěží. Od nuly nebo na existující kód — bez "přepsat všechno". Neidealizujeme mikroservisy ani se nemodlíme monolitu — řešení závisí na týmu a doméně.
- ✓Navrhování od nulySystem design, výběr stacku, roadmapa od MVP k production-ready.
- ✓Event-driven a CQRSOutbox pattern, saga orchestration, exactly-once semantika na Kafka / NATS.
- ✓Multi-region a failoverActive-active a active-passive schéma, zkoušení disaster recovery v produkci.
- ✓API designKontrakty gRPC / REST, verzování, BFF vrstvy, public API pro publikování.
Performance audit a zátěžové testování
Vezmeme váš servis, metriky a traces — a za 2–4 týdny přineseme zprávu, kde vidíte: kde, na jakém RPS a proč "všechno padne". Počítáme specifická úzká místa, ne "obecně je to pomalé".
- ✓Profilování služebpprof, async-profiler, eBPF nástroje, flame graphy horkých cest.
- ✓Analýza DBEXPLAIN ANALYZE, pg_stat_statements, strategie indexů, lock contention.
- ✓Zátěžové scénářek6, Gatling, JMeter — realistické profily, ne "zatížíme všechno najednou".
- ✓Capacity planningCo dostanete za své $X v cloudu, a kde peníze zmizí bez užitku.
Migrace a refaktoring
Víme, jak bezpečně rozřezat monolitý, vyndat služby a měnit sklady bez downtimu a bez "přepsat všechno od nuly". Přístup — strangler-fig: každý krok je měřitelný a rollbackovatelný.
- ✓Dekompozice monolituRozdělení po doménách, vynětí bounded contexts, plynulé vyčlenění služeb.
- ✓Online migrace DBVýměna enginu, sharding, změny schématu pod zátěží a bez downtimu.
- ✓On-prem ↔ cloudPřesun do AWS/GCP, lift-and-shift s následnou optimalizací pro cloud.
- ✓Snížení cloud-costRight-sizing, Spot/preemptible, FinOps přístup — obvykle −30…−50%.
Infrastruktura, platforma a SRE
Stavíme Kubernetes platformy, nastavujeme GitOps, observability a on-call procesy. Tak aby to fungovalo ne na papíře, ale v 3 ráno. Dobrá platforma — je ta, kam se nový tým nasadí za den.
- ✓Kubernetes platformaMulti-tenant clustery, namespace-as-a-product, rozumné výchozí nastavení pro týmy.
- ✓GitOps a IaCTerraform, Argo CD, Flux. Infrastruktura — to kód, který se code-review.
- ✓ObservabilityPrometheus, Grafana, OpenTelemetry, Loki/Tempo. Metriky, logy a traces.
- ✓On-call a postmortemySLO, error budget, rotace, blameless postmortemy, kultura spolehlivosti.