Case Studies
Case Studies
Właściciel szkoły językowej spędzał 5 godzin tygodniowo na tworzeniu contentu bez strategii i bez miary efektów. Brak pomysłów, brak kalendarza, brak systemu.
A language school owner spent 5 hours every week creating content with no strategy and no way to measure results. No ideas, no calendar, no system.
Kluczowy wniosek: Problemem nie był brak AI — był brak kontekstu. Model nie wiedział kim jest właściciel, do kogo mówi, jakimi słowami nigdy by nie mówił.
Key insight: The problem was not the lack of AI — it was the lack of context. The model had no information about who the owner is, who they speak to, or what words they would never use.
Punkt wyjścia z doświadczenia w QA: jakość fundamentu determinuje jakość wszystkiego, co na nim powstaje. Zaczęłam od kontekstu — warstwy, która daje modelowi pełną wiedzę o marce, zanim wygeneruje pierwsze słowo. System składa się z czterech wyspecjalizowanych modułów AI działających w sekwencji w Claude Code.
The starting point came from QA experience: the quality of the foundation determines the quality of everything built on top. I started with context — a layer that gives the model full knowledge of the brand before it generates a single word. The system consists of four specialized AI modules running in sequence inside Claude Code.
Trójpoziomowa hierarchia dokumentacji
Three-tier documentation hierarchy
Lekki plik root wskazuje gdzie szukać. Moduły ładują się lazy loading. Tokeny zużywane proporcjonalnie do złożoności zadania, nie objętości dokumentacji.
Lightweight root file points to where to look. Modules load via lazy loading. Tokens consumed proportionally to task complexity, not documentation volume.
Separacja warstw
Layer separation
Directive (co), Orchestration (jak), Execution (deterministyczne skrypty). Bez jawnej Dyrektywy agent pomija instrukcje biznesowe. Separacja obniża koszty i minimalizuje halucynacje.
Directive (what), Orchestration (how), Execution (deterministic scripts). Without an explicit Directive, agent skips business instructions. Separation lowers costs and minimizes hallucinations.
Mechanizm samonaprawy
Self-annealing
Agent diagnozuje błąd, aktualizuje instrukcję, loguje. Retry budget: max 3 próby — po przekroczeniu eskalacja do operatora zamiast pętli naprawczej.
Agent diagnoses error, updates instruction, logs fix. Retry budget: max 3 attempts — exceeded means escalation to operator instead of a repair loop.
Zarządzanie kosztami kontekstu
Context cost management
Każde wywołanie API etykietowane [agent:task]. Streaming wyłączony dla zadań w tle. Kontekst utrzymywany poniżej 50%. Jeśli wiadomość po polsku — angielskie wytyczne nie są wczytywane.
Every API call labeled [agent:task]. Streaming disabled for background tasks. Context kept below 50%. If the message is in Polish — English guidelines are never loaded.
Kontekst Foundera
Founder Context
Zanim AI napisze cokolwiek, musi wiedzieć kim jest właściciel
Before AI writes anything, it needs to know who the owner is
Research Agent
Research Agent
4 poziomy źródeł, filtr świeżości 7 dni, ocena trafności
4 source tiers, 7-day freshness filter, relevance scoring
Ideacja contentu
Content Ideation
Research zamieniony w briefy posortowane według priorytetu
Filtered research turned into briefs sorted by priority
Tygodniowy kreator
Weekly Content Creator
Gotowe posty na 5 dni z finalną kontrolą jakości
Ready-to-publish posts for 5 days with final quality checks
Efektywność kosztowa
Cost efficiency
Research Agent uruchamia dokładnie 4 zapytania z hardcoded limitem. Context-as-cache: wytyczne marki ładują się raz i są reużywane w całym systemie.
Research Agent runs exactly 4 queries with a hardcoded limit. Context-as-cache: brand guidelines load once and are reused across the entire system.
Odporność na błędy
Fault tolerance
Jeśli jedno z czterech zapytań nie zwróci wyników — pozostałe trzy pracują dalej. Brakujący plik kontekstu? Moduł zatrzymuje się z logowanym błędem.
If one of four queries returns no results — the remaining three continue. Missing context file? The module halts with a logged error.
Definition of Done
Definition of Done
Każdy moduł ma kontrakt wyjściowy. Jeśli output nie spełnia kontraktu — proces się zatrzymuje zamiast zwracać domyślne wartości.
Each module has an output contract. If output doesn't meet the contract — the process stops instead of returning defaults.
| MetrykaMetric | PrzedBefore | PoAfter | WpływImpact |
|---|---|---|---|
| Czas na contentContent creation time | 3–5 godz./tydz.3–5 hrs/week | ~30 min~30 min | ~85% redukcji~85% reduction |
| Budowa systemuSystem build | — | 1–2 dni1–2 days | JednorazowoOne-time |
| Posty / tydzieńPosts / week | 0–1 ad hoc0–1 ad hoc | 5 wg strategii5 per strategy | Spójny planConsistent plan |
| Głos contentuContent voice | GenerycznyGeneric | Własny tonOwner's tone | Spójny brandConsistent brand |
Właściciel małego biznesu analizuje decyzje strategiczne przez jedną soczewkę: własną. Finansową, marketingową, operacyjną perspektywę na to samo pytanie musiałby uzyskać od kilku różnych osób. Stratedzy dokumentują swoje frameworki publicznie — ta wiedza istnieje, ale nie aktywuje się sama.
A small business owner analyzes strategic decisions through one lens: their own. Getting a financial, marketing, and operational perspective on the same question would require several different people. Strategists document their frameworks publicly — that knowledge exists, but doesn't activate on its own.
AI Board of Advisors nakłada publicznie udokumentowane frameworki na kontekst konkretnego biznesu — kilka perspektyw równocześnie z projekcjami i głosowaniem: TAK / NIE / WARUNKOWO
AI Board of Advisors applies publicly documented frameworks to a specific business context — multiple perspectives simultaneously with projections and a vote: YES / NO / CONDITIONAL
Zanim system cokolwiek wyprodukuje, wczytuje plik kontekstu biznesowego foundera: model biznesowy, aktualne liczby, zespół, cele, ograniczenia. Architektura deliberacji: jeden agent koordynujący uruchamia równolegle subagenty przez Task tool — każdy doradca w izolowanym oknie kontekstu.
Before the system produces anything, it loads the founder's business context: business model, current numbers, team, goals, constraints. Deliberation architecture: one coordinating agent spawns subagents in parallel via Task tool — each advisor in an isolated context window.
Izolacja kontekstu na poziomie subagenta
Context isolation at subagent level
Współdzielony kontekst prowadzi do zapadnięcia podobieństwa semantycznego. Każdy subagent dostaje własny Task tool. Wymiana perspektyw dopiero po utrwaleniu stanowisk.
Shared context leads to semantic similarity collapse. Each subagent gets its own Task tool. Exchange of perspectives only after positions are committed to writing.
Definition of Done jako kontrakt outputu
Definition of Done as output contract
Każdy doradca musi dostarczyć: analizę przez framework, konkretne liczby, głos TAK/NIE/WARUNKOWO, ostrzeżenie o ryzyku. Brak elementu = output nie przechodzi.
Each advisor must deliver: framework analysis, specific numbers, YES/NO/CONDITIONAL vote, primary risk warning. Missing element = output fails the contract.
Deliberacja jako mechanizm podnoszenia jakości
Deliberation as output quality mechanism
Bez konfrontacji z inną perspektywą agent produkuje analizę spójną z persona promptem, ale nie testuje własnych założeń. Wymuszone odniesienie do stanowisk pozostałych zmusza model do obrony pozycji wobec konkretnych kontrargumentów.
Without confrontation with a different perspective, each agent produces analysis consistent with its persona but doesn't test its own assumptions. Forced reference to others' positions makes the model defend its stance against specific counterarguments.
Inicjalizacja
Initialization
Wczytanie kontekstu biznesowego foundera
Loading founder's business context
Faza 1: niezależne stanowiska
Phase 1: independent positions
5 doradców równolegle, bez wzajemnego dostępu
5 advisors in parallel, no access to each other
Faza 2: deliberacja
Phase 2: deliberation
Każdy doradca odpowiada na stanowiska pozostałych
Each advisor responds to others' positions
Generowanie outputów
Output generation
Rekomendacje z projekcjami finansowymi i głosowaniem
Recommendations with financial projections and votes
Co nie zadziałało
What didn't work
Pierwsza wersja kończyła sesję po jednej fazie. Stanowiska były poprawne, ale nie były wynikiem konfrontacji. Dodanie drugiej fazy zmieniło charakter outputu. Jedna zmiana w architekturze.
The first version ended after one phase. Positions were correct but weren't the result of confrontation. Adding a second phase changed the output character. One architectural change.
Obsługa błędów
Error handling
5 subagentów równolegle to 5 punktów awarii. Każdy scenariusz ma zdefiniowaną odpowiedź. Brak kontekstu nie zatrzymuje sesji — system kontynuuje z ostrzeżeniem.
5 parallel subagents means 5 failure points. Each scenario has a defined response. Missing context doesn't stop the session — system continues with a warning.
Koszt i świadome użycie
Cost and deliberate use
10 wywołań modelu na sesję. Adekwatne przy decyzjach strategicznych, nieadekwatne przy codziennych. Narzędzie uruchamiane świadomie komendą slash, nie automatycznym triggerem.
10 model invocations per session. Proportionate for strategic decisions, disproportionate for everyday ones. Invoked deliberately via slash command, not automatic trigger.