← WSZYSTKIE NOTATKI← ALL NOTES

NOTATKANOTE · 28.05.2026

Kiedy open source zamiast API — rachunek, który warto policzyćWhen open source beats an API — the math worth doing

Model zamknięty przez API kusi prostotą: klucz API, pierwsze zapytanie w dziesięć minut, zero infrastruktury. Ale przy odpowiedniej skali i wrażliwości danych ten rachunek się odwraca. Oto jak policzyć, kiedy się odwraca u Ciebie.A closed model behind an API is tempting for its simplicity: an API key, your first request in ten minutes, zero infrastructure. But at the right volume and data sensitivity, that math flips. Here's how to calculate when it flips for you.

Uczciwie o tym, co kusi w APIBeing honest about what's appealing about an API

Model zamknięty przez API działa od zaraz. Nie utrzymujesz serwerów, nie aktualizujesz wag, nie martwisz się o GPU. Płacisz za token i masz dostęp do rozumowania na poziomie, którego żaden model otwarty jeszcze nie replikuje.A closed model behind an API works immediately. No servers to maintain, no weights to update, no GPUs to worry about. You pay per token and get reasoning quality no open model quite replicates yet.

Dla pilota, prototypu albo zadania o niskiej, nieregularnej częstotliwości to często najlepsza — i najtańsza — decyzja. Problem zaczyna się, gdy ten sam model, w tej samej architekturze, zostaje na stałe niezależnie od skali.For a pilot, a prototype, or a low, irregular-volume task, that's often the best — and cheapest — decision. The problem starts when the same model, in the same architecture, stays in place regardless of scale.

Gdzie rachunek się odwracaWhere the math flips

Przy dużym, przewidywalnym wolumenie — tysiące dokumentów dziennie, stały strumień zapytań o podobnym charakterze — model otwarty (Bielik do zadań po polsku, Qwen do ogólnego rozumowania) uruchomiony na własnej infrastrukturze potrafi kosztować ułamek ceny za token, bo płacisz za moc obliczeniową, nie za marżę od zapytania.At high, predictable volume — thousands of documents a day, a steady stream of similarly-shaped requests — an open model (Bielik for Polish-language tasks, Qwen for general reasoning) running on your own infrastructure can cost a fraction per token, because you're paying for compute capacity, not a per-call margin.

To nie jest reguła uniwersalna — to jest próg. Poniżej pewnego wolumenu inżynieria własnej infrastruktury kosztuje więcej niż zaoszczędzone tokeny. Powyżej — odwrotnie, i to szybciej, niż większość zespołów zakłada.This isn't a universal rule — it's a threshold. Below a certain volume, engineering your own infrastructure costs more than the tokens you'd save. Above it — the opposite, and sooner than most teams assume.

W SKRÓCIETHE SHORT VERSION

Pytanie nie brzmi „open source czy API” — brzmi „przy jakim wolumenie i jakiej wrażliwości danych ten wybór się zmienia”. Tę liczbę policzymy dla Ciebie na audycie.The question isn't "open source or API" — it's "at what volume and data sensitivity does that choice change". We calculate that number during the audit.

Druga oś: nie tylko kosztThe second axis: not just cost

Dla kancelarii, szpitala czy instytucji finansowej dane, które zostają w Twojej infrastrukturze, to nie tylko kwestia oszczędności — czasem to wymóg zgodności. RODO i regulacje sektorowe bywają argumentem silniejszym niż cena za token.For a law firm, a hospital, or a financial institution, data staying inside your own infrastructure isn't just about savings — sometimes it's a compliance requirement. GDPR and sector-specific regulations can be a stronger argument than the price per token.

Praktyczna zasada kciukaA practical rule of thumb

Jeśli wolumen jest niski albo nieregularny, albo zadanie wymaga rozumowania na granicy możliwości modeli — model zamknięty wygrywa całkowitym kosztem posiadania, licząc czas inżynierii. Jeśli wolumen jest wysoki i stabilny, a zadanie da się dobrze zdefiniować — dostrojony model otwarty zwykle wygrywa, i to wyraźnie.If volume is low or irregular, or the task pushes the edge of model reasoning — the closed model wins on total cost of ownership, engineering time included. If volume is high and stable, and the task is well-defined — a fine-tuned open model usually wins, and by a clear margin.

OPEN SOURCEKOSZTYBIELIKQWEN

Chcesz to samo u siebie? Pierwsza rozmowa nic nie kosztuje. Want the same for your organization? The first call costs nothing.

Umów konsultacjęBook a consult
← POPRZEDNIA← PREVIOUSMCP w praktyce: jeden protokół zamiast dziesięciu integracjiMCP in practice: one protocol instead of ten integrationsNASTĘPNA →NEXT →Agent w firmie: jak nie zbudować bardzo drogiej zabawkiAn agent at work: how not to build a very expensive toy