Cortex: vijeće AI modela koje raspravlja umjesto vas — i sada je open source

Što ako za tešku odluku ne pitate jedan AI, nego pet — i to pet različitih AI-jeva, koji se međusobno ne slažu, prepiru se kroz nekoliko krugova, a na kraju netko mora presjeći i donijeti jednu odluku?

Točno to radi Cortex, alat koji smo gradili za vlastite potrebe — i koji smo upravo otvorili kao open source pod MIT licencom: github.com/invictumhr/cortex.

Problem: jedan model je samouvjereni generalist

Svaki tko ozbiljnije koristi LLM-ove zna taj osjećaj: postavite teško, otvoreno pitanje — “trebamo li migrirati monolit na mikroservise?”, “build ili buy za interni tooling?” — i dobijete uglađen, samouvjeren odgovor koji zvuči pametno, ali nigdje se ne vidi napetost. Model se ne svađa sam sa sobom. Trade-offovi se izglade, rizici se spomenu usput, a vi i dalje ne znate gdje je stvarna kvaka.

Većina “multi-agent” frameworka to rješava tako da isti model razgovara sam sa sobom u pet kostima. Cortex ide korak dalje: svaka persona vrti se na drugom modelu — Anthropic Claude, OpenAI o-serija, xAI Grok, Google Gemini, Mistral, DeepSeek. Različite arhitekture, različiti podaci za treniranje, različiti načini na koje griješe. Prava kognitivna raznolikost, ne kazalište jednog glumca.

Kako izgleda rasprava

Zadate temu, a Cortex sastavi panel od pet persona iz rostera od trideset stručnjaka — od Ane (software architect) i Zare (security analyst) do Marca (strateški savjetnik) i Dragana, persone s titulom “Klijent Pizajzl”, koja postavlja neugodna klijentska pitanja koja inženjeri najradije preskoče.

Panel može izabrati jeftini router-model po domeni pitanja, možete ga složiti ručno, ili pustiti Panel Architecta da za vaše konkretno pitanje generira pet skrojenih uloga koje ne postoje u rosteru.

Rasprava teče kroz krugove, i tu je nekoliko detalja do kojih nam je bilo stalo:

Prvi krug je nezavisan — persone ne vide tuđe odgovore
Od drugog kruga forsiramo neslaganje — svaka persona mora argumentirano odbaciti ili donijeti novi kut
Zadnji krug forsira konvergenciju — rasprava se mora zatvoriti

Uz debatere rade još dvije posebne uloge: Scribe i Chair.

Najvažniji dio: iskreni benchmark

Pitali smo se: pobjeđuje li ovaj boardroom uopće jedan jak model? Pa smo testirali — 30 otvorenih, teških pitanja, boardroom protiv samog Claude Opusa, odgovori slijepo A/B-randomizirani i ocijenjeni od dva neovisna suca iz različitih provider obitelji (claude-sonnet i gpt-4o).

Rezultat: boardroom pobjeđuje u prosjeku 31,7 % slučajeva, uz 2,8× veći trošak.

Multi-model rasprava ne pobjeđuje dobar single model sustavno — i to je važno naglasiti.

Boardroom je bolji na specifičnoj klasi problema: višedimenzionalni dizajn i dijagnostika — arhitektura sustava za milijune korisnika, build-vs-buy analize, dijagnoza zašto metrika raste a prihod ne, dizajn procesa u timu.

Gubi na jasnim strateškim odlukama i sinteznim esejima, gdje jedan oštar glas piše bolje od pet glasova u sobi.

Claude sudac je u 9 od 11 slučajeva presudio u korist Claude odgovora — isti parovi pred GPT sucem preokrenuli su se u korist boardrooma.

Zaključak: ako mjerite multi-agent sustave jednim sucem, mjerite krivo.

Ispod haube

Za one koje zanima tehnička strana, Cortex je punokrvna Laravel aplikacija:

Laravel 12 / PHP 8.3, MySQL 8, Redis, Laravel Reverb
Inertia + React chat sučelje (Tailwind, dark mode, HR/EN)
Filament admin i customer paneli
6 provider adaptera iza zajedničkog interfacea
Prepaid wallet sustav s event-sourced ledgerom
REST API s 8 endpointa i scoped tokenima
~240 PHP datoteka i 11.000+ linija koda

Probajte ga

Cortex je na GitHubu, MIT licenca, self-hostable:

github.com/invictumhr/cortex

Cortex je nastao kao interni alat u Invictumu — malom softverskom studiju iz Požege — jer smo ga sami trebali za odluke gdje “pitaj ChatGPT” nije bilo dovoljno.

Otvaramo ga jer mislimo da je pošteno izmjeren multi-model boardroom korisniji prilog ekosustavu od još jednog framework-a s velikim obećanjima.

Built for thinking, not vibe-coding.

03 Detalji