Deep Cogito vydal hybridní AI modely: rychlejší a chytřejší než konkurence

Šéfredaktor

Deep Cogito vydal řadu hybridních AI modelů kombinujících rychlé odpovědi a hloubkovou analýzu
Modely překonávají konkurenci od Meta a DeepSeek v testech logiky a vícejazyčnosti
Všechny modely jsou dostupné ke stažení nebo přes cloudové služby

uiw.cz

Americký startup Deep Cogito představil rodinu otevřených AI modelů Cogito 1, které kombinují dva režimy práce: „analytický“ pro řešení složitých úloh a „standardní“ pro rychlé odpovědi. Tato architektura snižuje výpočetní nároky při zachování vysoké přesnosti.

Co odlišuje modely Deep Cogito od konkurence

Všechny modely Cogito 1 využívají hybridní architekturu, jež propojuje komponenty pro logickou analýzu s prvky bez hlubšího uvažování. Díky tomu AI okamžitě odpovídá na jednoduché dotazy, ale při náročnějších úkolech aktivuje režim analýzy.

„Každý model dokáže odpovědět přímo […] nebo provést sebehodnocení před odpovědí,“ vysvětlil tým v blogové příspěvku.

Startup vytvořil modely na základě otevřených řešení Meta Llama a Alibaba Qwen, jejichž výkon vylepšil novými tréninkovými metodami. Počet parametrů (nastavení ovlivňujících schopnosti AI) se pohybuje od 3 do 70 miliard. V příštích měsících plánuje uvedení verzí s 671 miliardami parametrů.

Kde nové modely excelují

Podle interních testů Deep Cogito jejich modely překonávají konkurenty:

Cogito 70B v analytickém režimu předčil model DeepSeek R1 v matematických a jazykových testech.
Cogito 8B dosáhl 80,5 % v testu MMLU (hodnocení obecného porozumění), což je o 12,8 procentního bodu více než u LLaMA 3.1 8B.
Cogito 3B v analytickém režimu zaznamenal 84,2 % v testu ARC (logika), zatímco konkurence dosahuje 65–70 %.

V čisté matematice však modely zaostávají: Cogito 70B získal 83,3 % v testu MATH oproti 89 % u DeepSeek R1.

Jak se hybridní modely trénovaly

Místo standardního učení s lidskou zpětnou vazbou (RLHF) startup použil metodu Iterovaná destilace a amplifikace (IDA). Tento přístup, inspirovaný algoritmem AlphaGo, umožňuje AI věnovat více zdrojů hledání optimálních řešení a následně je „zapamatovat“.

Vývojáři tvrdí, že tato metoda pomáhá překonávat současná omezení AI. „Postupně se blížíme k univerzální umělé inteligenci,“ uvedl zástupce společnosti.

Kde modely využijete

Modely Cogito 1 jsou dostupné ke stažení na platformách Hugging Face a Ollama nebo přes API služeb Fireworks AI a Together AI. Jsou šířeny pod licencí LLaMA, která umožňuje komerční využití až pro 700 milionů uživatelů měsíčně.

Důraz je kladen na integraci s externími nástroji (tool-calling), což je klíčové pro podniková řešení:

Cogito 3B podporuje 4 typy dotazů s přesností 92,8 %.
Cogito 8B udržuje přesnost nad 89 % ve všech úlohách.
Pro srovnání: model LLaMA 3.1 8B dosahuje pouze 35–54 %.

Tým Deep Cogito plánuje rozšířit řadu o architekturu Mixture-of-Experts (směs expertů), kde různé části modelu řeší specializované úkoly.

Čtěte také: Nejlepší AI detektory pro češtinu: Test, výsledky, rady

Komentáře