Americký startup Deep Cogito představil rodinu otevřených AI modelů Cogito 1, které kombinují dva režimy práce: „analytický“ pro řešení složitých úloh a „standardní“ pro rychlé odpovědi. Tato architektura snižuje výpočetní nároky při zachování vysoké přesnosti.
Co odlišuje modely Deep Cogito od konkurence
Všechny modely Cogito 1 využívají hybridní architekturu, jež propojuje komponenty pro logickou analýzu s prvky bez hlubšího uvažování. Díky tomu AI okamžitě odpovídá na jednoduché dotazy, ale při náročnějších úkolech aktivuje režim analýzy.
„Každý model dokáže odpovědět přímo […] nebo provést sebehodnocení před odpovědí,“ vysvětlil tým v blogové příspěvku.
Startup vytvořil modely na základě otevřených řešení Meta Llama a Alibaba Qwen, jejichž výkon vylepšil novými tréninkovými metodami. Počet parametrů (nastavení ovlivňujících schopnosti AI) se pohybuje od 3 do 70 miliard. V příštích měsících plánuje uvedení verzí s 671 miliardami parametrů.
Kde nové modely excelují
Podle interních testů Deep Cogito jejich modely překonávají konkurenty:
- Cogito 70B v analytickém režimu předčil model DeepSeek R1 v matematických a jazykových testech.
- Cogito 8B dosáhl 80,5 % v testu MMLU (hodnocení obecného porozumění), což je o 12,8 procentního bodu více než u LLaMA 3.1 8B.
- Cogito 3B v analytickém režimu zaznamenal 84,2 % v testu ARC (logika), zatímco konkurence dosahuje 65–70 %.
V čisté matematice však modely zaostávají: Cogito 70B získal 83,3 % v testu MATH oproti 89 % u DeepSeek R1.
Jak se hybridní modely trénovaly
Místo standardního učení s lidskou zpětnou vazbou (RLHF) startup použil metodu Iterovaná destilace a amplifikace (IDA). Tento přístup, inspirovaný algoritmem AlphaGo, umožňuje AI věnovat více zdrojů hledání optimálních řešení a následně je „zapamatovat“.
Vývojáři tvrdí, že tato metoda pomáhá překonávat současná omezení AI. „Postupně se blížíme k univerzální umělé inteligenci,“ uvedl zástupce společnosti.
Kde modely využijete
Modely Cogito 1 jsou dostupné ke stažení na platformách Hugging Face a Ollama nebo přes API služeb Fireworks AI a Together AI. Jsou šířeny pod licencí LLaMA, která umožňuje komerční využití až pro 700 milionů uživatelů měsíčně.
Důraz je kladen na integraci s externími nástroji (tool-calling), což je klíčové pro podniková řešení:
- Cogito 3B podporuje 4 typy dotazů s přesností 92,8 %.
- Cogito 8B udržuje přesnost nad 89 % ve všech úlohách.
Pro srovnání: model LLaMA 3.1 8B dosahuje pouze 35–54 %.
Tým Deep Cogito plánuje rozšířit řadu o architekturu Mixture-of-Experts (směs expertů), kde různé části modelu řeší specializované úkoly.