Společnost Deepseek zveřejnila data ukazující možnost dosažení zisku z jazykových modelů umělé inteligence i při cenách nižších, než jsou tržní standardy. Podle propočtů by plná monetizace služeb mohla generovat až 562 tisíc USD denně, avšak reálné příjmy jsou zatím výrazně nižší kvůli bezplatným službám a slevám.
Klíčové ukazatele výkonnosti
Během 24hodinového testovacího období modely Deepseek zpracovaly:
- 608 miliard vstupních tokenů (textových jednotek pro zpracování AI);
- 168 miliard výstupních tokenů.
Více než polovina požadavků (56,3 %) byla vyřízena z mezipaměti – jakéhosi „archivu odpovědí“ na časté dotazy, což snížilo náklady.
Pro optimalizaci společnost využívá systém pružného rozdělování zdrojů:
- V hodinách špičky jsou všechny serverové uzly využity pro zpracování požadavků uživatelů.
- V noci se volné kapacity přesouvají na trénink modelů a výzkum.
Hardwarové náklady a výnosnost
Infrastruktura Deepseek zahrnuje 226 serverových uzlů (každý s 8 grafickými procesory Nvidia H800). Denní náklady na pronájem zařízení činí 87 072 USD. Zároveň:
- Jeden uzel zpracuje až 73 700 vstupních tokenů za sekundu;
- Rychlost generování odpovědí dosahuje 20–22 tokenů za sekundu.
Kdyby společnost účtovala platby podle tarifů prémiového modelu R1 (0,14 USD za milion vstupních tokenů z mezipaměti, 2,19 USD za výstupní), teoretický zisk by dosáhl 545 %. Praxe je však složitější: většina služeb je zatím zdarma a hlavním zdrojem příjmů zůstává přístup k API.
Situace Deepseek odráží celkové trendy v oboru. Například OpenAI nedávno zvýšila ceny za GPT-4.5, ačkoli rozdíl ve výkonu oproti levnějším konkurentům je minimální. To vytváří tlak na západní společnosti, které čelí miliardovým ztrátám v rostoucí konkurenci.