@@ -27,7 +27,7 @@ Informace jsou členěny do sekcí ve wiki:
...
@@ -27,7 +27,7 @@ Informace jsou členěny do sekcí ve wiki:
- Velké jazykové modely (LLM) se obvykle trénují jako univerzální, jejich úpravou, nebo trénováním na specifickém datasetu lze vytvořit model specializovaný na určitou oblast (např. programování), tyto modely mohou být výrazně menší. Pro specifické účely (např. medicínské) lze vytvářet i specializované velké modely, musí být ale k dispozici dostatečně velká datová sada pro primární trénink, který model zajistí schopnost používat přirozený jazyk.
- Velké jazykové modely (LLM) se obvykle trénují jako univerzální, jejich úpravou, nebo trénováním na specifickém datasetu lze vytvořit model specializovaný na určitou oblast (např. programování), tyto modely mohou být výrazně menší. Pro specifické účely (např. medicínské) lze vytvářet i specializované velké modely, musí být ale k dispozici dostatečně velká datová sada pro primární trénink, který model zajistí schopnost používat přirozený jazyk.
- Z hlediska dostupnosti se modely dělí na otevřené (Open source), které může provozovat kdokoliv s dostatečně výkonným HW, a uzavřené. Uzavřené modely zpravidla provozují společnosti, které je vytvořily, OpenAI (např. GPT), Google (např. Gemini), Anthropic (Claude) a X (Grok). Tyto společnosti obvykle nabízejí přístup k modelům jak přes vlastní rozhraní, tak pomocí API (přístup pro programátory).
- Z hlediska dostupnosti se modely dělí na otevřené (Open source), které může provozovat kdokoliv s dostatečně výkonným HW, a uzavřené. Uzavřené modely zpravidla provozují společnosti, které je vytvořily, OpenAI (např. GPT), Google (např. Gemini), Anthropic (Claude) a X (Grok). Tyto společnosti obvykle nabízejí přístup k modelům jak přes vlastní rozhraní, tak pomocí API (přístup pro programátory). Jsou rovněž k dispozici velké otevřené modely zejména čínské provenience, jeko je DeepSeek nebo MiniMax.
- Jsou k dispozici i nástroje (např. Perplexity), které umí sdružit rozhraní k více různým modelům, uživatelé si tak mohou vybrat model, se kterým budou komunikovat.
- Jsou k dispozici i nástroje (např. Perplexity), které umí sdružit rozhraní k více různým modelům, uživatelé si tak mohou vybrat model, se kterým budou komunikovat.
...
@@ -44,7 +44,7 @@ Informace jsou členěny do sekcí ve wiki:
...
@@ -44,7 +44,7 @@ Informace jsou členěny do sekcí ve wiki:
- Novější univerzální modely jsou schopné pro potřeby inference prohledávat internet (pokud nebyla odpověď na otázku v jejich datasetu) včetně uvádění zdrojů informací.
- Novější univerzální modely jsou schopné pro potřeby inference prohledávat internet (pokud nebyla odpověď na otázku v jejich datasetu) včetně uvádění zdrojů informací.
- Dále se objevila možnost tzv. reasoning, kdy model rozdělí úlohu na více kroků a ty řeší postupně, je tak schopen řešit složitější úlohy. Tento postup generuje výrazně větší množství tokenů. Nemusí to však znamenat zásadní kvalitativní posun výstupů, protože tento postup je třeba modely dotrénovat na konkrétních úlohách.
- Dále se objevila možnost tzv. reasoning, kdy model rozdělí úlohu na více kroků a ty řeší postupně, je tak schopen řešit složitější úlohy. Tento postup generuje výrazně větší množství tokenů. Nemusí to však znamenat zásadní kvalitativní posun výstupů, protože tento postup je třeba modely dotrénovat na konkrétních úlohách.
- Výpočetní nároky na inferenci mohou být poměrně velké (zejména na paměť GPU), rostou s kontextovým oknem a reasoning, ale lze je snížit architekturou MoE (Mixture of Experts, např MiniMax), kdy se na řešení úlohy podílí jen část modelu.
- Je třeba rozlišovat aplikace (nástroje) a modely, aplikace je rozhraní k modelu, které uživateli nějakým způsobem zprostředkovává určité funkce modelu. APlikace může některé věci dělat pro uživatele lépe, než model samotný, například tím, že používá skryté promty. Přímé rozhraní k modelu obvykle nabízejí jejich tvůrci (jako je OpenAI)
- Je třeba rozlišovat aplikace (nástroje) a modely, aplikace je rozhraní k modelu, které uživateli nějakým způsobem zprostředkovává určité funkce modelu. APlikace může některé věci dělat pro uživatele lépe, než model samotný, například tím, že používá skryté promty. Přímé rozhraní k modelu obvykle nabízejí jejich tvůrci (jako je OpenAI)
- Vzhledem k tomu, že modely jsou (do)trénované an různých datech, různým způsobem a s různým cílem (třeba řešit určité typy úloh), není dobré zobecňovat poznatky s jejím používáním na základě zkušenosti s určitým produktem a určitou úlohou (např. AI je dobrá v tom a tom)
- Vzhledem k tomu, že modely jsou (do)trénované an různých datech, různým způsobem a s různým cílem (třeba řešit určité typy úloh), není dobré zobecňovat poznatky s jejím používáním na základě zkušenosti s určitým produktem a určitou úlohou (např. AI je dobrá v tom a tom)