Slovníček AI pojmů
Slovníček pojmů pro lepší pochopení nových výrazů
Deep Learning (DL) : Hluboké učení
Podoblast strojového učení, která využívá hluboké neuronové sítě s mnoha vrstvami k učení složitých vzorců z dat.
Embedding : Vkládání
Když chceme, aby počítač rozuměl jazyku, musíme slova reprezentovat jako čísla, protože počítače rozumí pouze číslům. Embedding je způsob, jak toho dosáhnout. Takto to funguje: vezmeme slovo, jako je "kočka", a převedeme ho na číselnou reprezentaci, která zachycuje jeho význam. Toho dosáhneme pomocí speciálního algoritmu, který se dívá na slovo v kontextu dalších slov kolem něj. Výsledné číslo reprezentuje význam slova a může být použito počítačem k pochopení, co slovo znamená a jak se vztahuje k ostatním slovům. Například slovo "kotě" by mohlo mít podobný embedding jako "kočka", protože jsou významově spjaty. Podobně slovo "pes" by mohlo mít odlišný embedding než "kočka", protože mají odlišné významy. To umožňuje počítači porozumět vztahům mezi slovy a dává smysl jazyku.
Feature Engineering : Inženýring funkcí
Proces výběru a vytváření nových funkcí z hrubých dat, které mohou být použity k zlepšení výkonu modelu strojového učení.
Freemium : Zdarma s možností placeného upgradu
Na této stránce se často setkáte s termínem "Freemium". Jednoduše to znamená, že konkrétní nástroj, který si prohlížíte, má jak bezplatné, tak placené možnosti. Obvykle je na bezplatné úrovni k dispozici velmi omezené, ale neomezené použití nástroje. V placených úrovních je pak s větším rozsahem a přednastavenými funkcemi.
Generative Adversarial Network (GAN) : Generativní adverzní síť
Typ počítačového programu, který vytváří nové věci, jako jsou obrázky nebo hudba, trénováním dvou neuronových sítí proti sobě. Jedna síť, nazvaná generátor, vytváří nová data, zatímco druhá síť, nazvaná diskriminátor, ověřuje autentičnost dat. Generátor se učí zlepšovat své generování dat prostřednictvím zpětné vazby od diskriminátoru, který se stává lepším v identifikaci falešných dat. Tento proces zpětné vazby pokračuje, dokud generátor není schopen vytvářet data, která jsou téměř nemožná pro diskriminátor rozlišit od skutečných dat.
GANs mohou být použity pro různé aplikace, včetně vytváření realistických obrázků, videí a hudby, odstraňování šumu z obrázků a videí a vytváření nových stylů umění.
Generative Art : Generativní umělecká tvorba
Generativní umění je forma umění, která je vytvářena pomocí počítačového programu nebo algoritmu pro generování vizuálního nebo zvukového výstupu. Často zahrnuje použití náhodnosti nebo matematických pravidel k vytvoření jedinečných, nepředvídatelných a někdy chaotických výsledků.
Generative Pre-trained Transformer (GPT) : Generativní předtrénovaný transformátor
GPT znamená Generative Pretrained Transformer a jedná se o typ velkého jazykového modelu vyvinutého společností OpenAI.
Tento model využívá transformační architekturu, která umožňuje efektivní trénování na velkých datových souborech. GPT dokáže předpovídat další slovo nebo větu na základě kontextu, což je užitečné pro různé aplikace, jako například chatboty, strojový překlad a generování textů. Díky svému výkonu a univerzálnosti se stal GPT populárním nástrojem pro výzkum a vývoj v oblasti přirozeného jazyka.
Giant Language model Test Room (GLTR) : Místnost pro testování obřího jazykového modelu
GLTR je nástroj, který pomáhá lidem zjistit, zda byl text napsán počítačem nebo člověkem. To dělá tím, že se dívá na to, jak je každé slovo v textu použito a jak pravděpodobné je, že by počítač zvolil toto slovo. GLTR je jako pomocník, který vám ukazuje nápovědy tím, že barví různé části věty různými barvami. Zelená znamená, že slovo bylo velmi pravděpodobně napsáno člověkem, žlutá znamená, že není jisté, červená znamená, že je pravděpodobnější, že bylo napsáno počítačem a fialová znamená, že je velmi pravděpodobné, že bylo napsáno počítačem.
GitHub
Github je webová platforma pro správu verzí a sdílení kódu. Umožňuje programátorům a týmům spolupracovat na projektech, sledovat změny v kódu a spravovat problémy. Github je populární mezi open-source komunitou a mnoho projektů je zde hostováno zdarma. Platforma také nabízí mnoho dalších funkcí, jako jsou wiki stránky, code review a integrace s dalšími nástroji, jako jsou například Travis CI nebo Slack. Github byl založen v roce 2008 a v roce 2018 byl akvizován společností Microsoft.
Google Colab
Google Colab je internetová platforma, která umožňuje uživatelům psát, sdílet a spouštět Python skripty v cloudu. Tato platforma poskytuje uživatelům bezplatný přístup k výpočetnímu výkonu a paměti Googleových serverů, což je ideální zejména pro studenty, výzkumníky a vývojáře. Pomocí webového rozhraní nebo spojením s Jupyter notebookem mohou uživatelé snadno spouštět svůj kód. Kromě toho Google Colab obsahuje mnoho předinstalovaných knihoven a nástrojů pro strojové učení a analýzu dat.
Graphics Processing Unit (GPU) : Grafický procesor
GPU, neboli grafický procesor, je speciální typ počítačového čipu navržený pro zpracování složitých výpočtů potřebných k zobrazení obrazů a videí na počítači nebo jiném zařízení. Můžete si ho představit jako mozek grafického systému vašeho počítače, který se skvěle osvědčuje v rychlém provádění matematických operací. GPU jsou používány v mnoha různých typech zařízení, včetně počítačů, telefonů a herních konzolí. Jsou zvláště užitečné pro úkoly, které vyžadují velký výkon zpracování, jako je hraní videoher, renderování 3D grafiky nebo provádění algoritmů strojového učení.
Langchain
LangChain je knihovna, která pomáhá uživatelům propojovat modely umělé inteligence s externími zdroji informací. Tento nástroj umožňuje uživatelům řetězit příkazy nebo dotazy napříč různými zdroji, což umožňuje vytváření agentů nebo chatbotů, kteří mohou provádět akce jménem uživatele. Cílem je zjednodušit proces propojení modelů umělé inteligence s externími zdroji informací a umožnit tak složitější a výkonnější aplikace umělé inteligence.
Large Language Model (LLM) : Velký jazykový model
Jedná se o typ strojového učení, který je trénován na velkém množství textových dat a je schopen generovat přirozeně znějící text. Tyto modely využívají hluboké neuronové sítě k analýze a porozumění významu slov a frází v textu. LLM jsou často trénovány na obrovských textových souborech, jako je například celý internet, a jsou užitečné pro různé aplikace, jako jsou chatboti, strojový překlad a generování textů. Příkladem LLM je například GPT vyvinutý společností OpenAI.
Machine Learning (ML) : Strojové učení
Strojové učení (ML) je vědní obor umělé inteligence, zaměřující se na vývoj algoritmů a modelů, které umožňují počítačům učit se z datových vzorců. Jde o adaptivní proces, jenž zlepšuje výkonnost modelu s narůstajícím množstvím dat. ML má široké uplatnění v oblastech jako predikce, rozpoznávání obrazů, doporučování obsahu či autonomní řízení.
Natural Language Processing(NLP) : Zpracování přirozeného jazyka
Zpracování přirozeného jazyka (NLP) je specifický obor umělé inteligence, který se zabývá interakcí mezi počítači a lidským jazykem. NLP umožňuje strojům analyzovat, interpretovat a generovat text či řeč v lidském jazyce. Tato technologie se uplatňuje v rozmanitých aplikacích, jako jsou překladače, asistenti, analýza sentimentu, rozpoznávání hlasu nebo sumarizace textu. Hlavním cílem NLP je zlepšit komunikaci mezi lidmi a stroji, což vede k efektivnějšímu a plynulejšímu propojení.
Neural Networks : Neuronové sítě
Neuronové sítě jsou inspirovány strukturou a funkcí lidského mozku a představují základní kámen hlubokého učení (deep learning), což je pokročilý typ strojového učení. Tvořeny vrstvami propojených uzlů neboli neuronů, tyto sítě se učí rozpoznávat vzory a provádět složité úkoly. Tréninkem se síť učí zlepšovat váhy spojů mezi neurony, což zvyšuje přesnost predikcí či klasifikace. Neuronové sítě se široce využívají v oblastech jako je rozpoznávání obrazu, analýza textu, generování uměleckých děl nebo hraní her.
Neural Radiance Fields (NeRF) : Neurální radiační pole
Neurální radiační pole (NeRF) představují metodu hlubokého učení, která se zaměřuje na modelování radiance obrazu, tedy měření množství světla vysílaného či odráženého objektem. Tento přístup umožňuje řešení různých úkolů, jako je generování obrazů, detekce objektů nebo segmentace. NeRFs využívají neuronové sítě k naučení se zachycení geometrie, materiálů a osvětlení ve scéně. Díky tomu mohou generovat realistické 3D rekonstrukce prostředí nebo objektů na základě snímků z různých úhlů, což má široké uplatnění například ve virtuální a rozšířené realitě, vizualizaci dat či filmovém průmyslu.
OpenAI
OpenAI je výzkumná organizace, která se zaměřuje na vytváření a popularizaci bezpečných, transparentních a společensky prospěšných technologií umělé inteligence. Založena byla v roce 2015 skupinou odborníků a podnikatelů, včetně Elona Muska a Sama Altmana. OpenAI usiluje o výzkum a inovace v oblasti AI s etickým přístupem a v souladu s lidskými hodnotami. Mezi jejich úspěchy patří vývoj pokročilých jazykových modelů, jako je GPT, který výrazně přispěl k pokroku v oblasti zpracování přirozeného jazyka a otevřel nové možnosti využití AI v praxi.
Prompt : Příkaz
Příkaz (prompt) je úvodní text, který se vkládá do velkého jazykového modelu, aby jej nasměroval k určitému tématu či způsobu generování následujícího textu. Příkaz slouží jako vstup pro model a pomáhá definovat kontext, ve kterém model pracuje. Na základě příkazu model vyhodnocuje svou databázi znalostí a generuje odpovídající text, který je v souladu s daným kontextem. Tímto způsobem může být model použit k řešení různých úkolů, jako je odpovídání na otázky, psaní esejí, generování nápadů nebo tvoření kreativního obsahu.
Python
Python je vysoce oblíbený programovací jazyk vyšší úrovně, který se vyznačuje jednoduchostí, čitelností a flexibilitou. Navrhl jej Guido van Rossum a poprvé byl představen v roce 1991. Python je vhodný pro širokou škálu účelů, od webových aplikací po vědecký výzkum. Díky své jednoduchosti a množství dostupných knihoven se stal populárním jazykem pro práci s umělou inteligencí a strojovým učením. V AI a ML komunitě je široce používán pro implementaci algoritmů, zpracování dat a tvorbu modelů, což ho činí základním nástrojem pro vývojáře a výzkumníky v těchto oborech.
Reinforcement Learning : Zesilovací učení
Zesilovací učení (reinforcement learning) je typ strojového učení, ve kterém se model učí prostřednictvím interakce s prostředím a metodou pokus-omyl. Agent (model) provádí akce v prostředí, za které dostává odměny nebo tresty. Cílem agenta je maximalizovat kumulativní odměnu v průběhu času. Agent se tedy snaží najít optimální strategii, která mu umožní dosáhnout co nejvyššího zisku z odměn.
Zesilovací učení má široké uplatnění v oblastech jako robotika, autonomní řízení, hraní her či optimalizace systémů. Příkladem úspěšného využití zesilovacího učení je AI systém AlphaGo od společnosti DeepMind, který porazil světové šampiony v hře Go.
Spatial Computing : Prostorové výpočty
Prostorové výpočty spočívají ve využití technologií, které integrují digitální informace a zážitky do fyzického světa. Zahrnují například rozšířenou realitu, kdy jsou digitální prvky přidány do skutečného prostředí, nebo virtuální realitu, která nás zcela ponoří do digitálního světa. Prostorové výpočty mají široké spektrum aplikací, jako je vzdělávání, zábava či design, a mají potenciál změnit způsob, jakým komunikujeme s okolním světem a s ostatními lidmi. Tato technologie otevírá nové možnosti v interakci, spolupráci a kreativním vyjádření, čímž významně ovlivňuje naše zkušenosti s digitálním prostředím.
Stable Diffusion : Stabilní difuze
Stabilní difuze (Stable Diffusion) je model umělé inteligence, který generuje složité umělecké obrazy na základě textových podnětů. Jedná se o otevřený zdrojový kód pro syntézu obrazů, který je přístupný pro všechny zájemce. Stabilní difuze lze nainstalovat lokálně pomocí kódu dostupného na GitHubu, anebo využít některá z online uživatelských rozhraní, která tento model také implementují.
Tento model AI umožňuje vytvářet kreativní a unikátní vizuální obsah na základě textových popisů, což má široké uplatnění v oblastech jako digitální umění, design, reklama nebo zábava. Stabilní difuze tedy představuje inovativní nástroj pro umělce, designéry a tvůrce obsahu.
Supervised Learning : Učení s učitelem
Učení s učitelem (Supervised Learning) je typ strojového učení, kde jsou trénovací data opatřena štítky, které představují správné výstupy. Model se učí rozpoznávat vzory a vztahy mezi vstupními daty a odpovídajícími štítky. Cílem je, aby model byl schopen předpovědět správné štítky pro nová, neznámá data.
Příkladem učení s učitelem může být klasifikace e-mailů jako spam či ne-spam na základě textu e-mailu. Model se trénuje na e-mailech označených jako spam nebo ne-spam a učí se rozpoznávat vlastnosti, které tyto kategorie charakterizují. Poté je schopen automaticky klasifikovat nově příchozí e-maily. Učení s učitelem má široké uplatnění v oblastech, jako je klasifikace, regrese či predikce časových řad.
Unsupervised Learning : Učení bez učitele
Učení bez učitele (Unsupervised Learning) je typ strojového učení, kde trénovací data nejsou označena štítky. Model se snaží sám identifikovat vzory, vztahy nebo strukturu v datech bez předchozích znalostí správných výstupů. Cílem je odhalit skryté informace, které mohou být v datech obsaženy.
Příkladem učení bez učitele může být shlukování (clustering), kde se model snaží rozdělit data do skupin na základě podobnosti mezi jednotlivými prvky. Model může také identifikovat hlavní komponenty (Principal Component Analysis, PCA) ve velkém množství dat, což umožňuje redukci dimenzionality a zjednodušení problému.
Učení bez učitele se používá v situacích, kdy není k dispozici označená trénovací data, nebo kdy je cílem zjistit skryté struktury a vztahy, které nejsou zřejmé na první pohled.
Webhook
Webhook je způsob, jakým jeden počítačový program může v reálném čase poslat zprávu nebo data jinému programu přes internet. Funguje tím, že zprávu nebo data pošle na konkrétní URL adresu, která patří druhému programu. Webhooky se často používají k automatizaci procesů a usnadňují komunikaci a spolupráci různých programů. Jsou užitečným nástrojem pro vývojáře, kteří chtějí vytvářet vlastní aplikace nebo vytvářet integrace mezi různými softwarovými systémy.