2 Možnosti avatara – postava v plné velikosti
Vizuál avatara určuje, jak návštěvník vnímá exponát – zda jde o jednoduchou nápovědu, živého maskota nebo „skutečného“ průvodce. V tomto projektu jsou čtyři hotové varianty (základní SVG, animovaná postava Rive, anime styl Live2D, fotorealistické video D-ID). Níže je srovnání všech možností na trhu; u implementovaných variant popisujeme detailně, co umí, jak se pohybuje a kde dává smysl.
| Varianta | Vzhled | Mimika (oči, ústa, výraz) | Postava celá? | V projektu | Test zdarma? |
|---|---|---|---|---|---|
| A – Základní SVG | Jednoduchá kreslená hlava | Jen pohyb úst při mluvení | Ne – jen hlava | Ano | Ano |
| B – Fotka / video + lip-sync | Statický portrét nebo krátká smyčka | Slabá – hlavně ústa podle zvuku | Částečně (busta) | Ne | Ano (obecně) |
| C – Rive | Stylizovaná animovaná postava | Dobrá – mrkání, ústa, gesta, emoce | Ano – celá postava | Ano | Ano |
| C – Live2D | Stylizovaná animovaná postava (anime styl) | Dobrá – mrkání, ústa, gesta, emoce | Ano – celá postava | Ano | Ano ukázkové modely zdarma |
| C – Lottie | Stylizovaná animovaná postava | Střední – přednastavené animace | Ano – záleží na assetu | Ne | Částečně editor zdarma, assety placené |
| E – D-ID | Fotorealistická tvář z fotky | Velmi dobrá synchronizace rtů ve videu | Obvykle busta, ne celé tělo | Ano | Trial kredity |
| E – HeyGen talking head | Fotorealistická tvář | Velmi dobrá synchronizace rtů | Obvykle busta | Ne | Ne API placené |
| F – AI video postava (HeyGen full body) | Realistická postava ve videu | Velmi dobrá | Ano | Ne | Ne API placené |
HeyGen (talking head i full-body video) v tomto projektu není implementováno. HeyGen API nemá bezplatný trial pro automatický kiosk (kredity od cca 5 USD, platba za sekundy videa). Integrace do exponátu je možná pouze jako placený vývoj na zakázku; pro fotorealistickou ukázku zdarma použijte hotovou variantu D-ID s trial kredity.
HeyGen full-body – varianta F (není v projektu)
Varianta F – AI video postava (HeyGen full body) zobrazuje realistickou postavu v celé výšce (ne jen bustu jako u D-ID). HeyGen generuje krátké video z textu odpovědi – podobný princip jako u varianty D-ID, ale s možností studio avatarů s celým tělem vhodných pro vertikální monitor.
- V tomto projektu není – žádná stránka typu
heygen.php, žádné nastavení v administraci. - Integrace pouze placený vývoj na zakázku – napojení API, přehrávání videí v dialogu, odhad nákladů na provoz.
- API bez free trial – od února 2026 HeyGen neposkytuje bezplatné API kredity; start od cca 5 USD pay-as-you-go, platba za sekundy vygenerovaného videa.
- Webový Free plán HeyGen (ruční tvorba ve studiu, cca 3 videa/měsíc) nelze použít pro automatický kiosk v této aplikaci.
- Zdarma v projektu pro celou postavu: Rive nebo Live2D (stylizované). Pro fotorealismus s trial kredity: D-ID (typicky busta).
Varianty v tomto projektu – detailně
Všechny čtyři implementované varianty sdílejí stejný hlasový dialog: rozpoznávání řeči v prohlížeči, odpověď z AI (Gemini nebo ChatGPT), přečtení odpovědi hlasem, volitelná uvítací zpráva, výběr hlasu, barevné motivy a idle režim (prezentace atrakcí při nečinnosti). Liší se jen tím, jak vypadá a pohybuje se postava na obrazovce.
V projektu jsou čtyři implementované varianty: základní SVG hlava, animovaná postava Rive, anime styl Live2D a fotorealistické video D-ID – každá má vlastní exponát; společné nastavení avatara je v administraci (sekce Avatary).
A – Základní SVG hlava
Statická vektorová hlava na obrazovce. Žádné video, žádné externí knihovny – minimum nároků na hardware i údržbu.
Co umí:
- Hlasový dialog – stejný tok jako u ostatních variant (ptát se, dostat odpověď, slyšet ji)
- Stavový řádek: připraveno, poslouchám, přemýšlím, mluvím, chyba
- Animace úst při TTS – elipsa „úst“ se rytmicky mění podle mluvení
- Vizuální indikace poslechu (zvýraznění scény při aktivním mikrofonu)
- Volitelný idle režim – při nečinnosti mluví texty atrakcí, ústa se animují stejně
Jak se pohybuje:
- Idle – hlava je statická, žádné mrkání ani gesta
- Poslouchá – jen změna stavu UI, postava se nehýbe
- Přemýšlí – čekání na AI, opět bez pohybu těla
- Mluví – pulzující ústa synchronizované s TTS (ne s fonémy, jen rytmus)
Kdy použít: rychlý pilot, interní test, horizontální monitor u stolu, slabší PC, situace kde stačí „mluvící ikona“ a nepotřebujete celou postavu. Viz Monitor – koncept a rozložení – na výšku postava působí prázdně.
C – Rive (animovaná postava)
Vektorová celá postava vykreslená knihovnou Rive. Animace běží lokálně v prohlížeči – žádné generování videa, okamžitá reakce na stavy dialogu.
Co umí:
- Vše ze základní varianty + bohatší vizuál a výběr postav (picker maskotů); názvy v pickeru se lokalizují podle vlajky – jazyk exponátu
- Přednastavené postavy: asistent, maskoti, kočka, pes, mráček, chodec, lip-sync postava aj.
- Vlastní soubor
.riv– lze nahradit nebo doplnit vlastní animaci z editoru Rive - Čtyři režimy avatara: idle, poslouchá, přemýšlí, mluví
- Uvítání – volitelná animace mávnutí / pozdravu při startu exponátu
- Při mluvení pulz výrazů a opakované spouštění „mluvících“ animací (lip-sync styl)
- Konfigurovatelné názvy animací a state machine v administraci
- Idle režim – postava mluví texty atrakcí a přepíná se do stavu „mluví“
Jak se pohybuje:
- Idle – dýchání, mírný pohyb, smyčka klidu (záleží na konkrétním
.rivsouboru) - Poslouchá – naklonění, pozorný pohled, gesto „naslouchám“ (triggery / booleany ve state machine)
- Přemýšlí – výraz zamyšlení, čekání na odpověď AI
- Mluví – animace úst a gest, střídání výrazů každých ~280 ms pro živější dojem
- Pozdrav – jednorázové mávnutí nebo uvítací animace po klepnutí na start
- U postavy „Chodec“ – chůze a odpočinek; u maskotů – více výrazů (až 6 u mráčku)
Kdy použít: vertikální kiosk, muzeum, DV, veřejný prostor – nejlepší poměr efekt / cena / rychlost. Funguje i na horizontálním monitoru (postava v menším měřítku). Vhodné pro děti i dospělé, když nepotřebujete fotorealismus.
C – Live2D (animovaná postava)
Celá postava vykreslená knihovnou Live2D Cubism – typický anime / manga vzhled. Animace běží lokálně v prohlížeči (PixiJS), bez generování videa – samostatný exponát s anime postavou.
Co umí:
- Stejný hlasový dialog jako Rive a D-ID
- Výběr postavy návštěvníkem – picker v patičce exponátu (názvy postav v jazyce zvolené vlajky)
- Přednastavené ukázkové modely zdarma: Mark (chlapec), Natori (muž), Haru a Shizuku (ženské postavy)
- Vlastní model – export složky
runtimez Cubism Editoru doassets/live2d/ - Čtyři režimy avatara: idle, poslouchá, přemýšlí, mluví
- Při mluvení pulz úst (parametr
ParamMouthOpenY) a volitelné motion skupiny - Konfigurace v administraci: cesta k modelu, motion názvy, parametr úst, výběr postav v
config.json - Instalace modelů: skript
tools/install-live2d.ps1
Jak se pohybuje:
- Idle – klidová smyčka motion skupiny (např.
Idle) - Poslouchá – mírné naklonění hlavy / těla (parametry úhlu)
- Přemýšlí – výraz zamyšlení, čekání na AI
- Mluví – animace úst synchronizované s TTS (rytmický pulz, ne fonémy)
- Pozdrav – volitelná motion skupina (např.
Tap,TapBody)
Kdy použít: vertikální kiosk, kde chcete anime / japonský styl místo vektorových maskotů Rive. Vhodné pro mladší návštěvníky, herní expozice, fanouškovské instalace. Ukázkové modely jsou zdarma pod Live2D Free Material License; vlastní modely z editoru vyžadují ověření licence při komerčním provozu.
E – D-ID (fotorealistické video)
Tvář z fotografie (výchozí prezentérka nebo vlastní snímek) – každá odpověď se vygeneruje jako krátké video s přesnou synchronizací rtů a hlasem.
Co umí:
- Stejný hlasový dialog; text odpovědi generuje Gemini/OpenAI, video + hlas zajišťuje D-ID API
- Vlastní portrét – URL fotografie v nastavení (
did_source_url) - Český hlas Microsoft neural (např. Vlasta) přes
did_voice_id - Mezi odpověďmi statický poster (fotka), při odpovědi přehrání videa
- Indikátor generování („Generuji video avatara…“) – návštěvník vidí, že se něco děje
- Idle režim nepoužívá D-ID video – šetří kredity, mluví běžné TTS
Jak se pohybuje:
- Idle / čekání – statický portrét (žádný pohyb)
- Poslouchá – stále statická fotka, aktivní jen mikrofon a stavový text
- Přemýšlí – portrét + loader; paralelně běží AI a příprava videa
- Mluví – přehrává se vygenerované video: pohyb rtů, mírný pohyb hlavy, výraz podle řeči
- Žádné celé tělo – typicky busta od ramen; ruce a chůze ve videu nejsou
- Zpoždění 2–10+ s podle délky odpovědi a zatížení API (na rozdíl od okamžité Rive animace)
Kdy použít: reprezentativní instalace, úřad, banka, prezentace kde má průvodce vypadat jako skutečná osoba (kurátor, recepční, mascott z fotky ředitele). Horizontální monitor i vertikální kiosk – v portrétu busta, na šířku velký obličej. Počítejte s provozními náklady – viz D-ID – náklady.
Stavy avatara během rozhovoru
Všechny varianty procházejí stejným dialogovým cyklem. Rozdíl je v tom, jak bohatě na to reaguje vizuál.
| Stav | Co se děje | SVG hlava | Rive | Live2D | D-ID |
|---|---|---|---|---|---|
| Start / idle | Exponát čeká na klepnutí, pak uvítání | Statická hlava | Klidová smyčka; volitelné mávnutí | Klidová motion smyčka | Poster (fotka) |
| Poslouchá | Mikrofon zachytává otázku návštěvníka | Zvýraznění scény | Animace pozornosti, naklonění | Naklonění hlavy, stav „Poslouchám…“ | Poster + stav „Poslouchám…“ |
| Přemýšlí | AI generuje odpověď | Text „Přemýšlím…“ | Výraz čekání / zamyšlení | Výraz zamyšlení | Loader + příprava videa na serveru D-ID |
| Mluví | Přehrání odpovědi (TTS nebo video) | Pulzující ústa | Animace mluvení, gesta, výrazy | Pulz úst + motion mluvení | Video s lip-sync |
| Idle prezentace | Po nečinnosti mluví o atrakcích / stránkách | Ústa při TTS | Stav „mluví“ u každé stránky | Stav „mluví“ + pulz úst při TTS | TTS bez D-ID videa (úspora kreditů) |
Kdy kterou variantu zvolit
| Situace | Doporučení | Proč |
|---|---|---|
| Vertikální kiosk, celá postava | Rive nebo Live2D | Plná výška obrazovky, okamžitá animace, bez poplatků za video; Live2D pro anime styl |
| Fotorealistický „živý“ člověk | D-ID | Nejvyšší realismus tváře; vhodné pro formální instituce |
| Stolní monitor, rychlý pilot | SVG nebo Rive (busta) | Minimum konfigurace; Rive i jako menší postava na šířku |
| Dětská expozice, maskot | Rive (kočka, pes, mráček…) nebo Live2D | Výrazné postavy, gesta, emoce; Rive = maskoti, Live2D = anime postavy |
| Mužský / ženský avatar na výběr | Live2D | Mark (chlapec), Natori (muž), Haru a Shizuku (ženy) – výběr v pickeru na Live2D exponátu |
| Veletrh, omezený rozpočet | Rive nebo SVG | Žádné kredity za video; D-ID by rychle spotřebovalo trial |
| Vysoký provoz 10+ h / den | Rive | Stabilní odezva; u D-ID rostou náklady s počtem odpovědí |
| Vlastní brandovaná postava | Rive (.riv) nebo Live2D (.model3.json) |
Rive: editor zdarma; Live2D: Cubism Editor + export runtime složky |
| Existující foto ředitele / průvodce | D-ID | Stačí jedna kvalitní fotka portrétu, žádná 3D modelace |
Další možnosti (zatím mimo projekt)
V přehledové tabulce jsou i technologie, které projekt zatím neobsahuje, ale dávají smysl při rozšiřování:
- B – Fotka + jednoduchý lip-sync – levná alternativa k D-ID; slabší realismus, vhodné pro prototyp.
- Lottie – krátké přednastavené animace z After Effects; horší pro interaktivního průvodce než Rive/Live2D.
- HeyGen E – talking head – konkurence k D-ID (busta); API bez free trial, integrace pouze placený vývoj na zakázku.
- HeyGen F – full-body video – realistická postava v celé výšce; v projektu není, API bez free trial, integrace pouze placený vývoj na zakázku (viz HeyGen full-body výše).