Obsah · kapitola 2

2 Možnosti avatara – postava v plné velikosti

Vizuál avatara určuje, jak návštěvník vnímá exponát – zda jde o jednoduchou nápovědu, živého maskota nebo „skutečného“ průvodce. V tomto projektu jsou čtyři hotové varianty (základní SVG, animovaná postava Rive, anime styl Live2D, fotorealistické video D-ID). Níže je srovnání všech možností na trhu; u implementovaných variant popisujeme detailně, co umí, jak se pohybuje a kde dává smysl.

Varianta Vzhled Mimika (oči, ústa, výraz) Postava celá? V projektu Test zdarma?
A – Základní SVG Jednoduchá kreslená hlava Jen pohyb úst při mluvení Ne – jen hlava Ano Ano
B – Fotka / video + lip-sync Statický portrét nebo krátká smyčka Slabá – hlavně ústa podle zvuku Částečně (busta) Ne Ano (obecně)
C – Rive Stylizovaná animovaná postava Dobrá – mrkání, ústa, gesta, emoce Ano – celá postava Ano Ano
C – Live2D Stylizovaná animovaná postava (anime styl) Dobrá – mrkání, ústa, gesta, emoce Ano – celá postava Ano Ano ukázkové modely zdarma
C – Lottie Stylizovaná animovaná postava Střední – přednastavené animace Ano – záleží na assetu Ne Částečně editor zdarma, assety placené
E – D-ID Fotorealistická tvář z fotky Velmi dobrá synchronizace rtů ve videu Obvykle busta, ne celé tělo Ano Trial kredity
E – HeyGen talking head Fotorealistická tvář Velmi dobrá synchronizace rtů Obvykle busta Ne Ne API placené
F – AI video postava (HeyGen full body) Realistická postava ve videu Velmi dobrá Ano Ne Ne API placené

HeyGen (talking head i full-body video) v tomto projektu není implementováno. HeyGen API nemá bezplatný trial pro automatický kiosk (kredity od cca 5 USD, platba za sekundy videa). Integrace do exponátu je možná pouze jako placený vývoj na zakázku; pro fotorealistickou ukázku zdarma použijte hotovou variantu D-ID s trial kredity.

HeyGen full-body – varianta F (není v projektu)

Varianta F – AI video postava (HeyGen full body) zobrazuje realistickou postavu v celé výšce (ne jen bustu jako u D-ID). HeyGen generuje krátké video z textu odpovědi – podobný princip jako u varianty D-ID, ale s možností studio avatarů s celým tělem vhodných pro vertikální monitor.

  • V tomto projektu není – žádná stránka typu heygen.php, žádné nastavení v administraci.
  • Integrace pouze placený vývoj na zakázku – napojení API, přehrávání videí v dialogu, odhad nákladů na provoz.
  • API bez free trial – od února 2026 HeyGen neposkytuje bezplatné API kredity; start od cca 5 USD pay-as-you-go, platba za sekundy vygenerovaného videa.
  • Webový Free plán HeyGen (ruční tvorba ve studiu, cca 3 videa/měsíc) nelze použít pro automatický kiosk v této aplikaci.
  • Zdarma v projektu pro celou postavu: Rive nebo Live2D (stylizované). Pro fotorealismus s trial kredity: D-ID (typicky busta).

Varianty v tomto projektu – detailně

Všechny čtyři implementované varianty sdílejí stejný hlasový dialog: rozpoznávání řeči v prohlížeči, odpověď z AI (Gemini nebo ChatGPT), přečtení odpovědi hlasem, volitelná uvítací zpráva, výběr hlasu, barevné motivy a idle režim (prezentace atrakcí při nečinnosti). Liší se jen tím, jak vypadá a pohybuje se postava na obrazovce.

V projektu jsou čtyři implementované varianty: základní SVG hlava, animovaná postava Rive, anime styl Live2D a fotorealistické video D-ID – každá má vlastní exponát; společné nastavení avatara je v administraci (sekce Avatary).

Nejlehčí

A – Základní SVG hlava

Statická vektorová hlava na obrazovce. Žádné video, žádné externí knihovny – minimum nároků na hardware i údržbu.

Co umí:

  • Hlasový dialog – stejný tok jako u ostatních variant (ptát se, dostat odpověď, slyšet ji)
  • Stavový řádek: připraveno, poslouchám, přemýšlím, mluvím, chyba
  • Animace úst při TTS – elipsa „úst“ se rytmicky mění podle mluvení
  • Vizuální indikace poslechu (zvýraznění scény při aktivním mikrofonu)
  • Volitelný idle režim – při nečinnosti mluví texty atrakcí, ústa se animují stejně

Jak se pohybuje:

  • Idle – hlava je statická, žádné mrkání ani gesta
  • Poslouchá – jen změna stavu UI, postava se nehýbe
  • Přemýšlí – čekání na AI, opět bez pohybu těla
  • Mluví – pulzující ústa synchronizované s TTS (ne s fonémy, jen rytmus)

Kdy použít: rychlý pilot, interní test, horizontální monitor u stolu, slabší PC, situace kde stačí „mluvící ikona“ a nepotřebujete celou postavu. Viz Monitor – koncept a rozložení – na výšku postava působí prázdně.

Doporučeno pro kiosk

C – Rive (animovaná postava)

Vektorová celá postava vykreslená knihovnou Rive. Animace běží lokálně v prohlížeči – žádné generování videa, okamžitá reakce na stavy dialogu.

Co umí:

  • Vše ze základní varianty + bohatší vizuál a výběr postav (picker maskotů); názvy v pickeru se lokalizují podle vlajky – jazyk exponátu
  • Přednastavené postavy: asistent, maskoti, kočka, pes, mráček, chodec, lip-sync postava aj.
  • Vlastní soubor .riv – lze nahradit nebo doplnit vlastní animaci z editoru Rive
  • Čtyři režimy avatara: idle, poslouchá, přemýšlí, mluví
  • Uvítání – volitelná animace mávnutí / pozdravu při startu exponátu
  • Při mluvení pulz výrazů a opakované spouštění „mluvících“ animací (lip-sync styl)
  • Konfigurovatelné názvy animací a state machine v administraci
  • Idle režim – postava mluví texty atrakcí a přepíná se do stavu „mluví“

Jak se pohybuje:

  • Idle – dýchání, mírný pohyb, smyčka klidu (záleží na konkrétním .riv souboru)
  • Poslouchá – naklonění, pozorný pohled, gesto „naslouchám“ (triggery / booleany ve state machine)
  • Přemýšlí – výraz zamyšlení, čekání na odpověď AI
  • Mluví – animace úst a gest, střídání výrazů každých ~280 ms pro živější dojem
  • Pozdrav – jednorázové mávnutí nebo uvítací animace po klepnutí na start
  • U postavy „Chodec“ – chůze a odpočinek; u maskotů – více výrazů (až 6 u mráčku)

Kdy použít: vertikální kiosk, muzeum, DV, veřejný prostor – nejlepší poměr efekt / cena / rychlost. Funguje i na horizontálním monitoru (postava v menším měřítku). Vhodné pro děti i dospělé, když nepotřebujete fotorealismus.

Anime styl

C – Live2D (animovaná postava)

Celá postava vykreslená knihovnou Live2D Cubism – typický anime / manga vzhled. Animace běží lokálně v prohlížeči (PixiJS), bez generování videa – samostatný exponát s anime postavou.

Co umí:

  • Stejný hlasový dialog jako Rive a D-ID
  • Výběr postavy návštěvníkem – picker v patičce exponátu (názvy postav v jazyce zvolené vlajky)
  • Přednastavené ukázkové modely zdarma: Mark (chlapec), Natori (muž), Haru a Shizuku (ženské postavy)
  • Vlastní model – export složky runtime z Cubism Editoru do assets/live2d/
  • Čtyři režimy avatara: idle, poslouchá, přemýšlí, mluví
  • Při mluvení pulz úst (parametr ParamMouthOpenY) a volitelné motion skupiny
  • Konfigurace v administraci: cesta k modelu, motion názvy, parametr úst, výběr postav v config.json
  • Instalace modelů: skript tools/install-live2d.ps1

Jak se pohybuje:

  • Idle – klidová smyčka motion skupiny (např. Idle)
  • Poslouchá – mírné naklonění hlavy / těla (parametry úhlu)
  • Přemýšlí – výraz zamyšlení, čekání na AI
  • Mluví – animace úst synchronizované s TTS (rytmický pulz, ne fonémy)
  • Pozdrav – volitelná motion skupina (např. Tap, TapBody)

Kdy použít: vertikální kiosk, kde chcete anime / japonský styl místo vektorových maskotů Rive. Vhodné pro mladší návštěvníky, herní expozice, fanouškovské instalace. Ukázkové modely jsou zdarma pod Live2D Free Material License; vlastní modely z editoru vyžadují ověření licence při komerčním provozu.

Nejrealističtější

E – D-ID (fotorealistické video)

Tvář z fotografie (výchozí prezentérka nebo vlastní snímek) – každá odpověď se vygeneruje jako krátké video s přesnou synchronizací rtů a hlasem.

Co umí:

  • Stejný hlasový dialog; text odpovědi generuje Gemini/OpenAI, video + hlas zajišťuje D-ID API
  • Vlastní portrét – URL fotografie v nastavení (did_source_url)
  • Český hlas Microsoft neural (např. Vlasta) přes did_voice_id
  • Mezi odpověďmi statický poster (fotka), při odpovědi přehrání videa
  • Indikátor generování („Generuji video avatara…“) – návštěvník vidí, že se něco děje
  • Idle režim nepoužívá D-ID video – šetří kredity, mluví běžné TTS

Jak se pohybuje:

  • Idle / čekání – statický portrét (žádný pohyb)
  • Poslouchá – stále statická fotka, aktivní jen mikrofon a stavový text
  • Přemýšlí – portrét + loader; paralelně běží AI a příprava videa
  • Mluví – přehrává se vygenerované video: pohyb rtů, mírný pohyb hlavy, výraz podle řeči
  • Žádné celé tělo – typicky busta od ramen; ruce a chůze ve videu nejsou
  • Zpoždění 2–10+ s podle délky odpovědi a zatížení API (na rozdíl od okamžité Rive animace)

Kdy použít: reprezentativní instalace, úřad, banka, prezentace kde má průvodce vypadat jako skutečná osoba (kurátor, recepční, mascott z fotky ředitele). Horizontální monitor i vertikální kiosk – v portrétu busta, na šířku velký obličej. Počítejte s provozními náklady – viz D-ID – náklady.

Stavy avatara během rozhovoru

Všechny varianty procházejí stejným dialogovým cyklem. Rozdíl je v tom, jak bohatě na to reaguje vizuál.

Stav Co se děje SVG hlava Rive Live2D D-ID
Start / idle Exponát čeká na klepnutí, pak uvítání Statická hlava Klidová smyčka; volitelné mávnutí Klidová motion smyčka Poster (fotka)
Poslouchá Mikrofon zachytává otázku návštěvníka Zvýraznění scény Animace pozornosti, naklonění Naklonění hlavy, stav „Poslouchám…“ Poster + stav „Poslouchám…“
Přemýšlí AI generuje odpověď Text „Přemýšlím…“ Výraz čekání / zamyšlení Výraz zamyšlení Loader + příprava videa na serveru D-ID
Mluví Přehrání odpovědi (TTS nebo video) Pulzující ústa Animace mluvení, gesta, výrazy Pulz úst + motion mluvení Video s lip-sync
Idle prezentace Po nečinnosti mluví o atrakcích / stránkách Ústa při TTS Stav „mluví“ u každé stránky Stav „mluví“ + pulz úst při TTS TTS bez D-ID videa (úspora kreditů)

Kdy kterou variantu zvolit

Situace Doporučení Proč
Vertikální kiosk, celá postava Rive nebo Live2D Plná výška obrazovky, okamžitá animace, bez poplatků za video; Live2D pro anime styl
Fotorealistický „živý“ člověk D-ID Nejvyšší realismus tváře; vhodné pro formální instituce
Stolní monitor, rychlý pilot SVG nebo Rive (busta) Minimum konfigurace; Rive i jako menší postava na šířku
Dětská expozice, maskot Rive (kočka, pes, mráček…) nebo Live2D Výrazné postavy, gesta, emoce; Rive = maskoti, Live2D = anime postavy
Mužský / ženský avatar na výběr Live2D Mark (chlapec), Natori (muž), Haru a Shizuku (ženy) – výběr v pickeru na Live2D exponátu
Veletrh, omezený rozpočet Rive nebo SVG Žádné kredity za video; D-ID by rychle spotřebovalo trial
Vysoký provoz 10+ h / den Rive Stabilní odezva; u D-ID rostou náklady s počtem odpovědí
Vlastní brandovaná postava Rive (.riv) nebo Live2D (.model3.json) Rive: editor zdarma; Live2D: Cubism Editor + export runtime složky
Existující foto ředitele / průvodce D-ID Stačí jedna kvalitní fotka portrétu, žádná 3D modelace

Další možnosti (zatím mimo projekt)

V přehledové tabulce jsou i technologie, které projekt zatím neobsahuje, ale dávají smysl při rozšiřování:

  • B – Fotka + jednoduchý lip-sync – levná alternativa k D-ID; slabší realismus, vhodné pro prototyp.
  • Lottie – krátké přednastavené animace z After Effects; horší pro interaktivního průvodce než Rive/Live2D.
  • HeyGen E – talking head – konkurence k D-ID (busta); API bez free trial, integrace pouze placený vývoj na zakázku.
  • HeyGen F – full-body video – realistická postava v celé výšce; v projektu není, API bez free trial, integrace pouze placený vývoj na zakázku (viz HeyGen full-body výše).
Shrnutí: Pro většinu kiosků na výšku volte Rive – celá postava, bohatý pohyb, okamžitá odezva, bez poplatků za video. Chcete-li anime styl a výběr mužských i ženských postav, použijte Live2D. D-ID přidejte tam, kde je prioritou fotorealismus a akceptujete prodlevu generování a měsíční náklady. SVG nechte na piloty a horizontální nasazení. Volitelně zapněte komiksovou bublinu pro zobrazení tabulek a seznamů nad postavou (ceny, srovnání, info z webu). Rozložení na obrazovce popisuje kapitola Monitor – koncept a rozložení; konkrétní doporučení pro váš případ je v kapitole Doporučení. Další postavy z internetu: kapitola 3 – Kde sehnat další avatary.