Možnosti avatara – AI-EXPO.eu

2 Možnosti avatara – postava v plné velikosti

Vizuál avatara určuje, jak návštěvník vnímá exponát – zda jde o jednoduchou nápovědu, živého maskota nebo „skutečného“ průvodce. V tomto projektu jsou čtyři hotové varianty (základní SVG, animovaná postava Rive, anime styl Live2D, fotorealistické video D-ID). Níže je srovnání všech možností na trhu; u implementovaných variant popisujeme detailně, co umí, jak se pohybuje a kde dává smysl.

Varianta	Vzhled	Mimika (oči, ústa, výraz)	Postava celá?	V projektu	Test zdarma?
A – Základní SVG	Jednoduchá kreslená hlava	Jen pohyb úst při mluvení	Ne – jen hlava	Ano	Ano
B – Fotka / video + lip-sync	Statický portrét nebo krátká smyčka	Slabá – hlavně ústa podle zvuku	Částečně (busta)	Ne	Ano (obecně)
C – Rive	Stylizovaná animovaná postava	Dobrá – mrkání, ústa, gesta, emoce	Ano – celá postava	Ano	Ano
C – Live2D	Stylizovaná animovaná postava (anime styl)	Dobrá – mrkání, ústa, gesta, emoce	Ano – celá postava	Ano	Ano ukázkové modely zdarma
C – Lottie	Stylizovaná animovaná postava	Střední – přednastavené animace	Ano – záleží na assetu	Ne	Částečně editor zdarma, assety placené
E – D-ID	Fotorealistická tvář z fotky	Velmi dobrá synchronizace rtů ve videu	Obvykle busta, ne celé tělo	Ano	Trial kredity
E – HeyGen talking head	Fotorealistická tvář	Velmi dobrá synchronizace rtů	Obvykle busta	Ne	Ne API placené
F – AI video postava (HeyGen full body)	Realistická postava ve videu	Velmi dobrá	Ano	Ne	Ne API placené

HeyGen (talking head i full-body video) v tomto projektu není implementováno. HeyGen API nemá bezplatný trial pro automatický kiosk (kredity od cca 5 USD, platba za sekundy videa). Integrace do exponátu je možná pouze jako placený vývoj na zakázku; pro fotorealistickou ukázku zdarma použijte hotovou variantu D-ID s trial kredity.

HeyGen full-body – varianta F (není v projektu)

Varianta F – AI video postava (HeyGen full body) zobrazuje realistickou postavu v celé výšce (ne jen bustu jako u D-ID). HeyGen generuje krátké video z textu odpovědi – podobný princip jako u varianty D-ID, ale s možností studio avatarů s celým tělem vhodných pro vertikální monitor.

V tomto projektu není – žádná stránka typu heygen.php, žádné nastavení v administraci.
Integrace pouze placený vývoj na zakázku – napojení API, přehrávání videí v dialogu, odhad nákladů na provoz.
API bez free trial – od února 2026 HeyGen neposkytuje bezplatné API kredity; start od cca 5 USD pay-as-you-go, platba za sekundy vygenerovaného videa.
Webový Free plán HeyGen (ruční tvorba ve studiu, cca 3 videa/měsíc) nelze použít pro automatický kiosk v této aplikaci.
Zdarma v projektu pro celou postavu: Rive nebo Live2D (stylizované). Pro fotorealismus s trial kredity: D-ID (typicky busta).

Varianty v tomto projektu – detailně

Všechny čtyři implementované varianty sdílejí stejný hlasový dialog: rozpoznávání řeči v prohlížeči, odpověď z AI (Gemini nebo ChatGPT), přečtení odpovědi hlasem, volitelná uvítací zpráva, výběr hlasu, barevné motivy a idle režim (prezentace atrakcí při nečinnosti). Liší se jen tím, jak vypadá a pohybuje se postava na obrazovce.

V projektu jsou čtyři implementované varianty: základní SVG hlava, animovaná postava Rive, anime styl Live2D a fotorealistické video D-ID – každá má vlastní exponát; společné nastavení avatara je v administraci (sekce Avatary).

Nejlehčí

A – Základní SVG hlava

Statická vektorová hlava na obrazovce. Žádné video, žádné externí knihovny – minimum nároků na hardware i údržbu.

Co umí:

Hlasový dialog – stejný tok jako u ostatních variant (ptát se, dostat odpověď, slyšet ji)
Stavový řádek: připraveno, poslouchám, přemýšlím, mluvím, chyba
Animace úst při TTS – elipsa „úst“ se rytmicky mění podle mluvení
Vizuální indikace poslechu (zvýraznění scény při aktivním mikrofonu)
Volitelný idle režim – při nečinnosti mluví texty atrakcí, ústa se animují stejně

Jak se pohybuje:

Idle – hlava je statická, žádné mrkání ani gesta
Poslouchá – jen změna stavu UI, postava se nehýbe
Přemýšlí – čekání na AI, opět bez pohybu těla
Mluví – pulzující ústa synchronizované s TTS (ne s fonémy, jen rytmus)

Kdy použít: rychlý pilot, interní test, horizontální monitor u stolu, slabší PC, situace kde stačí „mluvící ikona“ a nepotřebujete celou postavu. Viz Monitor – koncept a rozložení – na výšku postava působí prázdně.

Doporučeno pro kiosk

C – Rive (animovaná postava)

Vektorová celá postava vykreslená knihovnou Rive. Animace běží lokálně v prohlížeči – žádné generování videa, okamžitá reakce na stavy dialogu.

Co umí:

Vše ze základní varianty + bohatší vizuál a výběr postav (picker maskotů); názvy v pickeru se lokalizují podle vlajky – jazyk exponátu
Přednastavené postavy: asistent, maskoti, kočka, pes, mráček, chodec, lip-sync postava aj.
Vlastní soubor .riv – lze nahradit nebo doplnit vlastní animaci z editoru Rive
Čtyři režimy avatara: idle, poslouchá, přemýšlí, mluví
Uvítání – volitelná animace mávnutí / pozdravu při startu exponátu
Při mluvení pulz výrazů a opakované spouštění „mluvících“ animací (lip-sync styl)
Konfigurovatelné názvy animací a state machine v administraci
Idle režim – postava mluví texty atrakcí a přepíná se do stavu „mluví“

Jak se pohybuje:

Idle – dýchání, mírný pohyb, smyčka klidu (záleží na konkrétním .riv souboru)
Poslouchá – naklonění, pozorný pohled, gesto „naslouchám“ (triggery / booleany ve state machine)
Přemýšlí – výraz zamyšlení, čekání na odpověď AI
Mluví – animace úst a gest, střídání výrazů každých ~280 ms pro živější dojem
Pozdrav – jednorázové mávnutí nebo uvítací animace po klepnutí na start
U postavy „Chodec“ – chůze a odpočinek; u maskotů – více výrazů (až 6 u mráčku)

Kdy použít: vertikální kiosk, muzeum, DV, veřejný prostor – nejlepší poměr efekt / cena / rychlost. Funguje i na horizontálním monitoru (postava v menším měřítku). Vhodné pro děti i dospělé, když nepotřebujete fotorealismus.

Anime styl

C – Live2D (animovaná postava)

Celá postava vykreslená knihovnou Live2D Cubism – typický anime / manga vzhled. Animace běží lokálně v prohlížeči (PixiJS), bez generování videa – samostatný exponát s anime postavou.

Co umí:

Stejný hlasový dialog jako Rive a D-ID
Výběr postavy návštěvníkem – picker v patičce exponátu (názvy postav v jazyce zvolené vlajky)
Přednastavené ukázkové modely zdarma: Mark (chlapec), Natori (muž), Haru a Shizuku (ženské postavy)
Vlastní model – export složky runtime z Cubism Editoru do assets/live2d/
Čtyři režimy avatara: idle, poslouchá, přemýšlí, mluví
Při mluvení pulz úst (parametr ParamMouthOpenY) a volitelné motion skupiny
Konfigurace v administraci: cesta k modelu, motion názvy, parametr úst, výběr postav v config.json
Instalace modelů: skript tools/install-live2d.ps1

Jak se pohybuje:

Idle – klidová smyčka motion skupiny (např. Idle)
Poslouchá – mírné naklonění hlavy / těla (parametry úhlu)
Přemýšlí – výraz zamyšlení, čekání na AI
Mluví – animace úst synchronizované s TTS (rytmický pulz, ne fonémy)
Pozdrav – volitelná motion skupina (např. Tap, TapBody)

Kdy použít: vertikální kiosk, kde chcete anime / japonský styl místo vektorových maskotů Rive. Vhodné pro mladší návštěvníky, herní expozice, fanouškovské instalace. Ukázkové modely jsou zdarma pod Live2D Free Material License; vlastní modely z editoru vyžadují ověření licence při komerčním provozu.

Nejrealističtější

E – D-ID (fotorealistické video)

Tvář z fotografie (výchozí prezentérka nebo vlastní snímek) – každá odpověď se vygeneruje jako krátké video s přesnou synchronizací rtů a hlasem.

Co umí:

Stejný hlasový dialog; text odpovědi generuje Gemini/OpenAI, video + hlas zajišťuje D-ID API
Vlastní portrét – URL fotografie v nastavení (did_source_url)
Český hlas Microsoft neural (např. Vlasta) přes did_voice_id
Mezi odpověďmi statický poster (fotka), při odpovědi přehrání videa
Indikátor generování („Generuji video avatara…“) – návštěvník vidí, že se něco děje
Idle režim nepoužívá D-ID video – šetří kredity, mluví běžné TTS

Jak se pohybuje:

Idle / čekání – statický portrét (žádný pohyb)
Poslouchá – stále statická fotka, aktivní jen mikrofon a stavový text
Přemýšlí – portrét + loader; paralelně běží AI a příprava videa
Mluví – přehrává se vygenerované video: pohyb rtů, mírný pohyb hlavy, výraz podle řeči
Žádné celé tělo – typicky busta od ramen; ruce a chůze ve videu nejsou
Zpoždění 2–10+ s podle délky odpovědi a zatížení API (na rozdíl od okamžité Rive animace)

Kdy použít: reprezentativní instalace, úřad, banka, prezentace kde má průvodce vypadat jako skutečná osoba (kurátor, recepční, mascott z fotky ředitele). Horizontální monitor i vertikální kiosk – v portrétu busta, na šířku velký obličej. Počítejte s provozními náklady – viz D-ID – náklady.

Stavy avatara během rozhovoru

Všechny varianty procházejí stejným dialogovým cyklem. Rozdíl je v tom, jak bohatě na to reaguje vizuál.

Stav	Co se děje	SVG hlava	Rive	Live2D	D-ID
Start / idle	Exponát čeká na klepnutí, pak uvítání	Statická hlava	Klidová smyčka; volitelné mávnutí	Klidová motion smyčka	Poster (fotka)
Poslouchá	Mikrofon zachytává otázku návštěvníka	Zvýraznění scény	Animace pozornosti, naklonění	Naklonění hlavy, stav „Poslouchám…“	Poster + stav „Poslouchám…“
Přemýšlí	AI generuje odpověď	Text „Přemýšlím…“	Výraz čekání / zamyšlení	Výraz zamyšlení	Loader + příprava videa na serveru D-ID
Mluví	Přehrání odpovědi (TTS nebo video)	Pulzující ústa	Animace mluvení, gesta, výrazy	Pulz úst + motion mluvení	Video s lip-sync
Idle prezentace	Po nečinnosti mluví o atrakcích / stránkách	Ústa při TTS	Stav „mluví“ u každé stránky	Stav „mluví“ + pulz úst při TTS	TTS bez D-ID videa (úspora kreditů)

Kdy kterou variantu zvolit

Situace	Doporučení	Proč
Vertikální kiosk, celá postava	Rive nebo Live2D	Plná výška obrazovky, okamžitá animace, bez poplatků za video; Live2D pro anime styl
Fotorealistický „živý“ člověk	D-ID	Nejvyšší realismus tváře; vhodné pro formální instituce
Stolní monitor, rychlý pilot	SVG nebo Rive (busta)	Minimum konfigurace; Rive i jako menší postava na šířku
Dětská expozice, maskot	Rive (kočka, pes, mráček…) nebo Live2D	Výrazné postavy, gesta, emoce; Rive = maskoti, Live2D = anime postavy
Mužský / ženský avatar na výběr	Live2D	Mark (chlapec), Natori (muž), Haru a Shizuku (ženy) – výběr v pickeru na Live2D exponátu
Veletrh, omezený rozpočet	Rive nebo SVG	Žádné kredity za video; D-ID by rychle spotřebovalo trial
Vysoký provoz 10+ h / den	Rive	Stabilní odezva; u D-ID rostou náklady s počtem odpovědí
Vlastní brandovaná postava	Rive (`.riv`) nebo Live2D (`.model3.json`)	Rive: editor zdarma; Live2D: Cubism Editor + export runtime složky
Existující foto ředitele / průvodce	D-ID	Stačí jedna kvalitní fotka portrétu, žádná 3D modelace

Další možnosti (zatím mimo projekt)

V přehledové tabulce jsou i technologie, které projekt zatím neobsahuje, ale dávají smysl při rozšiřování:

B – Fotka + jednoduchý lip-sync – levná alternativa k D-ID; slabší realismus, vhodné pro prototyp.
Lottie – krátké přednastavené animace z After Effects; horší pro interaktivního průvodce než Rive/Live2D.
HeyGen E – talking head – konkurence k D-ID (busta); API bez free trial, integrace pouze placený vývoj na zakázku.
HeyGen F – full-body video – realistická postava v celé výšce; v projektu není, API bez free trial, integrace pouze placený vývoj na zakázku (viz HeyGen full-body výše).

Shrnutí: Pro většinu kiosků na výšku volte Rive – celá postava, bohatý pohyb, okamžitá odezva, bez poplatků za video. Chcete-li anime styl a výběr mužských i ženských postav, použijte Live2D. D-ID přidejte tam, kde je prioritou fotorealismus a akceptujete prodlevu generování a měsíční náklady. SVG nechte na piloty a horizontální nasazení. Volitelně zapněte komiksovou bublinu pro zobrazení tabulek a seznamů nad postavou (ceny, srovnání, info z webu). Rozložení na obrazovce popisuje kapitola Monitor – koncept a rozložení; konkrétní doporučení pro váš případ je v kapitole Doporučení. Další postavy z internetu: kapitola 3 – Kde sehnat další avatary.