Obsah · Kapitola 10 · Mikrofon a zvuk

Mikrofon a zvuk

← Kapitola 10: Technické požadavky

U hlasového exponátu je nejčastější problém „nerozumí mi“ – zřídka chyba AI, častěji špatný signál z mikrofonu nebo ozvěna z reproduktorů. Níže srovnání pro rozhodnutí při nákupu hardware.

Vstup – rozpoznávání řeči (STT)

Jazyk rozpoznávání na kiosku odpovídá zvolené vlajce (CS, EN, DE, PL, SK) – viz Jazyk exponátu. Před nasazením cizího jazyka otestujte STT na stejném hardware a prohlížeči jako v provozu.

Volba Lepší pro kiosk? Důvod
Chrome / Edge na Windows Ano – nejlepší Nejspolehlivější české STT v prohlížeči; žádný extra API klíč
Chromium na Raspberry Pi Možné, s rezervou STT češtiny bývá horší než na Windows; před spuštěním otestujte reálnými otázkami
USB směrový mikrofon Ano Bere hlas návštěvníka, potlačuje hluk z místnosti a částečně i z reproduktorů
Vestavěný mikrofon v monitoru Jen pro tiché testování Často u reproduktorů → ozvěna; v hlučném vestibulu špatné rozpoznání
Mikrofon pod reproduktorem Ne Asistent „slyší“ vlastní odpověď a STT se zacyklí nebo přepíše otázku
Barge-in (přerušení odpovědi) Zapnuto v hlučném provozu Návštěvník může mluvit přes odpověď; vyžaduje kvalitní mikrofon a rozumnou hlasitost

Výstup – mluvení odpovědi (TTS)

TTS engine (admin) Kvalita češtiny Náklady Kdy zvolit
Gemini TTS Velmi dobrá, přirozená Placený tarif (free často limit) Hlavní doporučení pro veřejný provoz s Gemini chatem
OpenAI TTS (gpt-4o-mini-tts / tts-1) Velmi dobrá Placené API Při ai_provider: openai nebo když Gemini TTS není dostupné
Prohlížeč (browser) Slabší, monotónní 0 Kč Testování, free tarif bez TTS kvóty; na Pi často horší než na Windows

Praktické pravidlo: pokud návštěvníci říkají „špatně slyším“, řešte reproduktory a hlasitost. Pokud říkají „nerozumí mi“, řešte mikrofon a ozvěnu. Pokud zní roboticky, přepněte z browser na Gemini/OpenAI TTS.

Doporučené kombinace (shrnutí)

Nejlevnější (test / malý provoz)

Windows PC + Chrome + vestavěný mikrofon + Gemini free chat + TTS prohlížeče.

Limit: horší hlas a STT v hluku.

Vyvážená (doporučeno)

Windows mini PC + Chrome kiosk + USB směrový mikrofon + externí repro + Gemini chat + Gemini TTS (placený tarif).

Proč: nejlepší poměr cena / spolehlivost hlasu pro celodenní provoz.

Kompaktní (Raspberry Pi)

Pi 5 (4 GB+) + Chromium kiosk + USB mikrofon + cloud TTS (ne browser).

Pozor: před instalací otestujte české STT na konkrétním Pi – může být slabší než na Windows.