Mikrofon a zvuk
← Kapitola 10: Technické požadavky
U hlasového exponátu je nejčastější problém „nerozumí mi“ – zřídka chyba AI, častěji špatný signál z mikrofonu nebo ozvěna z reproduktorů. Níže srovnání pro rozhodnutí při nákupu hardware.
Vstup – rozpoznávání řeči (STT)
Jazyk rozpoznávání na kiosku odpovídá zvolené vlajce (CS, EN, DE, PL, SK) – viz Jazyk exponátu. Před nasazením cizího jazyka otestujte STT na stejném hardware a prohlížeči jako v provozu.
| Volba | Lepší pro kiosk? | Důvod |
|---|---|---|
| Chrome / Edge na Windows | Ano – nejlepší | Nejspolehlivější české STT v prohlížeči; žádný extra API klíč |
| Chromium na Raspberry Pi | Možné, s rezervou | STT češtiny bývá horší než na Windows; před spuštěním otestujte reálnými otázkami |
| USB směrový mikrofon | Ano | Bere hlas návštěvníka, potlačuje hluk z místnosti a částečně i z reproduktorů |
| Vestavěný mikrofon v monitoru | Jen pro tiché testování | Často u reproduktorů → ozvěna; v hlučném vestibulu špatné rozpoznání |
| Mikrofon pod reproduktorem | Ne | Asistent „slyší“ vlastní odpověď a STT se zacyklí nebo přepíše otázku |
| Barge-in (přerušení odpovědi) | Zapnuto v hlučném provozu | Návštěvník může mluvit přes odpověď; vyžaduje kvalitní mikrofon a rozumnou hlasitost |
Výstup – mluvení odpovědi (TTS)
| TTS engine (admin) | Kvalita češtiny | Náklady | Kdy zvolit |
|---|---|---|---|
| Gemini TTS | Velmi dobrá, přirozená | Placený tarif (free často limit) | Hlavní doporučení pro veřejný provoz s Gemini chatem |
OpenAI TTS (gpt-4o-mini-tts / tts-1) |
Velmi dobrá | Placené API | Při ai_provider: openai nebo když Gemini TTS není dostupné |
Prohlížeč (browser) |
Slabší, monotónní | 0 Kč | Testování, free tarif bez TTS kvóty; na Pi často horší než na Windows |
Praktické pravidlo: pokud návštěvníci říkají „špatně slyším“, řešte reproduktory a hlasitost.
Pokud říkají „nerozumí mi“, řešte mikrofon a ozvěnu. Pokud zní roboticky, přepněte z
browser na Gemini/OpenAI TTS.
Doporučené kombinace (shrnutí)
Nejlevnější (test / malý provoz)
Windows PC + Chrome + vestavěný mikrofon + Gemini free chat + TTS prohlížeče.
Limit: horší hlas a STT v hluku.
Vyvážená (doporučeno)
Windows mini PC + Chrome kiosk + USB směrový mikrofon + externí repro + Gemini chat + Gemini TTS (placený tarif).
Proč: nejlepší poměr cena / spolehlivost hlasu pro celodenní provoz.
Kompaktní (Raspberry Pi)
Pi 5 (4 GB+) + Chromium kiosk + USB mikrofon + cloud TTS (ne browser).
Pozor: před instalací otestujte české STT na konkrétním Pi – může být slabší než na Windows.