Obsah · kapitola 10

10 Technické požadavky vertikálního kiosku

Exponát není náročná aplikace na výkon serveru – většina práce probíhá v prohlížeči (mikrofon, přehrávání) a v cloudu (AI chat, TTS). Lokální PHP jen předává požadavky a drží konfiguraci. Pro spolehlivý hlasový provoz proto rozhoduje hlavně mikrofon, reprodukce a prohlížeč, ne výkon CPU.

Tři vrstvy provozu:
  1. STT (řeč → text) – vždy prohlížeč (Web Speech API), zdarma, kvalita závisí na Chrome/Edge a češtině.
  2. Chat (odpověď) – Gemini nebo OpenAI API přes serverovou vrstvu.
  3. TTS (text → hlas) – Gemini TTS, OpenAI TTS nebo záložní hlas prohlížeče (viz admin tts_engine).

Podrobnosti jsou rozděleny do samostatných stránek výše. Pro rychlý start doporučujeme doporučený provoz a mikrofon a zvuk – tam bývá nejvíc problémů v reálném provozu.