La vedo dura...
(Asterisk/Freeswitch/Elastix) + (CMU Sphinx [per la parte di riconoscimento vocale "Speech-To-Text"]) + (UniMRCP [via MRCP Server])...ma è un progetto mica da ridere.
Non so se con HiPath Xpressions (ed intendo proprio il Server HiPath Xpressions non il modulo IVM per la serie HiPath 3000...) puoi fare una cosa "relativamente economica" (dove "relativamente" diviene qui un eufemismo...ergo...normalmente costoso per una azienda che basa tutto sulla comunicazione vocale diviene costosissimo per un ristorante!)...e anche con soluzioni puramente software non è uno scherzo in termini di setup Software e necessità Hardware (almeno una macchina per Asterisk/Freeswitch/Elastix ti serve).
Saluti E BUONA FORTUNA,
Kimera.