educare:sphinx-2
Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
educare:sphinx-2 [2013/06/17 21:05] – external edit 127.0.0.1 | educare:sphinx-2 [2020/06/08 22:20] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ====== Appunti su Sphinx2 ====== | ||
+ | ==== Descrizione ==== | ||
+ | Sphinx2 non è un programma immediatamente utilizzabile, | ||
+ | * un Dizionario delle parole (file.dic): ad ogni parola corrisponde una sequenza di fonemi. | ||
+ | * un Modello Acustico (MA) (es: tipo semicontinuo) generato dal trainer per ogni lingua, contiene le statistiche dei fonemi di ogni lingua ed è costituito da alcuni(?) dei seguenti tipi di file: .vec .var .ccode .d2code .p3code .xcode .chmm | ||
+ | * il trainer genera un MA in formato Sphinx3 che deve essere convertito per Sphinx2 | ||
+ | * un Modello di Lingua (ML) (file.lm): combina (di solito) tre fonemi alla volta (trigrammi) a formare le stesse parole del Dizionario. | ||
+ | Il vocabolario delle parole riconoscibili è dato dall' | ||
+ | |||
+ | Sphinx2 può essere usato in 2 modalità: | ||
+ | * batch-mode | ||
+ | * live-mode | ||
+ | Ognuna delle quali può decodificare con due tecniche | ||
+ | * time-aling (disponibile solo in batch mode) | ||
+ | * allphone (disponibile solo per file audio?) | ||
+ | |||
+ | |||
+ | ==== Il comando (live-mode) ==== | ||
+ | questo comando funziona ma riconosce solo il 10% delle parole | ||
+ | < | ||
+ | questo non funziona bene | ||
+ | < | ||
+ | sphinx2-continuous \ | ||
+ | | ||
+ | -lmfn model/ | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | -live \ | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | -top 1 \ | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | -ugwt 0.7 \ | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | < | ||
+ | < | ||
+ | FATAL_ERROR: | ||
+ | |||
+ | l' | ||
+ | |||
+ | |||
+ | ==== Le API ==== | ||
+ | Ci sono 3 tipi di API, ogni tipo possiede un diverso livello di astrazione: | ||
+ | * per l' | ||
+ | * per l' | ||
+ | * il programma decoder (the core decoder itself) | ||
+ | * fbs_init() specifica i modelli e gli argomenti necessari all' | ||
+ | * fbs_end() chiude l' |