Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
educare:sphinx-2 [2013/07/22 12:02]
profpro [appunti su Sphinx2]
educare:sphinx-2 [2018/04/25 07:55] (current)
Line 1: Line 1:
 ====== Appunti su Sphinx2 ====== ====== Appunti su Sphinx2 ======
 ==== Descrizione ====  ==== Descrizione ==== 
-Sphinx2 non è un programma utilizzabile,​ ma un insieme di funzioni che permettono di realizzare sistemi di riconoscimento vocale. Ogni programma che utilizza le librerie Sphinx2 all'​avvio deve ottenere alcune informazioni:​  +Sphinx2 non è un programma ​immediatamente ​utilizzabile,​ ma un insieme di funzioni che permettono di realizzare sistemi di riconoscimento vocale. Ogni programma che utilizza le librerie Sphinx2 all'​avvio deve ottenere alcune informazioni:​  
-  * un Dizionario delle parole(.dic):​ ad ogni parola corrisponde una sequenza di fonemi. +  * un Dizionario delle parole (file.dic): ad ogni parola corrisponde una sequenza di fonemi. 
-  * un MA (Modello Acustico) (es: tipo semicontinuo) generato dal trainer per ogni lingua, contiene le statistiche dei fonemi di ogni lingua ed è costituito da alcuni(?) dei seguenti tipi di file: .vec .var .ccode .d2code .p3code .xcode .chmm+  * un Modello Acustico ​(MA) (es: tipo semicontinuo) generato dal trainer per ogni lingua, contiene le statistiche dei fonemi di ogni lingua ed è costituito da alcuni(?) dei seguenti tipi di file: .vec .var .ccode .d2code .p3code .xcode .chmm
     * il trainer genera un MA in formato Sphinx3 che deve essere convertito per Sphinx2     * il trainer genera un MA in formato Sphinx3 che deve essere convertito per Sphinx2
-  * un ML (Modello di Lingua).lm: combina (di solito) tre fonemi alla volta (trigrammi) a formare le stesse parole del Dizionario.+  * un Modello di Lingua ​(ML(file.lm): combina (di solito) tre fonemi alla volta (trigrammi) a formare le stesse parole del Dizionario.
 Il vocabolario delle parole riconoscibili è dato dall'​intersezione del Dizionario e del Modello di Lingua. Ogni pronuncia (parola o frase) può durare solo 60 sec. Il vocabolario delle parole riconoscibili è dato dall'​intersezione del Dizionario e del Modello di Lingua. Ogni pronuncia (parola o frase) può durare solo 60 sec.
  
  • educare/sphinx-2.txt
  • Last modified: 2018/04/25 07:55
  • (external edit)