User Tools

Site Tools


educare:tesseract

tesseract

prende una foto digitale .tif e ne estrae caratteri alfabetici sul computer

Può essere usato in combinazione con altri programmi per:

  1. scansionare o digitalizzare il testo su carta (sane)
  2. trasformare l'immagine in scala di grigi (graphics_magick-imagemagick)
  3. trasformarlo in caratteri alfabetici sul computer (tesseract)
  4. ascoltare una volce che lo legge (festival)

Esempio:

gm convert -colorspace Gray input.jpg output.tif
tesseract fileinput.tif fileoutput.txt -l ita

oppure uno script per trasformare, in un solo colpo, un gruppo di immagini

for i in *.tif; do tesseract "$i" "$i".txt -l ita; done
educare/tesseract.txt · Last modified: 2020/06/08 22:20 by 127.0.0.1