본문 바로가기
개발노트

tesseract OCR 학습 순서

by 학수씨 2017. 12. 25.

boxdata 만들기

tesseract.exe aaa.numfont.exp3.tif aaa.numfont.exp3 batch.nochop makebox



학습진행

tesseract.exe aaa.numfont.exp3.tif aaa.numfont.exp3 nobatch box.train


////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////


unicharset파일이 생성

unicharset_extractor.exe aaa.numfont.exp0.box aaa.numfont.exp1.box aaa.numfont.exp2.box aaa.numfont.exp3.box aaa.numfont.exp4.box aaa.numfont.exp5.box



클러스터링

mftraining.exe -F font_properties -U unicharset -O aaa.unicharset aaa.numfont.exp0.tr aaa.numfont.exp1.tr aaa.numfont.exp2.tr aaa.numfont.exp3.tr aaa.numfont.exp4.tr aaa.numfont.exp5.tr


cntraining.exe aaa.numfont.exp0.tr aaa.numfont.exp1.tr aaa.numfont.exp2.tr aaa.numfont.exp3.tr aaa.numfont.exp4.tr aaa.numfont.exp5.tr




파일 이름 변경

unicharset -> aaa.unicharset

normproto -> aaa.normproto

pffmtable -> aaa.pffmtable

inttemp -> aaa.inttemp



combine_tessdata.exe aaa.


'개발노트' 카테고리의 다른 글

Screen Text OCR  (13) 2015.02.17

댓글