
關(guān)于pdf識別流程(建議本身是圖片的pdf文檔使用該軟件):
1.pdf轉(zhuǎn)換成圖片。
2.圖片OCR成文字。
關(guān)于排版:
1.支持自動分段。
2.界面上有個強(qiáng)制分段的滑塊,表示一個閥值,當(dāng)識別的一行的文本個數(shù)小于該數(shù)值時,強(qiáng)制分段。
由于時間原因,該軟件僅僅進(jìn)行接口維護(hù)。
1.1更新
1.優(yōu)化了下排版接口。
2.增加了工作區(qū)域滾動條。
1.2更新
1.支持tif格式圖片
2.增加了工作區(qū)域可以進(jìn)行Ctrl+↑或Ctrl+↓進(jìn)行移動,同時可以進(jìn)行拖動方便排版。
3.對于導(dǎo)入的文檔順序進(jìn)行了部分優(yōu)化。
使用方法:
1.選擇目錄或者拖入文件。
2.選擇word配置。
3.點(diǎn)擊識別按鈕。
4.等待識別完成。
5.對于表格區(qū)域,按住Ctrl+上鍵(下鍵)可以進(jìn)行移動。
滑塊作用:更改某行文本小于某個數(shù)值時強(qiáng)制分段