首页 PaddleOCR 帖子详情
paddleocr如何设置使用ch_ppocr_server_v2.0_rec_pre模型
收藏
快速回复
PaddleOCR 问答OCR 1418 0
paddleocr如何设置使用ch_ppocr_server_v2.0_rec_pre模型
收藏
快速回复
PaddleOCR 问答OCR 1418 0
from paddleocr import PaddleOCR

imgN = imgDst[top:bottom, left:right]

ocr = PaddleOCR(use_angle_cls=False)
ocrText = ocr.ocr(imgN, det=False, cls=False)
print(’日期----->’, ocrText[0][0])

以上代码是按照demo写的,运行结果只能识别部分数字和符号,手写字大部分无法识别。比如手写20220410,识别成2020u10

[2022/04/25 13:13:25] ppocr DEBUG: Namespace(alpha=1.0, benchmark=False, beta=1.0, cls_batch_num=6, cls_image_shape='3, 48, 192', cls_model_dir='C:\\Users\\flash/.paddleocr/whl\\cls\\ch_ppocr_mobile_v2.0_cls_infer', cls_thresh=0.9, cpu_threads=10, crop_res_save_dir='./output', det=True, det_algorithm='DB', det_db_box_thresh=0.6, det_db_score_mode='fast', det_db_thresh=0.3, det_db_unclip_ratio=1.5, det_east_cover_thresh=0.1, det_east_nms_thresh=0.2, det_east_score_thresh=0.8, det_fce_box_type='poly', det_limit_side_len=960, det_limit_type='max', det_model_dir='C:\\Users\\flash/.paddleocr/whl\\det\\ch\\ch_PP-OCRv2_det_infer', det_pse_box_thresh=0.85, det_pse_box_type='quad', det_pse_min_area=16, det_pse_scale=1, det_pse_thresh=0, det_sast_nms_thresh=0.2, det_sast_polygon=False, det_sast_score_thresh=0.5, draw_img_save_dir='./inference_results', drop_score=0.5, e2e_algorithm='PGNet', e2e_char_dict_path='./ppocr/utils/ic15_dict.txt', e2e_limit_side_len=768, e2e_limit_type='max', e2e_model_dir=None, e2e_pgnet_mode='fast', e2e_pgnet_score_thresh=0.5, e2e_pgnet_valid_set='totaltext', enable_mkldnn=False, fourier_degree=5, gpu_mem=500, help='==SUPPRESS==', image_dir=None, ir_optim=True, label_list=['0', '180'], lang='ch', layout_label_map=None, layout_path_model='lp://PubLayNet/ppyolov2_r50vd_dcn_365e_publaynet/config', max_batch_size=10, max_text_length=25, min_subgraph_size=15, mode='structure', ocr_version='PP-OCRv2', output='./output', precision='fp32', process_id=0, rec=True, rec_algorithm='CRNN', rec_batch_num=6, rec_char_dict_path='C:\\Anaconda3\\envs\\pocr\\lib\\site-packages\\paddleocr\\ppocr\\utils\\ppocr_keys_v1.txt', rec_image_shape='3, 32, 320', rec_model_dir='C:\\Users\\flash/.paddleocr/whl\\rec\\ch\\ch_PP-OCRv2_rec_infer', save_crop_res=False, save_log_path='./log_output/', scales=[8, 16, 32], show_log=True, structure_version='STRUCTURE', table_char_dict_path=None, table_char_type='en', table_max_len=488, table_model_dir=None, total_process_num=1, type='ocr', use_angle_cls=False, use_dilation=False, use_gpu=False, use_mp=False, use_onnx=False, use_pdserving=False, use_space_char=True, use_tensorrt=False, vis_font_path='./doc/fonts/simfang.ttf', warmup=False)        
日期 -----> 2020u10

查看运行结果时发现有rec_char_dect_path和rec_model_dir两个选项

问题1:如果已知imgN中只有数字(比如日期,编号),如何才能设置只识别数字从而提高识别率(可否通过更改字典文件做到)即更改rec_char_dict_path='C:\\Anaconda3\\envs\\pocr\\lib\\site-packages\\paddleocr\\ppocr\\utils\\ppocr_keys_v1.txt',如果可以,需要如何改代码?;

问题2:默认使用预测模型是ch_PP-OCRv2_rec_infer,如何替换其他预训练模型?

0
收藏
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户