TextsNatch는 TesserAct OCR을 사용하여 이미지 (JPG, PNG) 및 스캔 된 PDF에서 텍스트를 추출 할 수있는 경량 파이썬 도구입니다.텍스트 출력 intxt orcsv와 OpenCV를 사용한 기본 이미지 정리를 지원합니다.