TextSnatch是一种轻巧的Python工具,可让您使用Tesseract OCR从图像(JPG,PNG)和扫描PDF中提取文本。它支持文本输出INTXT ORCSV和使用OpenCV的基本图像清理。