TextSnatch是一種輕巧的Python工具,可讓您使用Tesseract OCR從圖像(JPG,PNG)和掃描PDF中提取文本。它支持文本輸出INTXT ORCSV和使用OpenCV的基本圖像清理。