]> git.donarmstrong.com Git - bin.git/blob - make_ocr_pdf
add reset usb bus command
[bin.git] / make_ocr_pdf
1 #!/usr/bin/env python3
2 # Copyright 2018 by Don Armstrong <don@donarmstrong.com>
3 # Licensed under the terms of the GPL version 3 or any later version at your option.
4
5
6 import argparse
7 import subprocess
8 import re
9
10 parser = argparse.ArgumentParser(description="Make a PDF from TIFF files with OCR")
11
12 parser.add_argument('--output','-f',default='output.pdf')
13 parser.add_argument('tiff',nargs='+')
14 args = parser.parse_args()
15 # combine the tiff files into a multi-image tiff
16 subprocess.run(['e2mtiff','--output','temp.tiff']+args.tiff,check=True)
17 # tesseract appends pdf when we write to an output for some reason
18 output_name = re.sub(r"\.pdf$","",args.output)
19 subprocess.run(['tesseract','temp.tiff',output_name,'pdf'],check=True)
20