PDFを画像に変換
from PDFをOCRしてScrapboxに取り込むDeno script
する方法
terminal
TerminalでPDFを画像に変換する
Deno
TerminalでPDFを画像に変換する外部コマンドを呼び出す
web browser (firefox)
PDFjsのviewerから画像データとテキストデータを取得するUserScript
code:script.ts
type Option = {
extension: 'ppm' | 'pbm' | 'pgm' | 'png' | 'jpeg' | 'tiff';
verbose?: boolean;
};
export async function convertPDFtoImage(pdfFileName: string, outputName: string, {extension, verbose}: Option = {extension: 'png'}) {
if (verbose) console.log(Converting ${pdfFileName} to ${extension} images...);
let flag: string | undefined;
switch (extension) {
case 'ppm':
flag = undefined;
break;
case 'pbm':
flag = 'mono';
break;
case 'pgm':
flag = 'gray';
break;
default:
flag = extension;
break;
}
await exec(pdftoppm${flag ? -${flag} : ''} ${pdfFileName} ${outputName} -r ${dpi});
if (verbose) console.log(Finish.);
}
#2021-03-02 13:40:58
#2021-02-16