From dfee9e4619ebd7a5d9c3d5b4b5ffbaaeab4aac1e Mon Sep 17 00:00:00 2001 From: John Whitington Date: Tue, 2 Nov 2021 13:56:45 +0000 Subject: [PATCH] more --- Makefile | 2 +- cpdf.ml | 37 +++++++++++++++---------------------- test/README.md | 1 + test/mktext | 8 ++++---- 4 files changed, 21 insertions(+), 27 deletions(-) create mode 100644 test/README.md diff --git a/Makefile b/Makefile index 7eee757..92a5a49 100644 --- a/Makefile +++ b/Makefile @@ -18,7 +18,7 @@ OCAMLLDFLAGS = -g all : native-code native-code-library byte-code-library top htdoc clean :: - rm -rf doc foo foo2 out.pdf out2.pdf foo.pdf *.cmt *.cmti *.json debug/*.pdf + rm -rf doc foo foo2 out.pdf out2.pdf foo.pdf *.cmt *.cmti *.json test/*.pdf debug/*.pdf DOC_FILES = cpdferror.mli cpdfjson.mli cpdfstrftime.mli cpdfcoord.mli \ cpdfattach.mli cpdfpagespec.mli cpdfposition.mli cpdf.mli \ diff --git a/cpdf.ml b/cpdf.ml index eb0f342..c101fe2 100644 --- a/cpdf.ml +++ b/cpdf.ml @@ -1121,8 +1121,8 @@ let print_fonts pdf = (* Process UTF8 text to /WinAnsiEncoding string (for standard 14) or whatever is in the font (for existing fonts). *) -let charcodes_of_utf8 encoding s = - let extractor = Pdftext.charcode_extractor_of_encoding encoding in +let charcodes_of_utf8 pdf font s = + let extractor = Pdftext.charcode_extractor_of_font pdf font in let codepoints = Pdftext.codepoints_of_utf8 s in implode (map char_of_int (option_map extractor codepoints)) @@ -1515,7 +1515,7 @@ let unescape_string s = implode (unescape_chars [] (explode s)) let - addtexts metrics linewidth outline fast fontname font embed bates batespad colour position linespacing + addtexts metrics linewidth outline fast fontname (font : Pdftext.standard_font option) embed bates batespad colour position linespacing fontsize underneath text pages orientation cropbox opacity justification midline topline filename extract_text_font_size shift pdf = @@ -1545,30 +1545,23 @@ let Printf.printf "relative-to-cropbox = %b" cropbox; flprint "\n";*) ops_metrics := []; - - let encoding = + let fontpdfobj = match font with | Some f -> - if embed then Pdftext.WinAnsiEncoding else Pdftext.StandardEncoding + make_font embed (Pdftext.string_of_standard_font f) | None -> - let font = - let firstpage = - List.nth (Pdfpage.pages_of_pagetree pdf) (hd pages + 1) - in - match Pdf.lookup_direct pdf "/Font" firstpage.Pdfpage.resources with - | Some fontdict -> - begin match Pdf.lookup_direct pdf fontname fontdict with - | Some font -> Pdftext.read_font pdf font - | _ -> failwith "addtext: font not found A" - end - | _ -> failwith "addtext: font not found B" + let firstpage = + List.nth (Pdfpage.pages_of_pagetree pdf) (hd pages + 1) in - match font with - | Pdftext.StandardFont (_, encoding) - | Pdftext.SimpleFont {encoding} -> encoding - | Pdftext.CIDKeyedFont _ -> Pdftext.WinAnsiEncoding + match Pdf.lookup_direct pdf "/Font" firstpage.Pdfpage.resources with + | Some fontdict -> + begin match Pdf.lookup_direct pdf fontname fontdict with + | Some font -> font + | _ -> failwith "addtext: font not found A" + end + | _ -> failwith "addtext: font not found B" in - let text = charcodes_of_utf8 encoding text in + let text = charcodes_of_utf8 pdf fontpdfobj text in let lines = map unescape_string (split_at_newline text) in let pdf = ref pdf in let voffset = diff --git a/test/README.md b/test/README.md new file mode 100644 index 0000000..2ff8c0f --- /dev/null +++ b/test/README.md @@ -0,0 +1 @@ +The mktext script is used for testing special characters in -add-text diff --git a/test/mktext b/test/mktext index 9d5faf7..92cf40d 100755 --- a/test/mktext +++ b/test/mktext @@ -1,7 +1,7 @@ -./cpdf -add-text "\000\001\002\003\004\005\006\007\010\011\012\013\014\015\016\017\020\021\022\023\024\025\026\027\030\031\032\033\034\035\036\037\040\041\042\043\044\045\046\047\050\051\052\053\054\055\056\057\060\061\062\063\064\065\066\067\070\071\072\073\074\075\076\077\100\101\102\103\104\105\106\107\110\111\112\113\114\115\116\117\120\121\122\123\124\125\126\127\130\131\132\133\134\135\136\137\140\141\142\143\144\145\146\147\150\151\152\153\154\155\156\157\160\161\162\163\164\165\166\167\170\171\172\173\174\175\176\177\200\201\202\203\204\205\206\207\210\211\212\213\214\215\216\217\220\221\222\223\224\225\226\227\230\231\232\233\234\235\236\237\240\241\242\243\244\245\246\247\250\251\252\253\254\255\256\257\260\261\262\263\264\265\266\267\270\271\272\273\274\275\276\277\300\301\302\303\304\305\306\307\310\311\312\313\314\315\316\317\320\321\322\323\324\325\326\327\330\331\332\333\334\335\336\337\340\341\342\343\344\345\346\347\350\351\352\353\354\355\356\357\360\361\362\363\364\365\366\367\370\371\372\373\374\375\376\377" ./blank.pdf -o text.pdf +../cpdf -add-text "\000\001\002\003\004\005\006\007\010\011\012\013\014\015\016\017\020\021\022\023\024\025\026\027\030\031\032\033\034\035\036\037\040\041\042\043\044\045\046\047\050\051\052\053\054\055\056\057\060\061\062\063\064\065\066\067\070\071\072\073\074\075\076\077\100\101\102\103\104\105\106\107\110\111\112\113\114\115\116\117\120\121\122\123\124\125\126\127\130\131\132\133\134\135\136\137\140\141\142\143\144\145\146\147\150\151\152\153\154\155\156\157\160\161\162\163\164\165\166\167\170\171\172\173\174\175\176\177\200\201\202\203\204\205\206\207\210\211\212\213\214\215\216\217\220\221\222\223\224\225\226\227\230\231\232\233\234\235\236\237\240\241\242\243\244\245\246\247\250\251\252\253\254\255\256\257\260\261\262\263\264\265\266\267\270\271\272\273\274\275\276\277\300\301\302\303\304\305\306\307\310\311\312\313\314\315\316\317\320\321\322\323\324\325\326\327\330\331\332\333\334\335\336\337\340\341\342\343\344\345\346\347\350\351\352\353\354\355\356\357\360\361\362\363\364\365\366\367\370\371\372\373\374\375\376\377" ../blank.pdf -o text.pdf -./cpdf -add-text "\000\001\002\003\004\005\006\007\010\011\012\013\014\015\016\017\020\021\022\023\024\025\026\027\030\031\032\033\034\035\036\037\040\041\042\043\044\045\046\047\050\051\052\053\054\055\056\057\060\061\062\063\064\065\066\067\070\071\072\073\074\075\076\077\100\101\102\103\104\105\106\107\110\111\112\113\114\115\116\117\120\121\122\123\124\125\126\127\130\131\132\133\134\135\136\137\140\141\142\143\144\145\146\147\150\151\152\153\154\155\156\157\160\161\162\163\164\165\166\167\170\171\172\173\174\175\176\177\200\201\202\203\204\205\206\207\210\211\212\213\214\215\216\217\220\221\222\223\224\225\226\227\230\231\232\233\234\235\236\237\240\241\242\243\244\245\246\247\250\251\252\253\254\255\256\257\260\261\262\263\264\265\266\267\270\271\272\273\274\275\276\277\300\301\302\303\304\305\306\307\310\311\312\313\314\315\316\317\320\321\322\323\324\325\326\327\330\331\332\333\334\335\336\337\340\341\342\343\344\345\346\347\350\351\352\353\354\355\356\357\360\361\362\363\364\365\366\367\370\371\372\373\374\375\376\377" ../blank.pdf -no-embed-font -o textnoembed.pdf +../cpdf -add-text "\000\001\002\003\004\005\006\007\010\011\012\013\014\015\016\017\020\021\022\023\024\025\026\027\030\031\032\033\034\035\036\037\040\041\042\043\044\045\046\047\050\051\052\053\054\055\056\057\060\061\062\063\064\065\066\067\070\071\072\073\074\075\076\077\100\101\102\103\104\105\106\107\110\111\112\113\114\115\116\117\120\121\122\123\124\125\126\127\130\131\132\133\134\135\136\137\140\141\142\143\144\145\146\147\150\151\152\153\154\155\156\157\160\161\162\163\164\165\166\167\170\171\172\173\174\175\176\177\200\201\202\203\204\205\206\207\210\211\212\213\214\215\216\217\220\221\222\223\224\225\226\227\230\231\232\233\234\235\236\237\240\241\242\243\244\245\246\247\250\251\252\253\254\255\256\257\260\261\262\263\264\265\266\267\270\271\272\273\274\275\276\277\300\301\302\303\304\305\306\307\310\311\312\313\314\315\316\317\320\321\322\323\324\325\326\327\330\331\332\333\334\335\336\337\340\341\342\343\344\345\346\347\350\351\352\353\354\355\356\357\360\361\362\363\364\365\366\367\370\371\372\373\374\375\376\377" ../blank.pdf -no-embed-font -o textnoembed.pdf -./cpdf -add-text "\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065" -topright 50 ../blank.pdf -o textwidth.pdf +../cpdf -add-text "\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065\065" -topright 50 ../blank.pdf -o textwidth.pdf -./cpdf -add-text "\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377" -topright 50 ../blank.pdf -o textwidthspecial.pdf +../cpdf -add-text "\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377\377" -topright 50 ../blank.pdf -o textwidthspecial.pdf