摘要:很多人以为给PDF加水印只是“加个Logo”,其实真正的麻烦在后面:水印太浅,截图软件一调对比度就消失;水印太深,甲方直接拒收。
“再拖一天,合同扫描件就可能被随意转发,而你连水印都没打。”
很多人以为给PDF加水印只是“加个Logo”,其实真正的麻烦在后面:水印太浅,截图软件一调对比度就消失;水印太深,甲方直接拒收。
最惨的是,水印位置没算好,刚好压住公章,文件直接作废。
一个小技巧:先用ReportLab生成一张透明底的PNG,把文字转成路径,再叠到PDF上。
这样即使对方用PS抠图,水印也会跟着字体轮廓一起碎掉,比直接插文字难拆十倍。
分辨率别盲选300DPI。
实测发现,普通A4合同150DPI足够看清,文件体积只有300DPI的三分之一。
真要存档案,600DPI以上才保险,但记得把图片存成TIFF,PNG在600DPI时动辄上百兆,邮箱根本发不出去。
批量转图时最容易翻车的是内存。
一个200页的技术手册,一次性转图能把16G内存吃满。
把fitz的page.get_pixmap改成逐页生成,再用PIL的Image.save直接写磁盘,速度反而更快。
有人用PyPDF2合并文件时遇到“加密失败”,其实是忘了先解密。
OCR别迷信在线接口。本地跑Tesseract,把PDF先切成单页PNG,再开8线程识别,准确率比网页版高出一截。关键是把--psm 6参数写死,专治表格文字,省得它把“1”认成“l”。
未来最省心的做法可能是让AI自己决定水印:合同类文件自动在页脚加“Confidential”,简历类文件在页眉加姓名拼音,连位置都帮你算好。现在可以先写个简单规则:文件名含“合同”就加红色斜水印,含“发票”就加灰色横条,至少比手动点鼠标快十倍。
来源:仍有梦的孩子