为什么给 PDF 画黑框不等于脱敏

教你检查 PDF 黑框是否只是遮挡层,并用零信脱敏导出真正处理过的副本。

为什么给 PDF 画黑框不等于脱敏

这篇适合你已经拿到一个“打了黑框”的 PDF,或者准备用 PDF 编辑器手动画黑框遮住姓名、电话、账号。先别直接外发,黑框经常只是视觉遮挡,底下的文字可能还在。

第一步:先做三个快速检查

打开这个 PDF,先检查:

  1. 鼠标拖选黑框附近,看看能不能复制出原文。
  2. 用 PDF 搜索原始姓名、手机号、公司名。
  3. 如果能编辑 PDF,尝试选中黑框,看它是不是一个单独对象。

只要其中任意一项能看到或搜到原文,就说明它不是可靠脱敏。

第二步:理解黑框的问题

PDF 页面不是一张简单图片。一个页面里可能同时有:

  • 文字层
  • 图片层
  • 批注
  • 表单
  • 图形对象
  • 透明遮罩

你看到的黑框,可能只是盖在文字上面的图形对象。人眼看不到,不代表原文已经从文件里删除。

第三步:把原文件导入零信脱敏

不要在已经乱画黑框的副本上继续补丁。更好的做法是回到原始 PDF,重新导入零信脱敏。

导入原始 PDF 文件

常见需要识别的类别:

  • 姓名、电话、邮箱、地址
  • 身份证号、证件号
  • 单位名称、统一社会信用代码
  • 金融账户及卡号
  • 印章、人脸、二维码/条形码
  • 自定义词库里的客户名、项目名、内部代号

如果原文件已经找不到,也可以导入现有 PDF,但要更仔细检查黑框下方是否还有可提取文本。

第四步:审阅命中项,而不是手动画框

识别完成后,看右侧命中项。让每个需要处理的内容都成为可审阅的命中项,而不是靠手动画框凭感觉遮。

审阅 PDF 命中项

重点看:

  1. 黑框附近是否还有原文命中。
  2. 同一个姓名或公司名是否全文都命中。
  3. 页眉、页脚、批注、表格、签署页有没有漏。
  4. 扫描页和图片页是否也有视觉命中。

如果发现漏项,先补标,再导出。

第五步:用搜索验证原文是否还在

导出前,用搜索查你最担心泄露的原文。

搜索原始敏感词

建议至少搜索:

  • 原始姓名
  • 手机号后四位
  • 身份证号后四位
  • 客户简称
  • 合同编号或案号

如果搜索结果还定位到未处理内容,说明还不能导出。

第六步:看脱敏预览并导出副本

打开脱敏预览,看最终页面效果。

查看脱敏预览

预览通过后导出脱敏副本。导出后再打开副本,重复第一步的检查:复制、搜索、换阅读器打开看。确认原文不再暴露,再发送。

什么时候可以用黑框

黑框可以用来做内部审阅标记,让处理人知道哪些区域要脱敏。但它不应该作为最终交付结果。最终发出去的应该是经过导出的脱敏副本,而不是只在页面上盖了一层黑色矩形的 PDF。

需要处理真实 PDF 或文档?

零信脱敏可在本机完成敏感信息识别、审阅和内容级脱敏导出。

下载零信脱敏