—— 之实用高阶用法:如何让导入的图片格式PDF可搜索

 

1. 引言

Goodnotes,一款风靡全球的笔记应用,以其优雅的设计和强大的功能,被誉为笔记界的“爱马仕”。它不仅可以完美替代纸质笔记本,更能借助 iPad 的强大性能,成为纸质笔记本,超越纸质笔记本,进入学习和工作的新境界。

Goodnotes的用途可分为两大类,一类是学习,一类是创作。前者可导入书籍系统地学习,如高亮、划线、写笔记、写总结、写心得、绘结构图;后者如做手账、绘画、做思维导图。

Goodnotes的用途之一:学习(图片来源“DK奶酪”)

 

Goodnotes的用途之二:做手账(图片来源“Camille-龟”)

 

我曾把十几公斤的教科书导入到Goodnotes,然后把书丢一边,实现一部平板“走天下”,随时随地,优雅式地学习,炫耀式地分享笔记。

本文只讲一个实用的高阶用法:如何让导入的PDF可搜索

使用场景式:当想找教科书里或笔记里的某个内容时,再不用翻厚厚的书和厚厚的笔记,打开手机或平板一个cmd+F轻松搞定,所有包含关键词的内容高亮显示,唾手可得。

有人说,Goodnotes本来就能对笔记进行搜索啊!

问题很好,但高阶使用就不一定是了,譬如考研、写论文,很多教材或资料网上没有,只能自己扫描,最多能下载到一个影印版,因为其内容是是图片格式的,所以导入进去并不能被搜索,这是高阶使用的一大痛点,试想你笔记里有几千页的书或资料,想找一个关键词而不能通过搜索获取,只能人肉查找,这会是什么样的灾难!因此这个功能绝不允许被阉割。

在这里,我们默认大家都知道,为什么图片上的文字不能被搜索,而word里的文字可以被搜索。

2. 如何把教科书导入到Goodnotes

但凡会进来看这篇文章的,大概率对这个步骤轻车熟路了,因为用goodnotes学习,这是必经之路。

为了让这篇文章上下连贯,我在这里简单说明一下。

教科书导入Goodnotes有三种方式:

1、导入照片:用这种方式导入,照片上的文字不能被识别,即不能被搜索。因此如果你有几页资料,你可以用手机拍照导入,但只能看不能搜。

2、导入PDF文件:PDF文件分两种,一种是文本格式的,一种是图片格式的,前者导入可被搜索,后者导入不能被搜索。如何区分两种文件?我一会简单说一下。

3、通过Goodnotes的“扫描文稿”功能拍照扫描进去:尽管是图片格式,但可以被搜索,这可是Goodnotes的一个良心功能。对于资料少的初级使用者来说,一张一张拍照扫描没有问题,但如果是一本书,则一来是扫描出的图片或多或少会有变形,二来是工作量很大,足以让你望而却步。

3. 谈谈PDF的图片格式和文本格式

我们下载PDF有两种格式,一种是文本格式,一种是图片格式。

我们可以把两种格式分别看成是word文档和图片文件,PDF可以看做是对这两种文件的封装。对于绝大多数APP来说,它可以识别文字,但不能识别图片里的文字。

对于高阶用户,能下载到要学习的书籍是最好不过的了,最好不要沦落到扫描,那麻烦事就多了。但好在现在互联网很发达,一般的书大概率可以下载到。如何搜索并下载电子书,这又可以说是一个技术活了,这么说吧,我想读的书,除了刚出版的,几乎没有我下载不到的,至于如何搜书,这里先挖个坑,以后有机会来填。

如果能下载到文本格式的PDF学习书,则是我们的幸运,我们赶快去touch wood一下。

但事实上,对于高阶学习者,能下载到图片格式的影印版已经是不错的了,起码不用我们去一页一页去扫描。

手机扫描书还会有变形,尽管很多APP能修正了,如果动用扫描仪,那就是另一个麻烦事了。当然扫描书也有解决方案,我用Goodnotes学习是闭环的,先简单剧透一下,因为毕竟不是本文主题,可以去万能的某宝,很便宜,可以不拆书扫描,如需要也可以拆书扫描,再给你装订起来。我知道你要问什么,我想说的是,一来装订效果不错,二来是,对于学习的高手,大脑中的内容才是王道,其他一切皆为浮云!

但无论是下载到的影印版,还是扫描来的图片版,都是不能被Goodnotes搜索的。

4. 如何判断一本书是图片格式还是文本格式呢?

方法1:最简单的方法,你用鼠标在文字上拖动,文字能被选中的,是文本格式,不能被选择的,则是图片格式。

譬如,下面这本PDF可以被选中,是文本格式,

下面这本PDF,不能被选中,是图片格式的:(这本书一看就是影印版,高阶用户找到的很多电子课本,都是这个样子的)

方法2:现在,对于苹果生态用户,上面这个方法不适用了,因为Apple在打开图片或图片版PDF时,会自动做一个文字识别操作(即OCR),让你感觉上面的文字是文本。第二个简单方法,是你把页面放大再放大,如果文字模糊,那一定是图片格式,如果文字不模糊,始终锐利,那则是文本格式。

我把上面两个PDF放大截图大家一下。

☝🏻是不是很锐利?

☝🏻变模糊了吧!

 

当然还有其他方法,我们就不累述了,譬如用浏览器打开看能否拖动选择。

5. 如何让图片版本的PDF可搜索

终于开始说正题了,前面都是铺垫。

但作为一篇文章来说,铺垫和正题一样重要,正如前戏和正戏一样重要一般。

先说原理,我们拿到图片版PDF后,请专门的软件处理一下,处理步骤为:

① 识别图片上的文字(当然需要我们下载的PDF足够清晰,如果不清晰,其实也不碍多少事, 能识别大部分关键词就行了,不影响看,充其量影响搜索的完整性)

② 第二步相当于我们把图片放入到word里作为背景,然后我们把光标定位在图片的文字上方,输入相应文字,再把文字颜色设置为透明,这样既不影响图片视觉效果,又能对上面的文本选择和使用了。

③ 然后把图片和文字一起打包成新的PDF。

这样新的PDF就变成文本格式的了,只是在透明色的文本下面加了一张图片背景而已。

 

那么什么工具可以做这个事情呢?

我用的是苹果电脑,我先介绍macOS里可操作的方法:

用预览打开PDF,导出文件为新的PDF,导出时勾选“签入文本”。OK,万事大吉!

下面附实际操作截图:

① 打开PDF - 文件 - 导出👇🏻

② 勾选“签入文本”👇🏻

③ 导出后打开新文档,发现文字可以选中了👇🏻

④ 现在导入到Goodnotes里,看能否搜索👇🏻

我们惊奇地发现,真的可以搜索了。

从此,我们可以在Goodnotes里开心地学习这门功课了!

如果不是苹果电脑,该怎么操作呢?

本文我的重点是两个:

一是能如何使用/利用Goodnotes学习

我更想用“利用”,这个词的潜台词是我们熟知其工作模式,并我们有能力取其精华,这是一个学习者所应该具备的,学习要踩在巨人的肩膀上。

二是把图片格式PDF文件转化为文本格式的原理:

有了原理,我们就可以扩展它的使用范围了,也知道如何处理它了。

现在我们知道图片格式PDF的文本化,其原理很简单,用途又很广泛,一定有很多的软件能实现它,

这里我提供一个“元方法”,就网上搜“图片 PDF 嵌入文本 ocr”,能搜到很多软件或系统(下面放个截图)。

6. PDF页边距太小,手写不方便或写不下很多笔记怎么办?

再挖个坑,专门有app可以加大页边距,下次专门开一篇图文说,这里上个图,感兴趣的请先关注我:

调整前:

调整后:

7. 本节可以不看:为什么用Goodnotes学习?

用教科书学习的常规步骤包括:

  • 阅读教科书
  • 标记重点部分:高亮、划线(用不同颜色的标记笔)
  • 在书中标记重点或要点;在书中或笔记本上书写:学习笔记、补充图表、学习心得、重点总结等
  • 做练习题、订正、总结错题到笔记本、二刷错题或三刷错题
  • 根据艾宾浩斯遗忘曲线规律定期复习
  • 选用费曼学习法讲给别人

用上述常规的方法学习,我们需要带的物品有:书、各种笔、各种本。并如果不能随时随时带这些物品,就不能随时随地学习。并因为不能随时随地带这些东西,所以,我们的传统方法并不能实现随时随地地学习。

 

用Goodnotes学习,准确说是用电子化的方法学习,它的优点是:

  • 随时随地学习:除了电子设备,如平板或手机,其他物品都不用带,几乎可以实现随时随地学习;
  • 笔记高效且美观:可以键入,可以手写,可以用各种颜色的笔划线或高亮,可以用各种线性、粗细、颜色的笔写字、画图,清晰且高效。
  • 可搜索、可搜索、可搜索:重要的事说三遍,可搜索书本内容,可搜索笔记内容,及其高效!
  • 内容可放云端:不用担心遗失、损坏。我的所有文件,对,是所有,包括临时文件,都在云端,我只要记得我的iCloud账号密码,我就可以走遍天下(没网络的地方不行),一部手机可以访问我所有所有的文件,并手机、平板、电脑全同步。

(图片来源:某学习高手,找不到名字了,抱歉)

 

当然,电子化学习也有缺点,譬如不习惯阅读电子内容。我想说的是,你去屏幕使用时间里看一下你一天刷朋友圈刷小视频的时间,我们实质上不要太擅长看电子内容好不好。

8. 我的学习状态

我崇尚的一个词是“优雅”,虽然我我长相并不优雅,但并不妨碍我的学习方式很“优雅”:

  • 我不用背厚重的书包;
  • 我不用为了随时随地学习而时刻备一本书和一支笔;
  • 我在喝咖啡的间歇可以读30页书;我可以在有灵感的时候随时拿出手机写下解题思路;
  • 我可以任意修改我的笔记,包括调整大小、颜色、位置;
  • 当我思如泉涌时,我可以在任意地方插入一页让我信马由缰;
  • 当有人问我问题时,即使我在马桶上,我也可以把我的笔记分享给对方;
  • 我还可以把我的每本笔记导出为一个PDF作为过去学习的留念,而不用保存厚厚的弃之可惜又食之无味的纸质资料。

学习是快乐的,轻松的。

与学习课程相比较,我更享受于学习“学习的方法”,即元学习

如果本文对你有用,请告诉我,我将继续更新。