「派早报」是最受少数派读者熟悉和喜爱的常规栏目之一。虽然这个栏目的主题说起来并不复杂——汇总前一天我们认为比较重要的科技资讯;但实际运行中会涉及很多需要考量的细节。就以选择资讯来源这件事来说,除了要关注信源的权威和准确,遵纪守法当然也要常记心头。

对此,最为相关的法规是《互联网新闻信息服务管理规定》。根据该规定第 15 条,互联网新闻信息服务提供者转载新闻信息,应当转载国家规定范围内的单位发布的新闻信息

实践中,这里的「国家规定范围内的单位」是指《互联网新闻信息稿源单位名单》中列举的稿源单位。该名单最近一次修订是在 2021 年 10 月,涵盖了各级各地的机关、新闻媒体的网站、微博和微信公众号等。

当然,上述法规中的「新闻信息」和「互联网新闻信息服务提供者」有专门的法规定义,派早报所汇集的科技行业资讯,并不完全属于这个范畴。但毫无疑问,多加参照总是一种稳妥的选择,官方认可的来源也确实在可信度、内容质量上更有说服力。因此,我们会在选编资讯时,优先参考这些来源发布的报道。

问题来了:怎样快速从这些来源中搜索信息呢?

现行的《名单》共包含 1358 个来源,即使只考虑「派早报」编写中较为常用、更新及时、内容「接地气」的来源,也能找出二三十家,一一搜索显然是不现实的。固然可以通过搜索引擎的 insite: 语法指定网站范围,但每次搜索都要带上一长串后缀也很不方便。

我们找到的方案是自定义搜索引擎,也就是通过专门的入口,在一批特定的网站范围内搜索的定制化搜索引擎。

目前,提供自定义搜索引擎功能的主流搜索引擎主要是 Google 和 Microsoft Bing(很遗憾,我们短暂的调研中并未发现国产主流搜索引擎提供类似的功能),它们都可以免费使用,但在配置难易程度、免费档位限额等方面有所差异。

下面,我们就分别介绍如何使用这两家服务的自定义搜索功能,打造一个「白名单信源定向搜索引擎」。

准备工作:搜集信源网址