pdf_1.png如今,大多数专利研究人员都希望专利信息提供者能够访问PDF专利文档。

少做点事情似乎很落后。多年来,专利PDF可以从Google Patents和Espacenet等服务免费下载。 Adobe PDF作为ISO标准的开放也使个人创建自己的可搜索,加书签的PDF文档变得更加容易和便宜。

TotalPatent®专利研究工具中的PDF集合是否具有独特的价值?

根据TotalPatent产品文献,其PDF专利收藏以纯粹 馆藏的规模和广泛性 (60百万以上), 小文件 (压缩的PDF), 可搜索全文 (大多数文档)和内置 加入书签 (目录)。

这些特性旨在使TotalPatent用户可以节省时间和精力来购买专利文档,同时节省硬盘驱动器和服务器空间。能够使用主要部分的内置书签直接进入特定部分,直接在PDF文件中搜索和突出显示文本,然后将文本复制并粘贴到其他文档和应用程序中,并直接使用PDF专利文档图像,而无需在之间跳过提取的全文文件和PDF图像有助于节省时间。

现在,根据您的角色,您可以自己大量处理专利文件,也可以作为服务向下游客户提供PDF副本。

那么您知道您所提供的吗?您是否检查过PDF文件以查看它们是否对您的用户有所帮助或使他们沮丧?

作为更好地了解TotalPatent的使命的一部分,我决定仔细研究其PDF集合,因为它被突出显示为产品的关键功能。

我的迷你测验是高度非正式的,相当有限,但是当 评估专利研究平台。并非所有PDF文件都是一样的,它有助于了解您要提供给最终用户和客户的内容。

概括地说,这是我的过程:

  1. 在感兴趣的主题区域中创建一个小的搜索结果集。
  2. 选择要下载的专利文件列表。我确保包括一系列权限,语言和出版时间。
  3. 选择一些专利信息提供者进行比较。我建议您尝试免费和收费服务。
  4. 在每种服务上搜索相同的专利文档,并将专利PDF下载到文档供应商特定的文件夹中。
  5. 依次看每组。检查每个PDF文件。以下是要检查的内容:
  • 文件大小
  • 突出显示嵌入文本的能力:您可以这样做吗?
  • 您如何一致地突出显示所有文本?
  • 尝试使用PDF阅读器中的“查找”来搜索文本
  • 查看PDF文件的属性。

文件属性可以告诉您是谁生成了PDF文件,使用的PDF标准版本,甚至是用于生成该文件的软件的名称和版本。

我发现了什么

我自己的迷你测试很小而且非常有限,但是我发现它很有用。

专利文件的提供:我尝试的四个服务中的三个将所有文档都提供为PDF。

我期望这个结果。我的样本量非常小(少于20个文档),并且只从主要专利机构检索了相对较新的文档。

另一个提供商最近才开始为更广泛的机构提供PDF,并且该平台是免费的,并不是提供商业务的核心。我为几个不好的链接感到惊讶,但否则我并没有真正期望太多。

PDF的书签:我查看的每个下载的PDF都有该专利文件主要部分(例如,规格,权利要求)的章节标题书签。我感到惊喜。

PDF文件的全文搜索:我从TotalPatent查看的所有罗马脚本PDF文件都是可搜索的。一个没有嵌入全文的文件是中文专利文件。

我没想到可以从其他提供商那里找到可搜索的全文PDF,但是确实找到了一些。这不是一个一致的结果(大约来自一个提供者的一半到三分之一),但是果提供者从多个文档提供者那里获取专利PDF,则可能会发生。

PDF文件大小:TotalPatent PDF文件经过压缩,以加快下载速度并减少存储需求。

有趣的是,在我的小样本中,TotalPatent美国专利文件通常很小(约200至800 KB),但并不总是最小的可用文件。

最一致的区别在于WO和EP PDF文件。我检查的TotalPatent文件平均大约只有我从其他机构检索到的文件大小的一半,即使包含可搜索的文本也是如此。

总体LexisNexis TotalPatent 的确似乎在提供文件大小相对较小的大量可一致搜索的加书签的PDF。

当然,使用更广泛的日期和专利授权机构进行更广泛,系统的测试将更具权威性,但是,如果我正在为自己的组织评估产品,则进行这样的一些小型测试可能会使我对我的建议充满信心。

一致的内置可搜索性简化了专利研究人员和律师的工作流程

尽管可以使用现成的软件包来生成自己的可搜索,压缩的PDF文件,但是该过程仍然很耗时。能够为客户提供加书签的可搜索PDF文件的访问权限而无需付出额外的努力,这是一个巨大的优势,而且PDF文件的可搜索性应该为使用专利文件的每个人都节省时间。

一致性和质量控制激发信心

最终,即使样本量很小,TotalPatent PDF集合真正给我留下深刻印象的是结果的一致性和质量。

我得到了期望的结果,当我更详细地检查文件时,看到的一致性和文件质量是一致的。我感到,如果使用TotalPatent存储库,则可以向客户保证他们将可以访问具有一致特征的输出。我可以向客户保证文件也可以始终可搜索的想法也是一个巨大的优势。