XML 编程思想: 专利编档遭遇 XML

2016-02-19 16:50 13 1 收藏

在这个颜值当道,屌丝闪边的时代,拼不过颜值拼内涵,只有知识丰富才能提升一个人的内在气质和修养,所谓人丑就要多学习,今天图老师给大家分享XML 编程思想: 专利编档遭遇 XML,希望可以对大家能有小小的帮助。

【 tulaoshi.com - Web开发 】

  大型的专利组织都抱有双重目标:一方面简化电子专利编档,另一方面保持这种档案在部门之间的兼容性。这方面努力的背后,XML 技术发挥着领导作用,围绕着专利编档的 XML 格式进行了很多思考和工作。本栏目中,Uche Ogbuji 分析了 XML 专利电子编档的背景,并和专利专家 Carl Oppedahl 讨论了 XML 编档的实际情况。

  United States Patent and Trademark Office (USPTO)一直努力将电子编档付诸实践。对于一个主要职责就是和关注未来的客户打交道的部门而言,这并不奇怪。况且大型专利部门要处理海量的数据,他们需要能得到的一切帮助来保持数据流的清晰。从 1998 到 2000 年,USPTO 为专利文档开发了 SGML DTD,2000 年该机构开始把目光投向 XML,启动了一项新的计划,准备到 2002 年开发出 XML DTD。这项研究还扩展到了和商标有关的文档。

  这一努力中 USPTO 并不孤单,还有其他两家大型专利机构: European Patent Office (EPO)和 Japan Patent Office (JPO)。后者是电子编档的先驱,可以追溯到 1990 年。其中作为协调专利机构的国际权威, World Intellectual Property Organization (WIPO) 正致力于关于专利编档和处理的数据交换的标准化。WIPO 标准称为 Electronic Patent Cooperation Treaty (E-PCT)或 Annex F。它包括一组 XML DTD,类似但不同于大型专利机构开发的那些 DTD。本文简要讨论标准电子专利编档的 WIPO XML 格式,并就 XML 有关的专利编档与一位专家进行探讨。

  E-PCT DTD

  从 WIPO 网站上查找真正的 XML DTD 碰了几次壁后,我终于在 OASIS Cover Pages(请参阅 参考资料)上找到了 2001 年 6 月的专利申请主体的 E-PCT DTD 工作草案。该模式显然是由理解 XML 并了解信息体系结构的人设计的。非常清晰,任何熟悉 XML 的人即使不了解专利编档也可以使用。

  我发现该 DTD 中主要的毛病是一些完全不必要的缩写。多数元素都涉及散文体的内容,遵循类似 XHTML 和 Docbook 的惯例(尽管名称和那些标准不一定相同)。表格模型基于人所共知的 CALS 标准,其中包括用于个人以及组织名称、地址、文献引用和专利交叉索引的设计好的内容模型。它还包括 MathML DTD 以处理公式(化学和数学公式也可以作为特殊类型的图片包含进来),并提供了生物学数据参考。元数据元素提供了专利专用的元数据,但多数和编档有关的法律细节似乎要留待其他 DTD 完成。

  专利电子编档还具有互操作性吗?

  USPTO 所支持的电子编档方法需要使用一个名为 PASAT 的应用程序编辑专利申请,还有一个应用程序 ePave 用于提交和其他任务。对 PASAT 的不满可以看作是电子编档没有推广的原因之一,但因为其输出是 DTD 已公开的 XML,应该能够使用任何适当的工具编辑,这种能力被称为 跨平台的编档。可以选择的一种工具称为 PatXML,来自 EPO。另外一种是 PCT-SAFE Editor (PSE),WIPO 提供的 E-PCT 编档工具。这两种工具都支持导出到 USPTO XML 编档格式。开发 Annex-F 的最终目标之一是使所有编档人员能够选用喜欢的任何编辑工具无论是专利机构开发的还是商业软件厂商提供的并且所有主要专利机构都能够电子化地归档所生成的申请。人们期望 XML 在所有这类系统中的应用能够加速整合的进程。

  与 Carl Oppedahl 的对话

  Oppedahl & Larson LLP 法律服务公司提供专利、版权、商标和其他知识产权服务。他们以紧跟技术前进的步伐而自豪,事实上他们很早就出现在 Internet 上并获得了域名patents.com。他们也是基于 XML 的电子编档方式的最早采用者之一,发表了一些有用的文章指导此类系统的应用。这些文章在有关 XML 驱动的系统之间的互操作性问题方面提供了有趣的经验。

  我就跨平台编档的实际问题采访了Oppedahl & Larson LLP 的合伙人 Carl Oppedahl,从他的文章中我得知他在技术(包括 XML)和法律方面都有渊博的知识。

  Uche Ogbuji:业界对 PASAT 抱怨什么,为什么一些用户喜欢用 PatXML 和 PCT-SAFE?

Carl Oppedahl:PASAT 是十多年前开发的,人们发现这个程序不太稳定有时候会突然崩溃,所做的工作也丢失了。其他的编辑工具如 PatXML 和 PCT-SAFE Editor 是最近开发的,更加稳定。 还有一个区别可能对某些用户很重要,PCT-SAFE Editor 是一种有效的 XML 编辑器,其用户界面符合人们对标签式(如 HTML、SGML 或 XML)编辑器的期望。使用 PCT-SAFE Editor 创建和编辑也需跨越好几天的文件是一个 XML 文件。 也许最好把 PASAT 和 PatXML 称作 XML编辑工具。这些程序创建的文件都采用某种非 XML 的私有格式。作为用户,您可以单击一个按钮导出 XML,这时候程序将创建一个新的文件,这个文件是一个 XML 文件。 因此对一些用户而言比如在使用电子编档专利申请之前已经熟悉 HTML 编码的用户,PCT-SAFE Editor 可能提供了一种更加熟悉的用户界面。

  UO:您用过专利申请不是 XML 格式的电子编档工具吗?如果是这样,XML 的应用对用户的体验有很大的影响吗?

CO:是的。编档 PCT(国际)专利申请的设计者选择这样一种方式,允许用户使用 XML 或者 PDF 格式编制档案。当然,这种决策有利也有弊。一方面,允许使用 PDF 编档,可能使 PCT 专利机构失去标记化的计算机可识别数据的许多长处。另一方面,允许 PDF 编档可能使专利机构成功地说服更多的档案编制人员放弃纸张,而改用电子编档。

  UO:您是否曾经阅读过专利申请的原始 XML 正文?如果是这样,那么这种功能有用吗?如果没有,那么在需要时可以阅读原始数据,您认为这一点好不好?

CO: 大部分电子编档人员从来没有看过专利申请的原始 XML 代码。当然,对于精心设计和实现的系统,一般而言应该避免多数用户查看原始 XML 代码,即使不查看原始代码也应该能够达到他们所有的目标。比方说,很多人开车,但从未实际打开引擎盖看一看发动机。 我们的专利法律服务公司致力于实现跨平台的编档使用工具在一个专利机构中编辑专利申请书,然后在不同的机构中归档。因为这种跨平台的方法相对而言还没有经过验证(直到现在),偶尔会遇到一些小麻烦,这时候就需要用记事本打开 XML 文件。我们使用记事本作必要的修改,以便顺利完成跨平台的编档工作。

  UO:您有没有使用过不是专门用于专利编档的工具(即一般的 XML 或文本工具)加工、查看或者处理电子编档的 XML 文档?

CO:我们没有特别留意[使用一般的 XML 编辑器],虽然认为不妨试一试。 上面已经提到,我们经常发现需要使用记事本至少是查看(有时候还要编辑)XML 代码以克服各种跨平台的兼容性问题。

  UO:您观察过 EPO 和 PCT XML 格式吗?这两种格式相差很远吗,与 USPTO 格式相比呢?是否有哪种格式更清晰易读?

CO:事实上,EPO、WIPO(PCT)、USPTO 和 JPO(Japan)已经花了多年时间开发一种通用的 DTD 和其他通用标准(称为 Annex F),用于专利申请的电子编档。研究的目的是为了在 USPTO、EPO 和 PCT 的工作中长期使用单独一种 XML 格式。 我们的专利公司率先实现了这种跨平台的编档,为此我们必须使用记事本打开 XML 文件以调整引用外部文件的语法,如内嵌的图像。除了这类相当细小的变动之外,我们发现不同专利机构的 XML 格式基本相同,同样简单易懂。

  UO:您愿意使用商业化工具利用 XML 格式更好的实现跨平台支持吗?

CO:我非常乐于尝试使用标准的、得到广泛应用的、被证明为稳定的 XML 编辑器来编辑专利申请,并使用 Annex F DTD。 当然,要知道,专利电子编档的第一步是编辑 XML,第二步则是将 XML 文件交给专利机构中的提交引擎,后者接受 XML 文件,并使用专利申请序列号返回正式的编档收条。虽然我可以想象在第一步中引入商业化的 XML 工具,但是不知道在第二步中是否能够改变。

  UO:您倾向于继续使用专利机构所提供的工具,并希望其跨平台的特性得到改进吗?

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/webkaifa/)CO:在专利电子编档这个特殊领域中,遇到的一个问题是编档人员可能遇到不同绘图工具(如 Visio、Powerpoint)生成的图片文件(作为专利的图示),这些图片来自发明者所用的各种不同格式(如 PDF、Microsoft Word、JPG、GIF、TIF)。因此,专利机构取得一致意见,对嵌入到 XML 申请书中的图片格式和大小有严格的限制。所以对于编档人员,需要能够接受各种各样的图片文件,并通过某种方法转换成可接受的格式和可接受的大小。 为此,专利机构提供的一些 XML 编辑工具尝试简化图片格式的转换和附加(嵌入)过程。这些工具在一定程度上也实现了这种简化,与商业化的和现成的 XML 编辑器相比,它们是更好的选择(尤其是对于那些不熟悉 XML 的人而言)。

  UO:照您看来,真正的跨平台专利编档工具出现还需要多长时间?您认为 XML 的采用加速了这一过程吗?

CO:在专利机构中总是存在预算紧张和人员安排的问题,一下子实现所有的目标非常困难。USPTO 的预算是由议会决定的,现在还常常受到质疑。比如,现在 US Patent Office 提供了一些有限的、非正式的跨平台支持,如果它能够在这方面投入更多的资源我将非常高兴。

  毫无疑问,XML 是我们专利公司最初少数跨平台专利编档取得成功的 唯一原因。没有 XML 就一切都不可能了。最重要的是,不同专利机构的人们投入了多个人年开发专利编档的 Annex F DTD,使我们最初的跨平台编档得以步入成功的大门。开发通用 DTD 的这些努力开花结果了。

  结束语

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/webkaifa/)

  看到 XML 在如此之多的专门领域实现了自己的诺言是非常令人高兴的( 上一篇文章中我考察了 XML 在金融领域的应用, 再前一篇文章则分析了教育内容管理)。就 DTD 达成一致仅仅是第一步,这一反复出现的教训也应该使我们冷静下来。必须开发处理工具(本例中就是专利申请的编制和后续处理)为 XML 格式通信提供互操作框架。由于 XML 应用的大量艰苦工作和少数专利编档专家的开拓性研究,专利申请的电子编档和处理也许很快会得到普及。

来源:https://www.tulaoshi.com/n/20160219/1613289.html

延伸阅读
标签: Web开发
XML 作为基本数据格式无疑是成功的。但是 XML 1.0 提出的许多承诺 ― 从统一各企业间的通信方式到使 Web 更智能化 ― 都没有兑现。将 XML 用于共享的语义并因此用于共享的知识,是本专栏的主题。本文中,Ogbuji 先生介绍了迄今为止,开放应用程序组(Open Applications Group)和美国国防部(DoD)沿着这一方向,在最近发展环境中所取得的...
标签: Web开发
Uche Ogbuji 通过演示用来自现有 XML 格式的数据构成资源描述框架 (RDF)模型,开始了他的用 XML 进行的知识管理的实际探索。 如三个代码清单中所示,RDF 可用作定制 XML 的搭挡,而不仅仅用作某些数据类型的规范表示。包含代码样本的本专栏演示了如何用 RDF 方便地进行知识管理,甚至是在开发过程中相对比较晚的阶段。 虽然 W3C 将资...
标签: Web开发
Uche Ogbuji 就 XML 语义透明性和 XML 知识管理方面讨论了近来所发生的事情,这其中包括 ebXML 和 RosettaNet 中的一些新的开发。 Thinking XML 专栏的前两部分讲述了语义透明性 -- 可以共享那些不受约束的 XML 尖括号和引用标记中含义。由于本文的标题直接涉及到关于 XML 近来所发生的一些事情,所以在本文中(以后还会随时有其它的)...
标签: Web开发
教育技术领域引导着一些有趣的 XML 元数据实际应用的发展方向。在这个领域已有大量的规范、标准和开发技术,但这一切的核心是 IEEE 学习对象元数据(IEEE Learning Objects Metadata,LOM)规范。在本文中,Uche Ogbuji 介绍了 LOM,并说明它甚至会使那些与教育技术没有直接联系的人感兴趣。 计算机辅助教育学科一直充当知识管理技术的...
标签: Web开发
Uche Ogbuji 花了些时间回顾了他所展示的 XML/RDF 技术在更广阔的环境下的相关性。他讨论了 XML/RDF 交换的重要性、专门的 RDF 查询的重要性以及将 RDF 建模中获得的经验教训应用到整个应用程序开发的重要性。他还显示了 Thinking XML 专栏的这条线索与有关语义透明性方面的开发的类似线索之间是如何关联的。 在这一系列文章中,我演示...

经验教程

577

收藏

37
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部