摘要:本发明公开一种版式文件逻辑结构信息的表示方法和系统,涉及计算机信息处理技术中版式文件的信息表示方法和系统。为解决现有版式文件的逻辑结构信息表示方法不灵活,不便于添加和修改的问题而发明。本发明通过获取版式文件的逻辑结构信息和内容参考序列;根据所述逻辑结构信息将所述内容参考序列划分为多个内容参考子序列,并生成内容划分描述文件;根据所述逻辑结构信息生成逻辑单元描述文件;将所述内容划分描述文件与逻辑单元描述文件进行关联。可以有效、灵活地表示版式文件的逻辑结构信息,不需要对原有版式文件进行修改,且版式文件中的任意内容都能够单独进行逻辑结构信息描述、提取以及在不同文档逻辑结构模型中重复使用。
- 专利类型发明专利
- 申请人北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学;
- 发明人曲径;何震生;王毅;张力;
- 地址100871北京市海淀区成府路298号方正大厦5层
- 申请号CN200710123338.6
- 申请时间2007年06月22日
- 申请公布号CN101271463A
- 申请公布时间2008年09月24日
- 分类号G06F17/30(2006.01);G06F17/21(2006.01);