加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种文本标注方法、装置、设备及可读存储介质

发明专利有效专利
  • 申请号:
    CN202011233453.0
  • IPC分类号:G06F40/166;G06F40/216;G06F40/289
  • 申请日期:
    2020-11-06
  • 申请人:
    上海恒生聚源数据服务有限公司
著录项信息
专利名称一种文本标注方法、装置、设备及可读存储介质
申请号CN202011233453.0申请日期2020-11-06
法律状态实质审查申报国家中国
公开/公告日2021-01-05公开/公告号CN112183035A
优先权暂无优先权号暂无
主分类号G06F40/166IPC分类号G;0;6;F;4;0;/;1;6;6;;;G;0;6;F;4;0;/;2;1;6;;;G;0;6;F;4;0;/;2;8;9查看分类表>
申请人上海恒生聚源数据服务有限公司申请人地址
上海市浦东新区峨山路91弄61号7楼 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人上海恒生聚源数据服务有限公司当前权利人上海恒生聚源数据服务有限公司
发明人左永忠;刘余海
代理机构北京集佳知识产权代理有限公司代理人暂无
摘要
本申请实施例提供了一种文本标注方法、装置、设备及可读存储介质,在待标注的文本页的标题项中,确定表格的标题,从目标标题项中,按照排序的逆序查找满足预设条件的标题项,将满足预设条件的标题项中,排序在前的标题项作为上级标题,排序在后的标题项作为下级标题,预设条件包括所述标题项之间不存在文本。依据上级标题和下级标题的区别特征,识别文本页中的上级标题和下级标题。将识别出的各个标题指示的内容进行分词,得到各个标题的分词结果,从预设的对应关系中,查询目标分词单元,将目标分词单元对应的标注项,作为标题的标注结果。本方案确定各个标题的分级,因此不仅能够自动对文本中的标题进行标注,还能够保证标注结果的准确性。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供