加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于非结构化文本生成结构化信息实体的方法与设备

发明专利有效专利
  • 申请号:
    CN201110107222.X
  • IPC分类号:G06F17/30
  • 申请日期:
    2011-04-27
  • 申请人:
    百度在线网络技术(北京)有限公司
著录项信息
专利名称一种基于非结构化文本生成结构化信息实体的方法与设备
申请号CN201110107222.X申请日期2011-04-27
法律状态授权申报国家暂无
公开/公告日2011-10-12公开/公告号CN102214208A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人百度在线网络技术(北京)有限公司申请人地址
北京市海淀区上地十街10号百度大厦 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人百度在线网络技术(北京)有限公司当前权利人百度在线网络技术(北京)有限公司
发明人王京津;夏寅;耿磊;王坤;陆海霞;曹建栋;严孙荣;肖琦;左莉;苏上海;李博;王丽宝;李永强;张伟
代理机构北京汉昊知识产权代理事务所(普通合伙)代理人罗朋
摘要
本发明的目的是提供一种基于非结构化文本生成结构化信息实体的方法与设备。其中,信息实体生成设备获取与中心词相关的非结构化文本;基于预定分类模型,对所述非结构化文本进行分类分析,以获取所述中心词的分类;根据所述分类,生成所述中心词的结构化信息实体。与现有技术相比,本发明根据中心词的非结构化文本,生成该中心词对应的结构化信息实体,由此便于对该中心词所包含的内容进行数据挖掘,并降低中心词内容维护的成本。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供