加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于TF-IDF的文本摘要方法

发明专利有效专利
  • 申请号:
    CN201910191106.7
  • IPC分类号:G06F16/34;G06F40/289;G06F40/242;G06F40/205
  • 申请日期:
    2019-03-13
  • 申请人:
    北京工业大学
著录项信息
专利名称一种基于TF-IDF的文本摘要方法
申请号CN201910191106.7申请日期2019-03-13
法律状态授权申报国家中国
公开/公告日2019-07-02公开/公告号CN109960724A
优先权暂无优先权号暂无
主分类号G06F16/34IPC分类号G;0;6;F;1;6;/;3;4;;;G;0;6;F;4;0;/;2;8;9;;;G;0;6;F;4;0;/;2;4;2;;;G;0;6;F;4;0;/;2;0;5查看分类表>
申请人北京工业大学申请人地址
北京市朝阳区平乐园100号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京工业大学当前权利人北京工业大学
发明人张涛;陈才
代理机构北京思海天达知识产权代理有限公司代理人沈波
摘要
本发明公开了一种基于TF‑IDF的文本方法,本方法的步骤实现如下,中文分词;去停用词;计算词语的TF‑IDF;计算句子的TF‑IDF;计算句子的位置特征;计算句子的重要度;筛选关键句;输出文本;将句子所包含的关键词的TFIDF值作为权重,对于核心词关键词和一般关键词给予不同的权重。同时,为了防止句子长度不一致对结果产生影响,引入了滑动窗口,使用句子中最大的滑动窗口的重要度作为句子重要度,并结合句子长度和句子位置等特征对句子进行排序,在多个语料上达到了不错的效果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供