路标网共为您找到相关结果13个
基于概率主题进行短文本分类的方法及系统
发明专利无效专利摘要:暂无
一种短文本聚类的方法、系统及其数据处理装置
发明专利有效专利摘要:本发明公开了一种短文本聚类的方法、系统及其数据处理装置。该方法执行于一数据处理装置中,用于针对给定的短文本集进行聚类,包括:步骤1,将该给定的短文本集中的所有短文本作为一个类别;步骤2,从当前的所有类别中选择一个类别,从中寻找核心词汇;步骤3,如果找到,根据是否包含该核心词汇将所选择的类别分成两类,执行步骤2;步骤4,如果没找到,记录并删除该类别,从剩余的类别中选择一个类别,执行步骤2,直至没有剩余类别为止,所记录的类别作为聚类的结果。本发明以类间相似度最小,类内相似度最大的方式,将短文本依照其内在关联关系进行聚类,使使用者在大量数据中快速定位所需求的数据。计算复杂度较低,计算效率高。
一种识别假冒网页的方法及系统
发明专利有效专利摘要:本发明公开了一种识别假冒网页的方法及系统,该方法包括以下步骤:步骤1,针对一给定网页,构造与该给定网页具备关联关系的寄生网页社区;步骤2,逐个计算该给定网页相对该寄生网页社区中的每个网页的寄生因数,根据每个网页的寄生因数,判断该给定网页与寄生网页社区中的网页是否存在假冒关系。本发明实现的效果在于,根据给定的网页,识别出其是否为一假冒网页,识别出与该给定网页存在假冒关系的网页,即,该假冒网页所模仿的真实网站的网页,避免冒然提交个人数据而造成相关财产、隐私等权益的损失。同时,本发明的识别方法准确率高,操作方便。
一种网络广告自动投放方法及其系统
发明专利无效专利摘要:本发明公开了一种网络广告自动投放方法及其系统,其中该方法包括:步骤一,分析当前网页的页面内容,建立当前网页的特征向量;步骤二,根据特征向量计算当前网页与每个用于投放的第一广告之间的相关度,并根据相关度为每个第一广告打分;步骤三,根据广告的分值选择第一广告,并投放到当前网页上;步骤四,由当前网页跳转到新网页时,为该新网页计算用于投放的第二广告,并根据所选择的第一广告、第二广告分别在该新网页上的得分将所选择的第一广告或第二广告投放到该新网页上。本发明当用户在网络中浏览信息时,能够根据当前网页信息、用户模型自动投放相关的广告,以及当用户在网页间跳转时,让广告跟踪用户到新的网页。
一种假冒网站监测方法及其系统
发明专利有效专利摘要:本发明公开了一种假冒网站监测方法及其系统,其中该方法包括:包括:步骤一,监测Web服务器中的HTTP请求,获取HTTP请求信息;步骤二,根据所述HTTP请求信息中的引荐者参数、所述HTTP请求行中的Url参数对所述引荐者指向的网址进行过滤,获取可疑网址;步骤三,计算所述可疑网址与要保护的真实网页之间的相似度,得到评估结果并发出相关通知。采用本发明方法实现了对假冒网站的监测。
一种问题自动生成的系统及其方法
发明专利无效专利摘要:本发明公开了一种问题自动生成的系统及其方法,应用于服务器中,当服务器输出一页面时,对于页面中的文字内容进行分析,自动生成与所述文字内容相关的问题,包括:步骤一,扫描页面中的文字,识别页面中的属于各领域的领域概念以识别文字所属领域;步骤二,利用依存关系分析工具、该所属领域的语义词典、该所属领域的语义分析工具分析各个句子,形成具有明确语义与语法关系的具体问题源及问题源表达式;步骤三,在一模板库中,搜索与所述问题源表达式匹配的问题源表达式,获取与所述问题源表达式对应的问题及答案。利用本发明的技术方案,可针对一页面中显示的文章,自动生成与该文章内容相关的问题,帮助用户高速有效的理解文章的内容,提高阅读效率。
一种基于语义模板的问题自动翻译方法及其系统
发明专利无效专利摘要:本发明公开了一种基于语义模板的问题自动翻译方法及其系统,其中该方法包括:模板获取步骤,用于获取与用户提出的问题最相关的语义模板;模板映射步骤,用于将最相关的语义模板映射到目标语言模板,得到问题的可填充项及可填充项对应于目标语言模板中的语义标签;语义选择步骤,用于对可填充项进行自动翻译,得到可填充项的所有语义;利用语义标签从所有语义中选择可填充项的最佳语义,将最佳语义填充到目标语言模板中,得目标语言问题。本发明能够对交互式问答系统中用户提出的问题进行自动翻译,实现了不同语言用户之间的无障碍交流。
一种基于内容的问题自动分类方法及其系统
发明专利有效专利摘要:本发明公开了一种基于内容的问题自动分类方法及其系统,该系统包括:问题关键字获取模块,用于根据模板中的关键字标签和/或可填充内容标签获取新问题的问题关键字,为问题关键字设置权值,并得到新问题的问题向量;特征空间构造模块,用于根据已有所有类别的问题及所述权值获取每一类别的特征向量,构造特征空间;及语义映射模块,连接特征空间构造模块、问题关键字获取模块,用于将新问题的问题向量映射到特征空间,根据新问题映射后的问题向量、每一类别的特征向量计算新问题与每一类别之间的相似度,并根据相似度返回最相关的类别。本发明实现了对用户所提出的新问题自动分类,并把最可能的结果返回给用户供其选择。
一种图结构相似度测量方法及其系统
发明专利无效专利摘要:本发明公开了一种图结构相似度测量方法及其系统,其中该方法包括:步骤一,输入第一个图、第二个图,并获取所述第一个图、所述第二个图的SG空间;步骤二,根据所述SG空间计算所述第一个图、所述第二个图之间的结构相似度。该方法可用于数据挖掘或信息检索领域中。任何一个图与其他图的相似度数值可以进而作为一个量化的衡量标准用于相似图或以图作为表示形式特征的相似信息的搜索查询中,也可用于图聚类算法的距离测量中,该方法远好于文本相似度算法,搜索查询准确度更高。
一种问题推荐方法及系统
发明专利无效专利摘要:本发明涉及一种问题推荐方法及系统。所述方法,实施于交互问答系统中,用于向回答用户推荐问题,包括:根据系统中存储的由提问用户提出的多个待回答问题,确定所述待回答问题与回答用户的历史问答题目或者刚刚回答的问题的相关度;为所述回答用户推荐并显示相关度超过预定阈值的待回答问题。利用本发明所述方法,可快速为回答用户推荐最为相关的待回答问题以供其回答,且对问题的推荐较为均衡,保证不超过回答用户的答题能力,避免问题在一个回答用户处堆积,使该问题错过了被其它用户回答的机会。且随着回答用户不断回答题目,其能力值在不同时段随时得到更新,以调整在下一时段可接受推荐问题的数量。
一种自动生成问题的语义模板的方法和系统
发明专利无效专利摘要:本发明公开了一种自动生成问题的语义模板的方法和系统。方法包括:步骤一,识别自由文本形式的问题的基本结构;步骤二,从该基本结构中,选择需要进行泛化的词语;步骤三,在词语数据库中搜索被选择的词语的所有上位概念,将所述上位概念与一标签本体中的标签进行匹配,利用所述匹配成功的标签中的语义关键词为被选择词语进行语义标注。利用本发明可根据自由文本形式的问题得到对应的匹配程度高的语义模板,且该语义模板还可覆盖较多的结构相似及语义相关的问题,从而被众多用户提问时使用,结构化及语义化地积累问题和答案,为自动搜索问题和答案的过程提供较为准确且可适当扩展的搜索源。
一种自动问答方法和系统
发明专利无效专利摘要:本发明公开了一种自动问答方法和系统。该方法包括下列步骤:步骤A,通过问题分析获取问题的信息;步骤B,根据问题分析的结果,生成查询条件,在知识源中以搜索引擎进行检索,检索出与查询条件相关的文档集,并将文档集划分为段落集;步骤C,根据文档检索的结果,以段落检索方法从段落集中检索出与查询条件相关的段落集合,并从段落集合中返回问题的答案。其提高答案的准确性,提高返回正确结果的精确度。
文本相似度、词义相似度计算方法和系统及应用系统
发明专利有效专利摘要:本发明公开了一种文本相似度、词义相似度计算方法和系统及应用系统。该方法包括下列步骤:根据词汇数据库进行初始化,计算得到所述词汇数据库中词汇间的初始词义相似度,并根据初始词义相似度计算文本间的初始语义相似度;根据初始化得到的词汇间的词义相似度和文本间的初始语义相似度,交替迭代计算文本集中的各个文本间的语义相似度和词汇间的词义相似度直至收敛,根据迭代计算的收敛结果,以最终词义相似度构造所有词汇间的最终词义相似矩阵;根据所述最终词义相似矩阵,将原始文本的文本词频向量变换为新的文本词频向量,计算出所述文本集中文本相似度。其能够显著提高现有的文本相关的,特别是有关短文本的信息检索技术的性能。
*来源于国家知识产权局数据,仅供参考,专利服务由北京酷爱智慧知识产权代理公司提供