著录项信息
专利名称 | 一种向量间相似度的计算方法 |
申请号 | CN200910073836.3 | 申请日期 | 2009-02-27 |
法律状态 | 驳回 | 申报国家 | 中国 |
公开/公告日 | 2009-07-22 | 公开/公告号 | CN101488190 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/62 | IPC分类号 | G;0;6;K;9;/;6;2查看分类表>
|
申请人 | 华北电力大学(保定) | 申请人地址 | 河北省保定市永华北大街619号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 华北电力大学(保定) | 当前权利人 | 华北电力大学(保定) |
发明人 | 李中;苑津莎;杨宏 |
代理机构 | 石家庄冀科专利商标事务所有限公司 | 代理人 | 李羡民;高锡明 |
摘要
一种向量间相似度的计算方法,属数据识别技术领域,用于判断向量间的相似度。其技术方案是:定义n维向量xj与xk间的相似度距离是:dSSD(j,k)=ED×[1+COS(ASD/MSAD×π/2)]或dMSD(j,k)=ED×(2-ASD/MSAD),则n维向量xj与xk之间相似度是:s(j,k)=1/(dSSD+1)或s(j,k)=1/(dMSD+1),其数值越大,则两者越相似,反之,则差异越大。本发明不但考虑了向量间各维差值绝对值的和,而且考虑了向量间各维差值的具体特征,因而比传统方法具有更高的精度,更能逼近实际。
1、一种向量间相似度的计算方法,设在n维坐标系中有两个n维向量:xj=(xjl,...,xjn)T 和xk=(xkl,...,xkn)T,定义n维向量xj与n维向量xk间的相似度测量距离是:
其中,ED为欧几里得距离: ASD为向量差值和绝对值:
MSAD为向量差值绝对值和:
式中δi(δi≥0,i=1,2,...,n)是给n维向量各维设置的 权值系数,根据n维向量第i维所表达的信息设定,
则n维向量xj=(xjl,...,xjn)T与n维向量xk=(xk1,...,xkn)T之间相似度是:
其数值越大,则两者越相似,反之,则差异越大。
2、根据权利要求1所述向量间相似度的计算方法,其特征是,所述权值系数δi按下述 原则取值:
A、如果n维向量xm第i维值xmi表达的信息与物体的形态有关,则δi取值为1;
B、如果n维向量xm第i维值xmi表达的信息与物体的形态无关,则δi取值为:0≤δi< 1;
C、如果对n维向量xm各维取值具体定义不明确,则δi=1,i=1,2,...,n。
3、一种向量间相似度的计算方法,设在n维坐标系中有两个n维向量:xj=(xjl,...,xjn)T 和xk=(xk1,...,xkn)T,定义n维向量xj与n维向量xk间的相似度测量距离是:
dMSD(j,k)=ED×(2-ASD/MSAD)
其中,ED为欧几里得距离: ASD为向量差值和绝对值:
MSAD为向量差值绝对值和:
式中δi(δi≥0,i=1,2,...,n)是给n维向量各维设置的 权值系数,根据n维向量第i维所表达的信息设定,
则n维向量xj=(xj1,...,xjn)T与n维向量xk=(xk1,...,xkn)T之间相似度是:
其数值越大,则两者越相似,反之,则差异越大。
4、根据权利要求3所述向量间相似度的计算方法,其特征是,所述权值系数δi按下述 原则取值:
a、如果n维向量xm第i维值xmi表达的信息与物体的形态有关,则δi可以取值为1;
b、如果n维向量xm第i维值xmi表达的信息与物体的形态无关,则δi的取值范围为:0 ≤δi<1;
c、如果对n维向量xm各维取值具体定义不明确,则δi=1,i=1,2,...,n。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2014-08-30 | 2014-08-30 | | |
2 | | 2014-08-30 | 2014-08-30 | | |