著录项信息
专利名称 | 利用移动终端识别并获取相关网页信息的系统及方法 |
申请号 | CN201210136141.7 | 申请日期 | 2012-05-04 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2012-09-19 | 公开/公告号 | CN102682105A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 高凌 | 申请人地址 | 北京市海淀区复兴路79号602楼4单元7号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 高凌 | 当前权利人 | 高凌 |
发明人 | 高凌;吴浩彰 |
代理机构 | 北京汇泽知识产权代理有限公司 | 代理人 | 刘淑敏 |
摘要
本发明公开了一种利用移动终端识别并获取网页相关信息的系统及方法,包括数据源;用于获取所述静态图像或动态影像,并将其转换为数字图像的网址信息采集终端;用于接收所述的数字图像,通过图像识别运算,获取所述数字图像信息中包含的网页地址数据的网址信息识别处理模块;用于接收所述的网页地址数据,然后根据所述网页地址数据进行检索与页面分析处理,并将得到的网页相关信息发送给信息实时发布模块的数据检索与页面分析模块;用于将数据库中与所述页面地址对应的相关网页信息,反馈到用户的移动终端上的信息实时发布模块。采用本发明,能够通过移动终端对网页页面及包含网址信息的内容进行快速识别,从而获取页面中的相关内容信息。
利用移动终端识别并获取相关网页信息的系统及方法\n技术领域\n[0001] 本发明涉及移动数据信息采集处理和数字图像识别技术,尤其涉及一种利用移动设备识别并获取网页相关信息的系统及方法。具体地说,是一种通过直接采集计算机网页、平面、多媒体网址特征信息,进行优化识别和内容处理,从而获取相关网页信息内容的系统及方法。如利用智能手机拍照系统,直接采集网页、媒体中的网址特征信息,进行优化识别和处理,从而获取相关网页信息内容。\n背景技术\n[0002] 随着世界范围内便携式电子产品及移动互联网的迅猛发展,各类便携式联网产品在性能、种类、数量方面,均处于大幅上升的态势,尤其是个人随身产品领域,几乎每天都可以看到众多不同品牌、配置和系统的智能手机、平板电脑、随身数码等产品上市销售,其已逐渐形成了从低至高各种性价层次的系列产品体系。\n[0003] 这些便携式联网设备在便捷、实时、功能多样等性能方面,均远超于传统个人电脑(PC)设备。在其普及化过程中,正逐步替代以往PC设备的部分功能,二者通过优势互补,将过去的固定化办公/生活模式,逐步转变为随身化模式,使得随时随地访问、传递、关注网络内容成为了普遍性需求。\n[0004] 然而,由于便携式联网设备、传统PC设备、传统互联网络之间的巨大差异性,甚至是各类便携式联网设备之间的差异性决定,目前在互联网内容访问方面,仍然仅仅是依托于设备自身特性的节点式访问(即每台设备均为网络上的一个访问节点,独立访问不同的页面内容),不同设备之间很难实现无阻碍的快捷访问共享与切换,因此很大程度上限制了各类便携式联网设备的便捷、实时特性发挥。\n[0005] 现阶段,虽然操作者可以通过软硬件形成某些特定的联机工作,但其功能局限、受众范围、操作繁琐等方面很难得以改善。例如:某操作者在PC机上浏览某个网站的特定页面,如果想在个人智能手机上浏览同样的页面,或随时关注该页面的特定信息,其已知操作方法为:\n[0006] 1)最直接的方法:记录下该网站的首页网址信息(也可直接记录该特定页面的网址信息,但由于大部分网站的次级页面网址信息较长,不便于记录),在手机上通过输入相同的网站地址,然后一页页进行点击深入,最后到达该特定页面。\n[0007] 2)网站主办方加入二维码项目:利用二维码生成系统,为每一个特定网页地址生成独立的二维码标识,并公布于相应页面的显要位置;操作者需在个人智能手机上安装二维码解析软件,然后通过软件进行拍照解析,从而获取该页面的网页地址后再进行访问。\n[0008] 3)网站主办方加入短信名址项目:为该网站首页或重要页面地址购买文字标识,并公布于对应页面的重要位置;操作者阅读提示,在个人智能手机上通过短信发送标识到指定特服号码,特服系统查找与标识对应的网址信息,再通过短信下发给用户的便携设备。\n[0009] 纵观以上三种方法,第一种是靠操作者手工实现,费时费力且极易出错;另外两种不仅无法精确定位到用户任意指定的页面,并且需要投入相当比例的人财物才可实现该功能;而且以上三种方法在便捷、实时、普遍性上均有一定缺陷,无法良好地适应便携式联网设备的多样性,也无法彻底满足用户在各种行业下的特殊性需求。\n发明内容\n[0010] 有鉴于此,本发明的主要目的在于提供一种利用移动终端识别并获取网页相关信息的系统及方法,以使操作者能够通过智能手机等移动终端对网页页面、或包含网址的任意媒体进行拍照识别,从而快速精确的获取页面中的相关内容信息。\n[0011] 为达到上述目的,本发明的技术方案是这样实现的:\n[0012] 一种利用移动终端识别并获取网页相关信息的系统,包括数据源;还包括网址信息采集终端、网址信息识别处理模块、数据检索与页面分析模块和信息实时发布模块:其中:\n[0013] 网址信息采集终端,用于获取所述数据源,并将其转换为数字图像;\n[0014] 网址信息识别处理模块,用于接收所述的数字图像,通过图像识别运算,获取所述数字图像信息中的包含的网页地址数据;\n[0015] 数据检索与页面分析模块,用于接收所述的网页地址数据,然后根据所述网页地址数据进行检索与页面分析处理,将得到的网页相关信息发送给信息实时发布模块;\n[0016] 信息实时发布模块,用于将数据库中与所述页面地址对应的相关网页信息,反馈到用户的移动终端上。\n[0017] 其中:所述数据源包括网页页面、含有网页地址信息的静态图像或动态影像。\n[0018] 所述网址信息采集终端,为具有拍摄或录像功能,能够捕捉静态图像或动态图像的移动终端;或保存有静态或动态图像的其他的支持联网功能的手机、个人数字助理、平板电脑、随身数码等便携式设备。\n[0019] 所述的静态图像为原始位图或压缩位图;所述的动态图像为原始ARGB(透明度、红色、绿色、蓝色)原色数据流或原始YUV(亮度、色度、浓度)亮彩度数据流。\n[0020] 所述网址信息识别处理模块,位于所述移动终端内或服务器端。\n[0021] 所述网址信息识别处理模块,用于对所述静态图像或动态图像进行切割、缩放、旋转、降噪、反模糊运算处理。\n[0022] 所述网址信息识别处理模块进一步包含光学文字识别子模块,用于将所采集的静态图像或动态图像的特定区域信息转化成计算机能识别的文字字符。\n[0023] 一种利用移动终端识别并获取网页相关信息的方法,该方法包括:\n[0024] A、利用网址信息采集终端获得用户指定的数据源,并保存为数字图像;\n[0025] B、对所述数字图像进行网址信息识别,然后执行步骤D;若该网址信息采集终端无法识别该数字图像的网址信息,则将该图像数据发送到网址信息识别处理模块3,然后执行步骤C;\n[0026] C、利用网址信息识别处理模块对所述无法识别的数字图像进行精确识别,并将识别后的网址数据发送到数据检索与页面分析模块,然后执行步骤E;\n[0027] D、将利用网址信息识别处理模块进行识别处理得到的网址数据通过网络发送到数据检索与页面分析模块,然后执行步骤E;\n[0028] E、所述数据检索与页面分析模块对接收到的网址数据进行快速检索处理,并更新相关数据或将其录入数据库;\n[0029] F、利用信息实时发布模块获取数据库中的与网页地址相关的商品页面信息后,将该信息内容重新组合成适合于各种移动终端访问的页面结构;然后通过各种网络发送到所述的网址信息采集终端上。\n[0030] 其中:步骤A所述利用网址信息采集终端获得用户指定的数据源,根据移动终端和操作的不同,包括如下类型:\n[0031] A1、用户使用移动终端摄像头对商品页面中的网址信息进行拍摄,直接捕捉原始ARGB、YUV格式的动态图像数据流;\n[0032] A2、用户使用移动终端摄像头对商品页面中的网址信息进行拍照,获得BMP、JPG、JPEG、GIF、PCX、RAW、PXR、PNG、TIF格式的静态数据图片;或,\n[0033] A3、用户直接使用便携式设备上已保存的含有商品网址信息的图片类文件。\n[0034] 步骤E所述对网址数据进行快速检索处理,根据检索结果的不同进一步包括:\n[0035] E1、网页地址与数据库中某现存网址的特定页面能够匹配,则进行关键数据快速更新;\n[0036] E2、网页地址与数据库中某现存网址的任意页面均无法匹配,则对该页面进行快速采集处理,并录入相应数据库;或,\n[0037] E3、网页地址在数据库中无法匹配到网站,则对该地址指定的页面进行快速采集分析,以确定其内容是否符合授权范围,满足条件则将该站点及页面录入相应数据库。\n[0038] 本发明所提供的移动终端识别并获取网页相关信息的系统及方法,具有以下优点:\n[0039] 1)解决了现有技术无法通过便携式终端直接快速精确定位到其他设备正在浏览网页的问题,使用户利用传统PC设备浏览网页的同时,能够快速切换到便携式终端(如手机等),并直接精确定位到正在浏览的页面。\n[0040] 2)进一步发挥了各类设备的独立特性与协作特性,尤其是促进了固定设备(如PC等设备)与便携式设备之间,在某些特定领域的协同工作,使得用户可以根据任务状态需求进行便捷的即时切换,例如在固定设备上进行批量数据录入等操作,并在便携式设备上进行实时内容监控,查询、比对等。\n[0041] 3)通过发明内容中描述的一系列远程数据操作处理,可以使本发明服务于大量的现实工作生活状况,并衍生出很多便捷的服务内容,例如:利用本发明描述的设备间快速分享,可以在大型会议中设定某一台终端设备为数据源,为参会者进行快速资料/数据的电子分享;利用本发明描述的终端拍照获取相关页面信息,可以方便的让用户利用现有便携式联网设备,进行任意站点的实时性商品关注、价格查询、价格比对等服务;利用本发明描述的数据检索与页面分析处理模块中授权范围控制,可以实现如学校、医院等有限范围内的信息内容共享与查询服务等。\n附图说明\n[0042] 图1为本发明利用移动终端识别并获取网页相关信息的系统结构示意图;\n[0043] 图2为本发明利用移动终端识别并获取网页相关信息的方法流程图;\n[0044] 图3为本发明利用移动终端采集网址信息的方法示意图。\n具体实施方式\n[0045] 下面结合附图及本发明的实施例对本发明的系统及方法作进一步详细的说明。\n[0046] 图1为本发明利用移动终端识别并获取网页相关信息的系统结构示意图,如图1所示,该利用移动终端识别并获取网页相关信息的系统主要包括:数据源1,网址信息采集模块2,网址信息识别处理模块3、数据检索与页面分析模块4和信息实时发布模块5;其中:\n[0047] 数据源1,在本实施例中是通过传统PC或笔记本电脑访问的,某在线购物网站任意一款商品的内容介绍网页。在其他服务中该数据源1还可以是来自电视、液晶屏、纸质印刷品等任意媒体的包含网址信息的静态图像或动态影像。\n[0048] 网址信息采集终端2,在本实施例中可以是支持拍照、联网功能的手机等移动终端。在其他服务中该网址信息采集终端还可以是其他支持联网功能的手机、个人数字助理(PDA)、平板电脑、随身数码等任意便携式设备(可以不支持拍照功能,但此种状态下本发明的系统仅允许处理便携式设备内存中已保存的图片信息)。\n[0049] 这里,该网址信息采集终端2可以具有拍摄或录像功能,可以捕捉静态图像或动态图像流的设备。其捕捉的静态图像可以为BMP、JPG、JPEG、GIF、PCX、RAW、PXR、PNG、TIF等原始位图或压缩位图,;动态图像可以为原始ARGB(透明度、红色、绿色、蓝色)原色数据流,原始YUV(亮度、色度、浓度)亮彩度数据流。\n[0050] 网址信息识别处理模块3,用于接收静态图像或动态数字图像信息,并通过各种图像识别运算,获取数字图像信息中包含的网页地址数据。\n[0051] 如图3所示,所述网址信息识别处理模块3,具有逻辑与信号处理能力,可以对接收到的静态图像或动态数字图像中,包含网址信息的关键性区域,进行切割、旋转、缩放、降噪、反模糊等处理运算,从而获取到相对清晰的关键性图像数据。然后经光学文字识别(OCR)子模块,将采集到的该图片/图像特定区域信息转化成计算机可以识别的文字字符。\n该网址信息识别处理模块既可以位于终端设备内,也可以位于服务器端。\n[0052] 数据检索与页面分析模块4,用于接收网页地址数据,并根据该地址数据进行如下一种或多种组合操作:\n[0053] 1)快速检索数据库是否已存在对应页面内容;\n[0054] 2)快速采集对应页面内容;\n[0055] 3)数据库出/入库操作;\n[0056] 4)快速判断页面是否符合授权范围等;然后将网页相关信息发送给信息实时发布模块5。但在本实施例中授权为在线购物相关业务范围。\n[0057] 这里,所述的数据检索与页面分析模块,可以执行网页爬行,网页内容分析,网址(URL)分析与数据储存等操作。所述网页爬行是一种自动网站内容下载操作,所述网页内容分析是根据HTML或XML标准对网页内容进行分析解词以提取出所需内容的操作;网址(URL)分析是根据URL规范解析出所属网站页面、结构、动作的操作;网页储存是把分析后的网页内容以某种内容格式存储,以及根据网址分析内容快速提取出相应内容的操作。该模块通常位于服务器端。\n[0058] 信息实时发布模块5,用于将数据库中与页面地址对应的相关网页信息(包括但不限于根据行业范围预采集数据、查询现采集数据及以往提交处理数据),按照用户的终端类型快速反馈到用户的移动终端(如手机)。\n[0059] 这里,所述信息实时发布模块,可以通过短信、彩信、服务信息、智能手机系统的信息通知,以及移动终端主动读取信息,执行数据信息主动推送等操作。\n[0060] 本实施例中,正在使用传统电脑设备浏览某在线购物网站任意一款商品的用户,可以通过本发明的系统快速切换到个人便携式联网终端,并精确定位到同一商品页面,从而快速访问到适合本终端浏览的相关商品信息,以及通过本发明系统衍生出的比价、关注、检索等服务。\n[0061] 图2为本发明利用移动终端识别并获取网页相关信息的方法流程图,如图2所示,本发明方法通过如下步骤201~步骤207所述的各种有线/无线网络实现完整的业务处理流程:\n[0062] 步骤201:利用网址信息采集终端2(可以是便携式联网终端,如手机)拍摄、采集用户指定的电子显示屏(如计算机屏幕、电视或液晶等),或者纸质印刷品上的网页地址信息,保存为数字图像。若终端具有数字图像处理能力,则执行步骤202;若终端无法识别出网址信息、不支持网址信息识别或者属于该终端本地存储的图像信息等未识别的情况,则执行步骤203。\n[0063] 例如:用户使用传统电脑设备浏览某在线购物网站任意数据源1(如一款商品的web页面)时,通过网址信息采集终端2(如手机)拍摄商品页面中包含的网址信息,从而获取包含网址信息的数字图像信息。\n[0064] 该数字图像根据手机及用户操作不同,可以是:\n[0065] a、用户使用手机摄像头对商品页面中的网址信息进行拍摄,直接捕捉原始ARGB(透明度、红色、绿色、蓝色)原色数据流,原始YUV(亮度、色度、浓度)亮彩度数据流等图像动态数据流;\n[0066] b、用户使用手机摄像头对商品页面中的网址信息进行拍照,获得BMP、JPG、JPEG、GIF、PCX、RAW、PXR、PNG、TIF等静态数据图片;\n[0067] c、用户直接使用手机上已保存的含有商品网址信息的图片类文件。\n[0068] 步骤202:终端对所述采集到的数字图像进行网址信息识别,并将识别后的网址数据直接发送到数据检索与页面分析模块4,然后执行步骤205;\n[0069] 这里,要求该手机具有基本数据处理能力,通过该系统对手机获取的数字图像进行网址信息识别处理,获取其中的精确网址数据,并将此网址数据通过网络直接发送到数据检索与页面分析模块4。\n[0070] 步骤203:终端无法识别出网址信息、不支持网址信息识别或者属于该终端本地存储的图像信息等未识别的情况,则以图像数据形式发送到网址信息识别处理模块3,然后执行步骤204。\n[0071] 步骤204:所述网址信息识别处理模块3对接收到的未识别图像数据进行精确识别,并将识别后的网址数据发送到数据检索与页面分析模块4,然后执行步骤205。\n[0072] 步骤205:数据检索与页面分析模块4接收步骤202或步骤204所发送的网址数据,并对该网址数据进行快速检索处理,根据检索结果的不同,进一步进行如下处理:\n[0073] a、网页地址与数据库中某现存站点的特定页面可以匹配,则进行关键数据快速更新。\n[0074] 如:如果数据库已存在该网站信息,并且已存在与该网址数据对应的页面信息,则快速采集商品页面中价格信息等关键数据,以更新数据库中的页面信息。\n[0075] b、网页地址与数据库中某现存站点的任意页面均无法匹配,则对该页面进行快速采集处理,并录入相应数据库。\n[0076] 如:如果数据库已存在该站点信息,但不存在与该网址数据对应的页面信息,则快速采集商品页面中相关商品页面信息,并将该页面信息录入数据库。\n[0077] c、网页地址在数据库中无法匹配到站点,则对该地址指定的页面进行快速采集分析,以确定其内容是否符合授权范围,满足条件则将该站点及页面录入相应数据库,并通知管理员新站入库。\n[0078] 如:数据库不存在该站点信息,则快速采集商品页面中相关商品页面信息,并根据采集内容判断该站点是否为在线购物业务领域,如果是则将该站点及页面信息录入相应数据库。\n[0079] 步骤206:利用信息实时发布模块5获取的数据中该页面的相关商品页面信息后,将信息内容重新组合成适合于用户手机(或其他便携式联网设备)访问的页面结构。\n[0080] 步骤207:该信息实时发布模块6将处理过的相关商品页面,通过各种网络,发送到网址信息采集终端2(如手机)。\n[0081] 这样,用户通过便携式联网终端(如手机),即可快速访问到网址信息指定的适合于本移动终端的页面内容,以及本发明的系统衍生出的各种实时便捷服务。\n[0082] 至此,用户使用传统电脑设备浏览在线购物网站的过程,将被快速的切换到个人手机,并直接精确定位到电脑设备正在浏览的商品页面上,同时还可以使用该系统衍生出的目标商品关注、价格横向/纵向即时比对,商品信息扩展查询等各式服务。\n[0083] 特别说明:各步骤中如页面出现访问错误、超出项目范围等,该系统将为用户终端反馈相应提示信息,本实施步骤中不再做详细描述。\n[0084] 以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
法律信息
- 2020-04-17
未缴年费专利权终止
IPC(主分类): G06F 17/30
专利号: ZL 201210136141.7
申请日: 2012.05.04
授权公告日: 2016.01.13
- 2016-01-13
- 2012-11-14
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201210136141.7
申请日: 2012.05.04
- 2012-09-19
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2010-06-23
|
2008-12-10
| | |
2
| |
2010-07-28
|
2009-01-24
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |