著录项信息
专利名称 | 基于高速公路收费数据轨迹匹配的交通状态识别方法 |
申请号 | CN201110042176.X | 申请日期 | 2011-02-22 |
法律状态 | 权利终止 | 申报国家 | 暂无 |
公开/公告日 | 2011-06-01 | 公开/公告号 | CN102081846A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G08G1/01 | IPC分类号 | G;0;8;G;1;/;0;1;;;G;0;8;G;1;/;0;6;5查看分类表>
|
申请人 | 交通运输部公路科学研究所 | 申请人地址 | 北京市海淀区西土城路8号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 交通运输部公路科学研究所 | 当前权利人 | 交通运输部公路科学研究所 |
发明人 | 刘浩;张海林;张可;袁媛;李斌;李宏海;刘冬梅;牛树云;贺瑞华;张纪升;张晓亮;桑丽;张剑飞 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明属于智能交通领域,为一种基于高速公路收费数据轨迹匹配的交通状态识别方法。充分利用高速公路管理系统所提供的真实路网收费数据,对其内涵进行充分的挖掘,通过进行对收费数据的处理、匹配、分析计算,得到全路网的站点间行程时间以及交通流量,再利用模糊聚类的方法识别路网上任意站点间的交通状态,具体分为数据异常处理、平均行程时间计算、路段流量计算及基于模糊聚类的交通状态判别四个步骤。该方法可以为管理者提供准确的交通状况信息,使管理者能够及时、准确地掌握交通状况,为开展高速公路信息服务提供可靠的数据基础。
1.一种基于高速公路收费数据轨迹匹配的交通状态识别方法,其特征在于,对高速公路管理系统所提供的真实路网收费数据进行处理、匹配、分析计算,得到全路网的站点间行程时间以及交通流量,再利用模糊聚类的方法识别路网上任意站点间的交通状态,具体步骤如下:
(1)数据异常处理:收费站将采集到的车辆进入和驶出高速公路的信息以数据的形式储存在集合R中,筛选并删除所述集合R中数据信息缺失及时间异常的数据,得到集合R’; (2)平均行程时间计算:计算所述集合R’中每条数据记录的行程时间TT,并剔除明显偏离测量总体的个别观测值数据,得到集合RT’;将集合RT’中的数据记录按照时间排序,并划分若干个时间段,把每个时间段作为一个时间格T(i);计算同一时间格T(i)内驶入收费站O及驶出收费站D记录相同的数据的平均行程时间 ,并将其记入集合RTT中; (3)路段流量计算:假设车辆匀速行驶,以路段距离W(s)为权重,将集合RT’中的每条数据记录具体匹配到路网的各个单元路段s(a,b)中,累加同时间格T(i)内同单元路段s(a,b)流量,直到遍历所有数据,得到全路网流量,记入流量数据集合RQ; (4)基于模糊聚类的交通状态判别:在前面计算出来的路段平均行程时间 和路段流量的基础上,通过模糊聚类算法判断出高速公路路网任意两站点之间的交通拥堵状态。
2.根据权利要求1所述的交通状态识别方法,其特征在于,步骤(2)中行程时间TT按下式计算:TT=ta-tb,其中,TT表示集合R’中车辆ta时刻从O出发到D的行程时间;tb为车辆驶出D的时间。
3.根据权利要求1所述的交通状态识别方法,其特征在于,步骤(2)中剔除明显偏离测量总体的个别观测值数据时,采用分位值法。
4.根据权利要求1所述的交通状态识别方法,其特征在于,步骤(2)中计算平均行程时间按照下式计算: 其中,TT(i)为集合RT’中时间格T(i)内的第i个行程时间数据,n为集合RT’中时间格T(i)内O、D相同的数据记录总数。
5.根据权利要求1所述的交通状态识别方法,其特征在于,步骤(4)中判别交通状况时,具体采用如下步骤:
1)数据预处理:利用指数平滑法对集合RTT及集合RQ中的平均行程时间及路段流量数据进行处理,剔除短期交通干扰;对指数平滑处理过后的行程时间及路段流量进行标准化处理,消除量纲的差异,并得到集合RTT’及集合RQ’;
2)模糊C-均值聚类:选取经过上步预处理后的部分历史数据,时间范围应为24小时以 上;分为三个聚类中心,分别为拥堵、缓行、畅通三种类别,根据各类中心建立隶属度函数;
3)对集合RTT’及集合RQ’中的实时数据进行步骤1)的预处理,然后将其代入步骤2)中所述隶属度函数,计算实时数据隶属于各聚类中心的隶属度,以隶属度最大原则判断实时数据属于的类别,从而对实时公路交通状态进行判别,并提交给相关部门和用户;
4)更新数据,重复步骤3)。
基于高速公路收费数据轨迹匹配的交通状态识别方法\n技术领域\n[0001] 本发明属于智能交通领域,涉及一种高速公路路网交通状态识别方法。\n背景技术\n[0002] 随着我国高速公路的快速建设,越来越多的省市已经形成了网状的高速公路。依托于高速公路路网的收费数据信息能够从一个侧面反映出车辆行驶过的高速公路段的交通状态信息。以往的研究中,高速公路收费信息主要是为计算各收费站OD矩阵。目前国内外对联网收费数据的研究主要集中在信息服务系统的开发、行程时间预测及分析,以及限于封闭的高速路段的流量预测,关于路网中路段上的流量计算还很少有人涉及,并没有充分挖掘收费数据所能提供的信息。\n[0003] 另一方面,为了识别高速路网路段内的交通状况,现有技术中多采用的方法是在高速公路路段上间隔一定的距离设置检测设备,测量通过该检测设备的交通流量或者车辆行驶的平均速度,来大致评估该路段的交通状况。但是,这样的方法需要另外安装检测设备,提高了高速公路建设及维护成本。\n[0004] 本发明利用高速公路收费站的收费数据,对其进行匹配处理并通过数学模型对高速公路的交通运行状态进行识别,从而为开展高速公路信息服务提供可靠的数据基础,为高速公路管理部门提供直观的决策支持。\n发明内容\n[0005] 本发明的目的在于提供一种基于全网络收费数据的交通状态识别方法,为管理者提供准确的交通状况信息,使管理者能够及时、准确地掌握交通状况,为开展高速公路信息服务提供可靠的数据基础。\n[0006] 为了实现上述目的,本发明采用如下技术方案:\n[0007] 一种基于高速公路收费数据轨迹匹配的交通状态识别方法,其特征在于,对高速公路管理系统所提供的真实路网收费数据进行处理、匹配、分析计算,得到全路网的站点间行程时间以及交通流量,再利用模糊聚类的方法识别路网上任意站点间的交通状态,具体步骤如下:(1)数据异常处理:收费站将采集到的车辆进入和驶出高速公路的信息以数据的形式储存在集合R中,筛选并删除所述集合R中数据信息缺失及时间异常的数据,得到集合R’;(2)平均行程时间计算:计算所述集合R’中每条数据记录的行程时间TT,并剔除明显偏离测量总体的个别观测值数据,得到集合RT’;将集合RT’中的数据记录按照时间排序,并划分若干个时间段,把每个时间段作为一个时间格T(i);计算同一时间格T(i)内驶入收费站O及驶出收费站D记录相同的数据的平均行程时间 并将其记入集合RTT中;\n[0008] (3)路段流量计算:假设车辆匀速行驶,以路段距离W(s)为权重,将集合RT’中的每条数据记录具体匹配到路网的各个单元路段s(a,b)中,累加同时间格T(i)内同单元路段s(a,b)流量,直到遍历所有数据,得到全路网流量,记入流量数据集合RQ;\n[0009] (4)基于模糊聚类的交通状态判别:在前面计算出来的路段平均行程时间 和路段流量的基础上,通过模糊聚类算法判断出高速公路路网任意两站点之间的交通拥堵状态。\n[0010] 步骤(2)中行程时间TT按下式计算:TT=ta-tb,其中,TT表示集合R’中车辆ta时刻从O出发到D的行程时间;tb为车辆驶出D的时间。\n[0011] 步骤(2)中剔除明显偏离测量总体的个别观测值数据时,采用分位值法。\n[0012] 步骤(2)中计算平均行程时间按照下式计算: 其中,TT(i)为集合RT’中时间格T(i)内的第i个行程时间数据,n为集合RT’中时间格T(i)内O、D相同的数据记录总数。\n[0013] 优选地,步骤(2)中计算平均行程时间时,按照以下步骤进行:\n[0014] 1)建立以时间格T(i)与单元路段s(a,b)为维度的初始空白二维矩阵RTT,该矩阵中每个元素包含两个值(tt,n),tt用来计算累加的行程时间,n用来记录累加的次数,累加次数的结果实际上也是流量的结果;\n[0015] 2)按时间顺序读取集合RT’中的一条数据记录,采用最优路径算法计算该数据O、D间必经的单元路段s(a,b);\n[0016] 3)假设该车辆以匀速行驶,根据上述数据记录的起始时间ta、行程时间TT,以及O、D间通过的单元路段s(a,b)的距离W(s),计算该车辆驶入不同单元路段s(a,b)的时间ta(a,b),及在本单元路段s(a,b)中行驶的行程时间TT(a,b),并判断该车辆经过该单元路段s(a,b)时所处的时间格T(i),在上述RTT矩阵中时间格T(i)与单元路段s(a,b)对应元素的tt值计为该车辆在该单元路段上的行程时间TT(a,b),并将该元素的n值计为1;\n[0017] 4)重复第2)步,读取下一条数据并继续完成第3)步的计算,将计算结果TT(a,b)与上述RTT矩阵中T(i)与s(a,b)对应元素的值tt进行累加,并将该元素的n值累加1;\n[0018] 5)重复第4)步,直至遍历集合RT’中的所有数据,将RTT集合中每个元素的tt值除以n值,得到该单元路段s(a,b)的平均行程时间 将 作为集合RTT中每个元素的值。\n[0019] 步骤(3)中进行路段流量计算时,按照以下步骤进行:\n[0020] 1)遍历集合RT’中的数据记录,采用最优路径算法计算每一条数据O、D间必经的单元路段s(a,b),并进行记录;\n[0021] 2)假设该车辆以匀速行驶,根据数据集RT’中数据记录的起始时间ta、行程时间TT,以及O、D间通过的单元路段s(a,b)的距离W(s),计算该车辆驶入不同单元路段s(a,b)的时间ta(a,b),及在本单元路段s中行驶的行程时间TTs(a,b),并判断该车辆经过该单元路段时所处的时间格T(i),在时间格T(i)内对应于该单元路段s(a,b)的记录格内流量+1;\n[0022] 3)对RT’内的数据进行遍历后,对时间格T(i)与单元路段s(a,b)对应的记录格内记录的流量累加,得到该单元路段在该时间格T(i)内的流量数据,将结果记录在集合RQ内。\n[0023] 或者,基于上述平均行程时间的计算,步骤(3)中进行路段流量计算时,按照以下步骤进行:\n[0024] 1)建立以时间格T(i)与单元路段s(a,b)为维度的初始空白二维矩阵RQ,矩阵RQ中每个元素包含一个值Q,即流量;\n[0025] 2)遍历集合RTT中的数据记录,将每个元素中的n值复制并填入RQ中相同时间格T(i)与单元路段s(a,b)对应的元素Q。\n[0026] 步骤(4)中判别交通状况时,具体采用如下步骤:\n[0027] 1)数据预处理:利用指数平滑法对集合RTT及集合RQ中的平均行程时间及路段流量数据进行处理,剔除短期交通干扰;对指数平滑处理过后的行程时间及路段流量进行标准化处理,消除量纲的差异,并得到集合RTT’及集合RQ’;\n[0028] 2)模糊C-均值聚类:选取经过上步预处理后的部分历史数据,时间范围应为24小时以上;分为三个聚类中心,分别为拥堵、缓行、畅通三种类别,根据各类中心建立隶属度函数;\n[0029] 3)对集合RTT’及集合RQ’中的实时数据进行步骤1)的预处理,然后将其代入步骤2)中所述隶属度函数,计算实时数据隶属于各聚类中心的隶属度,以隶属度最大原则判断实时数据属于的类别,从而对实时公路交通状态进行判别,并提交给相关部门和用户;\n[0030] 4)更新数据,重复步骤3)。\n[0031] 上述步骤(4)的步骤2)中,采用以下C-均值函数:\n[0032] \n[0033] 式中,\n[0034] r1i表示集合RQ’中第i个流量值,r2i表示集合\nRTT’中第i个行程时间;\n[0035] U表示隶属度矩阵,μik为矩阵U第i行,第k列的元素;μik表示第k个样本对于第i个样本的隶属度;m>1,是一个可以控制聚类结果的聚类指数,这里选取m=2;\n[0036] V=[v1,v2,…,vc],vi∈Rn表示聚类中心;\n[0037] 表示内积距离模的平方,\n[0038] A为对角矩阵,这里令A=I,即令A为单位矩阵;\n[0039] 隶属度函数 c表示预定的类别数\n目,分为拥堵、缓行、畅通三种类别,相应地,c取为3;\n附图说明:\n[0040] 图1概要系统结构图;\n[0041] 图2路网简化结构图;\n[0042] 图3Dijkstra算法实现流程图\n具体实施方式\n[0043] 由于我国高速公路投资方式的特点,几乎全部的高速公路都建设了收费站,用以收取通行费来偿还建设资金。收费站能够采集到车辆进入和驶出高速公路的信息,并能够记录详细的车辆信息(例如车型)。这些信息一般以数据的形式存放在高速公路管理部门的数据库,可以进行取转存。\n[0044] 每次有车辆驶入驶出高速公路就会产生一条收费数据,对于一个有一定规模的高速公路路网来说,数据的数量非常庞大并且在时间上和空间上都不是均匀分布的,需要经过数据分析和数据挖掘,才能获取数据中隐含的知识。由于数据清分的需要,高速公路收费系统在省级或以下行政区域的地理界线上通常都会设置省界(或省级以下行政区域)收费站,这就使某一区域的所有车辆都会在本区域内留下完整的进出数据记录。因此各个行政区的路网被假设成独立的闭合网络,也使基于数据轨迹匹配的行程时间和流量的计算具有了可行性。\n[0045] 本发明为了判断路网的实时交通运行状态,在简化路网的基础上,对数据进行异常处理、将只含有起始与终结信息的数据通过全网络数据匹配算法将每条数据匹配到路网上,并进行行程时间和流量的计算,之后利用模糊聚类的算法对交通状态进行判别。下面对这几个步骤进行详细介绍。\n[0046] 为了实现基于全网络收费数据的交通状态识别,主要包括以下4个大步骤:数据异常处理,基于数据轨迹匹配的行程时间计算,基于数据轨迹匹配的路段流量计算,以及基于模糊聚类的交通状态判别,系统结构图如图1所示。\n[0047] 1.数据异常处理\n[0048] 收费站将采集到车辆进入和驶出高速公路的信息以数据的形式储存在集合R中。\n集合R的数据格式如下表:\n[0049] 表1集合R数据格式\n[0050] \n[0051] 其中,\n[0052] 数据编号为车辆驶入、驶出高速公路形成的数据记录的编号;\n[0053] 驶入时间指车辆驶入高速公路的时间;\n[0054] 驶入收费站指车辆进入高速公路时所通过的收费站,这里用编号表示;\n[0055] 驶出时间指车辆驶出高速公路的时间;\n[0056] 驶出收费站指车辆离开高速公路时所通过的收费站,这里用编号表示;\n[0057] 车辆类型是根据车辆的型号、轴距等分为几个等级,用数字表示。这里分为三等:\n1,表示小型车,2表示中型车辆,3表示大型车辆。\n[0058] 由于设备故障或其他原因,在原始数据中存在一部分异常数据。一般来讲,明显的异常数据包含以下两种形式:\n[0059] 1)数据信息缺失,包括时间和收费站信息的缺失;\n[0060] 2)时间异常,例如驶出时间早于或等于驶入时间。设驶入时间为ta(下同)驶出时间为tb(下同),则符合下式中两种情况被认为是明显的时间异常数据。\n[0061] (公式1)\n[0062] 数据集合R中符合以上情况的异常数据将在本步计算中,通过遍历查询的方式筛选并删除,并得到数据集合R’,数据集合R’与数据集合R数据格式相同。\n[0063] 从表1的数据字段结构中可以看出,收费数据主要包含了一辆车进入和离开高速公路路网的时间以及起点和终点等信息。但是这些信息不能直接表现出某路段流量或单元路段的行程时间,因此,需要对每条数据进行分析,分析某辆车在高速公路行驶的过程中,于何时通过了哪一个单元网络节点和哪一条单元路段。\n[0064] 要分析车辆的行驶轨迹,首先要对路网的结构进行分析。若不考虑高速公路路网内道路封闭的情况,道路网络节点与节点之间的道路应为双向联通,同时如上所述,行政区域之间的数据清分,使某一区域的所有车辆都会在本区域内留下完整的进出记录,因此可将高速公路区域路网当作闭合的网络并进行简化。这里假设一个路网的简化结构,如图2所示,方框中的数字表示收费站的编号;用O(下同)来表示驶入收费站,D(下同)来表示驶出收费站,两个O、D点对之间的路段用S(O,D)表示,如果O与D直接连接,中间没有其他节点,我们就把这种路段称之为单元路段s(o,d)。\n[0065] 由于时间最短路径变化比较频繁而且在高速公路上行驶距离与行程时间的关系比较简单,另外,在高速公路上的耗油量和收费状况也都和行驶距离有比较直接的联系,所以,在这里主要用路段距离作为权重信息。用单元路段s(o,d)的长度表示每两个节点之间的道路权重W(s)。\n[0066] 分析车辆的行驶轨迹,不但要对车辆行驶过的路径进行分析还要计算车在什么时间到达了哪个单元路段。同时,因为交通状态是随着时间有潮汐性变化的,为了对不同起始时间的平均行程时间和流量进行平均计算,这里将数据按时间进行排序,并对时间分段,把每个时间段作为一个时间格,用T(i)表示,对每个起始时间在T(i)内的数据进行行程时间和流量的匹配计算,最后,将计算结果标记在由单元路段编号和时间格作为标尺的二维矩阵里并进行最后计算。以下的两个部分将对行程时间和流量的计算分别进行详细说明。\n[0067] 2.行程时间数据计算\n[0068] 本部分的计算分为两个步骤:1)单数据行程时间计算及噪声处理;2)时间段平均行程时间计算。\n[0069] 1):单数据行程时间计算及噪声处理\n[0070] 经过上述异常数据剔除后,数据集合R’每条收费数据中都包含了一辆车驶入和驶出高速公路收费站的时间,这样,用驶出时间减去驶入时间就可以直接得到行程时间数据。\n如下式所示:\n[0071] TT=tb-ta (公式2)\n[0072] 其中,TT表示ta时刻从O出发到D点的行程时间。将数据集合R’中的数据代入上式,计算得到的结果保存在数据集合RT中,如下表所示:\n[0073] 表2集合RT数据格式\n[0074] \n ta O D TT(单位:秒)\n 2008-03-03 0:00:00 3 7 402\n[0075] 经过这一步计算,可以发现一些与相同路段其他数据有较大差别的数据,例如有些在服务区过夜或休息的车辆,其行程时间会明显偏长。将这些明显偏离测量总体的个别观测值定义为噪声数据,并利用分位值法进一步剔除。\n[0076] 将数据集合RT中的数据按ta时间进行排序,并对时间分段,把每个时间段作为一个时间格,用T(i)表示,这里T(i)选用5分钟作为单元时间格的长度,可以根据应用情况而不同,但下面步骤的计算需要与此处进行统一,对每个起始时间ta在T(i)内的数据按照公式(2)进行行程时间计算。为每个时间格T(i)内的行程时间计算结果TT设定上下两个分位值,PTu和PTl,超出这两个分位值的数据认为是噪声数据。数学表达如下:\n[0077] (公式3)\n[0078] 其中,TT(i)为时间格T(i)内第i个行程时间数据。\n[0079] 分位值法的一个先决条件是:需要先假设行程时间的分布,然后根据分布来选择上下分位值。分位值是随机变量的特征数之一。将随机变量分布曲线与x轴包围的面积作n等分,得n-1个值(x_1、x_2……x_(n-1)),这些值称为n分位值。这里就是将TT按照从小到大的顺序排列,假设一个时间格内有10个TT的值,将10分为100等分,20分位值就是位于第20个等分位置的值,即第2个TT值。这里选用20分位值和80分位值,即PTl为起始时间在T(i)时间格内相同O、D的数据集合中的20分位值,PTu为该数据集合中的80分位值。将筛选得到的噪声数据在数据集合RT中删除,并得到数据集合RT’,数据集合RT’与数据集合RT数据结构相同。\n[0080] 2)时间段平均行程时间\n[0081] 为了降低算法运行复杂度以及与流量数据统一,为交通状态判别的计算准备,我们将在数据集合RT’的基础上对同一时间段内O、D相同的记录进行累加,并计算平均行程时间,存入数据集合RTT中,其数据结构如表3所示。\n[0082] 表3集合RTT数据格式\n[0083] \n[0084] 假设某时间格T(i)内,一对起终点(OD)的数据记录数是n,RT’集合中的第i条记录的行程时间是TT(i),被记录入结果数据集RTT的平均行程时间 将按照如下公式计算:\n[0085] (公式4)\n[0086] 这样,对于一对起终点(OD)点对每天的数据量就简化为了288条。\n[0087] 在这一步计算过程中,以上方法计算得到的行程时间更加接近于实际情况,但由于收费记录仅在车辆驶入及驶出的收费站进行标记,如图2所示,从起点1出发到终点4时,上述计算方法只能记录路段S(1,4)的起终点与该路段的平均行程时间,这样,就造成了如s(1,2)、s(2,3)、s(3,4)等路段中的数据缺失。为了弥补这些缺失,本发明优选地通过全网络数据匹配方法,对车辆路过某单元路段但没有产生进出记录的数据进行匹配,估算其驶入与驶出该路段的时间,具体方法如下所述。\n[0088] 假设数据集RT’中没有找到O为3,D为8,即单元路段s(3,8)的数据,但是可以找到类似于表2中O为3,D为7的数据;由于高速公路上,车辆往往会选择距离最短的线路行进,因此,根据图2可以看出S(3,7)可以看成是单元路段s(3,8)与s(8,7)的集合,本发明通过全路网数据匹配,将这种包含s(3,8)的现有数据在时间和空间进行匹配,其具体过程如下:\n[0089] (1)建立以时间格T(i)与单元路段s(a,b)为维度的初始空白二维矩阵RTT,该矩阵中每个元素包含两个值(tt,n),tt用来计算累加的行程时间,n用来记录累加的次数,累加次数的结果实际上也是流量的结果;\n[0090] (2)按时间顺序读取集合RT’中的一条数据记录,采用最优路径算法计算其数据O、D间必经的单元路段s(a,b);\n[0091] (3)假设该车辆以匀速行驶,根据上述数据记录的起始时间ta、行程时间TT,以及O、D间通过的单元路段s(a,b)的距离W(s),计算该车辆驶入不同单元路段s(a,b)的时间ta(a,b),及在本单元路段s(a,b)中行驶的行程时间TT(a,b),并判断该车辆经过该单元路段s(a,b)时所处的时间格T(i),在上述RTT矩阵中时间格T(i)与单元路段s(a,b)对应元素的tt值计为该车辆在该单元路段上的行程时间TT(a,b),并将该元素的n值计为1;\n[0092] 以表2数据集RT中的第一条数据为例(假设该条数据经过噪声处理后,未被剔除,也即,该条数据存在于数据集RT’中),参考图2所示的路网状况,将TT(3,7)匹配为TT(3,\n8)和TT(8,7),其计算方法如下。\n[0093] \n[0094] ta(3,8)=ta(3,7)=2008-03-03 0:00:00\n[0095] 在下方表4行程时间数据集RTT中,时间格2008-03-03 0:00:00与S(3,8)对应的表格中就应添入TT(3,8)一次计算结果的记录316s。\n[0096] \n[0097] \n[0098] 因为ta(7,8)大于时间格“2008-03-03 0:05:00”的起始时间,所以就应该在单元路段s(7,8)与时间格“2008-03-03 0:05:00”所对应的表格中添入TT(7,8)的值119s进行记录。\n[0099] 表4行程时间数据集RTT\n[0100] \n[0101] (4)重复第(2)步,读取下一条数据并继续完成第(3)步的计算,将计算结果TT(a,b)与上述RTT矩阵中T(i)与s(a,b)对应元素的值tt进行累加,并将该元素的n值累加1;\n[0102] (5)重复第(4)步,直至遍历集合RT’中的所有数据,将RTT集合中每个元素的tt值除以n值,得到该单元路段的平均行程时间 将 作为集合RTT中每个元素的值。\n[0103] 以上所述的最优路径算法可以采用经典的Dijkstra算法,该算法的主要思想是从节点开始寻找每个节点到相邻节点的最优路径,通过层层迭代,推出从起点到终点的最优路径。假设每个点都有一对标号(dj,pj),其中dj是从起源点s到点j的最短路径的长度(从顶点到其本身的最短路径是零路(没有弧的路),其长度等于零);pj则是从s到j的最短路径中j点的前一点。其算法流程图如图3所示。\n[0104] 3.路段流量计算\n[0105] 路段流量不同于收费站流量,在高速公路联网收费数据中,只有在进出口发生了收费行为的时候才会被记录,特别是闸道收费站的进出流量并不包括从该收费站上行路段进入,通过本路段,并去往下行路段的流量。因此,路段流量的计算必须考虑整个路网上从不同路段进出,并路过某考查路段的数据。为了计算数据所经过的路径,本发明利用数据轨迹匹配法,将每条数据匹配到由时间格和单元路段组成的二维数组中,从而得到某一时间段内单元路段中的路段流量,具体步骤如下:\n[0106] (1)将数据集RT’中的数据记录按时间排序,并对起始时间在T(i)时间格内的数据进行遍历,通过最优路径算法计算每一条数据OD间必经的单元路段s(a,b),并进行记录。\n[0107] (2)根据数据集RT’中起始时间ta、行程时间TT及OD间通过的单元路段的距离W(s)之和,假设该车辆以匀速行驶,计算该车辆驶入不同单元路段s(a,b)的时间ta(a,b),并判断该车辆经过这些单元路段时所处的时间格。以表2数据集RT中的第一条数据为例(假设该条数据经过噪声处理后,未被剔除,也即,该条数据存在于数据集RT’中),将OD为(3,\n7)的数据匹配为s(3,8)和s(7,8)的流量,其计算方法如下。\n[0108] ta(3,8)=ta(3,7)=2008-03-03 0:00:00\n[0109] 在下方表5流量数据集RQ中,时间格2008-03-03 0:00:00与s(3,8)对应的表格中就应累加1。\n[0110] \n[0111] \n[0112] 因为ta(7,8)大于时间格“2008-03-03 0:05:00”的起始时间,所以就应该在s(7,8)与时间格“2008-03-03 0:05:00”所对应的表格中累加1。\n[0113] 表5流量数据集RQ\n[0114] \n[0115] (3)在不同的时间格T(i)对流量进行记录并在遍历结束后,对T(i)时间格与单元路段s(a,b)对应的记录格内记录的流量累加结果,作为起始时间在T(i)时间格内的流量计算结果。并将结果保留在流量数据集RQ里。\n[0116] 或者,在时间段平均行程时间计算的基础之上,采用如下步骤计算路段流量:\n[0117] (1)建立以时间格T(i)与单元路段s(a,b)为维度的初始空白二维矩阵RQ,矩阵RQ中每个元素包含一个值Q,即流量;\n[0118] (2)遍历集合RTT中的数据记录,将每个元素中的n值复制并填入RQ中相同时间格T(i)与单元路段s(a,b)对应的元素Q。\n[0119] 4.基于模糊聚类的交通状态判别\n[0120] 在前面计算出来的路段时间段平均行程时间和路段流量的基础上,可以通过模糊聚类算法判断出高速公路路网任意两站点之间的交通拥堵状态。基于模糊C-均值聚类的交通拥堵状态判别方法的主要思路是:首先,对数据进行预处理;其次,进行模糊C-均值聚类,选取经过前两步计算得出的一部分历史数据,时间范围应为1天(24小时)以上,时间范围越长,模糊聚类算法的效果也越准确;之后通过该算法,按照历史数据的特点将其分为三类,即聚类中心,然后计算得到各类的聚类中心及隶属度函数;最后计算实时数据距离各类中心的隶属度数值,根据隶属度最大原则判断当前的交通状态并提供给相关用户。在实时数据支持的情况下,可以使相关部门或用户及时识别某路段当前是否拥堵。如有意外发生时也可以及时做出判断,对交通流进行引导,缓解拥堵,保持交通通畅。\n[0121] 基于模糊C-均值聚类的交通状态判别方法具体步骤如下:\n[0122] 1)数据预处理\n[0123] (1)指数平滑处理\n[0124] 利用指数平滑法对原始交通数据进行平滑处理,剔除短期的交通干扰,如随机波动、交通脉冲和压缩波等。即对上述步骤中的平均行程时间集合RTT及流量数据集合RQ中的数据进行处理。\n[0125] 交通参数的指数平滑计算公式为:\n[0126] yi(t)=αxi(t)+(1-α)yi(t-1) (公式5)[0127] 式中,xi(t)表示第t个流量或行程时间数据,yi(t)表示第t个流量或行程时间数据的平滑值;0<α<1,α值越小,得到的数据越平滑,反之则越接近于数据原状,一般来说,α值取0.3。\n[0128] (2)数据标准化处理\n[0129] 由于行程时间及路段流量的特征值存在量纲上的差异,为消除指标特征值物理量量纲的影响,用下式对上一步骤经过平滑处理过的数据进行标准化处理:\n[0130] (公式6)\n[0131] 式中,xi max为第i个指标的最大特征值,xi min为第i个指标的最小特征值,rij为xij的标准化值,0≤rij≤1,并且rij与xij正相关。\n[0132] 平均行程时间集合RTT及流量数据集合RQ经过上两步处理后,分别成为新的集合RTT’及RQ’。\n[0133] 2)模糊C-均值聚类\n[0134] 模糊C-均值聚类是一种基于划分的聚类算法。假设N个观测值的集合记作X,X表示如下一个n×N的矩阵:\n[0135] (公式7.1)\n[0136] 式中,n=2,r1i表示RQ’中第i个流量值,r2i表示RTT’中第i个行程时间。\n[0137] 令c表示预定的类别数目,在本发明中,分为拥堵、缓行、畅通三种类别,相应地,c取为3。μik表示第k个样本对于第i个样本的隶属度,关于μik的基本假设如下:\n[0138] μik∈[0,1],1≤i≤N,1≤k≤c, (公式7.2)[0139] (公式7.3)\n[0140] (公式7.4)\n[0141] 本发明采用由Dunn定义的C均值函数,如下:\n[0142] (公式7.5)\n[0143] 其中,U表示隶属度矩阵,μik为矩阵U第i行,第k列的元素;V=[v1,v2,…,n\nvc],vi∈R 表示聚类中心,也需要计算得到。m>1,是一个可以控制聚类结果的聚类指数,这里选取m=2。 表示内积距离模的平方,其定义如下:\n[0144] (公式7.6)\n[0145] 其中,A为对角矩阵,这里令A=I,即令A为单位矩阵;\n[0146] 这里,通过构造如下的拉格朗日乘子对公式(7.5)求最小值的解:\n[0147] (公式7.7)\n[0148] 通过公式(7.7)关于U,V和λ的偏导数等于0的方程组解得μik和vi,如下:\n[0149] (公式7.8)\n[0150] 且\n[0151] (公式7.9)\n[0152] 取一定量的历史数据作为样本,时间范围应为1天(24小时)以上,时间范围越长,模糊聚类算法的效果也越准确;求出上述样本对于各类的隶属度值和各类的聚类中心,从而完成了模糊聚类的划分。\n[0153] 本发明通过模糊C-均值聚类方法分为畅通、缓行、拥挤三类,并得到各类的聚类中心。然后根据各类的中心和公式建立隶属度函数。\n[0154] 3)实时数据交通状态判别\n[0155] 采集实时数据,对实时数据进行预处理,处理后将其代入上述步骤2)中得到的隶属度函数,即公式(7.8)中,计算隶属于各类的隶属度。以隶属度最大原则对实时公路交通状态进行判别,并提交给相关部门和用户。然后更新数据,重复步骤3。\n[0156] 本发明的实施主要建立在接收的高速公路管理系统所提供的真实路网收费数据和路网简化工作的基础上,对数据进行处理匹配、分析计算得到全路网的站点间行程时间以及交通流量,而后对结果数据进行异常处理,进而利用模糊聚类的方法识别路网上任意站点间的交通状态。
法律信息
- 2018-06-08
未缴年费专利权终止
IPC(主分类): G08G 1/01
专利号: ZL 201110042176.X
申请日:
授权公告日:
- 2013-06-05
- 2012-10-31
著录事项变更
发明人由刘浩 袁媛 张可 牛树云张海林 贺瑞华 桑丽 张剑飞变更为刘浩 张海林 张可 袁媛李斌 李宏海 刘冬梅 牛树云贺瑞华 张纪升 张晓亮 桑丽张剑飞
- 2011-07-20
实质审查的生效
IPC(主分类): G08G 1/01
专利申请号: 201110042176.X
申请日: 2011.02.22
- 2011-06-01
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| | 暂无 |
2009-05-08
| | |
2
| | 暂无 |
2005-10-14
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |