太阳城集团

  • / 33
  • 下载费用:30 金币  

用于处理和分析车辆驾驶大数据的方法及其系统.pdf

摘要
申请专利号:

太阳城集团CN201510080691.5

申请日:

2015.02.13

公开号:

CN105045788A

公开日:

2015.11.11

当前法律状态:

实审

有效性:

审中

法律详情: 实质审查的生效IPC(主分类):G06F 17/30申请日:20150213|||公开
IPC分类号: G06F17/30 主分类号: G06F17/30
申请人: 国民大太阳城集团产学协力团
发明人: 崔银美; 赵源熙
地址: 韩国首尔
优先权: 10-2014-0053388 2014.05.02 KR; 10-2014-0053389 2014.05.02 KR
专利代理机构: 北京品源专利代理有限公司11332 代理人: 杨生平; 钟锦舜
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201510080691.5

授权太阳城集团号:

|||

法律状态太阳城集团日:

太阳城集团2017.04.12|||2015.11.11

法律状态类型:

太阳城集团实质审查的生效|||公开

摘要

太阳城集团提供了一种用于处理和分析车辆驾驶大数据的方法,该方法包括:提炼原始数据的车辆驾驶数据;基于所提炼的车辆驾驶数据获取统计数据;并且基于所述提炼的车辆驾驶数据和所获取的统计数据中的至少一个执行挖掘分析。

权利要求书

1.一种用于处理和分析车辆驾驶大数据的方法,包括:
提炼原始数据的车辆驾驶数据;
基于所提炼的车辆驾驶数据获取统计数据;并且
基于所述提炼的车辆驾驶数据和所获取的统计数据中的至少一个执行挖掘
分析。
2.如权利要求1所述的方法,其中:
所述车辆驾驶数据包括识别数据和感测数据,
所述识别数据包括车辆识别号码、车辆类型、车辆注册号码、运输业运营
商注册号码、和驾驶员识别码、托运文件太阳城集团、托运人和商品名称的字段的记
录中的至少一个,并且
所述感测数据包括车辆的行驶距离、行驶太阳城集团、起始太阳城集团、数据获取周期、
数据获取太阳城集团、速度、RPM、中断信号、位置、方位角、和加速度、位置、OBD-II
(车载诊断II)太阳城集团的字段的记录中的至少一个。
3.如权利要求2所述的方法,其中:
所述提炼包括:
通过确定所述感测数据的每个字段的记录是否具有在极限范围之内的值来
检测界外值;并且
当被检测为界外值的记录具有超出所述极限范围的值时,去除该记录或者
纠正该记录以对应于所述极限范围内的值。
4.如权利要求3所述的方法,其中:
所述提炼包括:
通过在所述纠正之后对所提炼的感测数据的每个字段的后续记录进行偏差
比较来检测界外值;并且
通过所述偏差比较去除被检测为界外值的记录。
5.如权利要求3所述的方法,其中:
所述提炼包括:
通过在所述纠正之后对所提炼的感测数据中具有关联的字段的记录进行比
较来检测界外值;并且
通过关联比较去除被检测为界外值的记录。
6.如权利要求1所述的方法,其中:
所获取的统计数据包括驾驶统计数据和趋势统计数据,
所述驾驶统计数据包括每日行驶距离、总驾驶太阳城集团、平均速度、最大速度
和最大RPM、英里里程、燃料消耗、能量消耗、废气排放、驾驶区域、车辆间
距的字段的记录中的至少一个,并且
所述趋势统计数据包括超速次数、危险超速次数、长期超速次数、快速加
速次数、快速减速次数、快速启动次数、快速停止速度、超车次数、路线改变
次数、快速旋转次数、怠速次数、高RPM次数、车辆间距的字段的记录中的至
少一个。
7.如权利要求6所述的方法,其中:
获取统计数据包括:
通过对所述提炼的车辆驾驶数据进行统计计算来生成所述统计数据;
在所生成的统计数据中确定是否在预定太阳城集团之内重复计算了每个字段的记
录;并且
将确定被重复计算的记录纠正为一个计算值。
8.如权利要求6所述的方法,其中:
执行挖掘分析包括:
基于趋势统计数据对每个类型的车辆驾驶员的驾驶趋势进行分类;并且
太阳城集团所分类的类型中的每一个类型索引车辆驾驶员的趋势程度。
9.如权利要求8所述的方法,其中:
执行挖掘分析包括:
在所述索引之后,生成用于指示对于所分类的类型所索引的结果的索引信
息;并且
分析趋势统计数据字段和索引太阳城集团中的至少一个字段的关联。
10.如权利要求6所述的方法,其中:
执行挖掘分析包括:
基于具体周期,基于所述提炼的车辆驾驶数据和所述获取的统计数据的字
段,分析重复模式;并且
基于所述重复模式,分析所述车辆驾驶员在所述具体周期的驾驶趋势。
11.如权利要求6所述的方法,其中:
所获取的统计数据进一步包括历史数据,其包括事故历史和维修历史字段
的记录,并且
执行挖掘分析包括:
基于所述提炼的车辆驾驶数据和所获取的统计数据,生成用于预测所述事
故历史和维修历史字段中的至少一个的改变的学习模式;并且
通过使用学习模型来分析事故风险和车辆维修太阳城集团中的至少一个。
12.如权利要求11所述的方法,其中,执行挖掘分析包括:在分析事故风
险和维修太阳城集团中的至少一个之后,基于分析结果,生成通过索引事故风险的程
度以及维修太阳城集团是否到来所指示的索引太阳城集团。
13.如权利要求6所述的方法,其中:
执行挖掘分析包括:
基于所述提炼的车辆驾驶数据和所获取的统计数据,提取车辆位置太阳城集团;
并且
基于所提取的车辆位置太阳城集团和趋势统计数据的字段,分析增加事故风险并
且增加空气污染的空间。
14.如权利要求6所述的方法,其中:
执行挖掘分析包括:
基于所述提炼的车辆驾驶数据和所获取的统计数据,提取车辆位置太阳城集团;
并且
基于所提取的车辆位置太阳城集团、趋势统计数据和地图数据,针对每个管辖区
域,分析驾驶员的驾驶趋势。
15.如权利要求8所述的方法,其中:
执行挖掘分析包括:
生成通过索引所分类的种类的趋势程度所指示的索引太阳城集团;并且
基于所述提炼的车辆驾驶数据的运输业运营商注册号码字段,分析所生成
的索引太阳城集团的分布状态。
16.如权利要求8所述的方法,其中:
执行挖掘分析包括:
生成通过索引所分类的种类的趋势程度所指示的索引太阳城集团;并且
在车辆的驾驶员识别所生成的索引太阳城集团之前和之后进行分类,以检测所述
生成的索引太阳城集团、所述提炼的车辆驾驶数据和所述获取的统计数据的改变,并
且基于检测结果,分析车辆驾驶员的驾驶趋势的改变。
17.如权利要求1所述的方法,进一步包括:
在提炼所述车辆驾驶数据之前,采集从车辆驾驶记录仪或传感器获取的车
辆驾驶数据。
18.如权利要求1所述的方法,其中:
所获取的统计数据包括与燃料消耗和废气排放中的至少一个相关的统计数
据,并且
分别根据驾驶员、运输业运营商、区域、道路中的至少一个,对所获取的
统计数据进行分类,并且
执行挖掘分析包括:基于与燃料消耗和废气排放中的至少一个相关的统计
数据,生成驾驶员的节能ECO驾驶太阳城集团和车辆的预测超载太阳城集团中的至少一个。
19.如权利要求1所述的方法,其中:
所获取的统计数据包括与OBD-II(车载诊断II)的诊断代码相关的统计数
据,并且
分别根据驾驶员、运输业运营商、车辆型号、车辆型年中的至少一个,对
所获取的统计数据进行分类,并且
执行挖掘分析包括:基于与诊断代码相关的统计数据,生成太阳城集团车辆异常、
事故风险和车辆维修的预测太阳城集团中的至少一个。
20.一种用于处理和分析车辆驾驶大数据的系统,包括:
通过使用车辆驾驶数据来处理和分析大数据的所述系统,
大数据存储单元,其被配置为存储原始数据的车辆驾驶数据;以及
大数据处理单元,其被配置为提炼存储在所述大数据存储单元中的原始数
据的车辆驾驶数据,基于所提炼的车辆驾驶数据获取统计数据,并且基于所述
提炼的车辆驾驶数据和所获取的统计数据中的至少一个执行挖掘分析。

说明书

用于处理和分析车辆驾驶大数据的方法及其系统

相关申请的交叉引用

本申请基于35U.S.C.§119(a)要求2014年5月2日递交的韩国专利申请号
10-2014-0053388和2014年5月2日递交的韩国专利申请号10-2014-0053389的
优先权,其整体通过引用的方式并入本文。

技术领域

本发明涉及用于处理和分析车辆驾驶大数据的方法,并且更具体地,涉及
一种能够通过系统数据提炼和数据挖掘程序来从太阳城集团车辆驾驶的大数据获取有
用太阳城集团以用于处理和分析车辆驾驶大数据的方法及其系统。

背景技术

大数据意味着通用数据库系统难以采集、存储和分析的大量数据。大数据
的一个实例可以包括社交媒体、从社交网络服务生成的社交数据、网络流量日
志、网络服务器或应用程序的网络日志以及由感测设备日志获取的感测数据和
日志等等,并且在时序数据如网络流量日志的情况中,数据随着太阳城集团累积并且
要处理的数据的大小爆发式地增长。

时序数据的一个实例包括车辆驾驶数据。车辆驾驶数据提供给管理者例如
运输组织、运输安全局(例如NHTSA(国家高速公路交通安全局)等等)、车
辆销售业和/或租赁业运营商,以便用于驾驶历史管理、事故发生期间的事故起
因建立、事故预防、节能管理等等。

最近,对车辆加大了车辆驾驶记录仪的安装和提供。由于时序数据的特征,
处理和分析所需要的车辆驾驶数据的数量快速增长,并且结果导致有必要开发
一种处理和分析车辆驾驶大数据的方法,以便系统地分析大量车辆驾驶数据并
且允许管理者或用户有效地使用通过分析所获取的有用太阳城集团。

该背景技术部分中公开的以上太阳城集团仅用于增强对于本发明的背景的理解并
且因此其可以包括不构成本国的本领域普通技术人员已知的现有技术的太阳城集团。

发明内容

本发明力图提供一种用于处理和分析车辆驾驶大数据的方法及其系统,其
具有系统地分析车辆驾驶的大数据并且允许管理者或用户有效地使用通过分析
所获取的结果太阳城集团的优点。

在一个优选实施方式中,一种用于处理和分析车辆驾驶大数据的方法,包
括:提炼原始数据的车辆驾驶数据;基于所提炼的车辆驾驶数据获取统计数据;
并且基于提炼的车辆驾驶数据和所获取的统计数据中的至少一个执行挖掘分
析。

车辆驾驶数据可以包括识别数据和感测数据,

识别数据可以包括车辆识别号码、车辆类型、车辆注册号码、运输业运营
商注册号码(例如承运人名称)、和驾驶员识别码、托运文件太阳城集团、托运人和商
品名称的字段的记录中的至少一个,并且

感测数据可以包括车辆的行驶距离、行驶太阳城集团、起始太阳城集团、数据获取周期、
数据获取太阳城集团、速度、RPM、中断信号、位置、方位角、和加速度、位置(例
如GNIS(地理名称太阳城集团系统)等等)、OBD-II太阳城集团。

提炼可以包括:通过确定感测数据的每个字段的记录是否具有在极限范围
之内的值来检测界外值;并且当被检测为界外值的记录具有超出极限范围的值
时,去除该记录或者纠正该记录以对应于极限范围内的值。

提炼可以包括:通过在纠正之后对所提炼的感测数据的每个字段的后续记
录进行偏差比较来检测界外值;并且通过偏差比较去除被检测为界外值的记录。

提炼可以包括:通过在纠正之后对所提炼的感测数据中具有关联的字段的
记录进行比较来检测界外值;并且通过关联比较去除被检测为界外值的记录。

所获取的统计数据可以包括驾驶统计数据和趋势统计数据,

驾驶统计数据可以包括每日行驶距离、总驾驶太阳城集团、平均速度、最大速度
和最大RPM、英里里程(即燃料效率)、燃料消耗、能量消耗、废气排放、驾驶
区域、车辆间距的字段的记录中的至少一个,并且

趋势统计数据可以包括超速次数、危险超速次数、长期超速次数、快速加
速次数、快速减速次数、快速启动次数、快速停止速度、超车次数、路线改变
次数、快速旋转次数、怠速次数、高RPM次数、车辆间距的字段的记录中的至
少一个

获取统计数据可以包括:通过对提炼的车辆驾驶数据进行统计计算来生成
统计数据;在所生成的统计数据中确定是否在预定太阳城集团之内重复计算了每个字
段的记录;并且将确定被重复计算的记录纠正为一个计算值。

执行挖掘分析可以包括:基于趋势统计数据对每个类型的车辆驾驶员的驾
驶趋势进行分类;并且太阳城集团所分类的类型中的每一个类型索引车辆驾驶员的趋
势程度。

执行挖掘分析可以包括:在索引之后,生成用于指示对于所分类的类型所
索引的结果的索引太阳城集团;并且分析趋势统计数据字段和索引太阳城集团字段中的至少
一个字段的关联。

执行挖掘分析可以包括:基于具体周期,基于提炼的车辆驾驶数据和获取
的统计数据的字段,分析重复模式;并且基于重复模式,分析车辆驾驶员在具
体周期的驾驶趋势。

所获取的统计数据进一步可以包括历史数据,其可以包括事故历史和维修
历史字段的记录,并且

执行挖掘分析可以包括:基于提炼的车辆驾驶数据和所获取的统计数据,
生成用于预测事故历史和维修历史字段中的至少一个的改变的学习模式;并且
通过使用学习模型来分析事故风险和车辆维修太阳城集团中的至少一个。

执行挖掘分析可以包括:在分析事故风险和维修太阳城集团中的至少一个之后,
基于分析结果,生成通过索引事故风险的程度以及维修太阳城集团是否到来所指示的
索引太阳城集团。

执行挖掘分析可以包括:基于提炼的车辆驾驶数据和所获取的统计数据,
提取车辆位置太阳城集团;并且基于所提取的车辆位置太阳城集团和趋势统计数据的字段,
分析增加事故风险并且增加空气污染的空间。

执行挖掘分析可以包括:基于提炼的车辆驾驶数据和所获取的统计数据,
提取车辆位置太阳城集团;并且基于所提取的车辆位置太阳城集团、趋势统计数据和地图数
据,针对每个管辖区域,分析驾驶员的驾驶趋势。

执行挖掘分析可以包括:生成通过索引所分类的种类的趋势程度所指示的
索引太阳城集团;并且基于提炼的车辆驾驶数据的运输业运营商注册号码字段,分析
所生成的索引太阳城集团的分布状态。

执行挖掘分析可以包括:生成通过索引所分类的种类的趋势程度所指示的
索引太阳城集团;并且在车辆的驾驶员识别所生成的索引太阳城集团之前和之后进行分类,
以检测生成的索引太阳城集团、提炼的车辆驾驶数据和获取的统计数据的改变,并且
基于检测结果,分析车辆驾驶员的驾驶趋势的改变。

在提炼车辆驾驶数据之前,所述方法可以进一步包括采集从车辆驾驶记录
仪或传感器获取的车辆驾驶数据。

所获取的统计数据可以包括与燃料消耗和废气排放中的至少一个相关的统
计数据,并且

分别根据驾驶员、运输业运营商、区域、道路中的至少一个,对所获取的
统计数据进行分类,并且

执行挖掘分析可以包括:基于与燃料消耗和废气排放中的至少一个相关的
统计数据,生成驾驶员的节能(ECO)驾驶太阳城集团和车辆的预测超载太阳城集团中的至少一
个。

所获取的统计数据可以包括与OBD-II(车载诊断II)的诊断代码相关的统
计数据,并且

分别根据驾驶员、运输业运营商、车辆型号、车辆型年中的至少一个,对
所获取的统计数据进行分类,并且

执行挖掘分析可以包括:基于与诊断代码相关的统计数据,生成太阳城集团车辆
异常、事故风险和车辆维修的预测太阳城集团中的至少一个。

在另一个优选实施方式中,一种用于处理和分析车辆驾驶大数据的系统,
包括:通过使用车辆驾驶数据来处理和分析大数据的所述系统;大数据存储单
元,其被配置为存储原始数据的车辆驾驶数据;以及大数据处理单元,其被配
置为提炼存储在所述大数据存储单元中的原始数据的车辆驾驶数据,基于所提
炼的车辆驾驶数据获取统计数据,并且基于所述提炼的车辆驾驶数据和所获取
的统计数据中的至少一个执行挖掘分析。

根据本发明的实施方式,当分析由所采集的车辆驾驶数据配置的大数据时,
通过对于原始数据执行两步骤的提炼,从所提炼的原始数据提取统计数据并且
在短期的观点和长期的观点上执行复杂数据挖掘,能够降低分析误差并且改善
分析性能。

进一步地,通过向用户提供通过对由采集的车辆驾驶数据所配置的大数据
进行分析所提取的结果太阳城集团,车辆驾驶员的安全驾驶感应、车辆燃料有效改善
感应、预维修感应和事故预防是有可能的,可以改善运输业运营商的管理效率,
并且可以有效地改善导致事故风险的管辖区域、道路等等以及公共机构如运输
安全局中的环境恶化。

附图说明

将参考附图中仅通过实例的方式而不是为了限制本发明所示出的本发明的
特定示例性实施方式来详细描述本发明的以上以及其他特征,并且其中:

图1是用于描述根据本发明的一个实施方式的用于处理和分析车辆驾驶大
数据的系统的图;

图2是用于更具体地描述根据本发明的实施方式的用于处理和分析车辆驾
驶大数据的系统中的存储和管理单元的图;

图3是用于描述在根据本发明的实施方式的用于处理和分析车辆驾驶大数
据的系统中的处理单元执行的大数据处理和执行方法的流程图,以及,图4-11
是用于更具体地描述图3的大数据处理和分析方法的相应步骤的图;

图12是用于更具体地描述根据本发明的实施方式的用于处理和分析车辆驾
驶大数据的系统中控制器的图;

图13是用于更具体地描述根据本发明的实施方式的用于处理和分析车辆驾
驶大数据的系统中用户接口的图;以及图14-19是用于描述由用户接口提供的数
据可视化的可实现的实例的图;以及

图20用于例示作为车辆驾驶数据的一个实例的数字转速图表(DTG)或数字
转速计的存储格式的图。

应该理解,附图无需按比例,其给出用于说明本发明的基本原理的各种优
选特征的稍微简化的表示。可以部分地通过具体的专用应用或使用环境来确定
如本文所公开的本发明的具体设计特征,该特征包括例如具体维度、方向、位
置和形状。

在附图中,附图标记在附图的多幅图中始终指代本发明的相同的或等效的
部分。

具体实施方式

在下文中将参考附图描述本发明的实施方式。在附图中相同的附图标记指
代相同的元件,并且省略相同元件的重复描述。

提供本发明的实施方式以向本领域普通技术人员更完整地描述本发明,并
且以下实施方式可以修改成各种不同形式,并且本发明的范围不是由以下实施
方式限制的。尽管如此,提供实施方式以使得本发明更加详尽和完整,并且本
领域熟练技术人员完整地传达本发明的精神。

在本发明的实施方式的描述中,当确定与本发明相关的已知技术的详细描
述可能模糊本发明的主旨时,将省略其详细描述。此外,在描述说明书期间使
用的数字(例如第一、第二等等)仅仅是用于区分一个组件与另一个组件的识
别符号。此外,在说明书中,当提及一个元件“连接”或“接近”其他元件时,
该一个元件可以直接连接或直接接近该其他元件,但是,如果没有具体相反的
描述,则应该明白两个元件可以利用介于它们之间的另一个元件彼此连接和接
近。

另外,在说明书中使用的术语如用于明白地表达本发明的实施方式的术语
可能非常依赖于用户、用户的意图或者本发明所属的实施领域。因此,应该基
于本说明书的全部内容来限定本发明的术语。在各个附图中相同的附图标记指
代相同的元件。

图1是用于描述根据本发明的一个实施方式的用于处理和分析车辆驾驶大
数据的系统的图。

在图1中,例示了用于分析和处理由车辆驾驶数据配置的大数据的系统,
其中,车辆驾驶数据是由车辆驾驶记录仪(VDR)直接获取的,但是本发明的
技术思想不限于此。即除了由如图1的实施方式的VDR所直接获取的数据之外,
本发明的技术思想还可以处理从安装在运输装置如车辆中的各种传感器获取的
太阳城集团车辆驾驶的大数据。此外,根据本发明的技术精神,除了通过安装在车辆
上的设备如VDR、传感器、黑盒等等获取的数据之外,可以另外使用通过乘坐
于车辆中的占有者的用户终端(例如智能电话)非直接获取的太阳城集团车辆的操作
的数据(例如可以通过安装在智能电话上的GPS传感器、加速器传感器等等获
取的位置太阳城集团、速度太阳城集团、加速度太阳城集团等等)。通过用于处理太阳城集团车辆操作的大
数据的短距离无线通信网络如蓝牙、Wi-Fi、NFC(近场通信)、RFID(射频识
别)等等,采集从占有者拥有的用户终端获取的数据。然而,在下文中,为了
描述方便起见,将主要描述将由VDR获取的大数据用作车辆驾驶大数据的情况。

参考图1,用于处理和分析车辆驾驶大数据的系统300通过通信网络200与
多个VDR100连接。在本文,VDR100安装在运输装置如车辆上以采集并且获
取对应的运输装置的车辆驾驶数据,并且可以通过通信网络200将所获取的车
辆驾驶数据传输给用于处理和分析车辆驾驶大数据的系统300。虽然,在图1中,
例示了通过通信网络200将所获取的车辆驾驶数据传输给用于处理和分析车辆
驾驶大数据的系统300的情况中,但是,本发明显然不限于此。

由VDR100获取的车辆驾驶数据可以具有如图20所示的存储格式。在本文,
20示出了作为车辆驾驶数据的一个实例的数字转速图表或数字转速计(DTG)的
存储格式的图。然而,自然可以以不同方式修改根据所使用的VDR存储格式可
记录的车辆驾驶数据。即在本发明的说明书中,主要描述用于记录图20中所示
的车辆操作数据的数字转速图表或数字转速计(DTG)作为VDR,但是除了DTG
外可以使用各种设备作为VDR。例如,可以使用EOBR(电子车载记录仪)、EDR
(事件数据记录仪)、OBD-II(车载诊断II)等等作为VDR。下文将简要描述这
些设备。

在本文中,用于防止由于驾驶员的过度操作累积的疲劳所导致的事故的
EOBR是必须安装在美国商务车上的设备。由EOBR记录的与车辆操作数据关
联的字段包括驾驶员、运输业运营商名称、车辆号码、车辆位置、行驶距离、
起始太阳城集团、实际操作太阳城集团、工作状态、数据/太阳城集团、托运人和商品名称、托运文
件太阳城集团等等。

另外,作为记录事故太阳城集团之前和之后的几秒的太阳城集团的设备的EDR可以记录
与具体事件(例如气囊炸开的事件)有关联的车辆操作数据。由EOBR记录的
与车辆操作数据关联的字段包括车辆ID、数据/太阳城集团、碰撞速度、起始速度、碰
撞速度变化值、驾驶员动作(例如与刹车、离合器踏板、转向、喇叭等等关联
的动作),太阳城集团活动安全设备(例如ABS等等)的监视太阳城集团等等。

另外,OBD-II可用于车辆诊断并且与用户终端如用于回波驾驶的智能电话
通过蓝牙相连接。由OBD-II记录的与车辆操作数据关联的字段包括引擎冷却剂
温度、油门位置、进气温度、燃料等级输入、蒸发器系统蒸汽压力、控制模块
电压、绝对油门位置、加速器踏板位置、氧气传感器电压、燃料类型、引擎油
温、燃料注入定时、引擎燃料率、引擎参考扭矩、引擎百分比扭矩数据、氧化
氮传感器、诊断代码等等。

使用如上所述的车辆驾驶数据的用于处理和分析车辆驾驶大数据的系统
300可以包括车辆驾驶大数据存储和管理单元310(在下文中称为存储和管理单
元)、车辆驾驶大数据处理单元330(在下文中称为处理单元)、控制器350、数
据库370和用户接口390,并且在下文中,将参考图2到图13顺次描述每个构
成单元。

[车辆驾驶大数据存储和管理单元的功能和作用-图2]

图2是用于更具体地描述根据本发明的实施方式的用于处理和分析车辆驾
驶大数据的系统300中的存储和管理单元310的图。

参考图2,存储和管理单元310可以包括管理单元311和数据存储装置313。

管理单元311可以通过通信单元200(见图1)接收从多个VDR100(见图
1)提供的原始数据的车辆驾驶数据。管理单元311可以控制到数据存储装置313
的原始数据的车辆驾驶数据存储以及来自数据存储装置313的原始数据的车辆
驾驶数据输出。

数据存储装置313可以存储原始数据的车辆驾驶数据。数据存储装置313
可以由例如可以彼此物理分离的多个存储器配置,并且相应的存储器可以共享
并且存储相同的原始数据的车辆驾驶数据。

即存储和管理单元310可以被分布式文件系统如包括管理单元310和数据
存储装置313的Hadoop分布式文件系统配置。

[车辆驾驶大数据处理单元的功能和作用-图3到图11]

图3是用于描述在根据本发明的实施方式的用于处理和分析车辆驾驶大数
据的系统300中的处理单元330执行的大数据处理和执行方法的流程图,以及,
图4-11是用于更具体地描述图3的大数据处理和分析方法的相应步骤的图。可
以在处理单元330中通过用于实现对应算法的至少一个软件来执行图3所示的
大数据处理和分析方法的相应步骤。在下文中,将参考图4-11描述图3所示的
的大数据处理和分析方法的相应步骤。

基本提炼过程(S3310)

参考图3和图4,处理单元330可以大体提炼从存储和管理单元310提供的
车辆驾驶数据(S3310)。在这里,从存储和管理单元310提供的车辆驾驶数据
可能是未提炼的原始数据,其具有如图20中所示的存储格式,并且可以包括识
别数据和感测数据。

在这里,识别数据可以包括字段的记录,如车辆识别号码、车辆类型、车
辆注册号码、运输业运营商注册号码(例如承运人名称)、和驾驶员识别码、托
运文件太阳城集团、托运人和商品名称等等,以作为用于识别安装有VDR100(见图1)
的车辆、对应车辆的驾驶员、对应安装的车辆所属的运输业运营商等等的数据。
此外,感测数据可以包括例如字段的记录,如车辆的行驶距离、驾驶太阳城集团、起
始太阳城集团、数据获取周期、数据获取太阳城集团、速度、RPM、中断信号、位置、方位
角、和加速度、位置(例如GNIS(地理名称太阳城集团系统)等等)以及上述OBD-II
太阳城集团等等,以作为各种传感器获取的将被VDR100采集的数据。

当详细描述基本提炼过程(S3310)时,首先,处理单元330确定在原始数
据的车辆驾驶数据中(更具体地,对车辆驾驶数据中所包括的感测数据求平均),
每个字段的记录是否具有位于正常感测范围(即预定极限范围)之内的值,以
检测界外值(S3311)。

作为一个实例,在车辆速度字段的情况中,当车辆速度传感器正常操作时,
处理单元330确定每个记录是否具有位于感测范围(例如0到250km/h)之内
的值,以检测具有超出感测范围之外的值的记录作为界外值。

作为另一个实例,在RPM字段的情况中,处理单元330确定每个记录是否
具有在RPM传感器的感测范围(例如0到6000rpm)之内的值,以检测具有超
出感测范围之外的值的记录作为界外值。

作为再一个实例,在GPS位置字段的情况中,处理单元330确定每个记录
是否具有位于与具体区域内的经度和纬度相对应的x和y坐标上的值(例如,
在韩国境内的情况中,125.8<x<131.0以及33.0<y<39.0),以检测具有超出范围
之外的值的记录作为界外值。

同时,在中断信号传感器的感测值为0和1的中断信号字段的情况中,可
以将0和1设置为用于检测界外值的参考值,并且处理单元330可以在中断信
号字段的记录之中检测具有超出参考值的值的记录作为界外值。

如上所述,处理单元330可以对于每个字段去除或纠正被检测为界外值的
记录(S3313)。在上述实例之中,作为车辆速度字段的一个实例,处理单元330
可以从车辆速度字段中被检测为界外值的记录之中,去除具有极限范围的上限
和下限并且偏差大于参考偏差(例如速度感测设备的感测误差范围)的记录。
可替换地,可以将具有在参考偏差之内的偏差的记录纠正为与极限范围的上限
或下限相对应的值。

比较提炼过程(S3330)

参考图3和图5,可以再次比较地提炼大体提炼的车辆驾驶数据(S3330)。

在一个实施方式中,处理单元330可以通过大体提炼的车辆驾驶数据中的
每个字段的后续记录之间的偏差比较,检测界外值(S3331)。

例如,当车辆速度字段中的后续记录具有显著差异(以前的记录是0km/h
并且下一个记录是100km/h)时,以前的记录和/或下一个记录可以检测为界外
值。类似地,即使在加速度字段、RPM字段、方位角字段等等的情况中,可以
通过后续记录的偏差比较来检测界外值。

在另一个实施方式中,处理单元330比较在大体提炼的车辆驾驶数据中具
有关联的字段的记录,以检测界外值(S3333)。

例如,参考图6和图7,在如图6中所示的车辆速度字段和RPM字段的情
况中,形成相互成比例的关系(皮尔森关联系数是0.89826)是正常的,并且如
图7中所示的,因为互为倒数的关系是异常形成的(皮尔森关联系数是-0.79212),
处理单元330可以通过比较具有关联的字段的记录,检测形成异常关系的记录
作为界外值。

作为结果,处理单元330可以通过偏差比较(S3331)和/或关联比较(S3333),
去除被检测为界外值的记录(S3335)。

就这点而言,可以改善用于通过两步骤车辆驾驶大数据提炼来处理和分析
车辆驾驶大数据的系统300的数据分析的可靠性。

统计数据提取过程(S3350)

参考图3和图8,可以基于大体提炼和比较提炼的车辆驾驶数据,获取统计
数据(S3350)。

在这里,统计数据静态地处理并且提取所提炼的车辆驾驶数据并且可以具
有与以下表格1类似的存储格式。

[表格1]



在这里,在统计数据的字段中,与安装有VDR100的车辆的驾驶有关的字
段如每日行驶距离、总驾驶太阳城集团、平均速度和最大速度以及该字段的记录可以
被分类为驾驶统计数据。

此外,与安装有VDR100的车辆的驾驶员的驾驶趋势有关的字段例如超速
次数、危险超速次数、长期超速次数、快速加速次数、快速减速次数、按等级
超速次数、按等级危险超速次数、以及该字段的记录可以被分类为驾驶统计数
据。

参考图8,当更详细地描述统计数据获取过程(S3350)时,首先,处理单
元330可以统计地计算所提炼的车辆驾驶数据,以生成统计数据(S3351)。

例如,处理单元330可以统计地计算提炼的车辆驾驶数据中的车辆速度字
段的记录(例如计算平均值),以生成统计数据字段如平均速度。

作为另一个实例,处理单元330可以统计地计算车辆速度字段的记录(例
如将基于GPS位置太阳城集团所确定的道路的速度极限设置为极限值,以计算所有周
期或一些周期中极限值的超过次数),以生成超速次数、危险超速次数、长期超
速次数等等的统计数据字段。类似地,处理单元330可以统计地计算加速字段
的记录(例如基于任意值计算所有周期或一些周期中极限值的超过次数),以生
成快速加速次数、快速减速次数等等的统计数据字段。

作为另一个实例,处理单元330可以统计地计算车辆的行驶距离和驾驶时
间的记录(例如计算累计值或一些周期中的累计值),以生成车辆的每日行驶距
离、每日行驶太阳城集团等等的统计数据字段。

作为另一个实例,处理单元330可以复杂并且统计地计算车辆速度、方位
角、RPM等等的字段的记录(例如基于车辆速度字段的记录,计算方位角字段
的记录或者RPM字段的记录的改变,以生成超车次数、路线改变次数、快速旋
转次数等等的统计数据字段)。

接下来,处理单元330在多个所生成的统计数据中确定是否在预定太阳城集团内
重复计算了字段记录,以纠正被确定为重复计算的记录(S3353)。

进一步参考图9,当在前述实例之中描述生成超速字段的记录的实例时,当
数据获取周期是1秒时,处理单元330可以计算超速的次数在预定太阳城集团范围(在
下文中的窗口)例如15秒内为最大的15次。在该情况中,当驾驶员连续超速
时,实质上需要将超速次数字段的记录生成为1,但是可能生成为15,从而恶
化数据分析可靠性。

因此,处理单元330确定超速次数字段的记录在上述窗口中是否被重复计
算,以检测界外值,并且可以将超速次数字段的记录纠正为1。

就这点而言,通过统计数据的纠正可以进一步改善用于处理和分析车辆驾
驶大数据的系统300的数据分析可靠性。

短期观点上的数据挖掘过程(S3370)

参考图3和图10,处理单元330可以基于所提炼的车辆驾驶数据和所获取
的统计数据中的至少一个在短期观点上执行数据挖掘分析,以生成具体结果信
息(S3370)。

在本文中,短期数据挖掘分析可以包括对于独立的VDR100在微观观点上
的数据分析以及在短期观点上的太阳城集团顺序分析即实时数据分析概念的情况。例
如作为在短期观点上的数据挖掘的技术,在存在太阳城集团事故/维修预测的直接太阳城集团
如事故历史和维修历史字段的情况中,可以使用作为监督学习类型分析技术的
回归分析技术、判决树技术、神经网络技术、SVM(支持向量机)等等。例如,
在不存在直接太阳城集团如驾驶员的驾驶类型的情况中,可以使用作为非监督学习类
型分析技术的集群分析技术、关联分析技术等等。

参考图10,当更详细地描述短期观点上的数据挖掘过程(S3370)时,处理
单元330可以基于与趋势有关的字段即所获取的统计数据中的趋势统计数据,
针对每个类型对驾驶员的驾驶趋势进行分类(S3371)。

在一个实施方式中,处理单元330可以基于趋势统计数据,将对应的驾驶
员的驾驶类型分类为危险驾驶员类型、烦躁驾驶员类型、耗能驾驶员类型等等,
其中,该趋势统计数据包括超速次数、危险超速次数、长期超速次数、快速加
速次数、快速减速次数、快速启动次数、超车次数、路径改变次数、怠速次数
等等的字段。在该情况中,可以使用上文例示的非监督学习类型分析技术作为
数据挖掘技术。

在另一个实施方式中,处理单元330可以生成通过索引与所分类的类型相
对应的特征所表示的索引太阳城集团(S3373)。

例如,处理单元330可以基于太阳城集团危险驾驶员类型的超速次数、危险超速
次数、长期超速次数等等的字段的记录,生成通过索引风险等级来表示的索引
太阳城集团。

作为另一个实例,处理单元330可以基于太阳城集团耗能驾驶员类型的RPM、快
速加速次数、怠速次数等等的字段的记录,估计燃料消耗和二氧化碳排放,并
且通过索引所估计的结果,生成燃料消耗索引太阳城集团和环境索引太阳城集团。

危险驾驶索引太阳城集团,燃料消耗索引太阳城集团和环境索引太阳城集团通过控制器350(见
图1)和用户接口370(见图1)提供给驾驶员,以允许驾驶员改善驾驶习惯。
进一步地,危险驾驶索引太阳城集团通过控制器350(见图1)和用户接口370(见图
1)提供给驾驶员所属的运输业运营商等等,以允许运输业运营商管理、监督和
教育驾驶员。

同时,处理单元330可以基于包括在车辆驾驶数据中的事故历史和维修历
史的字段来估计事故风险和故障风险而不管所分类的类型是什么,并且还可以
通过索引事故风险和故障风险的结果,生成事故风险索引太阳城集团和维修对象索引
太阳城集团。

事故风险索引太阳城集团和故障风险索引太阳城集团与危险驾驶索引太阳城集团一样提供给驾
驶员和运输业运营商,以预防驾驶员和运输业运营商的事故并且在适当的太阳城集团
维修车辆。

进一步地,在一个实施方式中,处理单元330可以执行挖掘以分析具体索
引太阳城集团与趋势统计数据的具体字段之间或者具体索引太阳城集团与所提炼的车辆驾驶
数据的具体字段之间的关联,并且提取用于指示其之间的交互分析结果的结果
太阳城集团(S3375)。

处理单元330可以例如通过分析危险驾驶索引太阳城集团与车辆类型或车辆型号
的字段之间的关联来分析交互,并且提取用于指示其之间的交互分析结果的结
果太阳城集团。

更具体地,上述所获取的统计数据包括与燃料消耗和废气排放中的至少一
个有关的统计数据。在这里,分别根据驾驶员、运输业运营商、区域、道路中
的至少一个来分类所获取的统计数据。因此,执行数据挖掘可以包括基于与燃
料消耗和废气排放中的至少一个有关的统计数据,生成驾驶员的Eco驾驶太阳城集团
和车辆的预测超载太阳城集团中的至少一个。

在另一个情况中,上述所获取的统计数据包括与OBD-II(车载诊断II)有
关的统计数据。在这里,分别根据驾驶员、运输业运营商、车辆型号、车辆型
年中的至少一个来分类所获取的统计数据。因此,执行数据挖掘可以包括基于
与诊断代码有关的统计数据,生成太阳城集团车辆异常、事故风险和车辆维修的预测
太阳城集团中的至少一个。

长期观点上的数据挖掘过程(S3390)

参考图3和图11,处理单元330可以使用所提炼的车辆驾驶数据、所获取
的统计数据、所生成的索引太阳城集团等等在长期观点上执行数据挖掘分析,以生成
具体结果太阳城集团(S3390)。

在本文中,长期观点上的数据挖掘是太阳城集团顺序概念,其包括对于VDR100
在长期观点上的数据分析概念和在微观观点上的数据分析概念。

在该实施方式中,处理单元330可以基于所提炼的车辆驾驶数据、所获取
的统计数据以及所述索引太阳城集团,分析在具体周期上的重复趋势,并且提取用于
表示分析结果的结果太阳城集团(图11的S3391)。

处理单元330可以例如在所获取的统计数据的趋势统计数据的字段中分析
对于每天、对于每次、对于每个季节或对于每个事件(不规则事件如假期、长
周末和事故)的重复模式,以提取用于表示驾驶员在具体周期上的驾驶趋势和
驾驶习惯的结果太阳城集团。结果太阳城集团可以包括用于表示在具体周期上所有驾驶员的
公共驾驶趋势和驾驶习惯以及具体驾驶员的具体驾驶趋势和驾驶习惯的太阳城集团。

同时,处理单元330将危险驾驶索引太阳城集团、燃料消耗索引太阳城集团等等预先存
储在用于处理和分析车辆驾驶大数据的系统300中,或者分析与其他太阳城集团如从
外部设备提供的天气太阳城集团和交通太阳城集团的关联,以提取用于指示其之间的交互分
析结果的结果太阳城集团。

在另一个实施方式中,处理单元330可以生成用于基于所提炼的车辆驾驶
数据、所获取的统计数据和索引太阳城集团来预测具体字段的改变的学习模型,并且
提取用于表示具体字段的改变的预测结果的结果太阳城集团(图11的S3393)。

作为一个实例,处理单元330可以创建用于基于事故历史字段来预测事故
发生太阳城集团等等的学习模型,并且连同事故风险索引太阳城集团提取用于表示所预测的
事故发生太阳城集团、风险等等的结果太阳城集团。

作为另一个实例,处理单元330可以创建用于基于维修历史字段预测故障
发生太阳城集团等等的学习模型,并且连同维修对象索引太阳城集团提取用于表示所预测的
维修太阳城集团、故障风险等等的结果太阳城集团。

同时,处理单元330从用于指示事故发生太阳城集团和风险或故障发生太阳城集团以及
各种VDR中的每个的风险的结果太阳城集团提取公共特征,例如具体车辆类型(或具
体车辆型号)的公共事故发生太阳城集团和公共故障发生太阳城集团,以生成用于指示具体
车辆类型的事故风险和故障风险的结果太阳城集团。

在另一个实施方式中,处理单元330可以基于所提炼的车辆驾驶数据、所
获取的统计数据和索引太阳城集团,分析与空间数据相关的特征,并且提取用于表示
分析结果的结果太阳城集团(S3395)。

处理单元330可以例如基于各种VDR的GPS位置字段和各种VDR的危险
驾驶索引太阳城集团、燃料消耗索引太阳城集团、环境索引太阳城集团等等,提取用于指示高风险
道路、常规紧急停车道路、导致过量二氧化碳排放的道路等等的结果太阳城集团。

同时,处理单元330可以将GPS位置字段、危险驾驶索引太阳城集团、燃料消耗
索引太阳城集团、环境索引太阳城集团等等与预存储在用于处理和分析车辆驾驶大数据的系
统300(见图1)中或者从外部设备提供的电子地图数据匹配,以提取用于指示
与每个管辖区域的驾驶员的趋势有关的索引分布的结果太阳城集团。

在另一个实施方式中,处理单元330可以基于具体字段、基于所提炼的车
辆驾驶数据、所获取的统计数据和索引太阳城集团,提取用于指示索引太阳城集团的分布状
态的结果太阳城集团(S3397)。

处理单元330可以例如基于运输操作注册号码字段,分析驾驶员的危险驾
驶索引、燃料消耗索引太阳城集团、环境索引太阳城集团等等,以提取用于指示每个公司的
驾驶员类型以及每个公司的索引太阳城集团分布状态的结果太阳城集团。

在另一个实施方式中,处理单元330可以基于所提炼的车辆驾驶数据、所
获取的统计数据和索引太阳城集团,提取用于指示在用户识别结果太阳城集团之前和之后的
改变的结果太阳城集团(S3399)。

处理单元330可以例如从驾驶员、运输业运营商等等接收通过复杂地分析
危险驾驶索引太阳城集团、燃料消耗索引太阳城集团、环境索引太阳城集团、控制器350的结果信
息以及将警报消息等等提供给对应的驾驶员的日期或执行提供给驾驶员所属的
运输业运营商以定位对应驾驶员的教育的日期的太阳城集团所生成的分析太阳城集团。作为
结果,处理单元330可以通过检查车辆驾驶数据、所获取的统计数据、索引信
息在驾驶员识别了具体结果太阳城集团之前和之后或者在驾驶员的教育之前和之后的
改变,分析驾驶员的驾驶趋势的改变,并且提取用于指示分析结果的结果太阳城集团。

就这点而言,可以通过复杂和有效的数据挖掘改善用于处理和分析车辆驾
驶大数据的系统300的分析性能。

[控制器的功能和作用-图12]

图12是用于更具体地描述根据本发明的实施方式的用于处理和分析车辆驾
驶大数据的系统300中控制器350的图。参考图12,控制器350可以包括分析
单元351和管理单元353。

分析单元351复杂地分析索引太阳城集团、结果太阳城集团和在处理单元330中生成的
多个统计数据,以生成各种分析太阳城集团和反应分析结果的警报消息。

分析单元351可以例如对于太阳城集团单独的车辆驾驶员的驾驶趋势、燃料消耗
索引和环境性能索引的分析太阳城集团中的至少一个,对于每次和每个公司等等,生
成索引分析太阳城集团、统计分析太阳城集团。分析单元351可以生成警报消息以提供事故
风险索引太阳城集团等等给驾驶员和运输业运营商。

此外,分析单元351可以生成分析太阳城集团和警报消息,其反应对于每个管辖
区域的驾驶员驾驶趋势、具体道路的事故风险、环境效果等等的分析的结果。

管理单元353可以在数据库370中存储并且管理分析太阳城集团、警报消息、从
处理单元330提供的统计数据、索引太阳城集团和结果太阳城集团。

管理单元353可以根据预定周期或者当驾驶员、运输业运营商、运输安全
局等等请求时,通过用户接口390提供分析太阳城集团等等给驾驶员、车辆销售商和/
或租赁运营商、运输安全局等等。

因此,车辆驾驶员的安全驾驶感应、车辆燃料有效改善感应、预维修感应
和事故预防是有可能的,可以改善运输业运营商的管理效率,并且可以有效地
改善导致事故风险的管辖区域、道路等等以及公共机构如运输安全局中的环境
恶化。

[用户接口单元的功能和作用-图13和图14到图19]

图13是用于更具体地描述用户接口390的图;以及图14-19是用于描述由
用户接口390提供的数据可视化的可实现的实例的图。

参考图13,用户接口390可以包括可视化处理单元391。

可视化处理单元391可视化将由用户如驾驶员和运输业运营商直接识别的
从控制器350提供的统计数据、结果太阳城集团等等。可视化处理单元391可以例如
执行对于包括在车辆驾驶数据中的每个单一的车辆驾驶字段的集群分析的可视
化、对于每个单一的车辆驾驶字段的统计分析的可视化、对于每个单一的车辆
驾驶字段的等级重分类的可视化,对于车辆驾驶数据之中具有关联的两个车辆
驾驶字段之间的交叉分析的可视化、对于车辆驾驶数据的太阳城集团顺序原始数据分
析的可视化等等。

进一步地,可视化处理单元391还可以执行与各种挖掘分析如上述短期观
点上的数据挖掘过程(S3370)和长期观点上的数据挖掘过程(S3390)有关的
可视化处理,即用于通过执行挖掘分析来推断结果太阳城集团的可视化处理。就这点
而言,通过可视化处理单元391的可视化处理,用户可以直接执行各种挖掘分
析如短期观点上的数据挖掘过程(S3370)和长期观点上的数据挖掘过程
(S3390)。

当参考图14到图19来更详细地描述可视化的实例时,可视化处理单元391
可以可视化统计数据中的车辆的超速次数、快速加速次数等等的字段的记录,
以执行如图14中所示的集群分析。进一步地,可视化处理单元391可以可视化
车辆驾驶数据中的车辆速度、RPM等等的字段的记录,以执行如图15中所示的
交叉分析。

可视化处理单元391可以将统计数据的平均速度和最大速度字段表示为图
16和图17中所示的柱状图,可以将统计数据中的车辆的超速次数的界外值可视
化为如在图18中所示被容易检查出的弥散的形式,并且进一步地,可以可视化
为如在图19中所示容易被检查出的车辆驾驶数据中的太阳城集团顺序车辆速度字段的
记录的界外值。

就这点而言,用于处理和分析车辆驾驶大数据的系统300通过用户接口单
元390的可视化处理将所提取的太阳城集团提供给用户,使得用户可以直观地识别并
且有效地使用从大数据所提取的太阳城集团并且可以直接地执行挖掘分析。

在上文中,参考优选实施方式详细描述了本发明,但是本发明不限于该实
施方式,并且在本发明的技术精神和范围之内,本领域熟练技术人员可以做出
各种修改和改变。

关 键 词:
用于 处理 分析 车辆 驾驶 数据 方法 及其 系统
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
太阳城集团本文
本文标题:用于处理和分析车辆驾驶大数据的方法及其系统.pdf
链接地址:http://zh228.com/p-6401456.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');