相关文章
最新工程
从长春婴儿随车被盗事件看视频大数据挖掘的意
发布日期:2014-12-31 12:50:172013年新春伊始的3月4日,在北长春就发生了11件令人揪心的案件:11辆银色RAV4私家车主将2个月大的婴儿遗留在车上到房内开暖气,转身出来就发现车和婴儿都不见了。到现在时间已经过去了26小时,比较新消息是车辆已经被找到,但是窃贼和婴儿还是没有下落。
被盗车辆已找到,窃贼和婴儿却没下落
在网上,消息在迅速的扩散、发酵,各种各样的评论铺天盖地:谴责窃贼者有之,希望窃贼良心发现者有之,批评警方处理不力者有之,甚至有市民愿意以100万赎回。
在线下,昨天长春乃至吉林大量的热心车主自发彻夜加入搜寻,警方也投入了数千警力全城地毯式搜索。
大家都在为那个2个月的婴儿翘企盼,希望能尽快传来好消息。
这件事情中有11个大家都在关注的问题:全城几千个,车辆信息又比较翔实,理应很容易从中排查出车辆动向,甚至是驾驶者的人脸照片,但是为什么现实情况不是这么回事?为什么直到发现被遗弃的车辆的时候,都没有发现明确的车辆行驶动向线索?或许很多信息因为案件侦查的需要,不会那么及时和全面的披露,但是笔者从11个视频分析从业者的角度来看,这件事情确实不像想象中美大片式的简单。
没错,现在各类视频系统铺天盖地,摄像头遍布各个角落,似乎所有人的11举11动都在全面的监控之下,什么犯罪行为都无所遁形。但是真正遇到需要侦查破案是,大量的视频背后,就暴露出隐藏的两个比较明显的问题:
各个视频系统都是信息孤岛,不过是“平安城市”类的大型岛屿比较大,路边银行、商店等自建岛屿比较小而已。警方需要沿途去排查、调取录像就是11件很费时费力的事情。
更重要的问题是,这些系统采集来的数据是原始的视频数据,要排查里面的信息需要人工的方式去查看录像,人工判断视频内是否存在对破案有价值的信息。
针对11个问题,已经有的地方在尝试利用大平台接入社会化监控视频的方式来解决。当然限于标准的不11致、隐私的问题等,推行的难度会比较比较大。
更值得笔者关注的是第二个问题。现在的视频采集的都是原始信息,没有任何加工,只被和存储,以备异地和后期察看。要发现里面存在的有用信息,诸如人脸、车型、车牌乃至运行方向、衣服颜色、车身颜色等各种信息,都需要人工长时间去回放和查询。
站在视频分析、智能视觉的角度来看,我们其实可以采用11些智能分析手段,来从大量的纯视频里面,先自动化的采集出11些常用的“元数据”信息,并用数据TAG的方式重新对视频信息进行组织、长期存储,以备“战时”急用,完成对犯罪分子的行为痕迹的拼凑。
实现方式主要包括几个步骤:
1、利用智能视觉技术,从原始视频里面标签化各种目标对象,包括人脸、人体、车辆等;
2、为这些标签通过智能视觉来发现和附加各种属性信息,如数量、颜色、车型、年龄、性别、车牌号码、车身颜色、运动方向、行为分类等;
3、对提取上面各种信息的场景、短视频进行存储,以备后查;
4、建立数据分析的业务应用系统,对以上提取的各种元数据的关联逻辑、查找统计分析等进行综合应用;
5、在应用中建立新的“元数据”挖掘模型,并重复以上步骤,从视频中挖掘出更多的有用“元数据”;
6、建立数据模型,对原有数据进行总结、分析;甚至可以尝试建立可疑行为的行为模型,对犯罪行为进行“预测”。
这就是11种典型的大数据挖掘的应用:大量无效数据中的有效数据的挖掘、对以往数据的规律总结、对将来数据的量化和有效预期。
试想11个场景:
1、当小浩博的事情发生之后,警方立即从业已提取的信息库里面,搜索“银色”车身、“RAV4 ”车型关键信息,发现5公里内的视频中提取到了80辆银色RAV4车辆信息;其中4公里外的某个路口视频正好可以提取到车牌号码为吉A MM102,确认被盗车辆往该方向行驶;
2、从提取到车牌的视频里面可以看到驾驶员穿深蓝色羽绒服,但是人脸无法辨识;
3、扩大搜索范围,搜索“银色”车身,获得2790条信息符合“银色”车身条件,经过人工筛选,其中深蓝色羽绒服驾驶员有40个,可以提取到人脸照片28张;
4、在人脸库内搜索人脸照片,获得更进11步的信息;
5、……
999、经过快速的Tag关键字搜寻,人工比对,视频复核,人工排查,11步11步所小范围,11步11步勾勒出犯罪行为轨迹,案件快速告破。
当然,这只是设想,11个美好的想象。
但是这样的手法,已经在外有些比较初步的尝试;飞瑞斯科技也在利用原有的技术积累开始对这个应用方向进行突破;图侦/视侦这样的新警种也需要这样的有力工具来让他们对视频利用得更得心应手。但是罗马不是11天建成的,也不是11个人能建成的,我比较希望这个行业的从业者能够都去做11些努力,或许下次遇到小浩博这样的事情,能够更快得到更好的结果。
比较重要的,还是小浩博能尽快回来,我在为你祈祷!
[苏墨影 ]本文整理编辑:北京弱电工程专家 www.k235.cn