Project Idea |使用关联规则挖掘分析911紧急呼叫

介绍 分析紧急呼叫数据集,发现隐藏的趋势和模式,将有助于确保应急响应团队更好地应对紧急情况。 考虑到道路事故、火灾事故等,特定地区的高数字表明,这些地区对救护车服务的需求很高。一些地区的交通事故可能是由于道路状况需要改善。呼吸系统问题导致的高频率紧急情况可能是该特定区域空气中的有害污染物造成的。因此,关联规则挖掘将有助于发现此类模式。

null

拟议的制度 数据集预处理->关联规则挖掘->从获取的规则中提取感兴趣的模式->规则验证

使用的数据集 用于分析的数据集来自Kaggle。该数据集包含宾夕法尼亚州蒙哥马利县的911紧急呼叫。选择的属性包括:紧急情况类型、时间戳、发生紧急情况的乡镇。

预处理 将删除缺少值的行。关联规则挖掘需要将数值转换为分类值。因此,时间戳被转换为一周中的一天、一个月和一天中的时间(上午、下午、晚上、晚上)。

关联规则挖掘 关联规则学习是一种基于规则的机器学习方法,用于发现大型数据库中变量之间有趣的关系。它的目的是使用一些兴趣度(支持度、可信度)来识别在数据库中发现的强大规则。

选择合适的支持和信心阈值: 对于非常小的数据库,将最小支持设置得更高,对于非常大的数据库,将最小支持设置得更低。如果将小型数据库的最小支持设置得更高,则是为了确保项目集的重要性。如果将大型数据库的最小支持设置得更低,则是为了确保找到足够的项目集。

提升:如果一条规则的提升为1,则意味着前因和后因的发生概率是相互独立的。当两个事件相互独立时,就不能制定涉及这两个事件的规则。如果升力大于1,这让我们知道这两个事件相互依赖的程度,并使这些规则对于预测未来数据集中的结果可能有用。如果一条规则有更高的置信度和更低的升力,直觉上它似乎更有价值,因为它有更高的置信度——它似乎更准确(得到更好的支持)。但规则的准确性可能会产生误导。lift的价值在于它同时考虑了规则的可信度和整个数据集。

获得的规则的结果和验证 第1组: {12月下午}=>{交通:车祸} {12月,晚上}=>{交通:交通事故} {12月,上午}=>{交通:交通事故} {December}=>{交通:交通事故}

这些规定表明,12月份可能会发生很多事故。 冬季(12月至1月至2月),气温分别为44华氏度(7摄氏度)和28华氏度(2摄氏度)。在冬季,由于该县各地的冰层覆盖,车辆事故的数量很高。据美国国家公路交通安全管理局(NHTSA)称,在圣诞节期间,许多涉及酒精受损司机的死亡事件发生。如果呼吸机的使用更广泛,所有这些事故肯定会更低。

第二组: {EMS:袭击受害者,夜晚}=>{NORRISTOWN} {EMS:袭击受害者,晚上}=>{NORRISTOWN} {EMS:attack受害者,POTTSTOWN}=>{Night}

这些规定表明,波茨敦的诺里斯敦在夜间和夜间可能不安全。 据报道,尽管总体犯罪率在十多年来缓慢而稳定地下降,反映了全国的趋势,但诺里斯敦在暴力犯罪方面仍然顽固地领先于邻近的蒙哥马利县乡镇。原因可能是——人口密度更高,富裕程度更低;毒品的祸害;快速变化的人口构成带来的挑战。

第三组: {EMS:过量,低梅里安}=>{Night} {CHELTENHAM,EMS:过量}=>{Night} {EMS:过量,周日}=>{Night} {EMS:过量,周六}=>{Night} {EMS:过量,周五}=>{Night} {EMS:过量,诺里斯敦}=>{Night} {EMS:过量,波茨敦}=>{Night}

这些规定表明,周末晚上的药物过量可能很高,这可能是因为人们在那个时候更容易聚会和吸毒。药物过量的另一个原因是,当医生停止开阿片类药物或这些药物变得太贵时,患者可能会转而服用海洛因,后者相对便宜,容易获得。海洛因(毒品)是一种阿片类物质——一种降低体内疼痛信号强度的物质。 规则表明,下梅里恩、切尔滕纳姆、诺里斯敦、波茨敦(宾夕法尼亚州的城镇)接到大量药物过量的紧急电话。 宾夕法尼亚州2015年全州药物过量死亡率为每10万人26例,高于2014年报告的每10万人21例。根据疾控中心的数据,2014年全国药物过量死亡率(最新数据)为每10万人14.7例。据报道,在过去的一年里,蒙哥马利县的药物过量现象急剧增加。根据地方检察官办公室提供的信息,该县经历了其历史上最严重的药物过量流行。

第四组: {EMS:CVA/STROKE}=>{Morning}

规则表明中风可能发生在早上。 科学研究表明,与其他时间相比,你在清晨更容易患中风,而这种增加的风险与身体的自然节律有关。 昼夜节律(存在于人类和大多数其他动物中的昼夜节律是由一个与生物体环境中的明暗周期和其他线索同步的内部时钟产生的。)似乎在血压、体温和其他身体功能中起作用。清晨血压较高时,中风的风险似乎会增加。

第五组: {EMS:FEVER}=>{Night} {EMS:FEVER}=>{Morning} {EMS:FEVER}=>{night}

第一条规则比其他两条规则有更高的可信度。 规则中出现这种模式的原因可能是这样的:体温通常遵循一个内置的24小时周期。它的最低点在凌晨3点到6点之间,然后是下午4点到11点之间的峰值。 两个主要因素控制着这个循环: 下丘脑有自己的24小时激素分泌模式。 身体在一天中所做的事情(心跳、肌肉运动、呼吸)涉及热能的释放,导致你的核心体温随着一天的进展而升高。 这就解释了为什么在正常情况下,你的体温会在一天快结束时升高。然而,当你发烧时,这种循环仍然会发生。不同的是,现在,温度升高更明显,因为你已经开始从一个比正常更高的温度开始。

第六组: {阿宾顿,EMS:中暑,晚上}=>{8月} {EMS:中暑,晚上,周四}=>{8月} {下午,EMS:中暑,周一}=>{7月} {EMS:中暑,晚上,星期一}=>{June} {ABINGTON,EMS:中暑}=>{August}

规则表明,8月和6月白天,阿宾顿的中暑率很高。 夏季白天(6月、7月、8月)气温飙升,导致热量耗尽。教育人们实践热安全措施(不要在烈日下花费太多时间,在清晨或深夜做户外工作,穿轻便、浅色、宽松的衣服,经常在阴凉处休息,保持充足的水分。)将有助于减少这些紧急情况。

使用的工具 R和RStudio •关联规则挖掘需要arules包。 •arulesViz软件包有助于可视化结果。

应用 这个项目对每个国家的应急小组都很有用。

本文由 布林达。M .如果你喜欢GeekSforgek,并想贡献自己的力量,你也可以使用 贡献极客。组织 或者把你的文章寄到contribute@geeksforgeeks.org.看到你的文章出现在Geeksforgeks主页上,并帮助其他极客。

© 版权声明
THE END
喜欢就支持一下吧,技术咨询可以联系QQ407933975
点赞10 分享