论文降重

机器学习方法在H7N9禽流感病人中的研究与应用[范文]

时间:2018-02-24 08:54:01 编辑:知网查重入口 www.cnkiid.cn

摘要

2013年春季,中国出现了全球首例H7N9禽流感病毒,此后疫情蔓延迅速,我国多个省市均受到了波及。近几年患上H7N9禽流感的人始终断断续续在增多,今年以来,我国已有16个省份发生了人被感染这一病毒的情况,甚至跟去年同期相比可以看出明显的上升趋势。这对社会造成了很大影响,同时引起了人们的高度重视。

由于H7N9禽流感患者具有较高的死亡率,本文通过机器学习的方法来预测感染者的治愈情况。基于中国136例H7N9禽流感病人的相关数据,首先利用散点图、条形图、密度曲线图等描述性统计方法对数据进行可视化处理,观察其分布情况。然后,针对患者治愈情况的预测,本文分别分析了三种机器学习方法:分类回归树、神经网络和朴素贝叶斯方法,并基于四种评价指标:灵敏性、特异性、准确率以及Kappa值,对这三种机器学习方法的预测效果进行比较和评价。最后,综合以上三种机器学习方法得到预测结果:20例病人的结果为恢复,20例病人的结果为死亡,17例病人的结果为不确定。此研究加深了人们对H7N9禽流感的认知,同时为疾病的结果预测提供了一种可行的方法,但从结果上看,这一方法仍有待改进。

 

1  绪论

1.1 研究背景及现状

1.1.1禽流感

禽流感是由A型流感病毒所引起的禽类呼吸道感染的传染病,它通常发生在鹅、鸡、鸭等禽类当中,少数情况下会感染猪。禽流感病毒一般分为低致病性、高致病性以及非致病性这三种类型。其中,高致病性这一类的禽流感病毒不仅发生在禽类之中,还会引起少部分的人类感染,从而简称为“人禽流感”。

原始数据分布图

原始数据分布图

在2013年春季,中国大陆出现了首例H7N9禽流感病毒。根据国家卫计委的通报,2013年3月31日,安徽省和上海市发生了3例人类感染H7N9禽流感的确诊病例,其中有2例病人因抢救无效而死亡。在此之后,疫情蔓延迅速,被感染的和死亡的病人不断增多,北京、浙江、江苏、江西、福建、山东、湖南、河南等多个省市均受到了波及。到2013年9月截止,就已经出现了134例病例,而其中有45例病人死亡。此疫情给我们国家的农业、经济和卫生等方面带来了一个十分巨大的挑战。

基于H7N9禽流感,国内外众多学者在病原学、临床特征、致病因子、流行病学、防治措施等不同领域均对其开展了研究,例如阎铁成等人根据中国大陆的130例H7N9禽流感病人进行其流行病学分布特征的研究、Hai-Nv Gao等人对111例H7N9禽流感病人在临床特征上的研究、Adam Kucharski等人基于中国暴发的H7N9禽流感进行传播方面的研究等等。然而,目前对其仍然存在很多不确定因素。

据报道,今年以来,我国有16个省份均发生了人被感染H7N9禽流感病毒的情况,甚至跟去年同期相比可以看出明显上升现象。通过国家卫计委所发布的数据可知,今年一月份我国被感染的病人有192例,其中死亡人数有79人。从中可以看出,H7N9禽流感病毒的感染并未终止,而且不排除疫情有加重的可能。所以,此研究具有重大实际指导意义。

1.1.2机器学习

机器学习是目前信息科学和计算机科学中一个相当热门的领域。那么有人就会问了,什么是机器学习?然而迄今为止,尚未对其有一个公认且准确的定义。接下来,我将结合王雪松等人所著的《生物信息学中的机器学习分析方法》和由Ethem Alpaydin所著而范明等人翻译的《机器学习导论》两书对机器学习进行初步认识。

机器学习主要是研究如何让计算机通过模拟人类当中的学习行为进行学习,从而得到对问题的较为详细的认知,以此提高系统自身性能。根据不同的学习方式,它一般分为无监督学习、有监督学习和半监督学习三种类型。从20世纪80年代始,机器学习的相关研究发展迅速,它不仅被用于数据挖掘之中,而且是人工智能重要组成部分,广泛应用于人脸识别、语音识别、医学诊断、自然语言处理、生物测定学等各种领域当中。

同样地,机器学习在生物信息领域作分类和预测的研究也很常见,例如杨国兵使用机器学习方法对乙酰胆碱酯酶抑制剂的分类研究、王佳基于机器学习方法对A型流感病毒跨种传播和抗原关系进行预测的研究、吕巍运用机器学习方法对H1N1神经氨酸苷酶抑制剂做分类预测等等。

论文写好后想知道重复率是多少?点击“知网论文查重入口”直连中国知网查重检测系统