论文查重 知网查重 知网论文查重 知网查重检测 中国知网查重
Copyright ©2013-2017 中国知网论文查重检测系统入口 All Rights Reserved. 网站备案号:黔ICP备19012782号-3.
今天跟大家分享的是2020年8月发表在Biomolecules杂志(IF=4.082)上的一篇文章:”Colorectal Cancer Prediction Based on Weighted Gene Co-Expression Network Analysis and Variational Auto-Encoder”。在文章中作者通过加权基因共表达网络分析(WGCNA)以及深度学习神经网络变异自动编码器(VAE)分别用于提取大肠癌中两种不同维度的特征构建分类器,通过支持向量机来探讨分类器的鲁棒性,诊断精确率高达0.9692。该方法为WGCNA共表达分析联合深度学习神经网络预测疾病进展提供新的思路
Colorectal Cancer Prediction Based on Weighted Gene Co-Expression Network Analysis and Variational Auto-Encoder
一.研究背景
大肠癌(CRC)是一种恶性肿瘤,其发病率在全球肿瘤患者中排名第三,死亡率高居第二。尽管现代医疗技术进步显著,但大多数CRC患者中晚期预后仍不好。因此,需要对CRC进行有效的早期诊断和构建新的预后指标。一种有效的特征提取方法可以避免模型过度拟合的问题,特征提取方法是影响分类器性能的关键因素,可提高微阵列基因表达数据预测CRC的准确性
二.结果解读
1.准备GEO数据集并进行数据矫正
选择来自数据集GSE8671,GSE9348和GSE23878的基因表达数据(正常组和癌症组)进行分析。PCA结果显示,在数据矫正前GSE23878与其他三个数据集有显着差异,而批次矫正后基本上消除了四个数据集的批处理效应
2. WGCNA进行特征提取
根据临床表型(normal vs tumor)作为性状,与全局网络构建共表达网络分析。结果显示,所有样品聚集在一起以形成17个模块,其中最小的模块包含36个基因。这些模块最多包含6377个基因,每个模块平均814个基因
3.WGCNA核心基因的界定
根据模块与性状之间的相关性,选取与性状相关性系数最大的基因作为后续研究对象(MEturquoise模块),共包含6865个基因。后续通过模块内置函数GS > 0.5 & MM > 0.8 以及差异表达情况共筛选出165个基因,根据K值选取前10个基因作为关键基因