详细信息
基于对称不确定性和Lasso的基因数据特征选择算法 被引量:2
文献类型:期刊文献
中文题名:基于对称不确定性和Lasso的基因数据特征选择算法
作者:杨耀[1];李四海[1]
第一作者:杨耀
机构:[1]甘肃中医药大学信息工程学院,甘肃兰州730000
第一机构:甘肃中医药大学信息工程学院(教育技术中心)
年份:2022
期号:1
起止页码:8
中文期刊名:信息技术与信息化
外文期刊名:Information Technology and Informatization
基金:甘肃省自然科学基金项目(21JR1RA272)资助。
语种:中文
中文关键词:对称不确定性;Lasso;基因数据;特征选择
摘要:基于目前肿瘤基因表达谱数据在医学相关结合行业的广泛普及,运用特征选择算法对其处理成了如今大量学者们的重点研究方向。基于此,提出了一种FCBF-Lasso结合算法。首先,采用FCBF算法对各基因数据集进行特征选择,通过删除冗余的和不相关的特征,得到特征子集;然后,再利用Lasso方法对得到特征子集进行特征选择,进一步地删除冗余特征,得到对应基因数据集的最优特征子集。算法采用FCBF算法的对称不确定性和Lasso方法的最小残差平方和作为度量特征之间以及特征与类之间相关性的评价准则,在一定程度上克服了两种算法的缺点。在6个基因数据集上与其它3种经典的特征选择算法进行比较,结果表明算法在选择最少特征数的最优特征子集和分类精度方面具有很好的优势。
参考文献:
正在载入数据...