招生专题网

我院蒋良孝教授指导的博士研究生张欢在数据挖掘国际重要期刊TKDE发表论文

发布人:石剑峰发表时间:2022-05-23点击:

(通讯员:孙琨)近日,数据挖掘国际重要期刊《IEEE Transactions on Knowledge and Data Engineering》在线发表了我院“数据挖掘与机器学习”团队(CUG-Miner)的最新研究成果——Multi-view Attribute Weighted Naive Bayes。该论文第一作者为我院2020级博士研究生张欢,通讯作者为智能科学与技术系蒋良孝教授。

 

图1论文提出的多视图属性加权的朴素贝叶斯模型

朴素贝叶斯以其简单、有效等特点,被誉为数据挖掘十大算法之一。为了削弱其不现实的属性条件独立假设,学者们提出了多种不同的改进方法。然而,几乎所有的改进方法都只关注于原始的属性视图,也就是专家定义的属性视图,而这一视图在复杂的现实问题中往往很难反映出足够的数据特征。为了更加充分、全面的刻画数据特征,该论文从原始属性视图中构建出两个标记视图,并提出一种新模型:多视图属性加权的朴素贝叶斯(Multi-view Attribute Weighted Naive Bayes,MAWNB)。该模型首先利用原始属性构建多个超父亲一依赖估计器(Super-ParentOne-DependenceEstimators,SPODEs)和多棵随机树(Random Trees, RTs),然后利用构建出的每个超父亲一依赖估计器和每棵随机树,依次分类每个训练示例,并使用所有的预测类标记构建两个标记视图。接着,为了避免属性冗余,在每个视图中通过最小化负的条件似然对数优化每个类别下每个属性值的权重。最后,对每个待测示例,融合三个视图中估计出的类成员概率,得到最终的预测类标记。通过在60个UCI数据集上的实验证明了MAWNB在分类精度和AUC指标上均显著优于NB和其他现有的比较对象,同时消融实验证明了MAWNB中每个模块均对分类性能的提高起了必不可少的作用。

TKDE为中国计算机学会(CCF)推荐的A类国际期刊,CCF认为“A类指国际上极少数的顶级刊物和会议,鼓励我国学者去突破”。论文信息如下:

Huan Zhang, Liangxiao Jiang (*),Wenjun Zhang,Chaoqun Li.Multi-view Attribute Weighted Naive Bayes.IEEE Transactions on Knowledge and Data Engineering, 2022, DOI: 10.1109/TKDE.2022.3177634.

张欢同学是计算机学院2020级博士研究生,跟随蒋良孝教授主要从事数据挖掘与机器学习领域的研究。目前以第一作者身份在中国计算机学会推荐的国际著名期刊TKDE,PR,INS,KAIS,SCIS,ESWA,NEUCOM等发表(含录用)论文7篇,主持校级优秀博士创新基金项目和校级实验室开放基金项目各1项,曾获“华为杯”中国研究生数学建模竞赛一等奖和二等奖各1项、中国地质大学(武汉)研究生科技论文报告会特等奖、中国地质大学(武汉)优秀研究生标兵等。