期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

丁天怀郏东耀《清华大学学报(自然科学版)》2006,46(2):176-179

以棉花中羊毛、白头发、塑料膜等杂质的检测为应用背景,提出一种利用多颜色空间特征融合方法。该方法构建了颜色特征评价函数,对近似目标在不同颜色空间的特征表现进行评估,从中抽取近似目标的若干最优特征;再利用区域信息相关度权值小波分析算法进行多特征融合,获取近似目标的图像。实验结果表明,融合图像比原始图像及单色空间图像具有较高的图像信息量值,近似目标视觉特征明显增强。此方法为提取与背景特征相近的近似目标提供一条新思路。相似文献

2.

互信息和核熵成分分析的油中溶解气体浓度建模

李颖张国林《山东大学学报(理学版)》2022,57(7):43-52

针对变压器油中溶解气体浓度的预测问题,提出了一种基于互信息和核熵成分分析(KECA)的油中溶解气体浓度预测建模方法。首先,用标准互信息变量选择方法确定模型的输入变量并对选取的输入变量进行相重构;然后,利用Renyi熵信息测度确定KECA核参数并采用KECA对相空间进行特征提取;最后,以核熵成分作为机器学习极限学习机(ELM)的输入,建立变压器油中溶解气体浓度的预测模型。实验结果表明,与灰色模型、支持向量机、BP神经网络建模方法相比,本文提出的方法能够充分利用油中溶解气体浓度信息,因而具有较优的预测精度和泛化能力。相似文献

3.

基于特征相关的改进加权朴素贝叶斯分类算法 总被引：1，自引：0，他引：1

饶丽丽刘雄辉张东站《厦门大学学报(自然科学版)》2012,51(4):682-685

朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高. 相似文献

4.

基于序列和结构特征的蛋白质自由能预测

下载免费PDF全文

鲁帮力陈庆锋江家文罗海琼《广西科学》2017,24(3):286-291

【目的】蛋白质自由能不仅能准确地反应蛋白质的交互,而且对药物设计有巨大帮助。因此,选择建立精确的蛋白质自由能回归模型是非常有必要的。【方法】收集135对蛋白质复合物并计算600个特征,通过最小冗余最大相关(mRMR)选择与蛋白质自由能显著相关的特征并去除冗余特征,从而得到最小冗余最大相关的特征集,用筛选后的特征建立6种回归模型,并对选择后的特征进行移除对比分析特征的重要性;最后通过10折交叉验证对比得到最佳模型,预测蛋白质自由能。【结果】相对于其它方法,本研究所建立的模型在预测135对蛋白质复合物的性能,相对于其它方法有着较高的相关系数和较低平均绝对误差。【结论】本实验所用方法比其他方法选出的模型有更好的预测精度。相似文献

5.

基于灰度共生矩阵的新疆地方性肝包虫CT图像特征提取方法 总被引：2，自引：0，他引：2

李莉木拉提·哈米提艾克热木·阿西木孔德伟孙静《科技导报(北京)》2010,28(16):31-35

特征提取是图像理解与分析的关键。为提取表征新疆地方性肝包虫病的CT影像特征,提出一种基于灰度共生矩阵对肝脏和包虫病灶进行特征提取的方法。首先,对肝脏CT切片图像进行归一化,利用中值滤波和直方图均衡化对肝脏及病灶区同时进行去噪和增强,从而得到更清晰的灰度图像;然后进行灰度级压缩,利用基于灰度共生矩阵的纹理特征提取方法分别提取新疆地方性单囊型、多囊型肝包虫和正常肝脏CT图像的角二阶矩、熵、惯性矩、逆差分矩及相关性的均值和标准差作为纹理特征。统计分析发现,单囊型和多囊型肝包虫CT图像在角二阶矩、熵和逆差分矩等方面存在显著差异,具有统计学意义。最后,采用Bayes判别分类,分类正确率达到93.33%。结果表明,研究采用的纹理提取方法对描述肝包虫CT图像特征具有较理想的效果,一定程度上有助于对肝包虫CT图像进行分类和检索。相似文献

6.

基于深度森林算法的油井产量预测研究

薛永超袁志乾金青爽张春辉赵天龙刘佳李海龙《科学技术与工程》2022,22(11):4327-4334

为了克服传统机器学习算法产量预测模型的缺点,以深度森林算法理论为基础,综合油井相关各项数据,建立了油井产量预测新模型。首先应用KNN最邻近方法和Z-Score标准化方法对油井相关数据进行预处理,利用MDI特征选择方法选择对油井产量影响最大的特征向量,然后将选出的特征向量作为深度森林模型的输入变量,建立深度森林产量预测模型,利用网格化搜索优化模型参数,最后在测试集上运行模型,对模型性能进行评估。研究结果表明,相对于BP神经网络等传统机器学习算法模型,深度森林模型的产量预测精度更高,可以准确预测油井产量,同时相对于深度神经网络等复杂学习算法,该算法参数少、调参及应用简单,为油井产量预测提供了一种新的方法和思路。相似文献

7.

评估子集类区分能力的特征选择方法

宋恩民黄东山马光志肖强《华中科技大学学报(自然科学版)》2011,(2):1-5

为了克服Relief选择前k个特征作为约简子集所存在的原始特征空间中的近邻在约简后的特征子空间中不一定还是近邻的问题,提出了一种在特征子空间中评价候选特征子集类别区分能力的方法,并结合最好优先特征搜索策略提出了一种新的特征子集选取方法.在12个UCI(加州大学欧文分校)数据集和1个老年痴呆实测数据集上,就约减能力对所提方法与其他3种经典特征选择方法进行了比较,并用决策树、逻辑回归模型详细比较了分类效果.实验结果表明:所提方法不仅能够选出特征数目较少的特征子集,而且特征子集的分类效果良好. 相似文献

8.

基于行为与时间特征的垃圾邮件检测方法

下载免费PDF全文

邵叶秦施佺《解放军理工大学学报(自然科学版)》2013,(5):494-500

垃圾邮件数量庞大、伪装形式多种多样,给反垃圾邮件带来了巨大的挑战。提出了一个基于行为和时间特征的垃圾邮件检测方法。根据邮件收发记录分析基于社会网络的行为特征和基于邮件发送间隔的时间特征,采用步进式判别分析方法,选择具有较强判别能力的行为特征,形成特征子空间,将训练样本投影到特征子空间。使用带标签的训练样本训练支持向量机SVM,形成邮件决策信息,以此检测出垃圾邮件。利用最近3年真实邮件数据,从不同的角度进行了对比实验。结果证明,提出的行为与时间特征能有效提升垃圾邮件检测的准确率和查全率,其整体性能优于其他的基于行为的垃圾邮件检测方法。相似文献

9.

改进的mRmR特征选择方法在人体行为识别中的应用

王华华黄龙周远文赵永宽《重庆邮电大学学报(自然科学版)》2019,31(2):261-269

在基于惯性传感器人体行为识别的研究中,特征选择的作用是挑选相关特征,以提高分类性能,去除冗余特征以降低计算复杂度。针对传统的过滤式特征选择方法仅使用一种相关度量系数筛选特征效果不佳的问题,提出一种改进的基于最大相关与最小冗余(mRmR)准则的特征选择方法。该方法在基于mRmR准则下,采用多种相关度量系数融合的方式,在考虑分类类别的条件下,分析待挑选特征与已选特征间的相关性对特征筛选可能产生的积极影响,以去除部分冗余、不相关特征,进而得到初选特征子集;然后利用二进制数对筛选后的特征编码,通过遗传算法搜索最优或次优特征子集。分别使用SVM和KNN分类器对7种日常行为进行分类。实验结果表明,与其他几种方法相比,该方法对实验分类的7种行为有最高的总体平均识别精度,通过SVM和KNN分类的各行为总体平均识别精度分别达到了97.02%和95.73%,与传统的mRmR方法相比,分别提高了13.72%和9.92%。相似文献

10.

基于两步策略的英文文本分类

陈建林樊兴华王国胤《广西师范大学学报(自然科学版)》2007,25(4):200-203

提出了基于两步策略的3种多类多标签英文文本分类方法:①以贝叶斯为分类器,以抽取词根的单词和未抽词根的单词分别作为第一、第二步使用特征的两步方法;②以贝叶斯和决策树分别为第一、第二步使用分类器的两步方法;③以ID 3、C 4.5和贝叶斯的组合分类器对部分特定类别进行分类,然后对余下类别采用方法②进行二次分类的混合两步方法。实验表明,3种方法中方法③具有最好的性能。相似文献

11.

电能质量扰动分类中特征选择问题的研究

管春《重庆邮电大学学报(自然科学版)》2013,25(4):514-517

以电能质量扰动信号为研究对象,首先分别从时域和变换域两个角度初步选取24个特征值构成初始特征空间。然后采用包括最优和次优搜索法的几种常用特征选择方法对所得到的初始特征空间进行特征选择,并基于3种常见分类方法,利用分类准确率对所选特征向量的有效性进行验证。研究结果表明:通过特征选择可以明显地改善各种分类器的性能。同时也发现不同的分类器其最优特征空间也有所不同,所以在设计分类器的同时也应该合理考虑特征值的选择问题。相似文献

12.

基于图拉普拉斯的多标签类属特征选择

下载免费PDF全文

吴喆君黄睿《上海大学学报(自然科学版)》2021,28(2):281-290

多标签特征选择能够有效去除冗余特征并提升分类精度, 是解决"维数灾难"问题的有效方法. 然而, 已有的多标签特征选择算法是对所有标签选择出相同的特征, 忽略了标签与特征之间的内在联系. 事实上, 每个标签都具有反映该标签特有属性的特征, 即类属特征. 提出一种基于图拉普拉斯的多标签类属特征选择(multi-label label-specific feature selection based on graph Laplacian, LSGL)算法. 对于每个类别标签, 基于拉普拉斯映射获得数据的低维嵌入, 再通过稀疏正则化获得数据空间到嵌入空间的投影矩阵, 接着通过分析矩阵系数确定每个标签相应的类属特征, 最后使用类属特征进行分类. 在 5 个公共多标签数据集上的多标签特征选择与分类实验结果证明了所提算法的有效性. 相似文献

13.

低阶数据映射和特征加权的线性SVM

下载免费PDF全文

王瑞向新肖冰松《空军工程大学学报(自然科学版)》2019,20(4):72-77

针对传统线性支持向量机在训练数据集时均等对待每一维输入特征,以及在原始空间直接分类造成预测准确率低的问题,提出低阶多项式数据映射和特征加权相结合的方法,来提高线性支持向量机的分类性能。该方法首先将每个样本映射到多项式核对应的2 阶显式特征空间,从而增加样本的隐性信息,然后使用模糊熵特征加权算法计算每一维特征的权重,通过权重衡量特征对分类结果的贡献大小。从不同数据库选取7个数据集进行测试,在训练时间和预测准确率2个方面将该方法与核支持向量机、线性支持向量机的其他改进算法进行比较。结果显示,随着数据集规模的扩大,训练时间降低一个数量级,预测准确率在一些数据集上取得与核支持向量机相接近的效果。结果表明：所提方法可以有效提高线性支持向量机的整体性能。相似文献

14.

一种基于两步降维和并行特征融合的表情识别方法

杨勇蔡舒博《重庆邮电大学学报(自然科学版)》2015,27(3):377-385

在采用特征融合方法进行人脸表情识别时,通常会产生高维特征问题.针对这一问题,提出一种基于两步降维和并行特征融合的表情识别新方法.利用主成分分析法(principal component analysis,PCA)分别对待融合的两类特征在实数域进行第一次降维,将降维后的特征进行并行特征融合;为了解决在并行融合过程中产生的高维复特征问题,提出一种基于酉空间的混合判别分析方法(unitary-space hybrid discriminant analysis,unitary-space HDA)作为酉空间的特征降维方法.该方法是实数域混合判别分析法在酉空间内的扩展,并兼顾了复特征数据的类间判别信息及全局描述信息.对局部二值模式(local binary pattern,LBP)和Gabor小波特征进行融合,并在JAFFE和CK+表情数据集上开展对比实验.实验结果表明,该方法具有较好的高维复特征数据降维能力,并且有效提高了表情识别率. 相似文献

15.

A Reliable Neighbor-Based Method for Identifying Essential Proteins by Integrating Gene Expressions,Orthology,and Subcellular Localization Information

《清华大学学报》2016,(6)

Essential proteins are those necessary for the survival or reproduction of species and discovering such essential proteins is fundamental for understanding the minimal requirements for cellular life, which is also meaningful to the disease study and drug design. With the development of high-throughput techniques, a large number of Protein-Protein Interactions(PPIs) can be used to identify essential proteins at the network level. Up to now, though a series of network-based computational methods have been proposed, it is still a challenge to improve the prediction precision as the high false positives in PPI networks. In this paper, we propose a new method GOS to identify essential proteins by integrating the Gene expressions, Orthology, and Subcellular localization information.The gene expressions and subcellular localization information are used to determine whether a neighbor in the PPI network is reliable. Only reliable neighbors are considered when we analyze the topological characteristics of a protein in a PPI network. We also analyze the orthologous attributes of each protein to reflect its conservative features, and use a random walk model to integrate a protein's topological characteristics and its orthology. The experimental results on the yeast PPI network show that the proposed method GOS outperforms the ten existing methods DC, BC, CC, SC, EC, IC, NC, Pe C, ION, and CSC. 相似文献

16.

基于复合物信息和亚细胞定位信息的关键蛋白质识别

毛伊敏章宇盟胡健《科学技术与工程》2020,20(17):6970-6976

针对蛋白质相互作用(protein-protein interaction,PPI)网络中存在大量噪声,以及现有关键蛋白识别方法的挖掘效率和预测准确率不高等问题,提出一种基于复合物信息和亚细胞定位信息(united protein complexes and subcellular locallizations,PCSL)来识别关键蛋白质。首先,整合PPI网络的拓扑属性、生物属性和空间属性构建加权网络,以降低PPI网络中噪声的影响,达到提升PPI网络的可靠性的目的;其次,根据复合物信息和空间信息,设计一种衡量蛋白质关键性的度量,从多维角度强化关键蛋白质在PPI中的重要程度;最后,利用基于PPI网络拓扑特性的寻优算法,设计一种新的试探策略,提升挖掘关键蛋白质的效率。PCSL方法应用在DIP(database of interacting protein)数据集上进行验证。实验结果表明,与其他10种关键蛋白质识别方法相比较,该方法具有较好的识别性能,能够识别更多的关键蛋白质。相似文献

17.

基于子图特征的科学家合作网络链路预测

许爽李淼磊《大连民族学院学报》2020,22(1):51-63

提出了多种基于子图结构特征的新特征,构建了基于节点重要性、基于节点共同邻居、基于边共同邻居、基于邻居子图和基于边子图五类特征,并将这五类特征中的多种特征分别作为特征输入,运用机器学习的方法,实现科学家合作网未来合作关系的预测。研究中发现,基于边子图特征的链路预测准确率最好。此外,研究中运用基于模型的特征排序和最大信息系数特征选择方法分析类内特征的影响力以及相互关系,通过机器学习算法的分类模型进行链路预测。该方法能够有效地揭示网络类内特征在预测中的重要性和相关性,有利于发现影响力大的特征和冗余特征。相似文献

18.

基于领域知识的文本分类 总被引：3，自引：0，他引：3

朱靖波陈文亮《东北大学学报(自然科学版)》2005,26(8):733-735

提出了一种基于知识的文本分类方法,其中引入领域知识,利用领域特征作为文本特征,增强文本表示能力,将文本分类过程看作集聚计算过程.文本索引过程采用了改进型特征选取和权重计算方法.提出了一种基于互信息的学习算法,从训练语料中自动学习领域特征集聚计算公式.实验结果显示基于领域知识的文本分类技术总体性能优于传统的贝叶斯分类模型,领域知识的应用能够有效改善对相似主题和相反主题的分类性能. 相似文献

19.

汉字识别中图特征提取方法

唐善成梁少君戴风华来坤曹瑶倩《科学技术与工程》2024,24(2):658-664

为解决图像像素表示汉字特征方法不能有效表示汉字本质特征、空间复杂度较高的问题,提出了一种汉字图特征提取方法。方法主要包含汉字图像二值化,汉字图像骨架提取,汉字图特征提取3个部分;二值化消除图像中的噪声,提高图特征提取的准确度;骨架提取保留图像中重要的像素点,剔除无关的像素点;图特征提取将汉字关键点与图数据结构结合来表示汉字形状特征。在3 908个常用汉字的5种字体上进行实验。结果表明,该方法能够正确提取笔画复杂汉字的图特征,有效表示汉字本质特征;不同字体汉字图特征相同的汉字数量最高为3 195个,方法表现较稳定;平均每个汉字可以用22.6个图节点、19.1个边表示,相较于用单通道图像表示汉字特征,可大幅降低空间复杂度。相似文献

20.

Rough set-based feature selection method

ZHAN Yanmei ZENG Xiangyang SUN Jincai 《自然科学进展(英文版)》2005,15(3):280-284

A new feature selection method is proposed based on the discern matrix in rough set in this paper. The main idea of this method is that the most effective feature, if used for classification, can distinguish the most number of samples belonging to different classes. Experiments are performed using this method to select relevant features for artificial datasets and real-world datasets. Results show that the selection method proposed can correctly select all the relevant features of artificial datasets and drastically reduce the number of features at the same time. In addition, when this method is used for the selection of classification features of real-world underwater targets,the number of classification features after selection drops to 20% of the original feature set, and the classification accuracy increases about 6% using dataset after feature selection. 相似文献