首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于加权超球支持向量机算法的超文本分类研究   总被引:3,自引:0,他引:3  
为提高超文本分类算法的性能,降低算法的复杂度,提出一种适用于超文本分类的加权超球支持向量机算法.该算法综合文档内容信息和超链接信息作为文档特征向量,针对传统超球支持向量机算法在不同类别样本数目不均衡时训练分类错误倾向于样本数目小的类别的问题,利用加权因子补偿了类别差异对算法推广性能造成的不利影响.在基准数据集上的测试结果表明,该算法降低了二次规划的复杂度,提高了分类器的分类性能.  相似文献   

2.
文本信息中存在的模糊性和不确定性在很大程度上影响文本情感观点的准确判定.为了提高文本情感分类准确率,提出基于混合特征云模型和支持向量机的多级文本情感分类算法.首先,将文本的TF-IDF权重特征和词性特征相结合,采用信息增益法选取特征的同时对特征降维;然后,在文档混合特征向量集上生成云向量模型,依据模型间的相似度筛选出相似度较大的R个文档,作为支持向量机的输入.实验结果表明,该算法具有良好的分类准确率,且系统的训练速度有显著的提高.  相似文献   

3.
基于加权近似支持向量机的文本分类   总被引:9,自引:0,他引:9  
随着因特网的迅速增长,能够分类大规模文档的高效文本分类算法变得非常重要.该文提出一种基于加权近似支持向量机模型的文本分类算法,加权近似支持向量机对近似支持向量机作了改进,通过为每个训练误差增加一个权值和使用在原空间直接求解的算法,克服了近似支持向量机模型不适合不平衡数据分类和高维数据分类的缺点.试验结果表明,与标准支持向量机算法相比,该算法的分类质量与训练速度都有提高,是一种适合文本分类的高效算法.  相似文献   

4.
在基于解决单类问题的支持向量数据描述算法基础上提出了基于聚类分布信息的c-SVDD算法.该算法对带野值的SVDD算法中的C值重新定义.通过增加核空间下测试样本的聚类分布信息。为每个样本定义一个特定的c值.c-SVDD算法适应于解决类别不平衡学习问题.该算法在保证少类样本高分类精度前提下,还有效提高了全样本的分类精度,更符合现实不平衡问题中对少类样本的处理要求.对UCI数据集和人工样本集进行实验.改进后的c-SVDD算法比带野值的SVDD算法AUC值平均提高0.14以上;比AdaBoost算法在正类查全率上平均提高40%,精确度也提高了至少5%.  相似文献   

5.
为了进一步提升语义检索的精度和改善用户体验,提出了一种基于多分类语义分析和个性化的语义检索方法.首先,利用改进的多分类语义分析方法实现目标文档的向量化,并建立词向量库;然后,利用支持向量机对文档进行分类,并结合文档类别生成标签索引.在检索时,根据词向量库的引导,使用用户历史检索记录和个人信息优化检索结果.实验结果显示,基于该方法的系统的检索精度、平均DCG和nDCG指标值分别达到0.7,7.267和0.890,较基于Lucene方法和Yahoo Directory方法所得结果的均值分别高出31%,36%和19%.在时间复杂度上,每次检索的平均耗时为0.669 s,较Lucene方法仅增加了0.326 s.由此可见,该方法提高了检索的精度和综合相关度,且额外的时间消耗较少.  相似文献   

6.
一种改进的快速支持向量机分类算法研究   总被引:5,自引:0,他引:5  
快速的支持向量机分类算法--FCSVM对支持向量集采用变换的方式,用支持向量集的子集代替全部支持向量进行分类计算,在保证不损失分类精度的前提下使得分类速度较传统SVM算法有较大提高. 为了获得最小的支持向量子集,同时避免支持向量的移动,对FCSVM算法进行了改进.采用二分法优化分类函数中的支持向量数,给出了变换矩阵存在的充要条件及构造方法,减少了计算量.实验结果表明,改进的快速分类算法较大幅度地减少了计算复杂度,提高了分类速度,尤其在训练集规模庞大、支持向量数量较多的情况下,效果更加明显.  相似文献   

7.
针对文本向量空间中特征项间的关联性及冗余性,提出了一种KNN算法运用于文本向量空间降维的方法,应用向量聚合理论和特征选择以降低特征空间维数,使得降维后的特征项更具有类别代表性.实验证明,KNN算法运用于文本降维方法中,有效地降低了向量空间的维数,提高了文本分类的精度.  相似文献   

8.
采用类别相似度聚合的关联文本分类方法   总被引:1,自引:0,他引:1  
针对基于关联规则的分类方法在分类时仅考虑规则的置信度并使用规则修剪技术,导致分类器的分类精度难以进一步提高的问题,提出了一种基于类别相似度聚合的关联文本分类方法.该方法采用修改的χ2统计技术提取各类别的特征词;为保证规则匹配的精度和速度,使用CR-tree存储分类规则,并给出了CR-tree的构建与匹配算法;采用向量内积来计算文本类别分量与类别标志向量的相似度,进而使用规则置信度和类别相似度的聚合值作为文本分类的依据.基于实际网络文本的实验表明,该方法仅需提取30个特征词,分类结果的微平均值即可达到92.42%,优于未经剪枝的ARC-BC分类器及KNN、Bayes分类器;在分类耗时方面,该方法与未经剪枝的ARC-BC分类器持平,表明该方法引入的相似度与聚合值的计算开销在可接受的范围内.  相似文献   

9.
基于特征贡献度的特征选择方法在文本分类中应用   总被引:1,自引:0,他引:1  
在目前的文本分类问题中,特征选择方法被认为是提高分类精度和效率的一种有效方法.提出了一种基于特征贡献度FCD(feature contribution degree)的特征选择方法,本方法将某个特征对于类别之间区分能力的贡献度大小作为该特征被选取的条件,特征对于某一类别的FCD值为特征在该类中出现的文档数与在所有类别中出现的文档数的比值.对该方法进行了实验,并与一些常用的特征选择方法进行了比较,实验结果表明该方法具有更好的分类效果.  相似文献   

10.
TF-IDF方法是文本向量化过程中一种常用的特征项权重计算方法,衡量的是特征项在整个文档集中的重要性.针对文本分类过程中TF-IDF方法未能体现特征项对类别的区分能力和对类别的代表性问题,基于文档类别,结合特征项的类间区分度和类内贡献度,提出一种改进的TF-IDF权重计算方法,并采用KNN和SVM模型对改进后算法的分类性能进行了验证.实验结果表明,与传统的TF-IDF方法相比,改进后的权重计算方法不仅在整个测试数据集上能够取得较高的宏平均精确率、宏平均召回率和宏平均F1,而且使测试数据集绝大部分类别的分类性能得到了较大提升.因此,改进后的TF-IDF权重计算方法是有效且可行的.  相似文献   

11.
为了提高数字图像的压缩比率,提出了一种将小波变换与分类矢量量化相结合的图像压缩算法.该算法首先对图像进行小波分解,充分利用不同尺度小波系数的相关性,并对不同尺度的子图使用分类矢量,不同类使用不同大小的子码书.为了解决高维矢量在算法实现时效率较低的问题,采用非线性插值对构造好的码矢量进行降维.实验表明,该方法在提高图像压缩比的同时,降低了算法的时间复杂度,从而提高了算法的效率.  相似文献   

12.
群进化算法是智能计算领域研究的核心内容,而算法中数值型参数的设置是影响算法搜索效率的重要因素,因此设计解决参数设置问题的方法也是群进化算法研究的重要内容.目前解决参数设置问题的常规统计方法是根据算法搜索的部分结果组成有限样本数据,依据统计最好值个数大小的判定结果来确定最优参数预设值.常规统计方法在有些测试样本数据中很难确定唯一的最优参数预设值.为了解决常规统计方法的缺点,提出了一种最优向量法,该方法可以将任意形式有限样本数据转换为向量,依据向量计算的判定规则进行最优参数预设值的确定.实验结果表明,依据获取的有限样本数据通过最优向量法找到最优参数值,采用该参数值的群进化算法搜索效率相对最优,从而验证了最优向量法的有效性.  相似文献   

13.
多分辨率运动估值的改进算法   总被引:1,自引:0,他引:1  
多分辨率运动估值和补偿算法是一种广泛应用于小波视频编码器的时间冗余的算法,针对其运动矢量编码效率低及采用全搜索方法、运算复杂度较高等问题,提出了一种基于区域分割的多分辨率运动估值算法。该算法具有如下特点:①充分利用了小波分解后各子带所表征的运动结构的相关性,有效地提高了运动矢量的编码效率;②通过对视帧小波分解后的低通子图像进行静止和运动区域分割,以分割结果指导运动估值过程,在有效地减少运动估值时间消耗的同时,进一步提高了运动矢量的编码效率;③在码率受限的情况下,重建图像的质量得到提高。实验结果表明文章所提出算法是有效的。  相似文献   

14.
针对自训练半监督支持向量机算法中的低效问题,采用加权球结构支持向量机代替传统支持向量机,提出自训练半监督加权球结构支持向量机。传统支持向量机需要求解二次凸规划问题,在处理大规模数据时会消耗大量存储空间和计算时间,特别是在多分类问题上更加困难。利用球结构支持向量机进行多类别分类,大大缩短了训练时间,降低了算法复杂度。球结构支持向量机在不同类别样本数目不均衡时训练分类错误倾向于样本数目较小的类别,通过权值的引入,降低了球结构支持向量机对样本不均衡的敏感性,补偿了类别差异对算法推广性能造成的不利影响。在人工数据集和UCI(university of california irvine)数据集上的实验结果表明,该方法对有标记样本的鲁棒性较好,不仅能够提高效率,且分类精度也有显著提高。  相似文献   

15.
基于Sherman Morrison定理和迭代算法, 提出一种改进最小二乘孪生支持向量机(SMI ILSTSVM)的增量学习算法, 解决了最小二乘孪生支持向量机(LSTSVM)不具备结构风险最小化和稀疏性的问题. 实验结果表明, 该算法分类精度和效率均较高, 适用于含有噪声的交叉样本集分类.  相似文献   

16.
针对经典Apriori算法存在多次扫描数据库及生成冗余候选项的弊端, 提出一种改进的VM_Apriori算法. 该算法采用事务数据向量矩阵与行候选向量相结合的表示方法, 运用快速排序的思想对频繁项集的项按各单项的出现频度升序重排,  以提高算法的执行效率. 实验结果表明, 改进的VM_Apriori算法能在正确挖掘关联规则的同时极大提高执行效率.  相似文献   

17.
AMR—WB是一种高品质的宽带语音编码技术,其矢量量化时一般采用全搜索算法,该算法虽然精度比较高,但却存在计算复杂度高、搜索速度慢的问题.针对以上问题,提出了一种改进的矢量量化码字搜索算法.该算法引入了部分失真搜素算法,并对其初始匹配码字的设置进行了优化.仿真结果表明,改进后的算法在保证语音质量的前提下,提高了码书搜索的速度,从而改善了AMR.WB编码的效率.  相似文献   

18.
文章提出了一种改进的等范数最近邻码本矢量搜索算法,该算法预先离线计算好各码本矢量的2-范数和它与中心线的矢量夹角,再根据各码本矢量的2-范数进行升序排列.编码时用二分法搜索到与目标矢量2-范数最近的码本矢量,再排除那些不在目标矢量形成的夹角范围内的码本矢量。结果证明,该算法对比文中列举的其他算法更加高效。  相似文献   

19.
探讨了一种交流异步电动机的新型定子磁通控制方案。采用新一代单片微机80C196KC,利用新颖的开关控制规则库,对定子磁通矢量轨迹进行直接的实时闭环控制。其控制方法简单有效,实现了控制系统的全数字化,实验结果表明,该方案具有较好的控制效果。  相似文献   

20.
提出一种将Gabor小渡变换与支持向量机相结合的人脸识别算法。首先用Gabor小波对人脸图像进行特征提取,由于变换后的特征维数较高,所以要对变换特征进行降维。本文采用一种改进的二维主元分析方法实现。最后采用支持向量机进行人脸的分类识别。在ORL人脸库中对算法进行了测试.结果表明该算法识别率较高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号