首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 859 毫秒
1.
为了克服传统K-Means算法k值不能确定问题和不具备变量自动选择能力,将预测强度和变量自动加权K-Means算法相结合,提出基于预测强度的变量自动加权K-Means算法。预测强度表示聚类模型对未知数据的预测能力,预测能力越强,则聚类结果越佳,主要用于k值的确定;变量自动加权K-Means算法具有在聚类过程中自动调整变量权重的能力,对于噪声变量和冗余变量削弱其对距离的贡献,使聚类结果反映最真实的聚类结构。实验表明,算法具有较强的分类能力和预测能力。  相似文献   

2.
面向化学领域网络资源的文本自动分类算法   总被引:2,自引:0,他引:2  
为了提高化学主题搜索引擎的查询效果,采用距离加权k-近邻分类算法来进行自动分类.为了测试该算法对化学领域网络资源进行分类的效果,文中使用化学化工资源导航系统ChIN人工积累的资源和描述信息作为数据集,并采用基于化学领域的多层次分类体系进行分类.经测试,系统微平均值Fmicro最高可达到71%.文中还就文档的关键词和数据集的熵对分类性能的影响进行了讨论.结果表明,该算法能较好地应用于化学领域网络资源的自动分类.  相似文献   

3.
胡坚 《科技资讯》2006,(34):175-176
随着网络信息的飞速发展,纯手工的信息归类手段已经严重影响信息处理的进程。因此自动化的信息归类处理越来越受到人们的重视,其中文本自动归类系统是信息归类处理的重要研究方向,它的功能是在给定的归类体系下,根据文本的内容自动判别文本的类别。本文在研究传统文本归类技术的基础上,包括向量空间模型、特征提取和TF/IDF分词算法,引入了领域本体知识推理和领域事件构造等关键技术,提出了基于本体领域事件驱动的文档自动归类算法,并给出了较满意的实验结果和评价。  相似文献   

4.
随着网络信息的飞速发展,纯手工的信息归类手段已经严重影响信息处理的进程。因此自动化的信息归类处理越来越受到人们的重视,其中文本自动归类系统是信息归类处理的重要研究方向,它的功能是在给定的归类体系下,根据文本的内容自动判别文本的类别。本文在研究传统文本归类技术的基础上,包括向量空间模型、特征提取和TF/IDF分词算法,引入了领域本体知识推理和领域事件构造等关键技术,提出了基于本体领域事件驱动的文档自动归类算法,并给出了较满意的实验结果和评价。  相似文献   

5.
基于人工标引的中文学术期刊文献自动分类算法   总被引:3,自引:0,他引:3  
为了解决期刊电子化的自动分类问题 ,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间 ,并考虑到人工标引在分类中的关键作用 ,得到综合了特征词 TF和 IDF权重的分类准则。通过适当训练建立分类库 ,计算待分类样本与已知分类的相似性 ,判别各分类。实验表明 :该分类算法可以获得 85 %的分类识别率  相似文献   

6.
提出一种基于多重假设检验的特征加权朴素贝叶斯分类算法, 该算法通过特征选择方法得到多个特征词集合, 再按多重假设检验错误率为每个特征词集合配以不同的权重系数并参与到分类器的构建中. 该方法已经应用到市长公开电话的文本分类中, 通过构建的3个特征加权朴素贝叶斯分类器实现了投诉文本的计算机自动分类, 且相对传统方法提高了分类器的效率和精度.  相似文献   

7.
文章运用模糊综合评判为核心的理论实现对网页的模糊自动归类,详细阐述了网页模糊归类算法(FWCA),并且通过一个实例阐明了实现过程.利用此算法设计实现了一个"网页模糊归类测试系统",通过分析大量实验数据,证明了利用此算法归类效果非常稳定和准确.  相似文献   

8.
针对自动文摘处理,提出一种新颖的自动文摘句子加权方法.该方法采用基于互增强关系(MRP)的迭代算法模拟句子和词之间的循环加权关系,计算句子权重.实验结果表明,基于MRP的迭代算法收敛速度快;与传统的自动文摘方法和MS Word Summarizer相比,所提出的基于MRP的句子加权方法可以使自动文摘系统具有更好的性能.  相似文献   

9.
在电力系统状态估计中引入多平衡机的思想,将其影响计入状态估计模型中,采用加权最小二乘法进行求解.同时,针对常规方法求导繁琐、微分代码灵活性差的问题,结合自动微分技术,实现了求导的自动化.对IEEE 4个标准算例的仿真记算表明:该方法能够完整地计及多平衡机对系统的影响,且采用AD技术方便了算法的实现,提高了算法的运行效率.  相似文献   

10.
介绍了基于模糊神经网络算法的塑料饮料瓶自动分类系统,包括算法设计和系统实现.系统根据各种塑料饮料瓶的颜色特性信息,迅速、准确地将饮料瓶按不同颜色进行自动分类,从而实现生产过程的自动化.  相似文献   

11.
HTML文本自动分类预处理方法的研究应用   总被引:4,自引:0,他引:4  
研究了HTML标记对网页内容的修饰作用,以前人理论为基础设计和实现了基于HTML标记的网页分析和加权策略与算法.经实验比较,加入预处理算法后,提高了分类器的分类效率,验证了所提出方法的有效性.  相似文献   

12.
在信息处理中,智能技术的使用是一大趋势.本文阐述了数据与信息处理的关系,提出文献自动分类算法.  相似文献   

13.
在多标签分类的相关研究中,由于现有的基于网络表示学习算法的相关方法只利用了网络中节点之间的邻接领域信息,而没有考虑到节点之间的结构相似性,从而导致分类准确性较低,因此,本文提出一种基于深度自动编码器的多标签分类模型。该方法首先利用轨迹计算算法(Orca)计算不同规模下网络中节点的结构相似性,作为深度自动编码器的输入来改进隐藏层中的向量表示,保留网络的全局结构;然后利用节点的邻接领域信息在模型中进行联合优化,从而能有效地捕捉到网络的高度非线性结构;最后根据隐藏层得到节点的向量表示,利用支持向量机对节点进行多标签分类。验证实验采用3个公开的网络数据集,实验结果表明,与基准方法相比,本文方法在多标签分类任务中能取得更好的效果。  相似文献   

14.
本文针对自动组卷问题是多目标优化问题,提出了基于遗传算法的自动组卷算法,并根据自动组卷和用户的需要对遗传算法进行了改进,并通过实验验证了基于遗传算法的自动组卷算法的性能。  相似文献   

15.
通过对汽车衡自动称重系统的传感器输出信号进行分析,针对噪声信号形式,给出了汽车衡自动称重系统信号处理的数学模型,给出了用于称重数据处理的滤波算法、建立了称重信号的转换过程数学模型,采用布拉克曼窗函数进行加权抑制能谱泄漏,去除了汽车重量信号中的噪声,得到了汽车质量真值.  相似文献   

16.
Boosting算法在文本自动分类中的应用   总被引:7,自引:0,他引:7       下载免费PDF全文
随着网络信息的迅猛发展,如何快捷、准确地识别和获取有用信息显得更为重要。文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。Boosting算法是一种新兴的机器学习算法。在文本分类中应用Boosting算法经过试验证明是有效的,并且优于目前的大多数分类算法。  相似文献   

17.
基于Web的多不确定因子WORD通用报表的动态生成   总被引:1,自引:0,他引:1  
报表是应用程序数据输出的一个重要方式,如何开发实用高效、通用性强、交互性好的报表系统是软件开发人员最关心的问题.文章针对Web成绩报表系统中的数据库结构、字段、专业、班级、学期课程数等诸多不确定因素,提出了一个基于Web成绩报表模型和实现算法,通过ASP对数据库的自动识别技术、字段自动识别与归类方法,开发出一个适应分布式环境的、能解决多不确定因素的通用高效WORD成绩报表系统.提高了工作效率,解决了现有报表中存在的不足.  相似文献   

18.
针对非监督分类算法分类精度不高、监督法分类算法的训练样本需要人工选择且容易误选的问题,提出了一种基于模糊C均值聚类(FCM)和BP神经网络相结合的遥感影像自动分类算法。首先利用FCM对影像进行初始聚类,然后根据聚类结果,由该算法自动选取其中的纯净像元作为训练样本,并送入BP网络进行学习,用最终训练得到的BP神经网络分类器对TM遥感影像进行分类,实验结果表明该算法具有较高的分类精度,能够满足大尺度地物类别判定的需要。  相似文献   

19.
范宏元 《甘肃科技》2014,30(15):41-43
遥感影像自动化解译一直是遥感影像解译的一个难点和发展方向。当今的自动化解译软件一般是采用先分割后分类的方式。影像自动解译的先决条件是影像分割,因此分割参数的设置至关重要,影响着分割及分类的最终结果是否准确。针对FeatureStation软件在甘肃省第一次全国地理国情普查遥感影像自动解译中,多尺度分割算法各参数的设置对于分割效果的影响进行了探讨,给出了初步结论。  相似文献   

20.
中文网页自动分类新算法   总被引:8,自引:0,他引:8  
为了有效地组织因特网上极其丰富的信息资源 ,通过分析中文和中文网页的特点 ,提出了一种新的中文网页的自动分类算法。这种算法主要利用字间的相关信息、词频以及页面的标记信息等 ,提取网页特征 ,并计算可调的词频加权参数 ,然后通过本类和非本类训练 ,建立专家数据库。实验表明 ,该算法可以获得 80 %以上的网页分类准确率  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号