首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
鉴于传统制造业企业仓储分类方法分类边界不明确、难以适应现代企业信息化发展趋势的问题,提出了基于聚类算法的ABC库存分类算法,提升了传统库存分类模型的分类精度和效率。以某电力制造业企业的库存产品数据为研究对象,结合聚类算法与ABC分类法提出了适用于实际研究场景的评价函数,并给出了新的基于k-means 算法的ABC分类法。采用该分类模型对库存环网柜产品进行分类,并基于ERP系统中存储的产品数据将库存环网柜产品分为A、B、C三类,根据分类结果对不同类别的环网柜产品采取不同的库存控制策略。研究结果表明,将数据挖掘算法应用于库存管理实现了企业库存管理决策的科学化和智能化。  相似文献   

2.
实现站内搜索引擎的关键一步是信息的自动采集.站内信息采集技术是通过分析网页的HTML代码,获取网内的超链信息,使用广度优先搜索算法和增量存储算法,实现自动地连续分析链接、抓取文件、处理和保存数据的过程.系统在再次运行中通过应用属性对比技术,在一定程度上避免了对网页的重复分析和采集,提高了信息的更新速度和搜全率.  相似文献   

3.
传统搜索引擎无法满足用户对社区网络中实时信息的需求。给出一种实时搜索引擎模型,利用经过算法优化的网络爬虫,实现制导式的数据抓取,同时利用社区网络提供的开放API获得更新数据。通过XML结构化数据,使用改进的向量空间模型对信息进行过滤和分类,并采用考虑时间因素的相关度算法对搜索结果进行排序。实验证明该模型能够实现搜索结果的实时性,并且能够保证搜索项与搜索结果之间比较高的相关度,为用户提供更好的搜索体验。  相似文献   

4.
传统的分类算法大多假设数据集是均衡的,追求整体的分类精度.而实际数据集经常是不均衡的,因此传统的分类算法在处理实际数据集时容易导致少数类样本有较高的分类错误率.现有针对不均衡数据集改进的分类方法主要有两类:一类是进行数据层面的改进,用过采样或欠采样的方法增加少数类数据或减少多数类数据;另一个是进行算法层面的改进.本文在原有的基于聚类的欠采样方法和集成学习方法的基础上,采用两种方法相结合的思想,对不均衡数据进行分类.即先在数据处理阶段采用基于聚类的欠采样方法形成均衡数据集,然后用AdaBoost集成算法对新的数据集进行分类训练,并在算法集成过程中引用权重来区分少数类数据和多数类数据对计算集成学习错误率的贡献,进而使算法更关注少数数据类,提高少数类数据的分类精度.  相似文献   

5.
不平衡数据的分类是机器学习的热点问题.传统的分类方法在分类时会倾向于多数类而使得分类精度不高.对不平衡数据集的分类,提出一种基于FCM结合KFDA方法,首先采用FCM算法对样本数据进行聚类,将数据聚类后的样本数据映射到特征空间里,再采用KFDA算法对数据进行分类,可以克服不平衡数据对分类性能的影响.对UCI数据集进行仿真实验,结果表明FCM-KFDA算法可以有效地提高数据识别率.  相似文献   

6.
在数据挖掘领域,聚类是对数据初始的处理。动态系统中,由于经常要增加一些新的数据,如果每次对新增的数据都重新聚类,这样就既浪费时间又浪费资源。首先介绍了聚类的基本概念和聚类的分类,在此基础上提出的一种基于特征向量的聚类算法,它只对新增的数据聚类,这样就会节省大量的资源和时间。通过实验,在动态系统中对新增的数据用该增量聚类算法和重新聚类的算法相比较,最后得出结论,该增量聚类算法是可行的。  相似文献   

7.
基于量子机制的改进的分类属性数据聚类算法   总被引:1,自引:1,他引:0  
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进的MCQC算法,能根据数据对象的关联情况计算同属性不同值间的相异性,计算数据对象间的相异性测度,从而提高聚类准确率.仿真实验采用3个数据集,即:大豆疾病、国会投票真实数据集和从KDD-CUP99训练样本集抽取离散属性维构成的人造样本集.实验结果表明,该算法是有效且可行的,对分类属性、二值属性和混合属性数据的聚类准确率明显高于CQC算法.  相似文献   

8.
提出一种基于C-均值聚类的二层次人像聚类算法,解决了传统硬聚类中由于每个数据只能属于某一类而使得处于类边界的数据在检索时结果准确度不高, 以及对高维大数据量数据分类时存在的模糊聚类时间和空间复杂性过大等问题. 该算法为大规模人像数据库检索提供了一种可行的分类方法, 使得分类后的人像数据在有效提高检索速度的同时保证了检索的准确度.  相似文献   

9.
针对微博对社会舆情影响力日趋增大,设计了基于层次聚类的微博敏感话题检测算法,通过对微博内容的自动抓取,利用层次聚类算法实现对微博内容的智能识别,并以敏感话题为单位对微博内容进行分类.重点对层次聚类算法的实现过程进行研究,引入了词频、词性等关键参数因子,提高层次聚类算法分类精度.通过测试表明,检测算法的检测分类精度为95.3%,话题误判率不超过6%.  相似文献   

10.
针对一类具有切换结构的混杂系统,提出一种基于仿射传播聚类的模型辨识方法。将模型辨识问题等价成对系统数据的分类和分类数据的回归问题。通过仿射传播聚类算法对样本数据进行聚类划分,并分别采用最小二乘支持向量机算法对子样本分别建立模型。仿真结果验证了该方法的有效性和实用性。  相似文献   

11.
搜索引擎通过网页搜索软件查询互联网上的链接,访问网络公开域中的每一个站点,将它们的网址带回搜索引擎,同时给web页上的文本建立索引,从而创建出一个详尽的网络目录。由于网络文档的不断变化,搜索软件也不断地更新以前已经分类的目录。搜索引擎目前广泛应用于网络资源搜索和商业智能系统。  相似文献   

12.
传统搜索引擎不能满足用户对个性化数据的需求,本文提出基于Agent的个性化元搜索引擎,将Agent技术与元搜索引擎技术相结合,较好的实现了搜索引擎的智能化,为用户提供了一种良好的检索解决方案.Agent具有的自主性、社会性、反应性和能动性等特性可提高系统的灵活性与智能性,可更好地根据用户行为定制个性化模型,大大提升了用户体验,查全率与查准率得到改善.  相似文献   

13.
数据挖掘综述   总被引:59,自引:1,他引:59  
从人工智能、统计分析和数据库技术3个方面对数据挖掘技术进行了总结;从模式识别的角度讨论了数据挖掘技术的主要任务,包括分类、聚类、回归、关联、序列和偏差6种模式的识别.详细介绍了数据挖掘技术的常用方法,包括模糊理论、粗糙集理论、云理论、证据理论、人工神经网络、遗传算法以及归纳学习.列举了当前数据挖掘技术的实际应用场合,并指出其今后的发展趋势以及急需关注的问题.  相似文献   

14.
针对目前搜索引擎返回的信息量过大且缺乏语义关联等问题,提出了一种云计算环境下的可视化探索式搜索引擎模型.该模型通过对元搜索引擎返回的原始信息在云计算环境下语义相似度的计算和语义链的构建,采用探索式搜索方法为用户获取个性化的结果.与传统搜索引擎相比,其结果更加直观地表现了目标信息及其之间丰富的语义关系,该方法使用户能够更为自然而有效地在海量的信息中发现更符合其需求的目标.作为实验模型,还需要更多的元搜索引擎的支持,以及进一步计算优化语义相似度的算法,才能使该模型真正实用化.本研究为云计算环境下构建新一代个性化智能搜索引擎提供了理论和实践上的参考.  相似文献   

15.
随着互联网上信息数量的激增,信息搜索技术面临着越来越大的挑战.传统的搜索引擎很难满足用户个性化的需求,因此将人工智能技术的研究成果引入到搜索引擎之中便成了不可避免的一种趋势.在传统搜索引擎的基础上,笔者提出了一种基于多Agent协作的智能搜索引擎模型,并将多种智能技术或算法引入到该引擎的研究之中,从而得到一个符合个性要求的高效的证券专业领域搜索引擎系统.将该系统运用到其他专业领域,同样可以取得很好的查询效果.  相似文献   

16.
A new common phrase scoring method is proposed according to term frequency-inverse document frequency (TFIDF) and independence of the phrase. Combining the two properties can help identify more reasonable common phrases, which improve the accuracy of clustering. Also, the equation to measure the in-dependence of a phrase is proposed in this paper. The new algorithm which improves suffix tree clustering algorithm (STC) is named as improved suffix tree clustering (ISTC). To validate the proposed algorithm, a prototype system is implemented and used to cluster several groups of web search results obtained from Google search engine. Experimental results show that the improved algorithm offers higher accuracy than traditional suffix tree clustering.  相似文献   

17.
搜索引擎是一个集多种技术于一体的综合性系统.元搜索引擎作为下一代功能更强大、更具智能的方案而成为当前的研究热点.这个系统区别于其他普通桌面元搜索引擎的特点,在于它的个性化和智能化.为了实现智能化和个性化,除了对PID-MSE系统采用多Agent的体系结构外,还采用了人工智能、机器学习、数据挖掘等领域的大量技术.针对桌面搜索引擎易于获得单个用户个性化信息的特点,提出了个性化桌面元搜索引擎的解决方案,从它的体系结构到局部的技术难点都作了详细描述,最后给出总结和展望,此系统是基于元搜索引擎功能的优化和扩展.  相似文献   

18.
基于分类和聚类相结合的个性化检索方法研究   总被引:1,自引:0,他引:1  
目前检索工具的设计大多面向所有用户,而没有考虑到用户个人的兴趣,导致查准率较低。由此提出一种基于分类和聚类相结合的个性化信息检索方法。该方法首先利用聚类技术,对用户的历史浏览记录进行聚类,产生一个初步的用户兴趣分类,然后根据ODP对用户兴趣分类进行调整得到最终的用户兴趣分类,并利用该分类对传统搜索引擎返回的结果进行分类,以产生有意义的分类搜索结果。该方法克服了单独利用分类或聚类技术的局限性,提高了搜索引擎的可用性。  相似文献   

19.
为提高Web 搜索精度和检准率, 在后缀树聚类算法基本模型的基础上, 提出了一种改进的基于后缀树的搜索结果聚类算法。将向量空间模型与后缀树聚类相结合, 改善了基类合并的效果, 综合基类节点对应文本数、短语包含词语长度、短语权重及是否包含查询词作为聚类标签的筛选条件, 改进了聚类标签的合理性和可读性。以搜狗语料库中的文本分类语料库为数据源进行的实验结果表明, 该方法在一定程度上提高了聚类结果的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号