排序方式: 共有35条查询结果,搜索用时 156 毫秒
21.
基于权值调整的文本分类改进方法 总被引:14,自引:0,他引:14
文本分类是文本挖掘的基础与核心 ,可广泛应用于传统的情报检索和 Web信息的检索与挖掘等。提出了一种利用权值调整思想对向量空间法 (VSM)和朴素 Bayes分类器 (NBC)进行改进的文本分类方法 ,并探讨了利用 EM算法进行无导师 Bayes分类的方法 ,设计和实现了一个中英文文本分类系统 CZW。 3组实验数据表明 ,用某些评估函数调节单词权值可有效提高 VSM和 NBC等文本分类模型的精度 ,并且训练文本规模越大 ,改进的效果越明显。 NBC的分类精度最高可达 86 %。 相似文献
22.
23.
24.
基于克服过早收敛的自适应并行遗传算法 总被引:65,自引:0,他引:65
为了克服遗传算法中存在的主要问题即过早收敛(过早收敛使得一些优秀个体或基因过早地被排除掉,从而导致搜索范围缩小及局部最优,影响了进一步搜索),从控制参数的改进着手,提出了多种群并行进化及自适应调整控制参数相结合的思想。克服了以往定常参数单种群进化的不足,综合了不同特性种群进化的长处,使得过早收敛问题得以缓解,同时又提高了搜索的范围和效率。 相似文献
25.
Bayesian方法的计算学习机制和问题求解 总被引:19,自引:0,他引:19
从信息熵的角度讨论了无信息先验分布的Bayesian假设的合理性 ,着重分析了贝叶斯方法的计算学习机制 ,得出贝叶斯定理是将先验分布中的期望值与样本均值按各自的精度进行加权平均 ,精度越高者其权值越大 ,合理地综合了先验信息和后验信息。在共轭先验分布的前提下 ,可以将后验信息作为新的一轮计算的先验 ,用 Bayesian定理与进一步得到的样本信息进行综合。多次重复这个过程后 ,样本信息的影响越来越显著。因此 ,合理正确地指派先验分布对提高学习的效率和质量有重要意义。 Bayesian方法既可避免只使用先验信息可能带来的主观偏见 ,和缺乏样本信息时的大量盲目搜索 ,也可避免只使用后验信息带来的噪音的影响。因此 ,适用于具有概率统计特征的数据采掘和知识发现问题 ,尤其是样本难得或代价昂贵的问题。 相似文献
26.
基于语义相似性的资源协同过滤技术研究 总被引:6,自引:0,他引:6
为解决协同过滤推荐系统中所存在的可扩展性、稀疏性等问题带来的推荐性能下降,提出新的基于资源语义知识协同过滤算法,算法综合考虑了资源语义和用户评价的影响,改善基于资源协同过滤算法性能.实验表明,基于资源语义的协同过滤算法相对于传统协同过滤算法可提高推荐性能. 相似文献
27.
28.
29.
粗糙集理论及其应用进展 总被引:90,自引:0,他引:90
粗糙集理论是一种新型的处理模糊和不确定知识的数学工具。目前已在人工智能、知识与数据发现、模式识别与分类、故障检测等方面得到了广泛应用。首先描述了粗糙集的基本算法及其复杂度 ,包括等价关系 ,上下近似及各种约简算法 ;接着对粗糙集扩展理论 ,如可变精度模型 ,相似模型等进行了讨论 ,然后对粗糙集在数据挖掘、大数据集、粗糙逻辑、多方法融合等领域中的应用进展情况进行了论述 ,最后给出了建议的研究方向 相似文献
30.
Web推荐系统能为用户提供有针对性的个性化服务。但目前基于协同过滤和使用挖掘的推荐系统存在着诸如数据信息的不完整或不正确,推荐精度和质量不高等问题。为提高推荐系统的性能,必须将站点的内容和结构信息以及用户行为数据集成形成混合模式推荐系统,在推荐引擎里统一使用。基于此,本文提出一种新型Web推荐系统框架,能够将站点的内容,结构和用户的浏览行为综合考虑形成用户浏览模型,通过用户模型向用户推荐资源,初步实验表明该模型能有效改善推荐系统的性能。 相似文献