期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

挖掘关注的语言值关联规则 总被引：1，自引：0，他引：1

邹晓峰陆建江储为民宋自林《解放军理工大学学报(自然科学版)》2002,3(3):9-12

为了解决利用RFCM算法划分数量型属性，并通过组合语言值进行语言关联规则挖掘中出现的规则数量太多，以及难于获得用户真正关注的规则等问题，提出了一种改进的语言值关联规则挖掘算法。通过最大隶属原则将记录在数量型属性上的取值转换为语言值，然后转换成布尔型属性关联规则挖掘问题。同时，给出一个能够度量语言值关联则简洁性和新奇性关注程度（兴趣度）的计算函数，用于减少选取关注语言值关联规则的工作量。采用本文提出的方法对一组实例数据进行实验，得到了关注程度较高的语言值关联规则。所采用的方法能适用于含有大量数量型属性的数据库，并能有效地获取用户关注的规则。相似文献

2.

基于记录对比的关联规则挖掘算法设计 总被引：2，自引：0，他引：2

钟云陆鑫《实验科学与技术》2006,4(2):48-51

介绍了数据挖掘及关联规则的基本概念、数据挖掘算法设计的基本方法、现在流行的基于“支持-可信度”的经典关联规则挖掘算法，有针对性地指出了基于“支持度-可信度”的关联规则挖掘算法的诸多不足之处，在此基础上提出了基于记录对比的关联规则算法设计思想。该算法不再认为数据源中的备条记录是独立的，而认为可以通过记录对比，从记录与记录的差异中，找出某种潜在的关系。最后对基于记录对比的关联规则挖掘算法和基于“支持度-可信度”的关联规则挖掘算法进行了对比分析。相似文献

3.

数据集中多属性关联规则发现算法 总被引：1，自引：0，他引：1

王凌李云峰等《吉林工学院学报》2000,21(4):26-28

对数据挖掘中的多属性关联规则算法进行了探讨,给出了关联规则发现算法的相关概念（关联规则、支持率、可信度）和关联规则发现算法,并说明了传统查询工具在数据挖掘中的作用,以及该算法需要进一步研究的内容。相似文献

4.

挖掘典型的语言值关联规则

陆建江徐宝文《东南大学学报(自然科学版)》2004,34(3):318-321

通过给定的最小支持率和最小信任度来挖掘语言值关联规则往往会得到很多规则,因此用户很难获得真正关注的语言值关联规则．本文提出一种挖掘典型语言值关联规则的算法,此算法将挖掘得到的语言值关联规则按照相同的后件进行分组,然后对每个分组中的语言值关联规则根据规则之间的不相似性进行聚类．最后从每个类中挑选出代表类原型的语言值关联规则作为典型的语言值关联规则．典型的语言值关联规则是语言值关联规则集合中最具有代表意义的规则．相似文献

5.

基于关联图的改进关联规则在推荐系统中的应用

王林林石冰胡元邢海华《山东科学》2011,24(5):76-80

提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。相似文献

6.

概念格递增修正关联规则挖掘方法 总被引：1，自引：0，他引：1

赵奕施鹏飞熊范纶《上海交通大学学报》2000,34(5):684-687

研究了一种知识发现与数据挖掘中关联规则的发现方法 .关联规则是数据挖掘的重要方法之一 ,其核心是各大项目集的获取 .针对货篮关联规则挖掘方法 ,提出了一种改进的概念格递增修正方法 .该方法适应于数据库的动态数据递增或递减更新 ,通过记录项目集 (即概念格中的结点 )在数据库中出现的频率值 ,不需要构造完整的格即可求得项目集的支持度值和可信度值 ,以获取大项目集 ,进而求得关联规则 .同时 ,该方法运用 Hasse图解进行可视化操作 ,降低了算法的时间复杂度相似文献

7.

基于多克隆选择的多维关联规则挖掘算法 总被引：6，自引：0，他引：6

刘芳孙杨军《复旦学报(自然科学版)》2004,43(5):742-745,749

通过引入多克隆选择算法的思想,提出了一种基于多克隆选择的关联规则挖掘算法．仿真对比试验表明,该算法加快了关联规则挖掘的收敛速度,具有更强的全局与局部搜索能力,与基于进化算法和基于免疫算法的关联规则挖掘算法相比,明显提高了所得关联规则的准确率．相似文献

8.

基于数据挖掘技术的SP企业广告策略

黄剑辉黄章树刘绍清王凤英《重庆工商大学学报(自然科学版)》2006,23(4):372-375

神经网络与关联规则是两种重要的数据挖掘技术。介绍了数据挖掘中神经网络、关联规则的常用算法,最后以某SP公司的实际群发记录为例,运用BP神经网络方法与关联规则的Apriori算法挖掘出隐藏在数据背后有用的强规则,说明了数据挖掘对SP广告宣传策略的制定具有一定的决策支持意义。相似文献

9.

一种基于串与运算的关联规则挖掘算法

胡蓉《湘潭师范学院学报(自然科学版)》2005,27(1):23-24

提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。Apriori算法是一种经典的最有影响的挖掘关联规则的算法，该算法虽然能有效地挖掘出关联规则，但是产生的冗余规则多，效率低下。针对数据挖掘的现状及关联规则算法的瓶颈问题，提出一种基于串与运算的关联规则挖掘算法，并对关联规则挖掘的未来研究方向进行了展望。相似文献

10.

基于有权重超图的离群点检测

张强李永丽董立岩李威张晓辉《吉林大学学报(理学版)》2007,45(4):611-616

基于有权重支持度框架的关联规则挖掘算法和超图分割算法, 给出一种新的基于有权重超图模型的离群点检测算法WHOT(Weighted Hypergraph based Outlier Test). WHOT算法根据有权重支持度的定义, 重新设计了基于有权重支持度框架的关联规则挖掘算法, 并挖掘出数据集中的重要关联规则, 形成超图. 在超图上应用超图分割算法, 得到聚类集合, 再结合项权重和事务权重的定义, 判断一条记录是否为离群数据. 相似文献

11.

决策树分类的属性选择方法的研究

王会青陈俊杰侯晓晶郭凯《太原理工大学学报》2011,42(4):346-348,352

针对ID3算法偏向于选择取值较多的属性作为测试属性的缺点,引入OneR算法选择属性的相关子集进行分类,降低无关属性和重复属性对分类的影响。实验结果表明,与ID3算法相比优化后的方案提高了ID3算法的分类准确率,降低了分类时间,同时克服了ID3算法的取值偏置问题,优化了分类结果。相似文献

12.

基于改进XGBoost的地震多属性地质构造识别方法

杨楚龙王怀秀刘最亮《科学技术与工程》2023,23(29):12442-12450

地震属性可以用来解释与预测地质构造,因此地震属性被广泛地运用在煤矿地质构造的识别。但一般情况下,勘探区中无构造区域与有构造区域分布不均衡,无构造区域远远多于有构造区域。机器学习中,传统的分类器更习惯于偏向多数类,这使得如何有效地识别出构造体成为一个难题。为了解决这一问题,提出了一种针对不平衡数据集的改进极限梯度提升(extreme gradient boosting, XGBoost)构造识别方法。该方法的原理是,首先,以基于三维地震勘探成果数据体提取的12种地震属性为数据集特征,以实际揭露后的地质构造为数据集标签构建多属性数据集,然后以特征对标签的相关性为标准,过滤掉冗余的特征;其次,将边界样本分类算法(boundary sample classification, BSC)与合成少数类过采样技术(synthetic minority over-sampling technique, SMOTE)相结合形成BSC-SMOTE算法。用BSC-SMOTE算法对原始数据集进行平衡,再利用平衡后的数据集训练XGBoost分类器,并用贝叶斯优化(Bayesian optimization, B... 相似文献

13.

分类算法中基于差别矩阵的属性约简方法

何海涛秦燕芬曹凤翔《燕山大学学报》2011,35(4):366-369,376

差别矩阵中会出现大量的重复元素占用大量内存,当数据太稠密时,构成的差别矩阵太大不容易操作且计算代价较高。本文提出了一种基于简化差别矩阵的属性约简算法(SDMAR),在属性约简之前,通过计算属性相似度,对属性进行了合并操作,得到简化决策表。根据简化决策表构造差别矩阵,计算差别矩阵中出现次数最多的属性并删除包含该属性的元素,当差别矩阵为空时终止操作,以达到对决策表属性约简的目的。通过算法及实例分析得到属性约简过程的时间复杂度有所减小。相似文献

14.

面向频繁封闭渐进项集的挖掘算法

徐学红陆伟杨余旺《科学技术与工程》2018,18(18)

主流数据挖掘算法不能有效解决大规模数值数据集挖掘问题。提出了一种应用于大规模数值数据集的线性时间封闭项集挖掘改进(Improved Linear time Closed Itemsets Minner, ILCM)算法。ILCM算法使用能够提取属性共同变化量的渐进模式挖掘方法,借鉴LCM算法的前缀保留闭合扩展思想,通过深度优先搜索输出频繁封闭渐进项集结果。实验证明,相比传统挖掘算法,ILCM能够显著提高算法运行效率和降低内存空间占用,并且能够有效处理如DNA微阵列等实际大型数值数据集挖掘。相似文献

15.

CFSBC： Clustering in High-Dimensional Space Based on Closed Frequent Item Set

NIWei-wei SUNZhi-hui 《武汉大学学报:自然科学英文版》2004,9(5):590-594

Clustering in high-dimensional space is an important domain in data mining. It is the process of discovering groups in a high-dimensional dataset, in such way, that the similarity between the elements of the same cluster is maximum and between different clusters is minimal. Many clustering algorithms are not applicable to high dimensional space for its sparseness and decline properties. Dimensionality reduction is an effective method to solve this problem. The paper proposes a novel clustering algorithm CFSBC based onclosed frequent hemsets derived from association rule mining. which can get the clustering attributes with high efficiency. The algorithm has several advantages. First, it deals effectively with the problem of dimensionality reduction. Second, it is applicable to different kinds of attributes, Third, it is suitable for very large data sets. Experiment shows that the proposed algorithm is effective and efficient 相似文献

16.

更新环境下多样K-支配轮廓查找方法

唐军军刘国华郗君甫李金才《燕山大学学报》2010,34(1):61-66

现有的多样-支配轮廓查询算法仅仅关注属性值不变的静态数据集,如何求出属性值更新时的多样-支配轮廓是多样K-支配轮廓查询领域一个新的研究问题。数据集的属性值变化包括单一数据和若干个数据的属性值变化的两种情况。对于这两种情形,利用现有的多样K-支配轮廓,本文提出了两种不同的查找算法。证明了算法的正确性和有效性,并且通过实验对算法进行了分析和验证。相似文献

17.

基于多任务压缩激发网络的行人属性识别

刘弋锋李勐邱迪王文杉许忠雄宋超《科学技术与工程》2019,19(24)

自然场景下的行人属性识别是一个具有挑战性的研究课题,存在行人属性类别多样、行人视角和分辨率多样、样本不平衡等诸多难点,致使难以有效建模。为克服上述难点,本文提出基于多任务压缩激发(Squeeze-and-Excitation, SE)网络的行人属性识别方法,通过多任务卷积神经网络、联合压缩激发模块与残差模块、焦点损失函数三方面改进,研究了自然场景下行人属性识别效果提升的不同方式。结果表明,本文的方法相比基线模型在Market-1501数据集和DukeMTMC-reID数据集上的准确率和效率均有提升。可见,本文的方法具有普遍有效性。相似文献

18.

An Attribute-Based Encryption Scheme Based on Unrecognizable Trapdoors

《清华大学学报》2020,25(5):579-588

Attribute-Based Encryption (ABE) has been widely used for ciphertext retrieval in the cloud environment.However,bi-flexible attribute control and privacy keywords are difficult problems that have yet to be solved.In this paper,we introduce the denial of access policy and the mutual matching algorithm of a dataset used to realize bidirectional control of attributes in the cloud server.To solve the problem of keyword privacy,we construct a security trapdoor by adding random numbers that effectively resist keyword guessing attacks from cloud servers and external attackers.System security is reduced to the Deterministic Bilinear Diffie-Hellman (DBDH) hypothesis problem.We validate our scheme through theoretical security analysis and experimental verification.Experiments are conducted on a real dataset,and results show that the scheme has higher security and retrieval efficiency than previous methods. 相似文献

19.

面向中文网络百科的属性和属性值抽取

贾真杨宇飞何大可刘胜久尹红风《北京大学学报(自然科学版)》2014,50(1):41

针对面向中文网络百科条目文章的属性和属性值抽取, 提出一种无监督方法。此方法将属性值看做命名实体, 利用频繁模式挖掘和关联分析, 从文本中抽取类别属性; 采用自扩展方法为属性建立触发词表; 基于属性触发词和属性值实体标注挖掘属性值抽取模式, 利用层次聚类算法获取高质量的模式。在互动百科中采集的数据集上进行实验, 结果表明所提方法行之有效。相似文献

20.

基于有效性指标的聚类算法选择

王开军李晓《四川师范大学学报(自然科学版)》2011,34(6):915-918

为数据集选择合适的聚类算法是获得高质量聚类结果的前提和保障.提出了基于有效性指标的聚类算法选择方法,通过对不同聚类算法的聚类结果的质量评价为数据集选择最适合的聚类算法.该方法的优点是在对数据集的情况了解甚少的情况下,也能有效地保障聚类质量.实验结果表明本文方法十分有效,为实验数据集正确选择出最适合的聚类算法,并获得了高质量的聚类结果. 相似文献