首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
随着经济的快速发展,信用贷款在企业资金周转中的作用越来越重要.信用评级是信用贷款发放的基本依据之一.本文针对实际信用评级中有标签样本数量不足的问题,提出一种基于Tri-training算法的多分类信用评级方法,该方法选择支持向量机、决策树和最大熵模型作为基分类器组合.最后,本文使用真实的信用数据集验证了该方法的实际效果.  相似文献   

2.
公共空间模式(CSP) 分析由于具有变换简单、实现快速等优点,被广泛应用于信息挖掘、脑电信号处理等大数据处理应用中.本文以基于脑电信号的人类认知状态分类识别为背景,研究一种基于Fisher 分数(Fscore)的特征评价与选择的CSP 构建方法.利用F-score 计算代价小、可以快速从高维数据中选择出有效信息和特征的优点,实现了对模式重要程度做出定量的表达;针对F-score 阈值确定困难、信息冗余、无法自适应实现等难点问题,提出了相应的解决方法.所提出方法在脑认知活动解析实验中,针对五类认知状态分类问题取得了92%的识别准确率.本方法为大数据的公共模式挖掘等问题供了一个强有力的新工具.  相似文献   

3.
脑-机接口是一种涉及多学科多领域的新颖的人机接口方式,标准的脑-机接口系统可以准确、快速地采集、识别出人脑在各种思想活动下的脑电信号,在医疗、航空、军事、生活娱乐等多个领域具有潜在应用价值.该文根据脑-机接口利用的脑电信号的来源和方式不同,对其研究方法中主要三个分类即视觉诱发电位、P300电位和运动想象进行了介绍,并对各分类国内主要申请人所申请的专利进行了分析,帮助更多申请人提升对技术的理解和把握,指导专利申请走向.  相似文献   

4.
对申请案件进行检索时一般采用关键词+分类号进行检索,这类常规检索没有考虑申请人性质而进行笼统检索,会导致漏检现象的发生或检索效率不高.该文对申请案件从申请人性质入手,区分为国内申请、国外申请、PCT申请、台湾申请、高校申请,国内申请又有国内小公司申请和国内大公司申请,针对不同申请人性质的申请案件提出不同的检索策略,提高了检索效率.  相似文献   

5.
信息公开制度在取得重大进展的同时也出现了个别申请人滥用申请权的问题。主要表现在个别申请人为拆迁安置等问题大量、反复申请,职业申请人的出现以及申请人间的抱团现象等。个中原因复杂多样。滥用申请权非我国独有,各国的立法模式大体可分为三种,分别是从申请人、申请行为本身及所申请的信息角度进行规制的。应通过立法来规制该问题,且应以申请行为为核心进行主客观分析并加之程序上的规范。配套措施的实行也非常重要,如收费、惩戒制度,其他纠纷解决机制的完善,及现有的公开职责的进一步实现等。  相似文献   

6.
针对大数据分类中的不平衡问题,本文提出一种基于边界条件生成式对抗网络(Boundary Conditional Generative Adversarial Networks,BCGAN)的不平衡大数据模糊分类算法,通过在多数类数据和少数类数据的决策边界附近引入一个边界少数类到过样本,生成更合适的少数类数据来提高分类性能.将处理过的平衡数据转换成概率索引表,数据和属性分别以行和列的形式呈现,计算每个数据属性中存在的唯一符号的隶属度,然后设计相关模糊朴素贝叶斯(Correlative Fuzzy Naive Bayes,CFNB)分类器进行数据分类.本文给出MapReduce框架下大数据模糊分类的并行实现.实验结果表明:所提基于BCGAN的不平衡大数据模糊分类准确度优于其他现有方法,说明该方法具有可行性和有效性.  相似文献   

7.
《创新科技》2018,(10):55-60
针对缓控释微丸制剂技术,在专利层面上,分别从全球专利申请趋势、申请国/地区、申请目标国/地区、IPC技术构成、申请人、重要申请人对比、国内各省市申请状况和缓控释微丸技术分类等维度进行详尽的定性与定量分析,阐明了缓控释微丸制剂的国内外研究进展,并为国内企业提出了发展建议。  相似文献   

8.
大数据时代,各行各业均产生海量信息,面临大量的信息,如何准确而高效地获取数据中的潜在规律和蕴含价值成为企业信息化的重点。为提升煤矿企业对安全监测数据的理解和监控能力,改善隐患排查治理工作水平,本文提出基于类别关键词权重的短文本分类模型,有效缓解了文本分类中特征稀疏的问题。该方法首先基于朴素贝叶斯算法,对不符合规范的非法数据进行筛选,然后构建基于关键词权重的短文本分类模型,利用中文分词技术、卡方检验方法构建关键词库,最后建立得分模型实现对隐患数据的分类。结果表明,该模型能较为准确地对矿业安全隐患数据进行有效的评级分类,进一步地改善隐患排查和治理的针对性和有效性。  相似文献   

9.
批量甜玉米低场核磁共振数据的统计分析   总被引:2,自引:0,他引:2  
以烫漂甜玉米的低场核磁共振数据为例,采用统计分析系统(SAS)得到烫漂温度对甜玉米中水分分布的影响规律,利用SAS批量读入数据并对数据进行多指数模型拟合、主成分分析和偏最小二乘法模型预测,提供了相应的SAS代码.结果表明,当弛豫时间为450~750和50~70 ms时,相应水组分的弛豫强度分数随处理温度的变化而呈现出一定的变化规律;烫漂温度可初步划分为3个温度段,即20~40、50~70和80~100 °C;束缚水含量模型具有较高的预测准确性(决定系数R2=0.974,标准差RMSECV=0.32%);SAS方法在批量数据处理过程中具有较高分析和处理数据的能力.  相似文献   

10.
截至2018-01-16,LIGO已成功探测引力波事件6次.可以预期,引力波探测事件会越来越多,引力波天文学会很快进入到大数据阶段.深度学习在大数据处理方面近年来得到迅速发展.它在数据处理速度,准确度等方面都表现出极大的优势.深度学习在引力波数据处理中的应用讨论还不多.本文引入此问题,并对其进行初步研究.引力波数据最大的特点是强噪声、弱信号.现行的数据处理方法是利用匹配滤波的方式把引力波信号从强噪声中挖掘出来.同时,匹配滤波方法还可以确定引力波源的性质,定量确定其参数.匹配滤波方法的弱点是计算量巨大.这导致数据处理速度很慢.对于将来的大数据引力波天文学,这更将是一个巨大的隐患.匹配滤波方法的另一个潜在问题是,完备准确的理论波形模板是其工作的前提条件.这个潜在问题的后果是很难找到理论预期之外的引力波信号.深度学习的数据处理方法有可能在这些问题上提供出路.同时,深度学习也会遇到其自身的若干困难和问题.本文将从网络结构、训练数据制备、训练优化、对信号识别的泛化能力、对数据的特征图表示以及对特征数据遮挡的响应等方面来展开讨论.  相似文献   

11.
彭大为  史惠存 《江西科学》2020,38(2):252-256
随着计算机技术的不断发展,数据处理技术不断推陈出新,特别是大数据、分布式集群、云计算技术的发展使得数字水利开始向智慧水利转变。由数字水利向智慧水利转变的重要技术之一就是对水利大数据的处理,大数据处理是实现智慧的核心技术。一个完整的大数据处理工作流程大致包括数据收集与导入、数据清洗与质量控制、数据管理与存储、数据分析与可视化、数据建模与模型管理。主要对水利自动化实时流式大数据的处理提出了一种解决方法,该方法能够实现对水利自动化设备实时上报的高频流式大数据进行有效的处理。  相似文献   

12.
以大丰市沿海滩涂湿地区域为研究区,以机载高光谱影像为主要数据源,冠层高度模型(canopy height model,CHM)数据为辅助数据,采用数据挖掘的方法对高光谱数据进行特征规则提取,实现了湿地植被的精细分类.结果表明:3种湿地植被分类结果的总体精度为90.3%,说明数据挖掘技术在处理高维数据时不仅可以提取重要程度较高的数据,而且可以减少数据量,提高数据处理效率与分类精度;与传统的支持向量机分类法(SVM)分类结果进行对比,基于数据挖掘的湿地植被精细分类总体精度比SVM分类方法高10.8%,表明数据挖掘方法在湿地植被高光谱遥感分类问题上具有较大优势.  相似文献   

13.
电子商务(E-commerce)的飞速发展, 产生了大量针对商品的在线评级数据, 通过分析评级数据, 用户可以对商品的质量进行评估. 然而, 评级数据的海量性和差异性使得用户难以快速而准确地评估商品的质量. 鉴于此, 提出一种基于E-commerce 评级的上下文感知赋权方法(context-aware weighting approach, CWA), 以选出少数“重要”的评级数据并抛弃大多数“不重要”的评级数据, 从而确保商品质量评估的快速性和准确性. 最后, 通过一组实验验证了CWA 的有效性.  相似文献   

14.
针对现有大数据分类算法中存在准确率低的问题,本文提出一种基于差异灰狼优化决策树的大数据分类方法.该方法首先将复杂的大数据输入Map-Reduce框架中,采用主成分分析法对输入数据进行降维;然后利用支持向量机对压缩后的数据进行粗略分类;最后采用基于差异灰狼优化的决策树对支持向量机输出的类标签进行精细分类,获得更高的分类准确度.实验结果表明,相比于其他分类算法,本文提出的方法在复杂大数据分类方面具有明显的优势.  相似文献   

15.
基于软件大数据的自动化缺陷检测模型已成为缺陷发现的重要工具.针对软件大数据中,被准确标定的缺陷样本稀少,且漏标、误标率高,导致现有机器学习数据平衡优化方法易使噪声加剧、分类边界模糊等问题,提出一种稳健边界强化GMM-SMOTE软件缺陷检测方法.该方法利用高斯混合聚类将软件集合划分为多簇,基于簇内类别比进行可靠样本筛选并且通过后验概率实现边界识别,用以指导完成加权数据平衡,最后利用平衡优化数据构建软件缺陷检测模型.在NASA多个公开数据集上的实验结果表明,GMM-SMOTE可实现噪声抑制、边界强化的数据平衡,有效提高了软件缺陷识别效果,实际应用价值大.   相似文献   

16.
在油气地表化探数据处理中常使用多元统计分析方法,但在使用过程中有许多值得注意的问题,如数据的预处理、失真数据的挑选、指标的优选及分类、趋势面次数的合理选择、异常下限的确定等,这些问题对计算和最终成果的解释具有重要影响。本文结合作者近年来实际工作的经验,针对化探数据处理过程中可能出现的某些问题进行了讨论,并给出了解决问题的思路或方法,使数据处理结果更趋可靠。  相似文献   

17.
利用决策树算法对银行的信用卡客户进行分类,构建了客户分类模型,给出了分类步骤中信用卡的客户类型特征,为银行的信用卡推广业务提供相应策略.  相似文献   

18.
CEDS-MD是为彩色电视机机壳结构设计研制的专用微机CAD系统,本文介绍了系统的数据分类,表示模型的选取,数据处理方法及相应的文件系统.  相似文献   

19.
当今人类已经进入大数据时代,海量数据处理已成为大数据技术领域的研究热点。Spark是一种典型的基于内存的分布式大数据处理框架,但在Spark的实际应用中出现的数据倾斜问题会对计算效率产生重要影响。本文针对于Spark在各类应用中出现的数据倾斜问题,梳理国内外相关研究进展,对在出现数据倾斜问题后常用的优化方法进行了分析对比,最后对未来的研究方向进行了展望。  相似文献   

20.
基于一类分类方法的多类分类及其应用   总被引:1,自引:0,他引:1  
在分析一种非线性数据处理新方法的核心概念基础上,研究了基于一类分类方法的多类分类基本原理,提出了应用于多类分类的可信度函数,使聚类与分类的结果更具有可信度.最后,以某企业对供应商关系的调查数据为例,将这种方法应用于企业商业关系网络分析中.结果表明了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号