首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
基于统计的方法是当前机器翻译领域主流的研究方向之一,其中对齐模板统计翻译模型是效果较好的一个统计模型,而双语词聚类在对齐模板统计模型参数训练中占有十分重要的地位.本研究针对其参数训练的双语词聚类,在原有的非层次聚类基础上,提出了双语层次聚类的算法;另外,又结合2种算法的思想,提出一种新的混合算法.使用信息熵作为评价标准,结果显示混合算法的聚类效果有3.4%~5.0%的改进.  相似文献   

2.
基于超图聚类的用户行为模式挖掘   总被引:2,自引:1,他引:2  
为解决代理服务器端用户行为日志的高维特征,提出一种基于超图模型的Web会话聚类方法。该方法利用页面归约和隐含在会话中的时间等统计信息描述会话,并在此基础上利用基于关联规则的超图对用户会话进行聚类,可以在较高层次上发现代理服务器端的用户行为模式。实验结果表明,该方法可以在大型的代理日志文件集中挖掘出有意义的用户行为模式,有效揭示用户的行为规律。  相似文献   

3.
给出了模糊聚类的基本思路,确定了模糊统计量的步骤,讨论了模糊传递闭包的等价性。根据绵阳市的气候环境观测资料,用模糊聚类分析方法对绵阳市的气候环境作了初步分析,应证了模糊聚类分析在环保测评中的作用。  相似文献   

4.
基于潜在语义空间维度特性的多层文档聚类   总被引:2,自引:0,他引:2  
为实现文档在不同概念层次下的自动聚类,研究了潜在语义空间中维度的统计特性,发现对应大奇异值的维度描述了语义元素间的共性,对应小奇异值的维度描述了语义元素间的特性,呈现出潜在语义空间维度与概念粒度之间隐含的对应关系.基于这种认识,通过采用不同维度来实现文档在不同概念粒度下的聚类,并获得了很好的聚类准确率.另外,在基于潜在语义分析的文档聚类算法中,采用文档自检索矩阵的行向量,代替低维文档向量作为聚类对象,获得了更好的聚类准确率.  相似文献   

5.
为了加快传统聚类方法的计算速度,提高实际工作的效率,在传统层次聚类算法基础上,探讨了一种基于距离的增量聚类算法,并应用于粮食智能决策支持系统中。算法在保持层次聚类优点的基础上,利用旧的聚类结果提高聚类速度,根据用户需要在聚类精度和聚类速度方面选取一个适当的平衡点,有效地提高了聚类分析的效率。由此得出结论:可以利用旧的历史数据提高分析效率,缩短实际业务中的统计计算时间。  相似文献   

6.
通过对天津海岸带遥感图像的研究,提出了基于树型增长神经网络模型的遥感图像聚类方法。该方法申神经模型的网络结构在训练过程中动态生成,用户可根据需要实现层次聚类,同时可以通过调节扩展因子SF的大小调节聚类的速度和精度,从而提高了聚类的精度和灵活性。  相似文献   

7.
针对微博对社会舆情影响力日趋增大,设计了基于层次聚类的微博敏感话题检测算法,通过对微博内容的自动抓取,利用层次聚类算法实现对微博内容的智能识别,并以敏感话题为单位对微博内容进行分类.重点对层次聚类算法的实现过程进行研究,引入了词频、词性等关键参数因子,提高层次聚类算法分类精度.通过测试表明,检测算法的检测分类精度为95.3%,话题误判率不超过6%.  相似文献   

8.
为了能在多文档自动摘要过程中更好地划分子主题,提出了一种基于半监督学习的子主题划分方法:首先计算句子的语义相似度;然后通过层次聚类对可信度高的句子进行主题类别标记,生成少量已标记主题类别的句子集,在此基础上对所有句子进行constrained-k-means聚类,通过交叉验证的方法确定子主题的数目k;最后使用k-means聚类获得多文档的各个子主题.实验结果表明,该方法有效地提高了子主题的识别率.  相似文献   

9.
采用因子分析法处理沉积物粒度数据,并依据系统聚类方法将九龙江河口区的现代沉积环境划分为3个亚类:Ⅰ类沉积区沉积物粒度粗,分选差,推移跃移质组分含量高,跃移组分双跳跃,代表往复性高能环境;Ⅲ类沉积区沉积物颗粒细,分选相对较好,推移跃移组分少,悬移组分含量高,代表持续而稳定的低能环境;Ⅱ类沉积区特点介于两者之间,属于过渡性沉积环境.各类亚环境特点符合前人对本区水动力及泥沙运动的研究结果,说明因子分析和系统聚类方法是划分沉积环境的有效手段.  相似文献   

10.
韩成浚 《甘肃科技纵横》2003,32(6):34-34,69
气候系统是极为复杂的,具有极大的不确定性,即便有各种先进的观测手段、统计方法和气候模型,要准确预测预报气候的变化,仍难以做到。但随着科技的发展,对气候规律研究的深入,预测预报气候的变化将越来越准确,越来越接近实际情况,这对防止气候灾害减少损失将有重要作用。  相似文献   

11.
针对湖区高速公路景观的独有特点,从路域环境景观资源、美学和生态三个方面构建了湖区高速公路景观评价指标体系.根据评价指标多因素、多层次以及定性与定量指标并存的特点,提出了可拓层次分析法和多级模糊评价相结合的公路景观评价方法.该方法采用可拓层次分析法,将景观评价信息之间的相对重要度用一个可拓区间数来表示.通过构造可拓判断矩...  相似文献   

12.
在气候变化和人类活动的双重影响下,流域径流过程会发生显著改变.利用M-K法、有序聚类法、Yamamoto法对无定河流域径流量进行水文变异诊断,利用IHA/RVA法对变异前后径流情势进行对比分析,并量化分析气候变化和人类活动对径流改变的影响.结果显示:1)1970-2007年无定河流域径流量呈现显著减小趋势,并在1971年发生减小突变;2)突变后径流情势发生改变,径流量年内分配、极端流量及其发生时间、频率、平均延时等均具有较高改变程度;3)枯水期平均流量、最小90日平均流量和高流量平均延时可作为识别无定河流域径流量突变的关键指标;4)无定河流域径流量的减少受到气候变化和人类活动的综合影响,且气候变化和人类活动对径流量减少的贡献率分别为36.57%和63.43%.   相似文献   

13.
从R(黎曼积分)的可积条件入手,通过研究其可积的判别条件,借助层次分析的手段来简要分析了R(黎曼积分)的特征和意义.  相似文献   

14.
从分析国网-省-地市-县垂直一体化评估模式出发,构建了配电网工程项目评估指标体系.考虑供电区域、建设模式、评估级别等差异性,给出了不同评估级别的评估指标计算方法.针对国网-省-地市-县垂直一体化评估的多指标性、复杂性,采用可辨识矩阵计算各指标属性重要度的方法得到各指标权重系数,并结合集对分析理论对配电网项目进行综合评估.以5个配电网项目评估为例对所提的评估方法进行了仿真验证,并对结果进行了分析和讨论.仿真结果表明评估指标、评估思路和评估方法具有广泛应用价值.  相似文献   

15.
以固原市原州区1957—2016年的降水资料为基础,采用线性回归、M-K(Mann-Kendall)检验、累积距平曲线和滑动t检验的方法对原州区近60 a的年际和年内各时段的降水量进行变化趋势和突变分析。原州区多年年均降水量为439.6 mm,汛期和夏季降水量占比较大,分别达到72.8%和57%;冬季降水变差系数最大,最不稳定。通过线性回归法和M-K趋势检验法对降水量进行趋势分析:年、汛期和夏季降水量均呈下降趋势,下降速率分别为0.17、0.91、0.69 mm/a;春、秋、冬三季降水量呈上升趋势,上升速率分别为0.21、0.03、0.29 mm/a;除冬季外,其他各时段的趋势变化均未通过0.05的显著性检验。运用M-K突变检验、累积距平曲线和滑动t检验对各时段降雨的突变年份进行综合分析,年降水和汛期、秋季降水突变点相近,春、夏和汛期均在1991年发生突变,冬季降水在1979年有较为显著的突变。  相似文献   

16.
该文基于调和均值的定义,应用积分概率变换,提出一个新的反映顺序疲劳寿命失效概率分布集中趋势的经验分布函数,并在此基础上给出极值型检验统计量及其不同显著度水平下的临界值;考虑疲劳寿命拟合实际情况,利用随机贝塔分布函数构建备择分布,提出不依赖分布形式的检验功效数值计算方法.理论分析和数值模拟得出基于调和均值经验分布函数的检验方法较常规的K-S检验具有更高的检验功效.  相似文献   

17.
熵权法在重大危险源应急救援评估中的应用   总被引:2,自引:0,他引:2  
针对重大危险源发生事故时的特点和影响应急救援能力的因素,建立应急救援能力评价指标体系和层次结构模型,采用层次分析法构建不同层次及各类因素中全部指标的判断矩阵,通过矩阵运算和一致性检验,得到各级指标的权重,并用熵权法对得出的权重进行修正。将2种方法所得出的结果进行对比,结果表明:在熵权法修正指标权重之后,"火灾监测仪表的配备、维护及定期检测情况","预警设备的灵敏度和准确度","重大危险源泄漏报警装置的灵敏度和准确度","监测信息识别、诊断、评价"4个指标的权值大幅度增大。同时,"救援组织能力"这个指标的权值在修订以后则大幅度的减小。相比之下熵权法修订后的结果在一定程度上增强了评估结果的客观性。  相似文献   

18.
一种基于ITA改进的水文气象序列趋势分析法   总被引:1,自引:0,他引:1  
基于ITA(innovative trend analysis)法,提出了改进其趋势显著性水平的参数型趋势检测方法,给出一种刻画时间序列趋势的数量指标,并采用自举法检验趋势的显著性水平。经过蒙特卡洛数值模拟,将改进的趋势检测法对人工数据序列的检测结果分别与经典的Mann-Kendall秩次检验法和ITA法进行比较,验证了其可行性。将改进的趋势检测法应用于4种不同长度、不同地区、不同水文气象要素的时间序列数据进行趋势分析,结果表明,在5%的显著性水平上,黑河上游的年径流量、日本福冈每年发生风暴的天数和琼海的年平均气温都呈现显著的增加趋势,而北京的最大日降水量在10%的显著性水平上为显著下降趋势。  相似文献   

19.
 储层构型分析是开发中后期油藏研究的核心之一,是剩余油表征的重要手段。以塔里木盆地小海子野外露头及油藏覆盖区钻井取心资料为基础,采用Miall构型要素分析方法,揭示了浪控滨岸相储层构型要素类型及特征。根据地层单元沉积构造、岩性、粒度成分等特征的差异性,将浪控滨岸相储层构型界面划分为七个级次,而不同级次构型界面控制着相应级次的构型单元。二级构型单元表现为单一岩相类型,根据储层的岩性及层理特征,结合不同岩相对油气开发的控制作用,将二级构型单元划分为13种类型。根据二级构型单元时空关系,以三级构型界面为约束条件,参考储层内部渗流屏障产状,将三级构型单元划分为板状、槽状、楔状和千层饼状四种类型。浪控滨岸相储层构型要素的厘定,为储层精细刻画提供了理论依据,对高含水期油藏开发和综合调整具有重要的指导意义。  相似文献   

20.
根据新疆气象局地面观测资料,整理出库车县1951~2009年沙尘暴年日数资料,运用小波分析、累积距平、滑动t检验等方法对沙尘暴年日数序列的变化趋势、周期特征、突变特征进行了分析,结果表明:(1)近60年间,库车县沙尘暴年日数呈显著减少的趋势,趋势系数为-0.34,通过α=0.05的显著性检验。20世纪50年代、60年代和70年代是近60年库车县沙尘暴的三个频发期。(2)沙尘暴年日数序列存在7年、15年、22年的周期;在不同的时间尺度上,沙尘暴经历了多个频发期和少沙尘暴期,在未来几年可能会再次迎来一个沙尘暴的频发期。(3)研究区内沙尘暴年日数变化趋势确实存在1985年的突变年份,而且这次突变并不是简单的均值突变或转折突变,是这两种突变的组合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号