排序方式: 共有6条查询结果,搜索用时 0 毫秒
1
1.
一种基于后缀树的中文网页层次聚类方法 总被引:1,自引:3,他引:1
为了便于用户浏览搜索引擎产生的搜索结果,结合STC算法和变色龙算法提出了一种中文网页的层次聚类方法-STCC算法。该方法采用雅可比系数修改了STC算法中基本类相似度的计算方法,然后根据基本类相似度矩阵,利用变色龙算法完成网页聚类。实验结果表明:STCC算法与STC算法相比。聚类精度提高将近10%,避免了单链接算法的链式效应,适用于大规模网页聚类。 相似文献
2.
滚轮法大直径测量精度研究 总被引:1,自引:0,他引:1
为了提高滚轮法大直径测量的精度,对影响其测量精度的打滑问题、测量力大小的选取、安装误差和滚轮偏心等进行了理论分析和实验研究.改变测量力大小进行实验,找出了在该实验装置上产生误差最小的测量力;对安装误差产生的影响进行分析,找出仪器调整的方法,使安装误差引起的测量误差达到最小.最后经过数据处理和误差补偿可以使滚轮法大直径测量精度达到±6.26μm. 相似文献
3.
4.
综合布线系统是智能大厦的重要组成部分,是建筑技术与信息技术相结合的产物,是不同布线子系统构成的一个有机整体。合理的布线结构、正确的选材能使综合布线系统便于维护,具有长期的使用寿命。综合布线系统的设计应遵循有关的标准。以期获得较长的使用寿命。目前,我国尚无正式的综合布线标准,本文根据综合布线国际标准ISO/IEC11801介绍了综合布线系统的基本结构。并在此基础上给出了综合布线系统设计的一般方法以及链路性能参数的测量方法。 相似文献
5.
基于条件随机域的Web信息抽取 总被引:1,自引:0,他引:1
为了获取隐藏在Internet中的信息,基于条件随机域模型(CRF),提出了一种Web信息抽取的方法。该方法对网页样本中的每一行加注标签,确定文本特征,建立条件随机域模型,采用拟牛顿迭代方法对样本进行训练,参照学习得到的条件概率分布模型,实现网页搜索结果的抽取。与HMM模型相比,CRF模型支持网页文本的语言特征,抽取准确率高。实验结果表明,使用CRF模型的抽取准确率达到90%以上,高于使用HMM模型的抽取准确率。 相似文献
6.
为了便于用户浏览网页信息,基于全置信度关联分析,提出了一种网页层次聚类的方法。该方法采用向量空间模型表示网页文档,将文档看成事务,文档的词汇视为事务中的项,根据关联挖掘算法发现文档之间的强关联规则产生基本类,然后利用图划分的算法完成网页文档的层次聚类。在关联规则产生过程中采用全置信度量发现强关联模式,规则的产生不受支持度阈值设置的影响,即使支持度闽值设置为零,也能发现强关联模式,有效地消除了弱相关的交叉支持模式。 相似文献
1