共查询到20条相似文献,搜索用时 62 毫秒
1.
王成平 《湘潭大学自然科学学报》2012,34(3):107-113
实现彝语文自动分词是计算机彝文信息处理中一项不可缺少的基础性工作,计算机彝文信息处理只要涉及到信息检索、机器翻译、语法分析、语义分析等方面的应用,就都需要以词为基本的处理单位.论文以彝语言的特点作为出发点,首先提出了计算机彝文分词规则与分词词表的设计思路,其次提出了实现计算机彝文自动分词技术的算法基础、系统结构,以及实现流程,而且进行了抽样测试,其分词的速度和准确率都比较高.论文最后根据彝语言的特点对实现计算机彝文自动分词的难点进行了分析. 相似文献
2.
陆维嘉 《湘潭大学自然科学学报》2016,(3):64-68
针对生物医学可用数据越来越庞大而导致管理人员很难从非结构化文件中整理出有用信息的问题,提出了一种基因-疾病关联规则提取方法 .首先从MEDLINE和OMIM准备实验语料库,应用解析器产生一些语法信息;然后学习所有可能的规则,利用粒子群优化进行优化学习,从不相关句子中区分相关的;最后,计算学习规则的分数,选择感兴趣的规则,并生成一组有用的关联规则.以精度、召回率和F-分数为评价指标的实验证明了提出方法的有效性.实验结果表明,提出的方法最大精度、召回率和F-分数可分别高达79.2%、65.1%、68.5%,相比手动规则集,提出的方法更加完整. 相似文献
3.
本文绍了关联规则挖掘的研究情况,提出了关规则的分类方法,对一些典型算法进行了分析和评价,指出传统关联规则衡量标准的不足,归纳出关联规则的价值衡量方法,展望了关联规则挖掘的未来研究方向。 相似文献
4.
5.
中文自动分词一直是中文信息处理、Web文档挖掘等处理文档类研究的基础技术之一,传统的中文分词技术研究,主要集中在算法的改进研究上,对实验的平台,有关软件的实现涉及很少.本文通过探讨中文自动分词的重要性和不可或缺性,给出了基于VC++/MFC自动分词软件的开发技术,最后对软件实现的四种基于词典的机械匹配的算法进行了实验分析,实验证明该系统能够高效的给中文信息处理提供一个平台. 相似文献
6.
针对当前关联规则挖掘存在的不足,在充分利用本体特点的基础上,对关联规则挖掘方法进行了改进。提出了一种面向领域的噪音清除算法,结合Apriori算法优点,又提出了一种改进的关联规则挖掘算法,采用领域本体技术来优化规则,从而去除冗余规则。通过实验验证所提方法的有效性。 相似文献
7.
文本分类规则的提取和优化是衡量文本分类系统适应性能和分类能力的主要指标.在基于粗糙集和模糊聚类理论的文本分类系统中,结合粗集理论及不完备信息系统理论,提出了分类规则的提取和优化方法,通过实验和分析,产生用户满意的约简规则,从而能够快捷迅速地指导新文本的分类,提高系统的适应性能和分类能力. 相似文献
8.
9.
10.
为了获得流格式数据集的规则挖掘以及降低挖掘过程中的计算开销,提出一种基于动态模糊频繁模式的数据挖掘方法 .首先,确定一种滑动窗口区分新旧事务,以处理连续产生的数据流;然后构建动态模糊频繁模式树(DFFMT),随着滑动窗口的变化,给每个删除的旧窗格添加相应算法,且插入新窗格;最后,当DFFMT构建完成之后,根据当前窗口推理模糊关联规则.两个公开数据集的实验验证了提出方法的有效性.与其他同类方法相比,提出的方法只需要检索数据库一次,可以处理大量的流格式数据集.同时,运行复杂度和存储复杂度表现也较优. 相似文献
11.
提出了一种改进的多任务学习方法,网络的主结构由特征提取网络和分别进行视盘分割与视盘定位的双路径网络组成,通过端到端的训练与测试可以实现眼底图像视盘自动分割与定位相结合的多任务目的。在特征提取网络的编码阶段利用密集连接提取眼底图像视盘的上下文特征。视盘分割任务是依靠解码阶段逐步恢复原来的图像分辨率并获取整个视盘轮廓,视盘中心定位任务由空洞空间金字塔模块和金字塔池化模块来进一步提取视盘抽象特征,得到精准的视盘中心坐标。对350幅眼底图像进行了视盘分割和中心定位,实验结果表明:该方法自动分割的视盘结果与手动标注视盘区域的Dice系数为0.965,自动定位的视盘中心坐标与手动标记的视盘中心的平均绝对距离为0.191 mm(34.7像素)。 相似文献
12.
曲长新 《哈尔滨师范大学自然科学学报》2011,27(1):47-49
移动学习系统的设计,包括系统设计原则、系统设计目标、相关的支撑技术、系统体系结构设计和功能模块设计,并分别对各个功能模块加以实现.该系统主要实现了移动学习、网上教学以及教学评价等功能,主要功能分为学生模块、教师模块和管理员模块三个部分. 相似文献
13.
Web的海量信息导致了搜索引擎的出现,同时,Web数据的迅速膨胀以及频繁的更新对搜索引擎提出了更高的要求,而并行搜索引擎可以提高抓取速度,并改善更新效率.语义Web是对未来Web的一个设想,语义Web的数据同传统Web一样面临着数据的膨胀更新问题.于是研究语义Web并行搜索引擎成了一个重要的研究方向.介绍了如何设计一个基本的面向语义Web的并行爬虫系统.该系统由一个中央控制器和若干个子爬虫组成.中央控制器负责为爬虫分配抓取任务,并汇总抓取的数据;子爬虫负责抓取并抽取URLs的工作.而对于每个子爬虫除了处理RDF文档之外,还试图从传统HTML网页中通过强化学习的方法发现更多RDF文档链接. 相似文献
14.
电子政务门户网站是各级政府沟通公众与社会的窗口,公众满意度是体现电子政务门户网站建设水平及其影响力的一项重要指标.该文描述了电子政务门户网站公众满意度评价的现实背景及其意义,构建了政府门户网站公众满意度指标体系,并以湘潭市政府门户网站为背景,运用了定量与定性相结合的方法,依据模糊综合评价的相关理论进行了公众满意度的分析. 相似文献
15.
通过对第三方物流服务供应商进行评估与选择,为企业合理选择物流服务商提供了指导与依据。考虑了第三方物流供应商选择原则步骤,提出相应的评价指标,并进一步建立了较为合理的评价指标体系。然后通过分析现有评价方法,提出主观、客观相结合的评价方法,运用了层次分析法、熵权法等建立了基于层次分析法、熵权法的综合评价模型,为物流服务商的选评提供了参考依据。最后,通过实例进行分析,运用综合评价模型,选择出适合的第三方物流供应商,验证了方法的有效性,为相关企业选择第三方物流供应商提供了一定的依据。 相似文献
16.
17.
山丹河作为黑河水系的较大支流,其水质优劣程度对黑河干流水质有着十分密切的影响.利用山丹河水质监测数据对山丹河主要污染物浓度以及污染特征进行分析,可知山丹河主要污染物以耗氧性有机物为主,营养盐次之,其主要污染物分担率为:BOD5占17.4%,挥发酚占13.6%,CODMn占12.9%,TP占12.6%.运用模糊评价法进行水质等级评价研究,根据模糊评价法最大隶属度原则,山丹河的水质等级属于V级,属重度污染.同时分析了山丹河污染成因,并提出相应的污染治理措施与建议. 相似文献
18.
19.
依据佛山供电局的发展战略和电网行业特性,运用层次分析法、模糊综合评价法等方法进行配网基建项目效益分析,辅助投资决策.从经济效益、安全可靠效益和社会效益三个维度出发,合理设置评价主题和代表性指标,构造具有层级结构的效益评价模板,运用层次分析法等方法计算出下层元素(主题或指标)对上层元素的权重.采用模糊综合评价法,由隶属度函数将待选配网基建项目的底层指标数据转化为评价值,结合各层级的权重向量,计算出项目总得分并依此进行排序.在年度配网基建总投资内进行项目优选,力求项目综合效益最优. 相似文献
20.
针对高等学校课程评价的特点,给出了课程权数构造的具体方法,根据评价原则组合多种权数,采用幂平均合成模型对课程成绩进行综合评价,并通过实例应用分析,确定权数合成方法和模型参数.该方法能合理地评价学生的学习效果. 相似文献