排序方式: 共有5条查询结果,搜索用时 312 毫秒
1
1.
2.
基于Hadoop云平台的并行数据挖掘方法 总被引:1,自引:0,他引:1
业界已经开始运用云平台来处理海量高维数据,将各种异构系统仿真为一个系统,其中在Hadoop环境进行数据挖掘会遇到数据模型的全局性、HDFS的文件随机写操作、数据生命周期短等问题.为解决这些问题,在Hadoop上实现高效海量数据挖掘,提出了在Hadoop上一种高效数据挖掘框架,利用数据库来模拟链表结构,管理挖掘出来的知识,提供了树形结构、图模型的分布式计算方法;在此基础上实现一个统计算法——Yscore分箱算法,以及决策树和KD树的建树算法;并利用Vega云对Hadoop集群进行仿真.实验数据表明该框架和算法实用可行,且可能拓展与数据挖掘之外的其他领域. 相似文献
3.
杨来定 《济源职业技术学院学报》2021,20(3):34-38
传统的高职声乐教学模式长期沿用和照搬本科层次的教学方法和育人模式,"师本位"思想严重,忽视了学生的接受能力和发展需求,违背了教学规律,教学效果和育人质量难以得到保障.运用模块化思维系统将声乐课程内容分解为歌唱理论知识、发声技术训练、作品演唱及处理和舞台表演四个模块,构建科学的声乐理论和实践教学体系,明确教学的阶段目标,... 相似文献
4.
5.
分词是中文信息处理的基础,词典查询又是分词的基础。另外,搜索引擎需要对访问过的URL进行唯一性检测。针对汉语词典查询和唯一性检测这两个问题,提出Dynamic Hash TRIE词典算法,有效地压缩了节点,没有单链树枝。通过Java和C++编程实验,对比了多个同类算法,证明该算法对于中文词典具有较高的查询性能,灵活的可拓展性。另外还提出了一个词库测试的标准Norm Test,可以排除机器性能的干扰来对比各种算法。 相似文献
1