排序方式: 共有1条查询结果,搜索用时 15 毫秒
1
1.
基于统计量化分析法对我国唐宋诗词的用词进行研究,综合运用数理统计数据处理方法和其他方法,建立了余弦相似度算法模型和隐含狄利克雷分布(Latent dirichlet allocation, LDA)模型,验证了字词能够很好地代表不同诗词的风格和主题,进一步根据LDA模型分别选取了唐宋时期各3个主题和30个关键词,证明主题和关键词对唐宋诗词分类有显著的相关性,并取得了很好的分类效果,最后运用支持向量机(Support vector machines, SVM)算法模型验证了题目、风格和用词等变量对题材分类产生影响的假设,进一步验证了LDA模型结果,也为唐宋诗词的分类和本体研究提供了科学依据。 相似文献
1