首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
传统的文本表示是在向量空间模型的基础上,采用特征选择方法降低文本的维数,这种方法认为文本中词语是相互独立的,没有考虑彼此之间的语义信息.文章提出一种新的基于语义特征选择的文本分类方法,在已有特征选择的基础上,利用词语之间的语义关联性,将那些与已选择的词语具有密切联系的词语加入词语特征空间.实验表明,该方法与已有的特征选...  相似文献   

2.
提出了一种基于双向长短期记忆网络和标签嵌入的文本分类模型。首先利用BERT模型提取句子特征,然后通过BiLSTM和注意力机制得到融合重要上、下文信息的文本表示,最后将标签和词在联合空间学习,利用标签与词之间的兼容性得分对标签和句子表示加权,实现标签信息的双重嵌入,分类器根据给定标签信息对句子进行分类。在5个权威数据集上的实验表明,该方法能有效地提高文本分类性能,具有更好的实用性。  相似文献   

3.
胡婧  刘伟  马凯 《科学技术与工程》2019,19(33):296-301
为了探讨中文病历文本预处理后高维稀疏性的特点,导致文本分类精度低、算法模型收敛速度慢等性能问题,提出一种基于粗糙集的词袋(BOW)模型结合支持向量机(SVM)的文本分类算法(BOW+SVM)。该算法首先采用BOW模型对特征词提取构建高维度文本空间向量,然后利用粗糙集的属性约简算法对文本特征处理,把模糊的、冗余的属性从决策规则中清除,降低空间向量维数,最后利用所提纯的特征与SVM分类器交叉结合进行文本分类。在Python+TensorFlow环境中设计六种交叉结合的算法仿真对比实验,结果表明:基于BOW+SVM高血压病历文本分类模型精准度可达97%。可见改进后的模型,能够解决样本分部不均,克服高维度稀疏特征空间的问题,有效改善病案管理工作流程。  相似文献   

4.
针对向量空间模型特征项正交的假设和缺乏语义的缺点,本文在广义向量空间模型的基础上,提出了一种基于《知网》义原的向量空间模型,利用义原的相似度实现文本相似度的计算。通过文本特征项的TF-IDF权重将文本表示为《知网》义原空间中的向量,并利用义原向量之间的夹角实现对文本相似度的计算。通过文本聚类实验对比了本文提出的方法与VSM和GVSM模型,实验结果表明本文提出的方法在语义相似度计算方面相比GVSM和VSM有所提高。  相似文献   

5.
针对自然场景中复杂的背景纹理对文本区域检测的干扰,提出了一种改进型局部二值模式(ULBP)提取算法,用于维吾尔文文本特征提取,并用获得的特征向量对候选维吾尔文本区域进行分类。本算法首先利用同质化映射来构建图像的同质化空间;然后,在同质化空间利用角点检测快速获取候选文本区域;最后,在候选文本区域里提取ULBP特征,把这些特征导入训练后的支持向量机(SVM)即可获得精确的文本区域。实验结果表明:ULBP特征对维吾尔文本区域具有较高的区分度,且能使误检率降低到8.3%,鲁棒性较强。  相似文献   

6.
针对不良文本的过滤问题,提出一种基于主题分类的文本过滤方法,通过对文本信息进行向量化,引人文本特征抽取技术,筛选出针对文本内容的最优的特征项集合,利用SVM分类技术,来判断文本的态度和立场,达到内容审查过滤的目的.并利用DSP在硬件上加以实现,实验表明该方法同传统的过滤方法相比具有较高的准确率和召回率,且过滤时间大幅减少.  相似文献   

7.
针对文本向量空间中特征项间的关联性及冗余性,提出了一种KNN算法运用于文本向量空间降维的方法,应用向量聚合理论和特征选择以降低特征空间维数,使得降维后的特征项更具有类别代表性.实验证明,KNN算法运用于文本降维方法中,有效地降低了向量空间的维数,提高了文本分类的精度.  相似文献   

8.
中文文本挖掘的特征导航机制   总被引:9,自引:0,他引:9  
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项,而且有助于改善向量空间模型中各个分量间的斜交现象·同时给出了基于概念的信息导航机制,按概念层次和上下文环境展现用户所关心的内容  相似文献   

9.
一种基于纹理能量的JPEG图像文本定位算法   总被引:2,自引:0,他引:2  
提出了一种新的JPEG图像人工文本定位算法.该方法直接在DCT域中计算各DCT块的纹理能量特征,并以此初步定位文本区域.然后利用文本的连通和几何特性,精确定位文本区域.实验结果表明,使用该方法可以快速有效地定位JPEG图像中的人工文本区域.  相似文献   

10.
研究了统计语言模型中b igram模型在自动文本分类中的应用,针对传统的向量空间模型在计算文本相似度时假设特征项相互独立的缺点,提出了一种新的利用词对及词序信息来改善文本分类结果的方法.实验结果表明:该方法是可行且有效的.  相似文献   

11.
藏文作为一门古老的语言有其独有的规则和特点。随着网络的普及,互联网用户中的藏族同胞迅速增加,网络上的藏文文本也越来越多。利用藏文文本聚类来提供更高效的管理和更良好的用户体验成为近年的研究热点。本文首先介绍了藏文文本聚类的应用背景和相关概念,然后介绍了藏文文本特点和藏文文本聚类的相关技术,讨论了藏文文本建模和聚类算法,最后对藏文聚类发展和应用进行了总结和展望。  相似文献   

12.
采用二阶CBS有限元法对雷诺数Re=100时不同间距的串列方形钝体构筑物的绕流进行数值研究,分析了间距比s(构筑物中心距离与构筑物宽度d之比)对流场的影响,以及平均阻力系数、阻力系数均方根、升力系数均方根、斯特劳哈尔数和压力系数随间距比变化的情况. 结果表明:间距比对串列方形钝体构筑物的流场影响显著;当2个方形构筑物为串列情形时,可有效降低流体阻力;当临界间距比在4.50~4.75时,其各项力学性能指标将发生跳跃;由于上游构筑物尾流的影响,下游构筑物的升力系数均方根总大于上游构筑物而表现出更强的脉动性,且2个构筑物表面压力分布的差异显著.  相似文献   

13.
在总结常用特征集合的基础上,根据微博文本的特点以及特征选取原则,选取了适合微博文本体裁分析的特征集合,这些特征能典型的反应微博文本和其他文本形式的区别.还分别对不同的文本体裁进行特征值的统计,并将统计结果在不同的文本体裁之间进行了深入的对比分析,并从体裁的角度分析出不同文本体裁的特征值差别的原因.并从体裁特征的角度说明微博文本是一种新的体裁文本.  相似文献   

14.
儿童传记文学插图没有采用写实的手法,而是以人物造型概念化、夸大变形的手法、角色行为拟人化、非写实性的描绘手法为特征,它符合生产者式文本的关注受众实践性、能动性和创造性特性。使儿童成为构建文本意义的主体,不受强势话语权左右,理解文本的过程其实就是一个不断从中激活意义的过程。  相似文献   

15.
针对网络文本信息的安全性判别问题,采取改进的邻近分类算法挖掘文本.该改进邻近分类方法在传统方法定义分类特征的同时,起用共线性判别矩阵,对具有共线属性的特征合并处理.这种改进策略,不仅可以增加分类特征的准确性,也可以加快文本信息的分类进程.对Spambase语料库开展实验研究,从精度、召回率、联判度、误差4个维度对分类效果进行评价.结果显示:改进的邻近分类方法具有明显的优势,可以更加准确地区分安全文本和危险文本.  相似文献   

16.
采用LS—DYNA3D动力有限元程序,建立某小净距隧道的三维模型。通过刚度等效的方法,分析了既有隧道不同钢拱架布置间距情况下既有隧道的动力响应。研究结果表明,随既有隧道钢拱架加固间距的减小,迎爆侧测点振速和位移峰值亦随之增加。建议小净距隧道爆破施工时,既有隧道钢拱架加固间距为0.5—1.0m。  相似文献   

17.
城市快速路匝道间距设计是路线设计的重要内容,匝道间距大小和匝道数量对快速路交通流有决定性的影响。当城市快速路处于不间断大交通流量时,车流呈现出较为明显的波动现象。根据城市快速路交通流的这一特点,应用车流波理论,分析了上下匝道间合流区和分流区的车流波特点,进一步建立了出口-入口组合型匝道间距比例数学模型。认为快速路匝道设计不但要考虑间距大小,相邻匝道作为一个整体,还应研究相互之间的影响。实例表明,当匝道间距比例不能满足数学模型时,快速路容易发生交通拥堵,服务水平较低,抗干扰能力较差。  相似文献   

18.
植生型多孔混凝土性能的试验   总被引:5,自引:0,他引:5  
研究植生型多孔混凝土的基本物理力学性能,分析了影响其物理力学性能的主要因素以及相应的影响规律.试验结果表明:胶结材的流动度控制在180—210mm之间,可获得良好工作性的植生型多孔混凝土;植生型多孔混凝土具有连续空隙结构、良好的透水透气性能,其透水性系数在1.5-3.0cm/s之间,与其空隙率有关;与植生型多孔混凝土的空隙率(20%-30%)相对应的抗压强度在8-28MPa之间.随着空隙率的增大,植生型多孔混凝土内部越易形成连续空隙结构;相同设计空隙率下,集料粒径越大,多孔混凝土中的有效空隙率越大.掺入矿物外加剂不仅可以调整多孔混凝土混合料的工作性,而且能改善多孔混凝土的物理力学性能,同时能降低多孔混凝土中的pH值,掺入硅粉、矿渣微粉或矿渣微粉与粉煤灰复合掺入的效果显著。  相似文献   

19.
综合利用复变函数理论、解析延拓法和Schwarz交替法揭示相邻水平并行隧道的应力分布特征. 在此基础上,结合考虑了中间主应力效应的D-P屈服准则建立相邻水平并行隧道力学模型. 提出并行隧道塑性区贯穿半径的概念,建立求解方程,并通过数值模拟证明其正确性. 采用隧道间塑性区临界贯穿状态下的间距作为隧道合理间距,与数值模拟软件FLAC3D计算得到的围岩位移量和沉降量随间距变化至基本不发生变化时所对应的隧道间距有较高的吻合性,从而表明其作为相邻水平并行隧道合理间距的可行性.  相似文献   

20.
韩伟锋 《科学技术与工程》2022,22(32):14451-14457
刀具布置是盾构刀盘设计中的重要组成部分,直接影响到掘进的切削效果、出土状况和掘进速度。针对不同地质条件下,为满足盾构地质适应性,实现高效破岩。采用盾构刀具破岩机理实验台,对工程样岩开展不同刀间距破岩实验,分析破损岩渣质量,探究不同地质条件下的最佳破岩刀间距。并与经验数据进行对比,结果表明:合理的刀间距能够提高破岩效率、减少刀具损耗,有效降低刀具成本,为不同地质条件下开展其他盾构工程进行刀间距设计提供了一种可行的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号