首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
本文应用基于Excel下的ESX工具对随机调查的某地区的工人的工资数据进行聚类、分类处理,得出工资与工作时间、年龄和接受教育的时间是明显正相关的。  相似文献   

2.
研究了基于生成模型的块稀疏偏差模型(Block Sparse-Gen).依靠块RIP条件和块REC条件,从理论上给出了最优解码的重构误差以及高概率恢复生成函数的测量次数.实验数值也验证了Block Sparse-Gen的有效性.  相似文献   

3.
“语料库及语言对比与翻译国际研讨会”(The International Symposium on Using Corpora in Contrastive and Translation Studies)2008年度大会于9月25日在浙江大学隆重开幕,会议历时3天。  相似文献   

4.
罗江毅  姚音 《河南科学》2023,(8):1093-1101
依赖于临床标签的氨基酸致病突变预测方法通常由于标签存在跨基因的偏差、稀疏噪声等因素,出现性能膨胀的情况.为解决此问题,创新地在不需要标签的情况下,利用预训练蛋白质语言模型计算ClinVar数据库中突变位点的氨基酸概率分布,并基于此分布构造突变型与野生型氨基酸出现概率的对数优势比(LOR),使用一种全局-局部结合的高斯混合模型拟合LOR,从而无监督地计算突变致病效应概率分数(PPE)并推断致病性,最后给出预测的不确定性度量.使用与深度突变扫描(DMS)实验的相关性作为评估指标以避免标签泄漏等问题.模型评估结果验证PPE具有稳健的致病性预测性能,在2458个蛋白质上的接收者操作特征曲线下面积(AUC)平均值约为0.89,与4种DMS实验的平均斯皮尔曼相关系数约为0.44,优于大部分依赖标签的计算方法,且与高通量实验的性能相当.该研究为遗传变异的解释、疾病的研究、诊断和临床治疗提供了可靠的辅助工具.  相似文献   

5.
为了满足汉语(二语)教学中语言点教学与研究的需求,以汉语(二语)教学中语言点的标注问题为研究对象,探讨了在汉语语料库中语言点标注的内容、维度、方法,制订了语言点的标注框架,在近15万句的经典汉语(二语)教材语料中对108个核心语言点进行了试标注,在此基础上检验并修订了语言点的标注框架,获得了102288个句次的包含语言点语义、句法、语用信息的标注语料。  相似文献   

6.
因果关系发现是因果推断的重要部分,其目标是揭示数据内在的生成机制,并以有向无环图的形式表示.然而关于因果关系发现,现有方法很少考虑到观察数据存在缺失值的情况.在实际场景中,大量数据集存在缺失值,因此估计缺失数据集中的因果关系成为一个亟需解决的问题.本文提出了一种新的基于因果反馈的算法实现关于缺失数据集的因果关系发现,其中生成对抗网络被用于估计缺失数据集的分布,并利用基于Actor-Critic的因果关系发现模块搜索最优因果图,设计了一个基于扩展贝叶斯信息准则的自定义奖励函数,引入分类误差引导模型加速探索过程,提升模型稳定性.在模拟数据和真实数据上进行的大量实验结果表明,本文提出的方法在不同数据缺失率下优于现有方法 .  相似文献   

7.
在Bigram语言模型建模过程中,语言被看作符号集序列,没有考虑语言本身具有的语法和语义结构特征,虽然在线的文本训练数据迅速增长,但语言模型的性能却再获得大幅度的提高,基于统计方法语言建模的基本原理,提出了一种结合Bigram和主题依存特征的中文语言建模方法,初步实验结果表明,该方法可有效地补充Bigram模型提取特征的不足,通过提取远距离主题依存特征降低了语言模型的分支度。  相似文献   

8.
建立中国少数民族濒危语言语音语料库的目的在于使濒于消失的少数民族语言的声音永久而系统地保存下来,并能使国内外语言学习、研究者方便地进行大规模语音资料的查询、检索和统计。语料库的特点和作用、工作步骤及建库过程中遇到的难点与汉语或非濒危语言语音数据库有所不同。  相似文献   

9.
阐述了基于模型同构、利用动态语言实现敏捷并行程序设计的方法,通过对Python语言并行性的研究,分析了在动态语言背景下实现敏捷并行程序设计的机制,提出了一种改进并行动态语言的模型,着重讨论了并行数据模型的映射方法,以及利用信号同步和数据锁实现并发控制的机制.  相似文献   

10.
对基于语料库的语言教学模式研究的缺乏是目前国内在教学中使用语料库所面临的困难之一。本文介绍并分析了数据驱动语言学习这一基于语料库的语言教学模式,认为这一模式在教学理念,学习内容,以及学习材料等方面与传统的教学模式存在很大的区别。应用在语法学习、词汇搭配、比较同义词和近义词、纠正语言失误、检查翻译译法等方面具有积极的意义。  相似文献   

11.
基于大型预训练语言模型的有监督学习方法在可控文本生成任务上取得了优秀的成果,但这些研究都着重于控制生成文本的高级属性(比如情感与主题),而忽略了泛化性问题.现有的基于自监督学习的研究方法则通过句子级别的训练来使模型获得补全整句的能力,使模型做到单词和短语级别的控制生成,但生成与特定属性强相关句子的能力依旧待提升.所以本文提出了一种单词级别(细粒度)与句子(粗粒度)级别相结合的多粒度训练方式:单词级别的主题模型让模型学习主题层面的语义以获得主题到文本的生成能力,句子级别的自监督训练让模型学习整句的表征以获得补全句子的能力.通过主题模型与自监督学习的结合,使模型在单词与短语级别的可控生成阶段取得了更好的效果.实验表明,本文提出的模型在主题契合度以及常规文本生成指标方面优于现有的基线模型.  相似文献   

12.
基于远距离依赖信息对于准确预测当前词的重要作用,文中利用一种改进的Apriori算法来建立一种特殊的Trigger pair语言模型.它能够准确、全面地反映较远历史中多个词对当前词的影响,利用该模型识别系统不仅能够预测当前词,而且能够对最终识别结果进行纠正.  相似文献   

13.
基于转换的无指导词义标注方法   总被引:5,自引:0,他引:5  
词义标注是自然语言处理的难题之一。该文提出用于文本词义标注的转换规则自动获取算法及相应的词义排歧算法。该算法用可能的句法关系对语境进行限制,减少了训练数据中的噪音; 为提高学习算法的速度,提出利用预排序方法减少规则搜索次数,以及只调整变化部分数据的计算方法; 并给了改善召回率的词义排歧算法。在近5 万词的语料库上对本算法进行了实验,开放测试的词义排歧正确率为743% 。  相似文献   

14.
混合算法实现的RBF神经网络及在模式辨识中应用   总被引:1,自引:0,他引:1  
把模糊聚类算法和RBF神经网络结合起来,得到一种基于混合算法的RBF神经网络.首先由改进的FCM算法确定神经网络结构;然后利用监督学习对网络参数进一步优化,并对输出权值调整.使网络不仅具有最优的拓扑结构,而且又具有较强的映射能力.对驾驶员的疲劳程度进行识别,得到了满意的结果.  相似文献   

15.
针对HSK(汉语水平考试)各类阅读材料难度判定与等级对应中缺乏有效参照标准和分析工具的问题,以历年HSK真题阅读文本为研究对象,提取文本可读性特征,采用支持向量机、随机森林、极端梯度增强等9种监督学习算法,建立可将自选文本自动归类于相应HSK等级的模型,采用准确率、AUC等多项指标评价各模型的分级效果,并选择最佳模型制成在线工具。结果表明,监督学习在HSK阅读材料文本分析及分级方面具有较高性能,9种模型中极端梯度增强的分级效果最好,准确率为0.913,AUC为0.994。建立的分级模型和在线工具能够以较高的准确率对HSK自选文本进行分级,帮助用户有针对性地遴选文本,提高学习效率。  相似文献   

16.
介绍了在母语语言学习及第二语言学习中内隐学习的实验研究的方法及其研究结果。在对研究结果进行分析评述后,提出了在语言学习中有效利用内隐学习的具体对策。  相似文献   

17.
通过对Horwitz的《语言学习观念调查表》的分析和删改,设计一份20个问题的问卷,据此对100名东北师范大学非外语专业学生进行问卷调查,以帮助外语教师系统地了解非英语专业学生所持有的学习观念,从而了解、重视这些学习观念对外语学习产生的影响。  相似文献   

18.
基于模型共享的分布式无监督异常检测   总被引:1,自引:0,他引:1  
提出一种具有通用性的分布式异常检测框架.首先,利用本地的无监督异常检测算法,建立多个本地检测模型;然后,将各个本地无监督检测模型转换成统一的共享模型;最后,采用集成学习的方法,综合考虑各模型差异性和准确性,实现全局异常检测.实验结果表明,基于模型共享的分布式异常检测不仅能有效地保护数据隐私,减少通信开销,同时能获得和集中式检测相当甚至在某些情况下更好的效果.  相似文献   

19.
以元认知知识为理论框架,采用个人访谈方法,对元认知知识在语言传递中的运用功效进行实证和理论研究。研究结果表明,元认知知识的三大要素,包括个人知识、策略知识和任务知识,对发挥语言传递的运用功效极其重要,对语言学习的成功和失败起到关键性作用。  相似文献   

20.
介绍了对构成数字化语言实验室系统各模块的功能,并从应用实践的角度阐述其对整个外语教学环境的改善。在数字化语言学习系统强大功能的支持下,外语教学打破了单一的程式化课堂模式,课堂教学变得更灵活、更丰富,使真正意义上的个性化教学成为可能;同时,促进了学生外语听说能力、语言综合运用能力的提高,使传统外语课堂教学的薄弱环节得以加强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号