期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

田小瑜秦永彬黄瑞章陈艳平《山西大学学报(自然科学版)》2023,(3):500-508

针对现有文本多标签语义信息挖掘方法仅注重从文本到标签的映射方向，而忽略了从标签到文本的映射方向的问题，本文认为从标签到文本的映射方向可以过滤文本中与标签无关的噪声信息，进而生成只关注于标签信息的文本表示。基于此假设，本文基于注意力机制提出了一种深度模块化标签注意网络，主要由标签注意网络进行多层级联而成。在标签注意网络中构建了双向标签注意单元和自我注意单元，从而得到标签和文本的双向依赖表示。模型在公开数据集RCV1、AAPD、EUR-Lex上与SGM、LSAN、EXAM等算法进行比较，对于现有的最佳性能平均提升0.54%。相似文献

2.

结合预训练和自训练的法律信息抽取增强式方法

周裕林陈艳平黄瑞章秦永彬林川《燕山大学学报》2023,(3):255-261

在“智慧法院”的建设中，法律信息抽取是法律人工智能任务中最基本的任务。目前，法律信息抽取方法主要基于深度神经网络的监督学习模型。由于现有的监督学习模型需要大量的标签数据，而人工标注的方式会提高法律信息抽取任务的成本，存在只有少样本情况下模型学习性能较差的问题。针对上述问题，提出一种结合预训练和自训练的法律信息抽取增强式方法。首先，利用大规模预训练模型和标签数据训练出一个教师模型；然后，利用改进的文本相似度计算公式从法律文书库中寻找出与训练集相似的无标签法律文本数据，再结合训练完成的教师模型对其生成伪标签数据；最后，将有标签数据和伪标签数据混合起来重新训练出一个学生模型用于下游的法律信息抽取任务。本文在2021法研杯提供的信息抽取数据集上进行验证。与基线模型进行对比，本文提出的结合预训练和自训练的法律信息抽取增强式方法取得了较好的抽取效果。相似文献

3.

一种采用机器阅读理解模型的中文分词方法

周裕林陈艳平黄瑞章秦永彬林川《西安交通大学学报》2022,(8):95-103

针对中文分词序列标注模型很难获取句子的长距离语义依赖,导致输入特征使用不充分、边界样本少导致数据不平衡的问题,提出了一种基于机器阅读理解模型的中文分词方法。将序列标注任务转换成机器阅读理解任务,通过构建问题信息、文本内容和词组答案的三元组,以有效利用句子中的输入特征;将三元组信息通过Transformer的双向编码器（BERT）进行预训练捕获上下文信息,结合二进制分类器预测词组答案;通过改进原有的交叉熵损失函数缓解数据不平衡问题。在Bakeoff2005语料库的4个公共数据集PKU、MSRA、CITYU和AS上的实验结果表明：所提方法的F₁分别为96.64%、97.8%、97.02%和96.02%,与其他主流的神经网络序列标注模型进行对比,分别提高了0.13%、0.37%、0.4%和0.08%。相似文献

4.

基于信誉推荐和客观信任协商的P2P信任评估模型

秦永彬许道云魏嘉银《广西师范大学学报(自然科学版)》2010,28(3)

根据P 2P网络的特点,在分析几种主要的信任模型的基础上,以信誉的特点及人类社会的实际特点为出发点,提出基于信誉推荐和客观信任协商的信任评估模型,该评估模型在充分考虑对每次网络交互的客观信任评价的前提下,引入主观性的信任评价机制。通过模拟实验,验证了模型的有效性。相似文献

5.

基于带噪预训练的刑期预测方法

下载免费PDF全文

郑洁黄辉秦永彬《广西科学》2023,30(1):71-78

刑期预测模型利用自然语言处理技术自动预测当前案件的建议刑期,对提高司法工作效率,维护司法审判的公平与公正,以及实现同案同判具有重要意义。现有的研究通常采用基于预训练语言模型的方法进行刑期预测建模,但由于存在裁判文书文本较长、专业性强及部分案由标注数据不足等问题,刑期预测任务依然具有较强的挑战性。针对上述问题,本文提出了基于带噪预训练的刑期预测方法。首先,根据刑期预测任务的特点,设计了融合罪名信息的刑期预测模型;其次,结合遮蔽语言模型(Masked Language Model,MLM)任务和自蒸馏策略减少刑期预测任务预训练数据中噪声的影响;最后,改进RoBERTa-wwm模型中的位置嵌入,增强模型的长文本建模能力。实验结果表明,本文提出的预训练方法能够极大地提升刑期预测任务的准确率,在小样本条件下也具有很好的表现。相似文献

6.

有限随机系统的极限概率分解

王芳秦永彬许道云《贵州大学学报(自然科学版)》2013,30(2)

有限随机系统状态迁移过程中对系统状态集的压缩,将系统分为两类随机子系统,由此建立了该随机系统的商系统并降低了概率矩阵的计算复杂度.在图论的基础上,通过研究有限随机系统及其商系统的极限性质,考察了有限随机系统的极限概率分解问题.在保留原有随机系统的极限性质的前提下方便了对随机系统平稳分布的预测. 相似文献

7.

基于Memetic算法的飞机地面作业调度问题研究

吕虹秦永彬罗聪《广西师范大学学报(自然科学版)》2011,29(2):145-150

机场地面作业管理是通过对机场各地面服务设备的安排调度,以保证航班正常、高效地运行.本文根据机场地面作业管理的实际情况,对每一个航班建立一棵飞机地面作业任务树,由此构建了相应的数学模型,该模型以最小化设备的总流经时间为目标,在规定的时间窗内完成飞机地面作业的并行任务.应用带有过滤扫描搜索策略的Memetic算法进行求解,... 相似文献

8.

跨度语义增强的命名实体识别方法

耿汝山陈艳平唐瑞雪黄瑞章秦永彬董博《西安交通大学学报》2022,(7):118-126

针对命名实体识别方法存在字与字之间语义信息丢失、模型召回率不佳等问题,提出了一种跨度语义信息增强的命名实体识别方法。首先,使用ALBERT预训练语言模型提取文本中包含上下文信息的字符向量,并使用GloVe模型生成字符向量;其次,将两种向量进行拼接作为模型输入向量,对输入向量进行枚举拼接形成跨度信息矩阵;然后,使用多维循环神经网络和注意力网络对跨度信息矩阵进行运算,增强跨度之间的语义联系;最后,将跨度信息增强后的矩阵进行跨度分类以识别命名实体。实验表明：与传统的跨度方法相比该方法能够有效增强跨度之间的语义依赖特征,从而提升命名实体识别的召回率;该方法在ACE2005英文数据集上比传统的方法召回率提高了0.42%,并且取得了最高的F₁值。相似文献

9.

基于前序关系的非确定型有穷自动机极小化算法

张明明秦永彬《山东大学学报(理学版)》2010,45(7):34-38

为了减少非确定型有穷自动机(non-deterministic finite automata,NFA)的状态数,引入前序关系,并以图论为工具,将NFA的转移图看作一个带有标记的有向图,给出了NFA极小化的一个新方法。与现行的利用归并等价状态来极小化NFA的算法相比,该方法可以使得NFA在接受语言的能力等价的前提下,状态数得到进一步的减少。相似文献

10.

面向小样本抽取式问答的多标签语义校准方法

刘青陈艳平邹安琪秦永彬黄瑞章《应用科学学报》2024,(1):161-173

小样本抽取式问答任务旨在利用文章给定的上下文片段,抽取出真实的答案片段。其基线模型采用的方法只针对跨度进行学习,缺乏对全局语义信息的利用,在含有多组不同重复跨度的实例中存在着理解偏差等问题。为了解决上述问题,该文利用不同层级的语义提出了一种面向小样本抽取式问答任务的多标签语义校准方法。采用包含全局语义信息的头标签和基线模型中的特殊字符构成多标签进行语义融合,并利用语义融合门来控制全局信息流的引入,将全局语义信息融合到特殊字符的语义信息中。然后,利用语义筛选门对新融入的全局语义信息和该特殊字符的原有语义信息进行保留与更替,实现对标签偏差语义的校准。在8个小样本抽取式问答数据集中的56组实验结果表明：该方法在评价指标F1值上均明显优于基线模型,证明了所提方法的有效性和先进性。相似文献