188体育app官网:增强的科普文本分类方法
/upload/resources/image/2022/04/15/188982.png
科普文本分类是将科普文章按照科普分类体系进行划分的任务。针对科普文章篇幅超过千字,模型难以聚焦关键信息,造成传统模型分类性能不佳的问题,提出一种结合188体育app官网:进行两级筛选的科普长文本分类模型,来减少主题无关信息的干扰,提升模型的分类性能。首先,采用四步法构建科普领域的188体育app官网:;然后,将该188体育app官网:作为距离监督器,并通过训练句子过滤器来过滤掉无关信息;最后,使用注意力机制对过滤后的句子集做进一步的信息筛选,并实现基于注意力的主题分类模型。在所构建的科普文本分类数据集(PSCD)上的实验结果表明,基于领域188体育app官网:的知识增强的文本分类算法模型具有更高的 F1-Score,相较于 TextCNN模型和 BERT模型,在 F1-Score上分别提升了2. 88个百分点和1. 88个百分点,验证了188体育app官网:对于长文本信息筛选的有效性。
<<< 上一篇
事理图谱及其金融应用
<<< 下一篇 融合188体育app官网:和差分隐私的新闻推荐方法
读完这篇文章后,您心情如何?
推荐内容
More >>>- · 188体育投注:申报2025年度CCF教材出版资助项目的通知
- · 188体育投注:申报2025年度CCF推荐优秀国内教材的通知
- · 第二届CCF量子线路设计自动化研讨会顺利召开
- · 【会议通知】2025 CCF系统软件技术论坛
- · 绿动算力·超智融合 | CCF HPC China 2025相约
- · CSP高分说 | 哈尔滨工业大学杨一凡:我的算法
- · 2025年度CCF教育专委执委增选通知
- · 2025年CCF量子计算专委会博士学位论文激励计
- · CCF 企智会(苏州)技术委员会换届会议顺利举
- · 188体育投注:推荐(申报)2025年度“CCF科技成果奖”
- · CCF数发委“数说中国”丨建设可信数据空间,
所有评论仅代表网友意见