《山东大学学报(理学版)》 ›› 2026, Vol. 61 ›› Issue (3): 44-53.doi: 10.6040/j.issn.1671-9352.1.2024.044
• • 上一篇
林原1,张亚1,于蒙1,许侃2*,林鸿飞2
摘要: 为准确检测和识别仇恨言论,通过微调大语言模型对数据集样本进行扩充与平衡,并基于预训练模型RoBERTa构建RoBERTa-Attention-GRU-TextCNN模型,将深度学习强大的特征捕获和提取能力应用到文本序列数据的分析、挖掘中。首先通过RoBERTa模型对文本数据进行特征提取;然后利用自注意机制获取单词间的依赖关系;最后将获取到的特征矩阵输入到GRU-TextCNN层中以捕捉更深层次的语义信息和局部特征。使用TweetEval提供的2个公开的数据集来评估模型效果,实验结果表明,该模型相较于传统的仇恨言论检测模型具有更好的检测效果。
中图分类号:
| [1] | 杨纪元,马沐阳,任鹏杰,陈竹敏,任昭春,辛鑫,蔡飞,马军. 基于自监督的预训练在推荐系统中的研究[J]. 《山东大学学报(理学版)》, 2024, 59(7): 1-26. |
|
||