您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》

山东大学学报(理学版) ›› 2017, Vol. 52 ›› Issue (6): 32-39.doi: 10.6040/j.issn.1671-9352.0.2016.484

• • 上一篇    下一篇

基于时间片段和主题片段的时间关系识别

赵红红1,谭红叶1,2*,寻丽娜1,王蓉1   

  1. 1.山西大学计算机与信息技术学院, 山西 太原 030006;2.山西大学计算智能与中文信息处理教育部重点实验室, 山西 太原 030006
  • 收稿日期:2016-10-20 出版日期:2017-06-20 发布日期:2017-06-21
  • 通讯作者: 谭红叶(1971— ),女,博士,副教授,研究方向为中文信息处理、信息检索. E-mail:hytan_2006@126.com E-mail:zhaohh1992@163.com
  • 作者简介:赵红红(1992— ),女,硕士研究生,研究方向为中文信息处理. E-mail:zhaohh1992@163.com
  • 基金资助:
    国家高技术研究发展计划(863计划)项目(2015AA015407);国家自然科学基金资助项目(61673248);国家自然科学基金青年项目(61100138,61403238,61502287);山西省自然科学基金资助项目(2011011016-2,2012021012-1);山西省回国留学人员科研项目(2013-022);山西省高校科技开发项目(20121117);山西省2012年度留学回国人员科技活动择优项目

Identification of temporal relations based on temporal segments and topic segments

ZHAO Hong-hong1, TAN Hong-ye1,2*, XUN Li-na1, WANG Rong1   

  1. 1. School of Computer and Information Technology of Shanxi University, Taiyuan 030006, Shanxi, China;
    2. Key Laboratory of Ministry of Education for Computation Intelligence and Chinese Information Processing of Shanxi University, Taiyuan 030006, Shanxi, China
  • Received:2016-10-20 Online:2017-06-20 Published:2017-06-21

摘要: 时间关系的识别成为近年来自然语言处理领域(nature language processing, NLP)的一个研究热点。引入时间片段和主题片段这两种比事件触发词粒度粗的语义单元进行时间关系识别,首先在文本中利用一些时间篇章特点识别时间片段,然后利用相似度计算与支持向量机(support vector maehine, SVM)模型相结合的方法识别主题片段,最后在主题片段范围内,以时间片段为排序对象,使用最大熵分类模型识别时间关系。在TempEval-2010的汉语语料上进行实验,得到的时间关系识别宏平均精确率为60.09%。实验结果表明:引入时间片段后可有效减少不必要的事件时序关系的识别;同时,在主题片段的约束下所得到的时间关系更简洁、语义逻辑性更好。

Abstract: Temporal relation recognition is a research focus in NLP(nature language processing). This paper identifies temporal relations based on temporal segment and topic segment, which semantic granularities were coarser. First, temporal segments were recognized according to temporal discourse characters. Then, topic segments were recognized through computing similarity between paragraphs and the SVM model. Final, within each topic segment, temporal relations between the adjacent temporal segments were identified by maximum entropy classifier. Experiments were made on TempEval-2010 corpus of Chinese, the macro-average precision of temporal relation recognition was 60.09%. The experimental results show that introduction of temporal segments can reduce the redundant recognition of the temporal relations between events. And with the scope constraint of topic segments, the results of temporal relations become more concise and understandable.

中图分类号: 

  • TP391
[1] 龚双双,陈钰枫,徐金安,张玉洁. 基于网络文本的汉语多词表达抽取方法[J]. 山东大学学报(理学版), 2018, 53(9): 40-48.
[2] 余传明,左宇恒,郭亚静,安璐. 基于复合主题演化模型的作者研究兴趣动态发现[J]. 山东大学学报(理学版), 2018, 53(9): 23-34.
[3] 严倩,王礼敏,李寿山,周国栋. 结合新闻和评论文本的读者情绪分类方法[J]. 山东大学学报(理学版), 2018, 53(9): 35-39.
[4] 原伟,唐亮,易绵竹. 基于本体的俄文新闻话题检测设计与实现[J]. 山东大学学报(理学版), 2018, 53(9): 49-54.
[5] 廖祥文,张凌鹰,魏晶晶,桂林,程学旗,陈国龙. 融合时间特征的社交媒介用户影响力分析[J]. 山东大学学报(理学版), 2018, 53(3): 1-12.
[6] 余传明,冯博琳,田鑫,安璐. 基于深度表示学习的多语言文本情感分析[J]. 山东大学学报(理学版), 2018, 53(3): 13-23.
[7] 张军,李竞飞,张瑞,阮兴茂,张烁. 基于网络有效阻抗的社区发现算法[J]. 山东大学学报(理学版), 2018, 53(3): 24-29.
[8] 庞博,刘远超. 融合pointwise及深度学习方法的篇章排序[J]. 山东大学学报(理学版), 2018, 53(3): 30-35.
[9] 陈鑫,薛云,卢昕,李万理,赵洪雅,胡晓晖. 基于保序子矩阵和频繁序列模式挖掘的文本情感特征提取方法[J]. 山东大学学报(理学版), 2018, 53(3): 36-45.
[10] 王彤,马延周,易绵竹. 基于DTW的俄语短指令语音识别[J]. 山东大学学报(理学版), 2017, 52(11): 29-36.
[11] 张晓东,董唯光,汤旻安,郭俊锋,梁金平. 压缩感知中基于广义Jaccard系数的gOMP重构算法[J]. 山东大学学报(理学版), 2017, 52(11): 23-28.
[12] 孙建东,顾秀森,李彦,徐蔚然. 基于COAE2016数据集的中文实体关系抽取算法研究[J]. 山东大学学报(理学版), 2017, 52(9): 7-12.
[13] 王凯,洪宇,邱盈盈,王剑,姚建民,周国栋. 一种查询意图边界检测方法研究[J]. 山东大学学报(理学版), 2017, 52(9): 13-18.
[14] 张帆,罗成,刘奕群,张敏,马少平. 异质搜索环境下的用户偏好性预测方法研究[J]. 山东大学学报(理学版), 2017, 52(9): 26-34.
[15] 杨艳,徐冰,杨沐昀,赵晶晶. 一种基于联合深度学习模型的情感分类方法[J]. 山东大学学报(理学版), 2017, 52(9): 19-25.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!