一种非监督的事件触发词检测和分类方法
DOI:
CSTR:
作者:
作者单位:

1. 中国科学院大学北京100049;2. 中国科学院空间信息处理与应用系统重点实验室北京100190

作者简介:

通讯作者:

中图分类号:

TP3

基金项目:

国家自然科学基金(61331017)项目资助


Unsupervised method for event trigger identification and classification
Author:
Affiliation:

1. University of Chinese Academy of Sciences, Beijing 100049, China; 2. Key Laboratory of Technology in Geospatial Information Processing and Application System, Institute of Electronics, Chinese Academy of Sciences, Beijing 100190,China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    事件触发词检测和分类是事件抽取中至关重要的第一步。传统的抽取和分类方法往往倾向于监督学习方法,如条件随机场、SVM等,但由于这类方法需要繁重的人工标注且受限于预先定义好的类别,因此很难在开放领域中得到应用。提出了一种非监督的事件触发词检测和分类方法,利用主题模型获取候选触发词在主题上的分布,然后利用二值状态自动机模型捕获高概率的主题,从而筛选出真正的事件触发词和相应的分类。在大规模的未标注新浪新闻数据集上的实验结果充分验证了本文方法的有效性。

    Abstract:

    The identification and classification of event trigger plays a decisive role in event extraction. Usually, the trigger words are extracted based on supervised machine learning methods such as CRF. However, since these methods rely on expensive manual annotation and require predefined event types, they are not sufficient for open domain application. In this paper, we present an unsupervised method for event trigger identification and classification. First, we run a topic model to obtain the topic distribution over each candidate trigger word. Then, an improved twostate automaton is proposed to detect the real trigger word and capture the corresponding topics. The experiment on a large unlabeled corpus shows our unsupervised model is very inspiring.

    参考文献
    相似文献
    引证文献
引用本文

陈自岩,黄宇,王洋,傅兴玉,付琨.一种非监督的事件触发词检测和分类方法[J].国外电子测量技术,2016,35(7):91-95

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2016-09-30
  • 出版日期:
文章二维码