文 转 自: 文 因 互 联
以下为陈玉博老师演讲《事件抽取与金融事件图谱构建》内容节选
现在互联网信息呈爆炸性增长,据中国互联网中心2018年发布的数据显示,截止到2017年12月,网民规模达到了7.72亿,网页总数也超过了2600亿。如何快速地去获取海量信息当中所需要的知识,尤为重要。
随着需求的产生,信息抽取技术也获得了进一步发展。
信息抽取技术包括实体抽取、关系抽取和事件抽取三个重要部分,今天我主要分享事件抽取。
构建一个事件图谱能丰富现有的以实体为核心的知识图谱。除此之外,它能支撑很多信息检索,比如说问地震遇难人数,它能给一个具体的数。另外还可以对一个企业或者是一支股票进行很多事件的监控。
事件图谱构建关键:事件抽取以及事件关系抽取
如何定义一个事件呢?
在知识图谱领域,事件是发生在某个特定的时间点或时间段、某个特定的地域范围内,由一个或者多个角色参与的一个或者多个动作组成的事情或者状态的改变
基于定义,我们在建模的时候就有几点需要注意。
首先就是不同动作或者状态的改变是不同类型的事件,就比如说奥巴马上任和奥巴马离任这都是两个类型的事件。
同一类型的事件中不同的元素代表了不同的事件,比如奥巴马上任和特朗普上任,这是两个事件。
同一个类型的事件中不同粒度的元素代表不同粒度的事件。事件之间其实有很多关系,其中子事件就是一个比较有代表性的,同样是战争类型的事件,持续的时间或者元素的粒度不一样,就有二战、抗日战争和淞沪会战之分,它们是不同粒度的事件。
构建一个事件图谱有两项关键技术,第一是事件抽取,第二是事件关系抽取。
更多HKSAIR及行业资讯,敬请关注香港人工智能与机器人学会公众号