这个是自然语言处理范畴,建议研究下自然处理框架,现在也开源了不少自然语言处理框架,有些是基于深度学习算法实现的,有些是其他机器学习算法。国内大学和公司对于中文的研究有些已经比较成熟,比如中科院的自然语言处理平台,还有哈工大的自然语言处理平台,百度也推出自己的平台,可以进行实体关系抽取,但是我亲身经历,准确率还没有那么高,但是词性标注还是比较准确的。谷歌有一款产品是word2vec,这个用于分析词与词之间的关系,但是还达不到您说的实体与关系的自动化抽取。自动化抽取非常复杂,估计暂时没有好的解决方案,想要准确率高,应该必须要人工干预,提供抽取规则。