教育/培训 办公自动化关键词

谁搞过 中文分词

这里所谓的【中文分词】,就是类似下面这样:中文短句: 一部电影的整体版权归电影制片厂所有分成类似:一部 电影 的 整体 版权 归 电影 制片厂 所有 并对分出来的每一个词,标记其词性,比如:90  POSTAG_ID_M      数词95  POSTAG_ID_N&nbs... 显示全部
这里所谓的【中文分词】,就是类似下面这样:
中文短句: 一部电影的整体版权归电影制片厂所有
分成类似:一部 电影 的 整体 版权 归 电影 制片厂 所有
并对分出来的每一个词,标记其词性,比如:
90  POSTAG_ID_M      数词
95  POSTAG_ID_N      名词
96  POSTAG_ID_N_RZ   人名(“毛泽东”)
97  POSTAG_ID_N_T    机构团体(“团”的声母为t,名词代码n和t并在一起。“公司”)




比如一个典型应用场景,提取关键词。 收起
参与5

查看其它 3 个回答gengyabin2011 的回答

gengyabin2011 gengyabin2011 软件开发工程师 物美商业集团
应该根据中文的语法,总结出一个算法吧。
例如,“的”字的前一个词,认定为形容词,后一个词认定为名词;
      “个”“斤”“只”的前面认定为副词。

不过这样肯定会出BUG, 中文博大精深,实在是不好总结。
看看找一找智能识别相关的资料吧。
互联网服务 · 2013-06-14
浏览973

回答者

gengyabin2011
软件开发工程师 物美商业集团
评论69

gengyabin2011 最近回答过的问题

回答状态

  • 发布时间:2013-06-14
  • 关注会员:1 人
  • 回答浏览:973
  • X社区推广