中文主要有:NLTK,FoolNLTK,HanLP(java版本),pyhanlp(python版本),Ansj,THULAC,结巴分词,FNLP,哈工大LTP,中科院ICTCLAS分词,GATE,SnowNLP,东北大学NiuTrans,NLPIR...
-
hadoop小学生: 目前常用的自然语言处理开源项目/开发包大汇总
2018-11-26 10:50 来自版块 - 网络技术
-
hadoop小学生: Python中调用自然语言处理工具HanLP手记
HanLP方法封装类: 1. # -*- coding:utf-8 -*- 2. # Filename: main.py 3. 4.from jpype import * 5. 5.startJVM(getDefaultJVMPath(...2018-10-31 11:06 来自版块 - 网络技术
-
hadoop小学生: 依存句法分析器的简单实现
生成式句法分析指的是,生成一系列依存句法树,从它们中用特定算法挑出概率最大那一棵。句法分析中,生成模型的构建主要使用三类信息:词性信息、词汇信息和结构信息。前二类很好理解,而结构信息需要特殊语法标记,不做考虑。 本文主要利用了词汇+词性生成联合概率...2018-10-17 13:16 来自版块 - 网络技术