论坛
门户
内部优惠
喜欢
话题
VIP会员
搜索
新浪微博
登录
注册
100%
100%
首页
>
网络技术
>
网络技术
>
中文自然语言处理工具HanLP源码包的下载使用记录
回复
« 返回列表
hadoop小学生
精灵王
注册日期
2018-09-13
发帖数
160
QQ
3234520070
火币
360枚
粉丝
0
关注
0
加关注
写私信
打招呼
阅读:
4185
回复:
0
中文自然语言处理工具HanLP源码包的下载使用记录
楼主
#
更多
只看楼主
倒序阅读
发布于:2019-02-15 10:26
保存
100%
100%
[]
1
这篇文章主要分享的是
hanlp
自然语言处理
源码的下载,数据集的下载,以及将让源代码中的demo能够跑通。Hanlp安装包的下载以及安装其实之前就已经有过分享了。本篇文章主要还是备忘之用,同时算是给
新手
朋友的一些参考吧!
不过在此之前先推荐两本书给想要学习中文自然语言处理的朋友,分别是《
NLP汉语自然语言处理原理与实战》,里面介绍了汉语自然语言处理的相关
技术
,还有一些源码的解读;另一本是《
python
自然语言处理》。
下面就进入到本篇的正题,其实只需要下载源代码,下载字典和模型数据文件、下载配置文件,并且对配置文件稍作修改,然后再使用
IDE打开源代码,就可以运行了,总的来说整个过程其实并不复杂。源代码、字典以及模型、配置文件的下载
自然语言处理
1可以到GitHub上下载。
网页中提供了详细的说明,其实按照说明来就可以,下载以后将字典和模型文件解压到一个目录,建议放在工程名目录下:
图片:图1.JPG
data中就是模型文件和字典数据文件:
图片:图2.JPG
通过
github提供的源代码下载链接下载下来的文件不包含hanlp.properties配置文件,这是你需要下载一个release版本的代码,解压以后,里面有一个hanlp.properties文件
图片:图3.JPG
将这个文件分别拷贝到解压以后的源代码
target/classes和target-classes目录下
图片:图4.JPG
最后用
ide打开源代码,我使用的ide工具是IDEA(
intel
lij),其他ide的操作应该大同小异,当然配置文件也许只需要一份就够了,不需要两个目录都拷贝,我这里没有验证,为保险起见,两个目录下都拷贝一份,读者可以试验一下,我这里主要目的是为了能跑通。
上述步骤完成之后,打开
src/test/
java
/com.hankcs/demo下的demo,就可以跑出结果了,接下来,就顺藤摸瓜去读源代码吧
图片:图5.JPG
喜欢
0
评分
0
最新喜欢:
DKHadoop用着还不错!
回复
100%
发帖
回复
« 返回列表
普通帖
您需要登录后才可以回帖,
登录
或者
注册
100%
返回顶部
关闭
最新喜欢