论坛
门户
内部优惠
喜欢
话题
VIP会员
搜索
新浪微博
登录
注册
100%
100%
首页
>
网络技术
>
网络技术
>
hanlp提取文本关键词的使用方法记录
回复
« 返回列表
hadoop小学生
精灵王
注册日期
2018-09-13
发帖数
160
QQ
3234520070
火币
360枚
粉丝
0
关注
0
加关注
写私信
打招呼
阅读:
4507
回复:
0
hanlp提取文本关键词的使用方法记录
楼主
#
更多
只看楼主
倒序阅读
发布于:2019-03-01 09:26
保存
100%
100%
[]
1
本文是
csu_zipple 分享的关于使用
hanlp
汉语言处理包提取关键词的过程一个简单的记录分享。想要使用hanlp提取文本关键词的
新手
朋友们可以参考学习一下!
如何在一段文本之中提取出相应的关键词呢?
之前有想过用
机器学习
的方法来进行词法分析,但是在项目中测试时正确率不够。于是这时候便有了
HanLP-汉语言处理包 来进行提取关键词的想法。
下载:
.jar .properties data等文件
请到大快搜索
官网下载
HanLP
新版本
,
1.
7
.
1
数据包下载
【
gitub上也可以下载
】
在
intel
lij中配置环境,并运行第一个demo
在项目中配置
jar包,添加依赖。
file->Project Structure->Modules->Dependencies->+Jars
图片:图1.JPG
将
properties文件转移到src根目录下,修改root为自己的数据集路径
图片:图2.JPG
运行第一个
demo
1 public class TestHanLP {
2 public static void main(String[] args) {
3 System.out.println(HanLP.segment("你好,欢迎使用HanLP!"));
4 }
5 }
可能的错误
字符类型对应表加载失败:
D:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes
解决办法:查看错误提示页面下是否有该文件,如果没有则去网上下载一个。像我这里,由于只是使用其一部分功能,为了方便就不再下载了,这里我直接修改了一个文件的文件名
—–成功运行!。
图片:图3.JPG
成功运行
图片:图4.JPG
---------------------
喜欢
0
评分
0
最新喜欢:
DKHadoop用着还不错!
回复
100%
发帖
回复
« 返回列表
普通帖
您需要登录后才可以回帖,
登录
或者
注册
100%
返回顶部
关闭
最新喜欢