Elastic Search 搜索引擎在 SpringBoot 中的实践

2018 年 1 月 16 日 开源中国 hansonwang


实验环境


  • ES版本:5.3.0

  • spring bt版本:1.5.9


首先当然需要安装好elastic search环境,最好再安装上可视化插件 elasticsearch-head来便于我们直观地查看数据。


当然这部分可以参考本人的帖子: 《centos7上elastic search安装填坑记》https://www.jianshu.com/p/04f4d7b4a1d3


我的ES安装在http://113.209.119.170:9200/ 这个地址(该地址需要配到springboot项目中去)


Spring工程创建


这部分没有特殊要交代的,但有几个注意点一定要当心


注意在新建项目时记得勾选web和NoSQL中的Elasticsearch依赖,来张图说明一下吧:



项目自动生成以后pom.xml中会自动添加spring-boot-starter-data-elasticsearch的依赖:



本项目中我们使用开源的基于restful的es java客户端jest,所以还需要在pom.xml中添加jest依赖:



除此之外还必须添加jna的依赖:



否则启动spring项目的时候会报JNA not found. native methods will be disabled.的错误:



项目的配置文件application.yml中需要把es服务器地址配置对



代码组织


我的项目代码组织如下: 


各部分代码详解如下,注释都有:


Entity.java



TestService.java



TestServiceImpl.java



EntityController.java



实际实验


增加几条数据,可以使用postman工具,也可以直接在浏览器中输入,如增加以下5条数据:



数据插入效果如下(使用可视化插件elasticsearch-head观看): 



我们来做一下搜索的测试:例如我要搜索关键字“南京” 我们在浏览器中输入:



搜索结果如下:



刚才插入的5条记录中包含关键字“南京”的四条记录均被搜索出来了!


当然这里用的是standard分词方式,将每个中文都作为了一个term,凡是包含“南”、“京”关键字的记录都被搜索了出来,只是评分不同而已,当然还有其他的一些分词方式,此时需要其他分词插件的支持,此处暂不涉及,后文中再做探索。



推荐阅读

2017 码云最火爆开源项目 TOP 50,你都用过哪些?

2018 年 Java 平台发布计划之新特性展望

在 Node 的帮助下,横跨多平台的 JavaScript 已经赢了

《绝地求生》外挂源代码被公布,或迎神仙大战时代?

2017 开源中国新增开源项目排行榜 TOP 100

点击“阅读原文”查看更多精彩内容

登录查看更多
1

相关内容

ElasticSearch是一个基于Lucene的分布式实时搜索引擎解决方案。属于Elastic Stack的一部分,同时另有 logstash, kibana, beats等开源项目。
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
204+阅读 · 2020年1月13日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
搭建自己的searx搜索引擎
黑白之道
13+阅读 · 2019年5月31日
文本分析与可视化
Python程序员
9+阅读 · 2019年2月28日
去哪儿网开源DNS管理系统OpenDnsdb
运维帮
21+阅读 · 2019年1月22日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
18+阅读 · 2018年12月21日
教你打造一个属于自己的「搜索引擎」
少数派
9+阅读 · 2018年10月23日
干货 | Python 爬虫的工具列表大全
机器学习算法与Python学习
10+阅读 · 2018年4月13日
Python 爬虫实践:《战狼2》豆瓣影评分析
数据库开发
5+阅读 · 2018年3月19日
Python & 机器学习之项目实践 | 赠书
人工智能头条
14+阅读 · 2017年12月26日
【宁波站】网络爬虫与文本挖掘
数萃大数据
5+阅读 · 2017年7月19日
The Evolved Transformer
Arxiv
5+阅读 · 2019年1月30日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2018年2月24日
Arxiv
11+阅读 · 2018年1月11日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
相关资讯
搭建自己的searx搜索引擎
黑白之道
13+阅读 · 2019年5月31日
文本分析与可视化
Python程序员
9+阅读 · 2019年2月28日
去哪儿网开源DNS管理系统OpenDnsdb
运维帮
21+阅读 · 2019年1月22日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
18+阅读 · 2018年12月21日
教你打造一个属于自己的「搜索引擎」
少数派
9+阅读 · 2018年10月23日
干货 | Python 爬虫的工具列表大全
机器学习算法与Python学习
10+阅读 · 2018年4月13日
Python 爬虫实践:《战狼2》豆瓣影评分析
数据库开发
5+阅读 · 2018年3月19日
Python & 机器学习之项目实践 | 赠书
人工智能头条
14+阅读 · 2017年12月26日
【宁波站】网络爬虫与文本挖掘
数萃大数据
5+阅读 · 2017年7月19日
相关论文
The Evolved Transformer
Arxiv
5+阅读 · 2019年1月30日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2018年2月24日
Arxiv
11+阅读 · 2018年1月11日
Arxiv
3+阅读 · 2012年11月20日
Top
微信扫码咨询专知VIP会员