博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Elasticsearch配置和使用
阅读量:2390 次
发布时间:2019-05-10

本文共 5612 字,大约阅读时间需要 18 分钟。

Elasticsearch使用

Elasticsearch官网:https://www.elastic.co/cn/products/elasticsearch

Elasticsearch具备以下特点

  • 分布式,无需人工搭建集群(solr就需要人为配置,使用Zookeeper作为注册中心)
  • Restful风格,一切API都遵循Rest原则,容易上手
  • 近实时搜索,数据更新在Elasticsearch中几乎是完全同步的。

1.Elasticsearch

在linux下安装Elasticsearch。

需要虚拟机JDK1.8及以上

新建一个用户leyou

出于安全考虑,elasticsearch默认不允许以root账号运行。

创建用户:

useradd leyou

设置密码:

passwd leyou

切换用户:

su - leyou

上传并解压

我们将安装包上传到:/home/leyou目录

在这里插入图片描述

解压缩:

tar -zxvf elasticsearch-6.2.4.tar.gz

我们把目录重命名

mv elasticsearch-6.3.0/ elasticsearch

修改配置

在这里插入图片描述

需要修改的配置文件有两个:

在这里插入图片描述

  1. jvm.options

Elasticsearch基于Lucene的,而Lucene底层是java实现,因此我们需要配置jvm参数。

编辑jvm.options:

vim jvm.options

默认配置如下:

-Xms1g-Xmx1g

内存占用太多了,我们调小一些:

-Xms512m-Xmx512m
  1. elasticsearch.yml
vim elasticsearch.yml
  • 修改数据和日志目录:
path.data: /home/leyou/elasticsearch/data # 数据目录位置path.logs: /home/leyou/elasticsearch/logs # 日志目录位置

我们把data和logs目录修改指向了elasticsearch的安装目录。但是这两个目录并不存在,因此我们需要创建出来。

进入elasticsearch的根目录,然后创建:

mkdir datamkdir logs

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hF6wNm4T-1586591256734)(assets/1528552839032.png)]

  • 修改绑定的ip:
network.host: 0.0.0.0 # 绑定到0.0.0.0,允许任何ip来访问

默认只允许本机访问,修改为0.0.0.0后则可以远程访问

目前我们是做的单机安装,如果要做集群,只需要在这个配置文件中添加其它节点信息即可。

elasticsearch.yml的其它可配置信息:

属性名 说明
cluster.name 配置elasticsearch的集群名称,默认是elasticsearch。建议修改成一个有意义的名称。
node.name 节点名,es会默认随机指定一个名字,建议指定一个有意义的名称,方便管理
path.conf 设置配置文件的存储路径,tar或zip包安装默认在es根目录下的config文件夹,rpm安装默认在/etc/ elasticsearch
path.data 设置索引数据的存储路径,默认是es根目录下的data文件夹,可以设置多个存储路径,用逗号隔开
path.logs 设置日志文件的存储路径,默认是es根目录下的logs文件夹
path.plugins 设置插件的存放路径,默认是es根目录下的plugins文件夹
bootstrap.memory_lock 设置为true可以锁住ES使用的内存,避免内存进行swap
network.host 设置bind_host和publish_host,设置为0.0.0.0允许外网访问
http.port 设置对外服务的http端口,默认为9200。
transport.tcp.port 集群结点之间通信端口
discovery.zen.ping.timeout 设置ES自动发现节点连接超时的时间,默认为3秒,如果网络延迟高可设置大些
discovery.zen.minimum_master_nodes 主结点数量的最少值 ,此值的公式为:(master_eligible_nodes / 2) + 1 ,比如:有3个符合要求的主结点,那么这里要设置为2

运行

进入elasticsearch/bin目录,可以看到下面的执行文件:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eGTi2ZOX-1586591256735)(assets/1528553103468.png)]

然后输入命令:

./elasticsearch

发现报错了,启动失败。

错误1:内核过低

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Wiyhaapf-1586591256735)(assets/1528598315714.png)]

Elasticsearch的插件要求至少3.5以上版本。不过没关系,我们禁用这个插件即可。

修改elasticsearch.yml文件,在最下面添加如下配置:

bootstrap.system_call_filter: false

然后重启

错误2:文件权限不足

再次启动,又出错了:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rqc2uaw9-1586591256736)(assets/1528599116836.png)]

[1]: max file descriptors [4096] for elasticsearch process likely too low, increase to at least [65536]

我们用的是leyou用户,而不是root,所以文件权限不足。

首先用root用户登录。

然后修改配置文件:

vim /etc/security/limits.conf

添加下面的内容:

* soft nofile 65536* hard nofile 131072* soft nproc 4096* hard nproc 4096

错误3:线程数不够

刚才报错中,还有一行:

[1]: max number of threads [1024] for user [leyou] is too low, increase to at least [4096]

这是线程数不够。

继续修改配置:

vim /etc/security/limits.d/90-nproc.conf

修改下面的内容:

* soft nproc 1024

改为:

* soft nproc 4096

错误4:进程虚拟内存

[3]: max virtual memory areas vm.max_map_count [65530] likely too low, increase to at least [262144]

vm.max_map_count:限制一个进程可以拥有的VMA(虚拟内存区域)的数量,继续修改配置文件, :

vim /etc/sysctl.conf

添加下面内容:

vm.max_map_count=655360

然后执行命令:

sysctl -p

重启终端窗口

所有错误修改完毕,一定要重启你的 Xshell终端,否则配置无效。

启动

再次启动,终于成功了!

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BOCOkaLt-1586591256736)(assets/1528603044862.png)]

可以看到绑定了两个端口:

  • 9300:集群节点间通讯接口
  • 9200:客户端访问接口

我们在浏览器中访问:http://192.168.56.101:9200

kibana

什么是Kibana?

Kibana是一个基于Node.js的Elasticsearch索引库数据统计工具,可以利用Elasticsearch的聚合功能,生成各种图表,如柱形图,线状图,饼图等。

而且还提供了操作Elasticsearch索引数据的控制台,并且提供了一定的API提示,非常有利于我们学习Elasticsearch的语法。

安装

因为Kibana依赖于node,我们的虚拟机没有安装node,而window中安装过。所以我们选择在window下使用kibana。

最新版本与elasticsearch保持一致,也是6.3.0

在这里插入图片描述

解压到特定目录即可

配置运行

配置

进入安装目录下的config目录,修改kibana.yml文件:

修改elasticsearch服务器的地址:

elasticsearch.url: "http://192.168.56.101:9200"

运行

进入安装目录下的bin目录:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-65JuqMmA-1586591256738)(assets/1528612108406.png)]

双击运行:

发现kibana的监听端口是5601

我们访问:http://127.0.0.1:5601

控制台

选择左侧的DevTools菜单,即可进入控制台页面:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EhFleqdA-1586591256739)(assets/1528612350020.png)]

在页面右侧,我们就可以输入请求,访问Elasticsearch了。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vy711Ct6-1586591256739)(assets/1528612514556.png)]

ik分词器

Lucene的IK分词器早在2012年已经没有维护了,现在我们要使用的是在其基础上维护升级的版本,并且开发为ElasticSearch的集成插件了,与Elasticsearch一起维护升级,版本也保持一致,最新版本:6.3.0

安装

上传课前资料中的zip包,解压到Elasticsearch目录的plugins目录中:

使用unzip命令解压:

unzip elasticsearch-analysis-ik-6.3.0.zip -d ik-analyzer

然后重启elasticsearch:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-U2lH9xRA-1586591256740)(assets/1528612928524.png)]

测试

大家先不管语法,我们先测试一波。

在kibana控制台输入下面的请求:

POST _analyze{  "analyzer": "ik_max_word",  "text":     "我是中国人"}

运行得到结果:

{  "tokens": [    {      "token": "我",      "start_offset": 0,      "end_offset": 1,      "type": "CN_CHAR",      "position": 0    },    {      "token": "是",      "start_offset": 1,      "end_offset": 2,      "type": "CN_CHAR",      "position": 1    },    {      "token": "中国人",      "start_offset": 2,      "end_offset": 5,      "type": "CN_WORD",      "position": 2    },    {      "token": "中国",      "start_offset": 2,      "end_offset": 4,      "type": "CN_WORD",      "position": 3    },    {      "token": "国人",      "start_offset": 3,      "end_offset": 5,      "type": "CN_WORD",      "position": 4    }  ]}

Rest风格API

文档地址:https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

客户端API

Elasticsearch支持的客户端非常多:https://www.elastic.co/guide/en/elasticsearch/client/index.html

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uKjT6jo0-1586591256741)(assets/1528613714338.png)]

点击Java Rest Client后,你会发现又有两个:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GfOIRe1G-1586591256741)(assets/1528613788606.png)]

Low Level Rest Client是低级别封装,提供一些基础功能,但更灵活

High Level Rest Client,是在Low Level Rest Client基础上进行的高级别封装,功能更丰富和完善,而且API会变的简单

建议先学习Rest风格API,了解发起请求的底层实现,请求体格式等。

Elasticsearch学习笔记

2.操作索引

Elasticsearch也是基于Lucene的全文检索库,本质也是存储数据,很多概念与MySQL类似的。

对比关系:

索引(indices)--------------------------------Databases 数据库  类型(type)-----------------------------Table 数据表     文档(Document)----------------Row 行	   字段(Field)-------------------Columns 列

要注意的是:Elasticsearch本身就是分布式的,因此即便你只有一个节点,Elasticsearch默认也会对你的数据进行分片和副本操作,当你向集群添加新数据时,数据也会在新加入的节点中进行平衡。

Elasticsearch采用Rest风格API,因此其API就是一次http请求,你可以用任何工具发起http请求

3.查询

  • 基本查询
  • _source过滤
  • 结果过滤
  • 高级查询
  • 排序

4.聚合aggregations

聚合可以让我们极其方便的实现对数据的统计、分析。例如:

  • 什么品牌的手机最受欢迎?
  • 这些手机的平均价格、最高价格、最低价格?
  • 这些手机每月的销售情况如何?

实现这些统计功能的比数据库的sql要方便的多,而且查询速度非常快,可以实现实时搜索效果。

Elasticsearch中的聚合,包含多种类型,最常用的两种,一个叫桶(bucket),一个叫度量 metrics

5.Spring Data Elasticsearch

Spring Data Elasticsearch是Spring Data项目下的一个子模块。

查看 Spring Data的官网:http://projects.spring.io/spring-data/

在这里插入图片描述

Spring Data Elasticsearch的页面:https://projects.spring.io/spring-data-elasticsearch/
在这里插入图片描述

转载地址:http://dxxab.baihongyu.com/

你可能感兴趣的文章
Metasploit攻击Oracle的环境搭建
查看>>
信息安全合规性产品
查看>>
google-gruyere web2.0漏洞学习平台 =w=~
查看>>
Preventing Cross-site Scripting Attacks
查看>>
WASC Distributed Web Honeypots Project Update
查看>>
安装pydev到eclipse
查看>>
[WAF]apache和modsecurity的安装
查看>>
写给换工作和找工作的同学
查看>>
Island Hopping the SpiderLabs Way
查看>>
Top Ten Web Protection Techniques of 2011
查看>>
Faster Blind MySQL Injection Using Bit Shifting
查看>>
Safely Dumping Hashes from Live Domain Controllers
查看>>
PHP CGI Argument Injection
查看>>
sgx模拟器
查看>>
SGX相关资源
查看>>
nessus 购买地址
查看>>
Google Security Architecture
查看>>
web server信息收集(附带plesk xday)
查看>>
JBoss AS Administrative Console Password Disclosure
查看>>
Securely Developing on Mobile
查看>>