Elasticsearch基础教程：快速搭建与应用

2025-2-3

Elasticsearch 基础教程：快速搭建与应用

Elasticsearch 是一个基于 Lucene 的开源搜索引擎，以其分布式、RESTful 风格的搜索和数据分析引擎而闻名。它能够达到近实时搜索，稳定，可靠，快速，安装使用方便。本教程将引导你快速搭建 Elasticsearch 环境并进行基础应用。

一、Elasticsearch 简介

Elasticsearch 主要特点包括：

分布式：Elasticsearch 允许你从一个节点扩展到数百个服务器，并且自动处理节点的加入和离开。
全文搜索：基于 Lucene 的强大全文检索能力，支持各种查询方式。
实时分析：数据写入后即可被搜索到，支持数据的实时分析。
RESTful API：通过简单的 HTTP 请求即可完成索引、搜索、更新、删除等操作。
模式自由：可以存储各种类型的数据，无需预先定义模式。

二、快速搭建 Elasticsearch

本教程以单节点安装为例，演示如何在本地快速搭建 Elasticsearch。

1. 前提条件

Java 环境：Elasticsearch 运行需要 Java 环境，建议使用 Java 8 或更高版本。
下载 Elasticsearch：从 Elastic 官网下载对应操作系统的安装包。

2. 安装步骤 (以 Linux 为例)

a. 解压安装包

bash tar -xzf elasticsearch-8.9.1-linux-x86_64.tar.gz cd elasticsearch-8.9.1/

b. 修改配置 (可选)

可以根据需要修改 config/elasticsearch.yml 文件，例如修改集群名称、节点名称、网络绑定地址等。对于单节点测试，通常可以保持默认配置。

需要注意的两个配置是，内存和跨域问题：

内存配置：编辑 config/jvm.options 文件，设置 -Xms 和 -Xmx 参数来调整 JVM 的堆内存大小。确保将这些值设置为至少机器总内存的一半，但不要超过 32GB，因为使用零基压缩指针（zero-based compressed oops）可以更有效地利用内存。例如：

-Xms4g -Xmx4g
跨域配置：编辑 config/elasticsearch.yml 文件。添加如下配置：

http.cors.enabled: true http.cors.allow-origin: "*"

c. 启动 Elasticsearch

bash ./bin/elasticsearch

如果需要在后台运行，可以使用 -d 参数：

bash ./bin/elasticsearch -d

d. 验证安装

启动成功后，可以通过浏览器或 curl 命令访问 http://localhost:9200/，如果看到类似以下的 JSON 响应，说明 Elasticsearch 启动成功：

json { "name" : "your-hostname", "cluster_name" : "elasticsearch", "cluster_uuid" : "...", "version" : { "number" : "8.9.1", "build_flavor" : "default", "build_type" : "tar", "build_hash" : "...", "build_date" : "...", "build_snapshot" : false, "lucene_version" : "...", "minimum_wire_compatibility_version" : "...", "minimum_index_compatibility_version" : "..." }, "tagline" : "You Know, for Search" }

三、基础应用

1. 索引数据

Elasticsearch 使用 索引 (Index) 来组织数据，类似于关系型数据库中的数据库。每个索引可以包含多个 类型 (Type) (7.x 版本后已废弃)，每个类型包含多个 文档 (Document)，每个文档由多个 字段 (Field) 组成。

以下是一个向名为 my_index 的索引添加一个文档的示例：

bash curl -X POST "localhost:9200/my_index/_doc/1?pretty" -H 'Content-Type: application/json' -d' { "name": "John Doe", "age": 30, "about": "I love to go rock climbing" } '

my_index：索引名称。
_doc：表示文档类型，7.x 版本后固定为 _doc。
1：文档 ID，如果不指定，Elasticsearch 会自动生成。
pretty：使 JSON 响应格式化输出。

2. 搜索数据

可以使用 Elasticsearch 强大的查询 DSL (Domain Specific Language) 进行各种搜索。

a. 简单查询

bash curl -X GET "localhost:9200/my_index/_search?q=name:John&pretty"

这个命令会在 my_index 索引中搜索 name 字段包含 John 的文档。

b. 使用查询 DSL

bash curl -X GET "localhost:9200/my_index/_search?pretty" -H 'Content-Type: application/json' -d' { "query": { "match": { "about": "climbing" } } } '

这个命令使用 match 查询在 about 字段中搜索包含 climbing 的文档。

3. 更新数据

可以通过文档 ID 更新已有的文档：

bash curl -X POST "localhost:9200/my_index/_doc/1/_update?pretty" -H 'Content-Type: application/json' -d' { "doc": { "age": 31 } } '

这个命令会将 ID 为 1 的文档的 age 字段更新为 31。

4. 删除数据

a. 删除文档

bash curl -X DELETE "localhost:9200/my_index/_doc/1?pretty"

这个命令会删除 ID 为 1 的文档。

b. 删除索引

bash curl -X DELETE "localhost:9200/my_index?pretty"

这个命令会删除 my_index 索引及其所有文档。

四、进一步学习

本教程只是 Elasticsearch 的入门介绍，更多高级特性和应用场景可以参考官方文档：

Elasticsearch 官方文档

以下是一些学习方向建议：

集群部署：学习如何搭建多节点 Elasticsearch 集群，实现高可用和负载均衡。
Kibana：Kibana 是 Elasticsearch 的可视化工具，可以用于数据探索、分析和可视化。
Logstash：Logstash 是数据收集和处理引擎，可以与 Elasticsearch 配合使用，构建 ELK (Elasticsearch, Logstash, Kibana) 日志分析平台。
高级查询：深入学习 Elasticsearch 查询 DSL，掌握各种查询方式和技巧。
性能优化：学习如何优化 Elasticsearch 的性能，包括索引优化、查询优化等。
安全管理：学习如何配置 Elasticsearch 的安全机制，保护数据安全。

五、总结

Elasticsearch 是一个强大且易用的搜索引擎，可以应用于各种场景，包括全文搜索、日志分析、数据分析等。本教程介绍了 Elasticsearch 的基本概念、快速搭建方法和基础应用，希望能帮助你快速入门 Elasticsearch。通过进一步学习和实践，你可以掌握 Elasticsearch 的更多高级特性，并将其应用于实际项目中。

作者：admin

链接：https://hostlocvps.com/2025/02/03/elasticsearch%e5%9f%ba%e7%a1%80%e6%95%99%e7%a8%8b%ef%bc%9a%e5%bf%ab%e9%80%9f%e6%90%ad%e5%bb%ba%e4%b8%8e%e5%ba%94%e7%94%a8/

文章版权归作者所有，未经允许请勿转载。

THE END

今日GitHub热榜项目 - 2025年02月03日

<<上一篇

强大的HTML在线预览功能介绍

下一篇>>