在Elasticsearch中,文档(Document)是存储在索引中的基本数据单元。它是JSON格式的数据对象,包含了实际的信息。每个文档都有一个唯一的标识,称为文档ID。文档被组织在索引中,而索引是文档的逻辑容器。
以下是一些关于Elasticsearch文档的重要概念:
- JSON 格式: Elasticsearch文档是以JSON格式表示的。JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于阅读和编写。
- 唯一标识: 每个文档都有一个唯一的文档ID,用于在索引中标识和检索文档。如果你没有为文档提供ID,Elasticsearch会自动生成一个唯一的ID。
- 字段: 文档由多个字段组成,每个字段包含一个数据值。字段可以是基本类型(如文本、数字、日期)或复合类型(如对象、数组)。
- 索引: 文档存储在一个或多个索引中。索引是一个逻辑命名空间,用于组织和存储相关联的文档。每个索引都有其自己的映射(Mapping),定义了文档中字段的类型和属性。
- 类型: 在Elasticsearch 7.x版本及以后,索引中只包含一个类型(type)。在较早的版本中,一个索引可以包含多个类型,但现在已经被弃用。文档类型用于定义相同索引中不同类别的文档。
-
_source 字段: 文档的原始JSON表示称为
_source
字段,包含了文档的实际数据。默认情况下,Elasticsearch会存储文档的源数据,但你也可以禁用它或根据需要定义要存储的字段。 - 分片和副本: 文档存储在索引的分片中。分片允许在集群中分布和并行处理数据。副本是分片的复制,提供了高可用性和容错性。
文档是Elasticsearch中最基本的数据单元,索引的目标是提供对这些文档的高效存储、检索和分析。在使用Elasticsearch时,理解文档的结构和索引的概念对于构建强大的搜索和分析系统至关重要。
Was this helpful?
0 / 0