大数据-173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

62,311次阅读
没有评论

共计 4054 个字符,预计需要花费 11 分钟才能阅读完成。

点一下关注吧!!!非常感谢!!持续更新!!!

目前已经更新到了:

  • Hadoop(已更完)
  • HDFS(已更完)
  • MapReduce(已更完)
  • Hive(已更完)
  • Flume(已更完)
  • Sqoop(已更完)
  • Zookeeper(已更完)
  • HBase(已更完)
  • Redis(已更完)
  • Kafka(已更完)
  • Spark(已更完)
  • Flink(已更完)
  • ClickHouse(已更完)
  • Kudu(已更完)
  • Druid(已更完)
  • Kylin(已更完)
  • Elasticsearch(正在更新…)

章节内容

上节我们完成了如下的内容:

  • Elasticsearch 索引操作
  • IK 分词器安装上使用
  • 自定义分词

大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

映射操作

索引创建之后,等于有了关系型数据库中的 Database,Elasticsearch7.x 取消了索引 type 类型的设置,不允许指定类型,默认为_doc,但字段仍然是有的,我们需要设置字段的约束信息,叫做字段映射(mapping)
字段的约束包括但不限于:

  • 字段的数据类型
  • 是否要存储
  • 是否要索引
  • 分词器

创建映射字段

语法:

PUT / 索引名 /_mapping
{
  "properties": {
    "字段名": {
      "type": "数据类型",
      "index": true,
      "store": false,
      "analyzer": "分词器"
    }
  }
}

上述内容解释如下:

  • type 类型,可以是 text、long、short、date 等等
  • index 是否为索引 默认为 true
  • store 是否存储 默认为 false
  • analyzer 分词器

示例:


PUT /wzkicu-index

PUT /wzkicu-index/_mapping/
{
  "properties": {
    "name": {
      "type": "text",
      "analyzer": "ik_max_word"
    },
    "job": {
      "type": "text",
      "analyzer": "ik_max_word"
    },
    "logo": {
      "type": "keyword",
      "index": "false"
    },
    "payment": {
      "type": "float"
    }
  }
}

运行结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作
上图中,包含的字段如下所示,并且加了一些属性:

  • name 企业名称
  • job 需求岗位
  • logo logo 图片地址
  • payment 薪资

映射属性详解

支持的类型非常的多,可以访问对应的文档进行查看:

https://www.elastic.co/guide/en/elasticsearch/reference/8.15/mapping-types.html

对应的页面如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作
这里有几种:

  • String 类型:text 可分词,不可参与聚合。keyword 不可分词,作为完整字段进行分配,可以参与聚合。
  • Numerical 类型:数值类型、分两类,基本数据类型、浮点数的高精度类型
  • Date:日期类型,ES 可以对日期格式化字符串存储,但是建议我们存储为毫秒值、存储为 long、节省空间。
  • Array 数组类型,进行匹配时,任意一个元素满足,都认为满足。排序时,如果升序则用数组中最小值来排序,如果降序则用数组中的最大值来排序
  • Object 对象,{name:“jack”, age: 21, girl: {name:“Rose”, age: 21}},如果存储到索引库是对象类型,例如上面的 girl,会把 girl 变成 girl.name 和 girl.age
  • index,true 字段会被索引,则可以用来进行搜索,默认值就是 true。false 字段不会被索引,不能用来搜索。比如 LOGO 的图片地址,这种不需要索引,就可以设置为 False。
  • store,是否将数据进行独立存储,原始的文本存储在 _source 里面,默认情况下其他提取出来的字段都不是独立存储的,是从_source 里面提取出来的。当然你也可以独立的存储某个字段,只要设置 store:true 即可,获取独立存储的字段要比_source 中解析快得多,但是也会占用更多的空间,所以要根据实际业务需要来设置,默认为 false
  • analyzer:指定分词器 一般使用 IK 分词器 ik_max_word ik_smart

查看映射关系

单个映射关系
语法:

GET / 索引名称 /_mapping

示例:

GET /wzkicu-index/_mapping

执行的结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

所有映射关系

语法:

GET _mapping
GET _all/_mapping

执行结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

修改映射关系

PUT / 索引库名 /_mapping
{
  "properties": {
    "字段名": {
      "type": "类型",
      "index": true,
      "store": true,
      "analyzer": "分词器"
    }
  }
}

主要注意的是:修改映射只能是增加字段的操作,其他的更改只能删除索引重新建立索引来实现。

一次性建立索引与映射

实际上创建索引和映射是可以放到一起来做的,在创建索引的同时,直接指定映射。

PUT / 索引库名称
{
  "settings":{
    "索引库属性名":"索引库属性值"
  },
  "mappings":{
    "properties":{
      "字段名":{
        "映射属性名":"映射属性值"
      }
    }
  }
}

案例:

PUT /wzk-index
{
  "settings": {},
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "analyzer": "ik_max_word"
      }
    }
  }
}

执行结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

文档增删改查与局部更新

文档,即索引库中的数据,会根据规则创建索引,将用来搜索,可以类比做数据库中的一行数据。

新增文档

新增文档时,涉及到的 ID 的创建方式,手动指定或者自动生成。

手动新增

POST / 索引名称 /_doc/{id}

示例:

POST /wzkicu-index/_doc/1
{"name" : "百度",
  "job" : "小度用户运营经理",
  "payment" : "30000",
  "logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

POST /wzkicu-index/_doc/2
{"name" : "百度",
  "job" : "百度用户运营经理",
  "payment" : "50000",
  "logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

执行的结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

自动新增

语法:

POST / 索引名称 /_doc
{
  "field": "value"
}

示例:

POST /wzkicu-index/_doc
{
  "name" : "百度",
  "job" : "百度测试",
  "payment" : "20000",
  "logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

执行结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

查询文档

单个文档

语法:

GET / 索引名称 /_doc/{id}

示例:

GET /wzkicu-index/_doc/1

执行结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作
对返回的结果的格式解释如下:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

所有文档

语法:

 POST / 索引名称 /_search

示例:

POST /wzkicu-index/_search
{
  "query":{
    "match_all": {
    }
  }
}

测试运行的结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

定制返回字段

很多业务场景下,我们不需要返回这么多字段:
示例:

GET /wzkicu-index/_doc/1?_source=name,job

执行结果如下图所示,可以看到根据需要,只返回了 name 和 job:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

更新文档

全部更新

新增方式相同,只不过新增是 POST,而更新是 PUT,而且修改必须指定 ID 才可以。

  • id 对应的文档存在,则修改
  • id 对应的文档不存在,则新增
PUT /wzkicu-index/_doc/5
{
  "name" : "百度",
  "job" : "百度测试",
  "payment" : "20000",
  "logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

第一次执行,可以看到右侧是:created:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作
再执行一次,可以看到右侧是:updated:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

局部更新

ES 可以使用 PUT 或者 POST 进行更新,如果指定 ID 存在,则执行更新操作。
注意:

  • ES 执行更新操作的时候,ES 是先将旧的标记为删除,再添加新的文档。
  • 旧的文档不会立即消失,但是你也无法访问,ES 会在添加更多数据的时候,后台清理已经标记为删除的数据。
    全部更新是直接把之前的老数据,标记为删除状态,然后再添加一条更新的数据(PUT 或者 POST),局部更新,只是修改某个字段(POST)。
POST / 索引名 /_update/{id}
{
  "doc":{
    "field":"value"
  }
}

示例:

POST /wzkicu-index/_update/2
{
  "doc":{
    "name":"淘宝"
  }
}

执行的结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

删除文档

ID 删除
语法:

DELETE / 索引名 /_doc/{id}

示例

DELETE /wzkicu-index/_doc/3

执行结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

条件删除

语法:

POST / 索引名 /_delete_by_query
{
  "query": {
    "match": {
      "字段名": "搜索关键字"
    }
  }
}

示例:


POST /wzkicu-index/_search
{
  "query":{
    "match":{
      "name":"百度"
    }
  }
}


POST /wzkicu-index/_delete_by_query
{
  "query":{
    "match":{
      "name":"百度"
    }
  }
}

执行结果如下图所示:
大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

删除所有

POST / 索引名 /_delete_by_query
{
  "query": {
    "match_all": {}
  }
}

原文地址: 大数据 -173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

    正文完
     0
    Yojack
    版权声明:本篇文章由 Yojack 于2024-10-29发表,共计4054字。
    转载说明:
    1 本网站名称:优杰开发笔记
    2 本站永久网址:https://yojack.cn
    3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理。
    4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
    5 本站所有内容均可转载及分享, 但请注明出处
    6 我们始终尊重原创作者的版权,所有文章在发布时,均尽可能注明出处与作者。
    7 站长邮箱:laylwenl@gmail.com
    评论(没有评论)