博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
ElaticSearch5.5.1(核心4)
阅读量:6037 次
发布时间:2019-06-20

本文共 3771 字,大约阅读时间需要 12 分钟。

  hot3.png

1.es的document数据格式和数据库的关系型数据格式的区别

    1.1 es中document数据格式(ES主要是面向文档的搜索分析引擎)

        1.1.1 应用系统的数据结构都是面向对象的,复杂的

        1.1.2 对象数据存储到数据库中,只能拆解开来,变为扁平的多张表,每次查询的时候还得还原回对象格式,相当麻烦
        1.1.3 ES是面向文档的,文档中存储的数据结构,与面向对象的数据结构是一样的,基于这种文档数据结构,es可以提供复杂的索引,全文检索,分析聚合等功能
        1.1.4 es的document用json数据格式来表达

    1.2 下面介绍es数据格式与mysql这样数据库的区别

        1.2.1 下面是mysql两张关联表Employee,EmployeeInfo,并给一个对象赋值

  public class Employee {

  private String email;
  private String firstName;
  private String lastName;
  private EmployeeInfo info;
  private Date joinDate;
}
private class EmployeeInfo {
  private String bio; // 性格
  private Integer age;
  private String[] interests; // 兴趣爱好
}

EmployeeInfo info = new EmployeeInfo();

info.setBio("curious and modest");
info.setAge(30);
info.setInterests(new String[]{"bike", "climb"});

Employee employee = new Employee();

employee.setEmail("zhangsan@sina.com");
employee.setFirstName("san");
employee.setLastName("zhang");
employee.setInfo(info);
employee.setJoinDate(new Date());

            1.2.2 下面是elaticSearch 的赋值格式,就是相当于一个json

            {

    "email":      "zhangsan@sina.com",
    "first_name": "san",
    "last_name": "zhang",
    "info": {
        "bio":         "curious and modest",
        "age":         30,
        "interests": [ "bike", "climb" ]
    },
    "join_date": "2017/01/01"
}

通过1.2.1和1.2.2我们就明白这两者上传数据的区别了。

 

2.  看下最简单的命令行

GET /_cat/health?v

135036_5AI5_3209213.png

epoch      timestamp cluster       status node.total node.data shards pri relo init unassign pending_tasks max_task_wait_time active_shards_percent

1488006741 15:12:21  elasticsearch yellow          1         1      1   1    0    0        1             0                  -                 50.0%

如何快速了解集群的健康状况?green、yellow、red?

green:每个索引的primary shard和replica shard都是active状态的

yellow:每个索引的primary shard都是active状态的,但是部分replica shard不是active状态,处于不可用的状态
red:不是所有索引的primary shard都是active状态的,部分索引有数据丢失了

为什么现在会处于一个yellow状态?

我们现在就一个笔记本电脑,就启动了一个es进程,相当于就只有一个node。现在es中有一个index,就是kibana自己内置建立的index。由于默认的配置是给每个index分配5个primary shard和5个replica shard,而且primary shard和replica shard不能在同一台机器上(为了容错)。现在kibana自己建立的index是1个primary shard和1个replica shard。当前就一个node,所以只有1个primary shard被分配了和启动了,但是一个replica shard没有第二台机器去启动

 

3.创建索引

PUT /index/type/id

{
  "json数据"
}

index:为索引(相当于mysql的数据库)

type:为类型(相当于mysql的表)

id:为document(相当于 mysql的行)

es会自动建立index和type,不需要提前创建,而且es默认会对document每个field都建立倒排索引,让其可以被搜索

 

PUT 创建 也可以覆盖

POST 修改

DELETE 删除

GET 查询

4. 查询

    4.1 GET /ecommerce/product/_search

        took:耗费了几毫秒

        timed_out:是否超时,这里是没有

        _shards:数据拆成了5个分片,所以对于搜索请求,会打到所有的primary shard(或者是它的某个replica shard也可以)

        hits.total:查询结果的数量,3个document

        hits.max_score:score的含义,就是document对于一个search的相关度的匹配分数,越相关,就越匹配,分数也高

        hits.hits:包含了匹配搜索的document的详细数据

        query string search的由来,因为search参数都是以http请求的query string来附带的

        搜索商品名称中包含yagao的商品,而且按照售价降序排序:GET /ecommerce/product/_search?q=name:yagao&sort=price:desc

            适用于临时的在命令行使用一些工具,比如curl,快速的发出请求,来检索想要的信息;但是如果查询请求很复杂,是很难去构建的

            在生产环境中,几乎很少使用query string search

 

    4.2 query DSL

        DSL:Domain Specified Language,特定领域的语言

        http request body:请求体,可以用json的格式来构建查询语法,比较方便,可以构建各种复杂的语法,比query string search肯定强大多了

        查询所有的商品

GET /ecommerce/product/_search

{
  "query": { "match_all": {} }
}

 

GET /ecommerce/product/_search

{
    "query" : {
        "match" : {
            "name" : "yagao"
        }
    },
    "sort": [
        { "price": "desc" }
    ]
}

GET /ecommerce/product/_search
{
  "query": { "match_all": {} },
  "from": 1,
  "size": 1
}
 

GET /ecommerce/product/_search

{
  "query": { "match_all": {} },
  "_source": ["name", "price"]
}

 

       4.3 query filter

GET /ecommerce/product/_search

{
    "query" : {
        "bool" : {
            "must" : {
                "match" : {
                    "name" : "yagao" 
                }
            },
            "filter" : {
                "range" : {
                    "price" : { "gt" : 25 } 
                }
            }
        }
    }
}

      4.3 full-text search(全文检索)

GET /ecommerce/product/_search

{
    "query" : {
        "match" : {
            "producer" : "yagao producer"
        }
    }
}

    4.4 phrase search(短语搜索)

跟全文检索相对应,相反,全文检索会将输入的搜索串拆解开来,去倒排索引里面去一一匹配,只要能匹配上任意一个拆解后的单词,就可以作为结果返回

phrase search,要求输入的搜索串,必须在指定的字段文本中,完全包含一模一样的,才可以算匹配,才能作为结果返回

GET /ecommerce/product/_search

{
    "query" : {
        "match_phrase" : {
            "producer" : "yagao producer"
        }
    }
}

        

 

 

 

转载于:https://my.oschina.net/mdxlcj/blog/1518118

你可能感兴趣的文章
Liferay 中部署portlet的细节窥探
查看>>
制作Windows Server 2003/08 image详细步骤与OpenStack介绍
查看>>
007-df和du的使用
查看>>
springIOC学习笔记
查看>>
Eclipse 调优及使用小细节
查看>>
前台jsp从session中拿值
查看>>
数据库名称
查看>>
centos7部署redis
查看>>
怎样做网站优化才能更有效的吸引蜘蛛来访?
查看>>
带搜索的下拉框(select2插件)
查看>>
Linux日常运维--5
查看>>
Java基础之多线程框架(二)
查看>>
51.php-fpm的pool 慢日志 open_basedir 进程管理
查看>>
Visual Paradigm 教程[UML]:如何在序列图中应用消息编号?
查看>>
线程组之间的JMeter传递变量
查看>>
Mycat - 实现数据库的读写分离与高可用
查看>>
【更新】Infragistics Ultimate UI for WPF v18.2(三):Excel引擎
查看>>
UniDAC使用教程(五):数据加密
查看>>
设计模式简单入门(下)
查看>>
swing 把对话框保存为图片
查看>>