From 390feecfbf5dcab1116e0cf314eaa0fc8ba47a70 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E5=86=AF=E9=92=8A?= Date: Tue, 12 Oct 2021 07:53:14 +0000 Subject: [PATCH] Add new file --- docs/10.ES集群监控指标梳理.md | 92 +++++++++++++++++++++++++++++++++++ 1 file changed, 92 insertions(+) create mode 100644 docs/10.ES集群监控指标梳理.md diff --git a/docs/10.ES集群监控指标梳理.md b/docs/10.ES集群监控指标梳理.md new file mode 100644 index 0000000..4901025 --- /dev/null +++ b/docs/10.ES集群监控指标梳理.md @@ -0,0 +1,92 @@ + + +```shell + +###################ElasticSearch监控指标梳理########################### +#author:lugh1 # +#date:2021-09-26 # +#description:ES监控指标 # +###################ElasticSearch监控指标梳理########################### + +##集群 +status #集群状态green、yellow、red +number_of_nodes #集群节点个数 +active_primary_shards #正常的主分片数量 +active_shards #正常的分片数 +relocating_shards #正在迁移的分片数 +initializing_shards #刚刚创建的分片数 +unassigned_shards #未分配的分片数 +nodes.count #节点数量 +indices.count #总的索引数量 +indices.shards.total #总分片数 +indices.docs.count #总的文档数 +indices.store.size_in_bytes #总存储大小 +indices.fielddata.memory_size_in_bytes #用于fielddata的内存总大小 +indices.query_cache.memory_size_in_bytes #用于查询缓存的总内存大小 +indices.segments.count #段总数量 +#如上内容可以通过/_cat/_health和/_cluster/stats查看 + +##查询 +indices.search.query_total #查询总数 +indices.search.query_time_in_millis #查询总时间 +indices.search.query_current #当前正在进行的查询数量 +indices.search.fetch_total #提取总数 +indices.search.fetch_time_in_millis #花费在提取上的总时间 +indices.search.fetch_current #当前正在进行的提取数 + + +##索引 +indices.indexing.index_total #索引的文件总数 +indices.indexing.index_time_in_millis #索引文档总时间 +indices.indexing.index_current #目前索引的文件数量 +indices.refresh.total #索引刷新总数 +indices.refresh.total_time_in_millis #刷新指数的总时间 +indices.flush.total #索引刷新总数到磁盘 +indices.flush.total_time_in_millis #将索引刷新到磁盘上的总时间 +merges.current_docs #目前的合并。合并目前正在处理中 +merges.total_docs #合并总数。合并总数的计数 +merges.total_stopped_time_in_millis #合并花费的总时间。合并段的所有时间的聚合 + + +##节点 +nodes.roles #比如masternode,datanode +nodes.indices.docs #每个节点内存的文档数 +nodes.indices.store #节点耗用了多少物理存储 +nodes.indices.indexing #节点索引相关指标 +nodes.indices.merges #包括了 Lucene 段合并相关的信息。它会告诉你目前在运行几个合并,合并涉及的文档数量,正在合并的段的总大小,以及在合并操作上消耗的总时间 +nodes.indices.search #在活跃中的搜索( open_contexts )数量、查询的总数量、以及自节点启动以来在查询上消耗的总时间 +nodes.indices.fielddata #接近于 0。因为 fielddata 不是缓存,任何驱逐都消耗巨大,应该避免掉。如果你在这里看到驱逐数,你需要重新评估你的内存情况,fielddata 限制 +nodes.indices.segments #展示这个节点目前正在服务中的 Lucene 段的数量 +nodes.indices.memory #统计值展示了 Lucene 段自己用掉的内存大小。这里包括底层数据结构,比如倒排表,字典,和布隆过滤器等。 +nodes.thread.pool #节点线程池相关指标 +nodes.breaks #熔断相关指标,有总熔断以及查询熔断和fielddata熔断等 + +##机器 +nodes.os.cpu.percent #CPU使用率 +nodes.os.cpu.load_averager #负载 +nodes.os.mem #内存使用相关指标 +nodes.os.swap #Swap使用相关指标 +nodes.process.open_filedescriptors #打开的文件描述符 +nodes.fs #文件系统相关指标,比如IO,读写,磁盘存储和目录等 +nodes.http.current_open #http连接当前打开数 +网络流出/流入字节数,tcp连接等 + + + +##JVM&GC +nodes.jvm.gc.collectors.young.collection_count #年轻代垃圾回收总数 +nodes.jvm.gc.collectors.young.collection_time_in_millis #年轻代垃圾回收耗时 +nodes.jvm.gc.collectors.old.collection_count #年老代垃圾回收总数 +nodes.jvm.gc.collectors.old.collection_time_in_millis #年老代垃圾回收耗时 +nodes.jvm.mem.heap_used_percent #当前JVM堆占比 +nodes.jvm.mem.heap_committed_in_bytes #已提交的JVM堆量 +nodes.jvm.threads #jvm线程相关指标 +nodes.jvm.classes #jvm类加载相关指标 + + +##其他 +正在运行的任务数,运行时间,任务类型,运行节点等 #/_cat/tasks +每个索引的状态,health,主副分片,文档数,存储的大小等 #/_cat/indices +排队的任务数量 #/_cat/pending_tasks + +```