Satori
latest
简介
基本情况
一分钟快速感受
常见的问题
安装
初次安装
更新
配置
agent 配置
规则仓库签名
报警配置
编写规则
编写规则简介
过滤事件
判定和发送报警
调度插件
数据聚集
看门狗
其他需要用到的流
编写插件
编写插件
内置监控项
Agent 存活
CPU 占用
内存占用
网络相关
机器负载(Load)
磁盘利用率
内核参数
TCP 统计
高级 TCP 指标
附带的插件
端口监听
进程数量监控
单进程 CPU 监控
URL 监控
Java 进程 OldGen 占用
MySQL 查询
NVidia GPU 监控
基础监控插件
集群交叉检测
交换机监控(swcollector)
其他监控插件
其他
ChangeLog
Satori 社区
使用 Satori 的公司
Satori
Docs
»
Satori 监控系统
Edit on GitHub
Satori 监控系统
¶
Satori 是一个由
LeanCloud
发起的监控系统。
简介
基本情况
截图
设计思路
架构图
与 Open-Falcon 的比较
一分钟快速感受
常见需求
复杂需求
常见的问题
重启了 master,机器信息都丢掉了?
机器信息里看不到插件项,插件版本也不对?
我修改了规则之后,为什么相关报警一直留在报警页面里?
插件目录中的插件总是不执行?
安装
初次安装
机器要求
交互式安装
非交互式(无人工干预/批量)安装
Agent 安装
登录 Web 界面
更新
从 1.x 更新到 2.x
没有大变化的话该怎么更新?
配置
agent 配置
样例配置
参数解释
为 agent 开启 cgroups 限制
插件配置
过滤不想要的事件
agent 的自动更新
规则仓库签名
生成签名用的 key
对规则仓库进行签名
配置 agent 接受的签名公钥
阻止未签名的 push
报警配置
报警人员和组配置
报警策略配置
SMTP 发送邮件
发送短信
电话报警
微信企业号
BearyChat
PagerDuty
OneAlert
静默(不报警)
编写规则
编写规则简介
规则文件的组织
Copy & Paste 的正确姿势
事件流的组织
错误处理
发送报警
Riemann 提供的文档
过滤事件
where
by
runs
changed
判定和发送报警
发送报警(!)
judge*
judge
judge-gapped*
judge-gapped
alarm-every
调度插件
plugin-dir
plugin
数据聚集
aggregate*
aggregate
->difference
avgpdiff
maxpdiff
|>| 和 |<|
Riemann 自带的窗口函数
group-window
slot-window
slot-coalesce
看门狗
feed-dog
watchdog
其他需要用到的流
smap
copy
sdo
->waterfall
编写插件
编写插件
带参数的插件
无参数的插件
持续输出的插件
内置监控项
Agent 存活
CPU 占用
内存占用
网络相关
机器负载(Load)
磁盘利用率
计算值(对标 iostat 工具,比较容易使用)
原始值(/proc/diskstat 的原始数据)
内核参数
TCP 统计
高级 TCP 指标
数据包统计
SYN Cookies 功能
TIME_WAIT 回收
超时重传相关
重传数量
FastOpen
MD5
DelayedACK
DSACK
Reorder
连接终止
内存 Prune
PAWS 相关
Listen相关
Undo 相关
快速路径与慢速路径
未归类
暂时无解释
附带的插件
端口监听
进程数量监控
单进程 CPU 监控
URL 监控
Java 进程 OldGen 占用
MySQL 查询
NVidia GPU 监控
基础监控插件
集群交叉检测
交换机监控(swcollector)
其他监控插件
其他
ChangeLog
Satori 社区
使用 Satori 的公司
Read the Docs
v: latest
Versions
latest
next
Downloads
html
On Read the Docs
Project Home
Builds
Free document hosting provided by
Read the Docs
.