前端使用JQ插件morris.js绘图(http://morrisjs.github.io/morris.js/index.html)
或者highstock(http://www.highcharts.com/download)
数据库采用线性数据库存储(http://influxdb.com/)
后端当然采用PHP了,哦不也有可能是graphite
客户上报使用(https://collectd.org/)+write_graphite模块
这块可以参考(https://www.dnspod.cn/docs/custom-monitoring.html)
相关内容可以参考(http://www.jsxubar.info/)

初期部署三个节点采集ping数据并在掉线时由主服务器发送提醒信息(微信、短信、邮件三种形式)
客户设定完毕之后可以通过*.zhou.si访问,并且输入authy的二步验证码或者一个指定密码或者直接查看监控详情页
详情页由各种图表构成,大概就是这样,可能可以在其中利用到nodejs
可以考虑做一个小图标来输出当前服务器状态列表的图片(GD库)

初期考虑100个以内用户进行内测

关于运维自动化可以参考puppet

万事俱备,就差开工= =