1、流量采集是手段,明确目标,安排人力2、资源方面考虑 存储、计算、输出 窗口等设定,考虑 项目的使用方,尽量做到自助3、内部网络数据可能包含各种敏感信息,需要考虑脱敏和保密 一步不要走太大,从解决具体问题开始,坚持
目录层数深:是 posix 文件系统的缺陷结构百亿小文件,通常需要CMS+Object对象存储架构 对象存储不在意 一个层级放多少,可以基本无限扩展考虑到怎么使用,可以自己定义一套数据库来做元数据,也可以使用内存管理模块给应
副本型的结构,要奇数个replica,用偶数 随意脑裂
要考虑恢复效率,以及恢复本身是否可控,会不会对整体性能造成影响需要厂商提供相对透明的 恢复细节和进度
这个问题的核心不是软件,监控系统本身是随业务变化,要能调整和适应的一个是流程,一个是业务和设备专注于 价值流
分布式存储一半都是软件占了大部分的能力,集群内部也需要完备的监控数据对外一般会提供API,web管理上看得到的数据和操作,都是可以由厂家提供相应接口的
首先是网络吞吐能力的limit假设同读一个文件,理论上都在cache,磁盘没有问题 这类问题思考模式:所有的资源都是有限的,IO链路带宽,NAS 协议处理的能力,总量有限,对存储没影响,存储还是存储,可能对访问存储的应用有影响
主要是包管理器不同IO设备(网络、磁盘)的细节不同service 管理的手段可能有差异 命令和内核基本一致
各家实现的细节差别还是挺大的建议多研究公有云的:AWS、azure、aliyun 统一资源管理建议参考: HashiCorp: Multi-Cloud Management, Security, Automation 市面上有一些 多云管理平台,可以抽象资源管理
虚机创建速度虚机南北向网络能力东西向网络能力磁盘读写能力存储的一些高级管理能力:快照 个数、速度等从这几个方面应该比较全面的覆盖
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024 talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30