Lucien168

存储工程师地平线机器人

回答

银行数据迁移分布式存储存储io
回答于 · 2021-05-26

如何有效和智能的控制并恢复IO，减少因IO问题导致数据批量计算的影响，是分布式存储考虑和解决的问题？

backfill和recovery的最优值 ceph在增加osd的时候会触发backfill，让数据得到平均，触发数据的迁移ceph在移除osd的时候需要在节点上进行数据的恢复，也有数据的迁移和生成只要是集群里面有数据的变动就会有网卡流量，cpu，

赞同1
银行可靠性分布式存储稳定性
回答于 · 2021-05-26

分布式存储使用过程稳定性和可靠性如何保障？

分布式系统一般都是靠分布式协议paxos算法或者Raft算法来保证集群的高可用性和可靠性，一般只要运维和监控的保障不会出现大问题。数据不均衡：但是咱们在运维的过程中，会发现ceph的crush算法，会导致数据倾斜, 集群中

赞同1
系统集成 Tomcat Nginx centos 7.4
回答于 · 2020-09-11

Nginx 将你重定向的次数过多？

看看nginx日志，是不是后端状态吗码有问题。然后这个设置 proxy_next_upstream error timeout invalid_header http_500

赞同
零售/批发 Ceph PG
回答于 · 2020-08-31

PG和PGP的区别是什么？调整 PGP 会不会引起 PG 内的对象的分裂？

首先来一段英文关于PG和PGP区别的解释： PG = Placement Group PGP = Placement Group for Placement purpose pg_num = number of placement groups mapped to an OSD When pg_num is increased for any pool, ever

赞同
互联网服务 Ceph ceph集群
回答于 · 2020-08-29

多节点组成Ceph存储集群后，时间如何同步？

通过ntp 然后进行监控，如果不同步，集群也会出现告警提示。

赞同
零售/批发 OSD OSD 无响应
回答于 · 2020-08-29

osd 龟速无响应,会是那些方面的问题？

一个反复出现的问题是 OSD 龟速或无响应。在深入性能问题前，你应该先确保不是其他故障。例如，确保你的网络运行正常、且 OSD 在运行，还要检查 OSD 是否被恢复流量拖住了。 Tip：较新版本的 Ceph 能更好地处理恢复，可防止

赞同
零售/批发 Ceph osd error
回答于 · 2020-08-29

osd 启动报错了，应该从哪几个方面诊断排错?

首先看报什么错误，然后根据问题，找对应的解决方案，一般网上都有对应的解决方案。最后，搞不定把详细的步骤和日志，帖到社区。

赞同
互联网服务启动报错 Ceph
回答于 · 2020-08-29

ceph启动报错？

提示很清楚，根据提示多检查步骤。

赞同
互联网服务 Ceph
回答于 · 2020-08-29

ceph报错，RuntimeError: Failed to connect any mon？

ping mon地址，检查mon日志，是否有错误日志。

赞同
保险数据迁移集群 io
回答于 · 2020-08-25

机器死机，如何不影响用户请求io，并且尽量让集群内部数据迁移量最小化，影响最小？

设置集群为维护模式，避免有数据迁移的发生，尽快恢复死机的机器，重新拉起osd起来。

赞同

关于 Lucien168

用户名： Lucien168
职位：存储工程师
公司：地平线机器人
行业：互联网服务
社区声望：4210
荣誉等级：LV.1

关注TA的人

更多关注TA的人 >>

最近来访

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024 talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广