海爷
作者海爷·2020-06-04 23:17
待业·待业

为什么OceanBase每次都只刷TPC-C的数据却不尝试TPC-E?

字数 2578阅读 5832评论 4赞 3

首先,海爷还是要对阿里系的 PR 人员表达一下敬意,最近“二度刷新 TPC - C 基准测试支付宝 OceanBase 树立数据库新标杆”牛皮文章满天飞。也二度让我们干 IT 的人震惊湿身了。相信如果要让养活马爸爸身后的那些女人知道此事,那必定更是全国震惊了,海爷也相信阿里的 PR 终有一天是能做到的。毕竟你们是让宇宙敬仰,超越时代的伟大企业。

表扬完 PR 同学,得回到正题:为什么 OceanBase 每次都只刷 TPC - C 的数据却不去刷 TPC - E 的数据呢?不知道有没有论坛里面有没有朋友深究此事的,可一起探讨下。

海爷最近响应国家总理号召,辞职开拓地摊经济产业,回收买卖二手图书,生意虽然一般但时间却是多出了一大把。作为曾经的行业从业者,特意研究了下 TPC 这个事务处理性能委员会。国家的领导人说过,我们有幸生活在伟大的时代,海爷是打心里非常认可的,在这个伟大的时代,最简单的一个体现就是:所有的信息都是公开的,你撒一个谎,可能就不仅仅是需要另外 10 个谎言去遮掩的事情了。海爷这会在自己的二手图书地摊上一口啤酒一口黄瓜,爽就一个字!

随手打开 www.tpc.org 的网站,因为海爷自打小就有个习惯,凡是习惯刨根问底,虽然自小为这德行没少挨打,但至今都快四十了还是没改了,所以也就不打算改了。海爷心里好奇啊: TPC - C 真有那么牛逼吗?值得我们伟大企业阿里的 OB 吹两次牛逼吗?

查完后,不得不说: TPC 确实牛逼,首先你看看它的介绍: TPC 是一个非盈利组织,成立于 1988 年,这个组织主要的功能是定义事务处理、数据库的基准,这个基准用于评估服务器的性能,并且把服务器评估的结果发布在 TPC 的官方网站上。大家请关注这个组织的根本目的是用于评估服务器的性能。因为它是一个非盈利组织,那它必然是有协会成员的,海爷就再查了下, 10 年前左右,华为是唯一一个加入该组织的中国企业。

从去年开始,OB就开始在国内宣传TPC-C的成绩了,我这牛劲上来了就挡也挡不住,再查了下,原来伟大的企业阿里巴巴也成为TPC的成员了。

但是相比华为这么多年的低调,阿里这刚加入组织就这样敲锣打鼓的,不知道是壮胆还是真的因为是性格问题?要海爷总结,那就是两个因素都有!要我分析原因?不,就不!不说就是黑阿里?黑OB?不,这天下绝对没有任何人或任何组织是可以黑我们超越时代的伟大企业和伟大的OB产品的。 再来看看什么是TPC-C? 1992年代初发布的TPC-C是用来评估OLTP的Benchmark , TPC-C包含五个OLTP事务的测试程序,基本模拟了一个真实的销售流程,五个测试程序有:新增订单,付款,发货,订单状态,库存级别。 TPC-C自2012年2月10日由Oracle问鼎后一直无人能够挑战,原因是这玩意烧钱还没啥意义。直到7年后的2019年10月初,伟大的阿里OB来了,带着足够多的钱和资源来了,果然,一测之下,飙升到第一了!毕竟那五个测试的程序的场景训练,早已提前拿马爸爸身后的亿万女人练过手了。一套游戏规则玩熟练了后就停不下了,心里肯定想:这个时候,这个世界环境,我再刷个第一的数据,那肯定是“为国争光”啊!5月20日,中国人这么吉利的日子,果然 “二度刷新TPC-C基准测试 支付宝OceanBase树立数据库新标杆” 了。只是,几乎在同一时间,5月22日,华为以及30几家中国科技企业被美国商务部宣布进入贸易“实体名单”。真的是前后只隔3天哦!感觉它们两似乎是商量好的一样,都说川建国同志脑回路奇特,海爷也确实体会到了,不直接禁了世界第一牛逼的公司,却要腾出手去搞中国那30几个大大小小的公司, 川建国同志 ,您这是何苦啊!何必啊!

单手打字到这,海爷自己也激动了,再喝口酒吃口黄瓜,还得往回收收,毕竟自己曾经是个喜欢执拗较真做技术的挨踢人。

继续查,发现其实除了 TPC - C 的测试,还有个 TPC - E 的标准测试, 2007 年, TPC 发布了 OLTP 测试新标准 TPC - E ,目的在于替代原有的 TPC - C 。 TPC - E 在测试模型上进行了巨大的革新与改进,很多企业都已经把 TPC - E 基准作为数据库采购的新标准。跟 TPC - C 相比, TPC - E 更复杂,它模拟证券经纪公司而不是批发商的流量和交易模式,从 C / S 架构过渡到 B / S 架构,事务类型从原来的 5 种增加到 12 种,数据表由原来的 9 个增加到了 33 个,数据库构成更加复杂,也更加符合实际应用,当然对服务器的性能要求也更高了。 TPC - E 评测的不仅仅服务器硬件性能,而是整体方案的性能,这个方案包括服务器、存储、 OS 、数据库、客户端等软硬件在内的一整套系统。

原来真正的王者是 TPC - E ,继续看介绍: TPC 组织之所以要用 TPC - E 取代 TPC - C ,主要原因有两点:一是 TPC - C 的模型已经使用了十多年,而当今无论是软硬件技术,还是实际应用环境都发生了巨大改变,所以必须对原有模型进行更新;二是过去厂商参加 TPC - C ,需要搭建宠大的软硬件环境,成本非常高,导致一般的小型服务器厂商无法参加。这下,海爷终于明白了: OB 原来是拿着大钱(估计得拿人民币换成美金吧?),用着过时的技术,来向国人展示“傲人”的成绩。

TPC - C 和 TPC - E 存有很大的差别。在 TPC - C 中,最常见的两种调用是新订单和付款。新订单大约有 11 行数据,可执行选择、更新和插入等操作,每个 新订单包含 10 列字段。付款由 3 行更新和 1 次插入组成。 TPC 最重头的部分也就是对数据表的插入和更新。在 TPC - C 中,只有一次组合查询。而在 TPC - E 中,除了一般的操作外,还包含了多表连接查询,更加复杂。 TPC - E 的主要指标是 tpsE ( 指系统在执行多种交易时,每秒钟可以处理多少交易),而 TPC - C 的指标 tpmC 是以分钟为单位,果然还是王者和青铜的差别。

最后,海爷终于明白了一个道理: OB 原来不是真的分布式数据库,最起码不是能够经过实际金融核心业务验证的分布式数据库。

大家说,海爷说的对不对?

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

3

添加新评论4 条评论

sunnyit1022345sunnyit1022345yyu
2020-06-06 11:06
而在 TPC - E 中,除了一般的操作外,还包含了多表连接查询,更加复杂。 TPC - E 的主要指标是 tpsE ( 指系统在执行多种交易时,每秒钟可以处理多少交易),这种场景,阿里应该也拿手吧。
xiamx_ksrcbxiamx_ksrcbdba某农商行
2020-06-05 14:25
OB基于高内存进行计算的架构,直接规避了IO存储的问题, 读写速度比传统数据库快是必然的。好比别人都在跑步,你直接坐上骑上了小摩的。我并不想说骑小摩的不好,但骑小摩的还要各种吹嘘还是让人觉得有些不爽。希望ob团队能够在数据库稳定性上多下苦工,少整这些花哨的测试。
GoldenDBGoldenDB产品经理中兴通讯
2020-06-05 08:04
作秀也是很重要的,好酒也怕巷子深,不然你就是做出了成绩别人未必清楚,这一点要多向阿里学习!

海爷@GoldenDB 秀可以,但不能作啊。一作就过了。

2020-06-05 09:21
汉堡汉堡数据库分析架构中国移动
2020-06-04 23:35
难道除了堆机器,OB没有其他展示自己技术能力的方式了?高调当然可以,但是希望它能在真正的核心技术方面能有展示吧,不然总是这样悬空着,很不好。给人很不踏实的感觉。
Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广