一、前言
最近TiDB阿里云推出,经过一段时间的测试,对TiDB阿里云一些使用感受和一些可完善的地方。
TiDB通过和阿里云的深度集成,实现了数据库集群的分钟级初始化、扩容,可以让用户既获得TiDB的优秀软件体验、云环境下部署实践、原厂级服务保障,又能够充分的利用到云计算天然具备的弹性、稳定性和开箱即用。
二、阿里云TiDB数据库架构

三、阿里云TiDB数据库试用申请流程
注册阿里云账号并登录,推荐服务里面搜索tidb即可看到云数据库TiDB免费试用或购买使用

试用集群名默认为tidb-prod,TiDB v6.5.0的版本,暂不可修改。

试用分别最大可申请5个tidb、pd、tikv节点,建议:可添加Tiflash节点部署

支持负载均衡,各个节点系统盘最大可申请到500G硬盘

四、云数据库使用感受
1)部署过程
整个部署过程还是挺快的,只需要10分钟左右,省去了一些部署过程中介质的下载上传以及一系列的tiup部署流程,部署过程中还会有相应的部署日志,对部署的可视化

2)概览信息
概览页面有基本的集群相关信息,如:
1.负载均衡EIP的IP地址端口
2.TIDB登录的IP地址端口
3.Dashboard监控的地址
4.Grafana监控地址
5.TiDB版本信息等

#问题建议:可添加一个对实时集群的概览信息,比如扩容之后,还可以展示现在集群有多少个TiDB、PD、TiKV、TiFlash以及TiCDC、Pump、Drainer等节点基本信息

3)资源信息
我们平时主要通过资源界面进行对TiDB、PD、TiKV、以及tiup控制节点进行远程连接和执行命令,还可以进行健康诊断
资源下可选择ECS实例、SLB实例、RDS实例,还可查看3天、7天、15天天内即将到期的机器,方便我们实时观察并继续续费使用,也可进行搜索某台实例进行操作,如:启动、停止、重启、资源分配等

ECS实例中ControlServer安装了tiup运维工具以及AlertManager、Prometheus、Grafana等监控和报警组件,进行远程连接后,默认登录的是ecs-assist-user用户,如果需要使用tiup命令行进行对TiDB集群进行管理的话需要切换到root用户,密码为申请时候填写的ECS登录密码。在这里使用tiup的命令和本地部署的完全一样,详细命令可查看

ECS实例中ControlServer默认安装了mysql客户端,可直接进行命令行登录,操作TiDB数据库
平时一些运维管理操作也可直接通过tiup进行命令操作,如:扩缩容,集群启停,配置集群参数,重新加载集群等一系列常规操作

4)监控相关信息
监控页面可监控到云服务器ECS、弹性公网IP、负载均衡等相关信息,如:cpu、内存、平均负载等

Dashboard监控账号为root,密码为申请时候填写的登录密码
Grafana监控账号为admin,密码为admin

#问题建议:
点击查看监控和查看告警没能跳转过去

5)运维管理
运维管理页面可以进行平时节点扩缩容,实例启动、停止、重启,硬盘扩容等常规操作


#问题建议:
1.tiup命令行扩缩容和界面扩缩容的信息存在不同步想象,比如:tiup命令进行缩容单个节点,页面还能看到对应节点运行中状态。
2.可添加一些新的节点,如:PD,TiCDC,Pump、drainer等节点的扩缩容
6)性能测试
sysbench 压测oltp_update_index 100并发
TPS、QPS :7785.28
max Latency:863.84ms

sysbench 压测oltp_update_index 300并发
TPS、QPS :7507.48
max Latency:27766.36ms(延迟较高)

sysbench 压测oltp_update_index 500并发
TPS、QPS :7254.20
max Latency:110196.56ms

sysbench 压测oltp_update_index 1000并发
会出现断连的现象,估计是延迟过高导致的

7)删除服务实例

问题建议:删除实例后可设置回收站保留一段时间,防止误删