四个主要的研究方向:Hardware,Scalability,Deployment,DataModel
硬件
SMP,NUMA
In-memory Index(New Index)
NVM/PM(Persistent Memory):Intel XPoint
RDMA(Remote DMA)
分布式
数据分区(Data Partition)
如何均匀切分:
启发式方法
机器学习方法
share-disk versus share-nothing
分布式事务(Distributed Transaction)
GTM(全局事务管理)
如何定义逻辑时钟、解决时钟漂移问题,从而进行 MVCC
google truetime clock
分布式查询优化(Distributed Optimizer)
CBO 在多点间评估、规划,Learned CBO。
高可用(High Availability)
high-level approaches:
hardware redundancy
software replica(multi-alive)
部署
Auraro Features:存算分离,log-as-data(用户只用写 log 不用写 page)等。
Autonomous Database:AI4DB、self-driving
Security & Privacy
数据模型
NoSQL、OLAP、Graph、Time-series
阿里李飞飞报告摘要
数据库系统为什么重要?数据库连接底层存储与上层应用,数据库是处理、存放和消费数据的中心。
云原生落到数据库这里主要有两点特性:资源池化(磁盘、CPU、内存)与资源解耦(存算节点分离、弹性能力)
报告主要介绍阿里的两款系统:PolarDB 与 AnalyticDB
PolarDB 特性
share-disk (serveless storage)
基于 RDMA 传输,改造的 ParallelRaft 共识协议
Active-Active 工作,读写分离
PolarDB 对标 Amazon Aurora
AnalyticDB 特性
用数据库的方法解决大数据的问题。
SDDP(Self-Driving Database Platform)