四个主要的研究方向:Hardware,Scalability,Deployment,DataModel

硬件

SMP,NUMA

In-memory Index(New Index)

NVM/PM(Persistent Memory):Intel XPoint

RDMA(Remote DMA)

分布式

数据分区(Data Partition)

如何均匀切分:

启发式方法
机器学习方法

share-disk versus share-nothing

分布式事务(Distributed Transaction)

GTM(全局事务管理)

如何定义逻辑时钟、解决时钟漂移问题,从而进行 MVCC

google truetime clock

分布式查询优化(Distributed Optimizer)

CBO 在多点间评估、规划,Learned CBO。

高可用(High Availability)

high-level approaches:

hardware redundancy
software replica(multi-alive)

部署

Auraro Features:存算分离,log-as-data(用户只用写 log 不用写 page)等。

Autonomous Database:AI4DB、self-driving

Security & Privacy

数据模型

NoSQL、OLAP、Graph、Time-series

阿里李飞飞报告摘要

数据库系统为什么重要?数据库连接底层存储与上层应用,数据库是处理、存放和消费数据的中心。

云原生落到数据库这里主要有两点特性:资源池化(磁盘、CPU、内存)与资源解耦(存算节点分离、弹性能力)

报告主要介绍阿里的两款系统:PolarDB 与 AnalyticDB

PolarDB 特性

share-disk (serveless storage)
基于 RDMA 传输,改造的 ParallelRaft 共识协议
Active-Active 工作,读写分离

PolarDB 对标 Amazon Aurora

AnalyticDB 特性

用数据库的方法解决大数据的问题。

SDDP(Self-Driving Database Platform)