理解 N+1 查询问题及 Hibernate 的优化方法

在开发过程中，尤其是使用 ORM（对象关系映射）框架如 Hibernate 时，我们常常会遇到一个性能陷阱：N+1 查询问题。它会实实在在会让你的应用跑得像蜗牛一样慢。今天我们就来好好聊聊，什么是 N+1 查询问题，以及 Hibernate 是如何帮我们避免踩坑的。

什么是 N+1 查询问题？

简单来说，N+1 查询问题出现在你查询一组数据时，ORM 框架先执行 1 次查询拿到主对象集合（比如查询所有用户），然后对每一个主对象，再分别执行 1 次查询去加载它们关联的数据（比如每个用户的订单列表）。如果你有 100 个用户，那总共就执行了 1+100=101 次查询。

举个例子，假设你有一个 User 和 Order 的一对多关系。代码大概长这样：

List<User> users = session.createQuery("from User", User.class).list();
for (User user : users) {
    System.out.println(user.getOrders().size());
}

看似很平常，但实际上 Hibernate 会先查一次所有用户，然后对每个用户单独再查一次订单。小规模还好，一旦用户量大了，数据库直接爆炸，系统性能直线下降。

Hibernate 提供了几种方法来优雅地解决这个问题：

最常见也最有效的办法就是使用 JPQL 或 HQL 的 fetch join，一次性把需要的数据全部查询出来。

List<User> users = session.createQuery(
    "select u from User u left join fetch u.orders", User.class
).list();

这样 Hibernate 会生成一条带连接的 SQL，把用户和他们的订单一次性查完，极大减少了查询次数。

如果因为某些原因不能用 fetch join（比如分页），Hibernate 还支持批量抓取。通过设置批量大小，让 Hibernate 一次性查询一批对象的关联数据。

在实体上加配置，比如：

@BatchSize(size = 10)
private Set<Order> orders;

这样 Hibernate 会把每 10 个用户的订单一起查询，虽然不是一条查询，但也大大减少了 SQL 的数量。

Hibernate 的二级缓存可以缓存实体对象，包括关联关系。如果用户对象或订单对象已经缓存了，下次访问就不用查数据库了。虽然二级缓存不直接解决 N+1，但能从另一角度减少查询压力。

当然，使用二级缓存需要谨慎设计，避免脏数据问题。

还有一种比较冷门但有时很好用的方法：子查询抓取（Subselect Fetch）。Hibernate 可以在第一次查询后，用一个子查询一次性把所有关联对象拿回来。

比如：

@Fetch(FetchMode.SUBSELECT)
private Set<Order> orders;

适合在一次性加载大量数据时使用，能一定程度减少查询数量。

N+1 查询问题在实际开发中应该避免，不然随着数据增多系统会越来越慢。

浏览量: 318