Jackson 序列化的隐性成本

我们常以为接口的瓶颈在数据库或业务逻辑，但在高并发、海量请求下，真正吞噬 CPU 的，可能是“把对象变成 JSON”的那一步。当监控把序列化时间单独拆出来，你会惊讶它能让账单失控。这篇《The Hidden Cost of Jackson Serialization》对我启发很大：默认好用的 Jackson，在某些场景可能成为热路径的成本中心。下面顺手分享给大家参考，以下内容翻译整理自《The Hidden Cost of Jackson Serialization》。

Jackson 很强大，直到你看到它真正让你付出了什么代价。我们的 REST API 正在大把大把的花钱。每个 JSON 响应要消耗 3–5ms 的 CPU 时间。把它乘以每天 5000 万次请求，你就会得到一张能让 CTO 掉眼泪的 AWS 账单。罪魁祸首？Jackson。Java 生态里最流行的 JSON 库，那个大家几乎不假思索就会用的默认选项。

事情是怎么开始的？

我们有一个标准的 Spring Boot 微服务，很普通。

@RestController
public class UserController {
    
    @GetMapping("/users/{id}")
    public User getUser(@PathVariable Long id) {
        return userService.findById(id);
    }
}

干净、简单，跟每篇 Spring Boot 教程教你的几乎一样。

Spring Boot 默认用 Jackson 把 Java 对象转换成 JSON。你不用配置什么，它就能工作。

直到你看了指标数据。

当头棒喝

我们的监控面板显示出一些奇怪的东西：

数据库查询时间：8ms
业务逻辑：2ms
JSON 序列化：47ms

等等，什么？

实际工作只花了 10ms。把结果转换成 JSON 花了 47ms。就像你做饭用了 2 分钟，装盘却花了 10 分钟。

我以为是测量误差，于是跑了一个 profiler。

Method                          Time    Calls
-------------------------------- ------- -------
Jackson.writeValueAsString()     47ms    1
UserService.findById()           8ms     1

不是。Jackson 确实在每次请求里，用 47ms 序列化一个简单的 User 对象。

排查开始

我抓起我们的 User 实体，看了看：

@Entity
public class User {
    private Long id;
    private String email;
    private String firstName;
    private String lastName;
    
    @OneToMany(fetch = FetchType.EAGER)
    private List<Order> orders;
    
    @OneToMany(fetch = FetchType.EAGER)
    private List<Address> addresses;
    
    @ManyToMany(fetch = FetchType.EAGER)
    private List<Role> roles;
}

哦。我们把整张对象图都返回出去了。每个用户对象附带：

50+ 个订单（每个订单还有行项目）
3–4 个地址
多个角色

Jackson 在每次请求中序列化上千个对象。难怪它慢。

但关键是：我们只需要用户的基本信息。邮箱和姓名，仅此而已。

“用 DTO 就好”的论调

每个资深开发看到这，都会大喊：“用 DTO 啊！”

是的，我们本来就该从第一天起就用数据传输对象（DTO）。但我们没有。

为什么？因为 Spring Boot 返回实体太容易了。在快速迭代出功能时，你会走捷径。

这些捷径会迅速累积。

我们有 73 个 REST 接口。都直接返回 JPA 实体。把它们全部重构成 DTO 要花上几周。

我们需要一个更快的修复方式。

快速优化一：@JsonView

Jackson 有个叫 @JsonView 的特性，可以控制被序列化的字段：

public class Views {
    public static class Basic {}
    public static class Detailed {}
}

@Entity
public class User {
    @JsonView(Views.Basic.class)
    private Long id;
    
    @JsonView(Views.Basic.class)
    private String email;
    
    @JsonView(Views.Detailed.class)
    private List<Order> orders;
}

@RestController
public class UserController {
    
    @JsonView(Views.Basic.class)
    @GetMapping("/users/{id}")
    public User getUser(@PathVariable Long id) {
        return userService.findById(id);
    }
}

结果：序列化时间从 47ms 降到 12ms。

好一些，但对我们的规模仍然太慢。

快速优化二：禁用用不到的功能

Jackson 默认启用了很多特性，其中不少你并不需要：

@Configuration
public class JacksonConfig {
    
    @Bean
    public ObjectMapper objectMapper() {
        ObjectMapper mapper = new ObjectMapper();
        
        // 禁用开销较大的特性
        mapper.disable(SerializationFeature.WRITE_DATES_AS_TIMESTAMPS);
        mapper.disable(SerializationFeature.FAIL_ON_EMPTY_BEANS);
        mapper.disable(DeserializationFeature.FAIL_ON_UNKNOWN_PROPERTIES);
        
        // 启用/调整更快的行为
        mapper.disable(MapperFeature.USE_GETTERS_AS_SETTERS);
        mapper.disable(MapperFeature.AUTO_DETECT_GETTERS);
        mapper.disable(MapperFeature.AUTO_DETECT_IS_GETTERS);
        
        return mapper;
    }
}

结果：再省 3ms，降到 9ms。

真正的问题：反射

Jackson 用反射去检查你的对象、决定如何序列化。

反射很慢。非常慢。

Jackson 每次序列化一个对象时：

检查类结构（有哪些字段）
通过反射调用 getter
把值转换成 JSON 字符串
处理空值和类型转换

对于一个简单的 User 对象，这也许没问题。但当你每天要序列化复杂的对象图上千万次，这些毫秒就会变成钱。

核选项：手写序列化

如果我们……自己把 JSON 拼出来呢？

@RestController
public class UserController {
    
    @GetMapping("/users/{id}")
    public String getUser(@PathVariable Long id) {
        User user = userService.findById(id);
        
        return String.format(
            "{\"id\":%d,\"email\":\"%s\",\"firstName\":\"%s\",\"lastName\":\"%s\"}",
            user.getId(),
            user.getEmail(),
            user.getFirstName(),
            user.getLastName()
        );
    }
}

结果：0.8ms。

从 47ms 到 0.8ms，提升了 58 倍。

但是……这是不是太疯狂了？我们仿佛又回到了 1999 年的字符串拼接时代。

被忽略的争论

这里会有点争议。

A 队：手写序列化不可维护。用 Jackson + DTO 才对。
B 队：Jackson 是性能瓶颈。写自定义序列化器。

两边都对，也都不完全对。

真正的答案取决于你的规模：

如果每天请求 < 100 万

用 Jackson。开发效率值得那点性能代价。

如果每天请求 1000 万+

在热路径上考虑自定义序列化。维护成本能被 AWS 账单的节省抵消。

如果每天请求 1 亿+

你大概应该用 Protocol Buffers 或 FlatBuffers 了。

我们的实际做法

我们采用了混合方案：

对 90% 的接口仍用 Jackson（流量低、响应复杂）
对中等流量的接口使用 @JsonView（简单优化）
对 5 个关键接口编写自定义序列化器（高流量、响应简单）

这 5 个接口占了我们 80% 的流量。只优化这几个就每月给我们省了约 4200 美元的 AWS 成本。

你应该跑的基准测试

别信我的数字。用你的代码测试：

@Test
public void benchmarkSerialization() {
    ObjectMapper mapper = new ObjectMapper();
    User user = createComplexUser();
    
    long start = System.nanoTime();
    for (int i = 0; i < 10000; i++) {
        mapper.writeValueAsString(user);
    }
    long end = System.nanoTime();
    
    System.out.println("Time per serialization: " + 
        (end - start) / 10000 / 1_000 + "μs");
}

用你的真实领域对象跑。如果结果 > 100μs，那你就有问题需要关注。

有帮助的工具

JProfiler：精确展示时间花在了哪里
Spring Boot Actuator 指标：按接口统计序列化时间
JMH（Java 微基准测试框架）：更准确的性能测试
Jackson 的 @JsonView：不用大改就能有快速收益

我们犯过的常见错误

错误 1：过度信任默认
Spring Boot 的默认值更偏向开发体验，而非性能。多数应用这没问题。但在规模化场景下，默认会“害人”。
错误 2：不测量
我们的 API 跑了 8 个月，没人做过性能剖析。8 个月的冤枉钱，只因为我们以为“应该没问题”。
错误 3：直接返回实体
JPA 实体用于持久化，DTO 用于 API。混用不仅有性能问题，还会带来安全风险（不小心暴露敏感字段）。
错误 4：过早优化
问题解决后，团队有人想“把所有地方都优化一下”。这是坏主意。先优化热路径，测量，再决定是否继续。

不那么舒服的真相

Jackson 并不慢。

Jackson 正在做它被设计要做的事：在零配置的情况下，处理任意结构的 Java 对象。

这种灵活性是有代价的。反射、类型检查、空值处理、循环引用检测——这些都要时间。

问题不在 Jackson，而在“把一切都交给 Jackson”。

替代方案

如果你遇到 Jackson 的瓶颈，这里是一些选择：

Protocol Buffers（protobuf）
- 二进制格式，极快
- 需要定义 schema
- 不可读
MessagePack
- 二进制 JSON，通常比文本 JSON 快
- 很多场景可作为替代
FastJSON
- 号称比 Jackson 更快
- 但历史上有过安全问题
自定义序列化器
- 可能是最快的
- 维护成本高
好好用 DTO
- 认真点，这能解决 90% 的问题

真正的教训

你没有 Jackson 问题，你有架构问题。

如果 Jackson 慢，那是因为你序列化了太多数据。修的是数据，不是库。

用 DTO、用投影、用 @JsonView，如果需要用户自定义响应结构可以用 GraphQL。

别把责任推给 Jackson，它只是忠实地序列化了你让它序列化的庞大对象图。

行动计划

你应该这样做：

步骤 1： 加指标，跟踪序列化时间

@Around("@annotation(org.springframework.web.bind.annotation.GetMapping)")
public Object measureSerialization(ProceedingJoinPoint joinPoint) throws Throwable {
    long start = System.nanoTime();
    Object result = joinPoint.proceed();
    long serializationTime = System.nanoTime() - start;
    
    metrics.recordSerializationTime(serializationTime);
    return result;
}

步骤 2： 剖析你最热的 10 个接口

步骤 3： 若序列化时间 > 响应时间的 20%，继续调查

步骤 4： 先修最严重的几个

步骤 5： 再次测量

不要盲目优化。不要盲目相信框架。测量一切。

我预期会看到的评论

“用 gRPC/GraphQL/REST 替代就好！”
可以，如果你能重构整个 API。多数团队做不到。
“DTO 能解决所有问题！”
它能解决很多。但即便用了 DTO，如果你还在序列化巨大的列表，Jackson 仍会慢。
“手写序列化是技术债！”
50K 的 AWS 账单也是。择其轻。
“这是过早优化！”
当你每月在无谓的 CPU 周期上花 4K 美元时，就不是了。

尾声

Jackson 很好，Spring Boot 也很棒。

但“好”不代表“适用于所有规模”。

在某个时刻，你需要质疑默认值；在某个时刻，你需要测量；在某个时刻，你需要在开发效率与运行成本之间做艰难取舍。

我们在每天 5000 万请求时遇到了这个时刻。你可能更早、也可能更晚，甚至永远不会遇到。

但当你遇到时，希望你能记起这篇文章。