点赞系统怎么设计：从校招场景题到高并发架构的完整拆解

开篇：为什么点赞系统，成了社交平台的“生死线”？

各位校招的同学注意了——如果你面试时被问到“如何设计点赞系统”，可千万别以为这是个简单的CRUD题。要知道，点赞按钮虽小，却是用户交互的“最后一公里”。数据显示，当点赞响应超过3秒，用户流失率会飙升40%；而在明星塌房、世界杯进球这类流量峰值时刻，百万级并发点赞如果处理不好，直接会让服务器“原地爆炸”。

普通点赞和高并发点赞的技术难度，简直是自行车和F1赛车的区别。比如你给朋友圈好友点个赞，背后可能就是一条SQL插入；但如果是周杰伦新歌发布，100万粉丝同时点赞，这背后需要一整套高可用、高并发、高一致的架构支撑。今天牛哥就带大家从需求拆解到架构落地，一步步搞懂点赞系统的设计思路，以后面试再遇到这类题，保证你能说得头头是道。

先想清楚：高并发点赞系统要满足哪些“硬需求”？

校招面试时，面试官往往会先看你“会不会审题”。拿到“设计点赞系统”这个题，第一步不是急着说技术选型，而是明确核心需求和约束条件。记住，任何系统设计都是“需求驱动”的，点赞系统至少要满足这四个“非妥协”要求：

快！响应延迟必须“毫秒级”

用户点击点赞按钮后，界面必须立即反馈（比如按钮变色），后端处理延迟要控制在500ms以内。超过这个时间，用户会以为没点上，可能会重复点击，反而增加系统压力。这就要求我们必须把热点数据放在内存里，不能每次都查数据库。

准！数据一致性不能“差之毫厘”

10万用户点赞，最终统计结果必须是10万，不能多也不能少。尤其是“点赞-取消点赞”这类高频操作，要避免并发场景下的重复计数或漏计数。比如用户快速双击点赞，系统要能识别这是“点赞→取消”，而不是“点赞两次”。

稳！流量洪峰下“屹立不倒”

像微博热搜事件、直播带货秒杀，点赞请求可能在几秒内从每秒几千飙升到几十万。这种“潮汐式流量”下，系统不能崩，更不能丢数据。这就需要流量削峰和过载保护机制，不能让前端请求直接“冲垮”数据库。

省！存储成本要“精打细算”

一个千万级用户的社交平台，每条内容都有点赞记录，累计下来可能是数十亿条数据。如果全存在关系型数据库，不仅查询慢，存储成本也会很高。所以需要冷热数据分离，只把热点数据放在贵的存储里，冷数据归档到低成本介质。

技术选型：这3个“核心工具”缺一不可

需求明确后，下一步就是技术选型。面试时，面试官会通过你的选型思路，判断你是否“懂业务”“知取舍”。点赞系统的技术栈不是拍脑袋选的，而是根据前面说的“快、准、稳、省”需求来的，核心就三个工具：

Redis：内存数据库的“性能担当”

为什么Redis是点赞系统的首选？因为它有两个“杀手锏”：内存存储和原子操作。点赞是高频读（查点赞数、查是否点赞）高频写（点赞/取消点赞）场景，Redis的读写性能能到每秒10万+，比数据库快100倍以上。

具体用Redis的什么结构？主要两种：

Hash：存“内容-用户”的点赞关系，比如like:post:1001 {userId1:1, userId2:1}，1表示已点赞，查某个用户是否点赞只需HGET like:post:1001 userId1，O(1)复杂度。
String/Set：存内容的点赞数，比如like_count:post:1001 "520"，用INCR/DECR原子操作更新计数，避免并发问题。

面试官可能追问：“为什么不用ZSet？” 这里要注意，ZSet适合排序场景（比如按点赞时间排序），但点赞系统主要是“是否点赞”和“计数”，Hash和String足够了，用ZSet反而浪费空间。这就是“合适的技术用在合适的场景”。

消息队列：流量削峰的“缓冲带”

高并发下，点赞请求不能直接打到数据库——就像暴雨天，直接让雨水进下水道会淹掉，需要先经过“蓄水池”。消息队列（Kafka/RabbitMQ）就是这个“蓄水池”，它能异步化处理写请求：用户点赞后，先写Redis，再发个消息到队列，后台线程慢慢消费消息同步到数据库。

为什么要异步？因为数据库的写入性能是瓶颈（每秒几千），而消息队列能扛每秒几十万的写入，等峰值过去后，再慢慢把数据刷到数据库。这样既保证了前端响应快，又保护了数据库。

这里面试官可能会问：“消息队列丢消息怎么办？” 好的回答要提到“消息持久化”（Kafka默认持久化）、“生产者重试”和“消费确认机制”，说明你考虑过数据可靠性问题。差的回答是“不会丢消息”，太绝对，显得没经验。

MySQL：数据持久化的“安全锁”

Redis虽然快，但它是内存数据库，万一宕机数据可能丢失（虽然有RDB/AOF，但恢复需要时间）。所以最终的点赞记录必须存在MySQL里，这是数据的“最终一致性”保障。

MySQL里怎么存？至少需要两张表：

like_relation：存用户和内容的点赞关系（user_id, post_id, create_time），唯一索引(user_id, post_id)避免重复点赞。
like_count：存内容的点赞总数（post_id, count），可以和内容表合并，减少联表查询。

架构拆解：高并发点赞系统的“四层逻辑”

技术选型确定后，就可以搭架构了。好的架构就像“多层防护网”，能层层拦截流量、处理逻辑、保障稳定。点赞系统建议按这四层设计，数据流向清晰，职责分明：

前端层：用户体验的“第一关”

前端不能等后端响应了才更新界面——用户点击点赞后，应该立即本地更新UI（比如按钮变红、数字+1），再异步发请求给后端。这样用户感觉“很快”，即使后端稍有延迟，也不影响体验。

同时，前端要做防抖处理：用户快速点击时，只发最后一次请求（比如300ms内多次点击算一次），减少无效请求。这是“从源头减少流量”的关键。

服务层：逻辑处理的“中央枢纽”

前端请求先经过接口网关（比如Spring Cloud Gateway），做限流、路由，然后到点赞服务。服务层要处理核心逻辑：

判断用户是否已点赞：查Redis的点赞状态，如果已点赞则执行“取消点赞”，否则执行“点赞”。
幂等性校验：用请求ID或user_id+post_id做幂等，避免重复处理（比如网络重试导致的重复请求）。
权限校验：比如未登录用户不能点赞，避免刷赞。

缓存层：高频访问的“加速引擎”

服务层处理完逻辑后，核心操作都在Redis：

点赞状态：用Hash结构like:post:{postId}存用户ID和点赞状态（1=点赞，0=取消），比如HSET like:post:1001 2001 1表示用户2001点赞了内容1001。
点赞计数：用String结构like_count:post:{postId}存总数，点赞时INCR，取消时DECR，都是原子操作，不怕并发。

为什么不用数据库存状态和计数？因为数据库的行锁会导致并发更新阻塞，而Redis的单线程模型+原子操作，天然适合处理这类高频计数场景。

持久层：数据落地的“异步管道”

缓存更新后，不能忘了同步到数据库。但同步不能阻塞前端请求，所以用消息队列异步处理：服务层更新Redis后，发一条消息（比如“用户2001点赞了内容1001”）到Kafka，然后立即返回给前端。

后台启动一个消费者服务，从Kafka拉取消息，批量写入MySQL：

写like_relation表：如果是点赞，插入记录；如果是取消，删除记录。
更like_count表：更新对应内容的点赞数（可以批量累加，减少SQL次数）。

这里面试官可能追问：“缓存和数据库同步，怎么保证最终一致？” 好的回答要提到“先更缓存，再发消息”“消费端重试机制”，以及“定时对账任务”（定期用数据库数据校准Redis计数），说明你考虑过数据一致性问题。

关键细节：这些“坑”踩过才懂

架构搭好后，就到“填坑”环节了。校招面试时，面试官往往通过这些“细节问题”判断你是否有“工程思维”——知道理论是一回事，能落地是另一回事。点赞系统有几个经典的“坑”，必须提前规避：

Redis用Hash还是Set存点赞状态？

前面提到用Hash存状态，但其实Set也能存（比如SADD like:post:1001 2001），两者各有优劣：

Hash适合需要额外信息的场景：比如存点赞时间、点赞设备，HSET like:post:1001 2001 "2023-10-01:mobile"。
Set适合只需要判断“是否存在”的场景：SISMEMBER like:post:1001 2001比HEXISTS稍快，且节省空间（Hash会存field和value，Set只存member）。

面试时要说明“根据业务需求选”：如果产品需要显示“谁点赞了”，Set更合适（SMEMBERS取所有用户）；如果需要更多上下文，用Hash。

Lua脚本：并发操作的“原子性保障”

用户点赞时，需要“查状态→更计数→更状态”三个操作，这三个操作必须是原子的，否则可能出现并发问题。比如两个线程同时查状态都是“未点赞”，都执行了+1，导致多计数。

怎么保证原子性？用Redis的Lua脚本，把多个命令打包成一个脚本执行，Redis会单线程执行脚本，中间不会被打断：

-- 点赞脚本：如果用户未点赞，则计数+1，记录状态
if redis.call('HEXISTS', KEYS[1], ARGV[1]) == 0 then
    redis.call('HSET', KEYS[1], ARGV[1], 1)
    redis.call('INCR', KEYS[2])
    return 1
end
return 0

KEYS[1]是点赞状态Hash的key，KEYS[2]是点赞计数的key，ARGV[1]是用户ID。这样一次调用就能完成所有操作，避免并发问题。

缓存过期：点赞数的“更新策略”

Redis缓存不能永久有效，需要设置过期时间，但点赞数是“热点数据”，过期了怎么办？直接删除会导致“缓存穿透”（大量请求查数据库），所以建议定期更新+主动刷新结合：

主动刷新：用户点赞/取消时，直接更新Redis，保证最新。
定期更新：后台线程每隔一段时间（比如5分钟），从数据库拉取热门内容的点赞数，刷新Redis（防Redis宕机后数据丢失）。
缓存预热：新内容发布后，主动在Redis初始化点赞计数为0，避免第一次访问缓存miss。

优化技巧：从“能用”到“好用”的3个升级

基础架构跑通后，就该考虑“优化”了。面试时，能说出这些优化点，说明你有“追求极致”的思维。点赞系统可以从这三个方向进一步提升性能和可靠性：

分级缓存：本地缓存+Redis的“双重加速”

如果某条内容特别火（比如百万点赞），所有请求都打到Redis，Redis也可能成为瓶颈。这时可以在服务层加一层本地缓存（Caffeine/Guava），缓存热门内容的点赞数，有效期设短一点（比如10秒）。

这样，大部分请求在服务层本地就能返回，不用每次都查Redis。但要注意缓存一致性：本地缓存更新不及时可能导致不同服务实例的数据不一致，适合对一致性要求不高的场景（比如点赞数允许短暂误差）。

读写分离：MySQL的“压力分流”

即使有了Redis和消息队列，MySQL的读请求可能还是不少（比如后台统计、数据分析）。这时可以用MySQL的主从复制：主库负责写（消息队列同步的点赞记录），从库负责读（查询历史点赞记录），分散读压力。

如果数据量太大，还可以分库分表：按post_id哈希分表，把不同内容的点赞记录分到不同表，避免单表数据量过大导致的查询缓慢。

限流熔断：流量洪峰的“安全阀”

极端情况下，比如系统刚恢复，大量缓存失效，所有请求同时涌到数据库，可能导致“雪崩”。这时需要限流熔断：

限流：用令牌桶算法限制每秒的请求数（比如10万/秒），超过的请求直接返回“系统繁忙”，引导用户稍后重试。
熔断：如果数据库压力过大（比如连接数满了），暂时停止同步数据到数据库，把消息先存在队列里，等数据库恢复后再消费。

先定义问题：明确场景的核心功能（点赞/取消）和用户规模（百万/千万级）。
再拆解需求：从用户体验（快）、数据质量（准）、系统可靠性（稳）、成本（省）四个维度列约束。
然后选技术：根据需求选最适合的工具（Redis快、消息队列异步、MySQL持久化）。
最后搭架构：分层设计，明确每层职责，考虑流量、数据、一致性问题。

记住，校招面试更看重“思路”而非“背诵”。当面试官问“如何设计XX系统”时，先别急着说技术名词，而是从需求出发，一步步推导，说出每个决策的“为什么”，这样才能让面试官觉得“这小子有潜力”。

最后送大家一句话：系统设计没有银弹，只有权衡。真正优秀的工程师，是能在需求、成本、性能、可靠性之间找到最佳平衡点的人。加油，校招路上，技术深度和思维能力同样重要！

学习交流

如果你在编程面试、技术提升的路上苦苦摸索，别错过牛哥的公众号牛牛码特，定期更新系列知识，帮你精准攻克面试难关。点个关注👆，优质内容不错过!

关注牛哥公众号：牛牛码特，回复：1，即可获得秋招大礼包

面经统计表/Java Top100面试题/秋招企业投递表

点赞系统怎么设计：从校招场景题到高并发架构的完整拆解

点赞系统怎么设计：从校招场景题到高并发架构的完整拆解

开篇：为什么点赞系统，成了社交平台的“生死线”？

先想清楚：高并发点赞系统要满足哪些“硬需求”？

快！响应延迟必须“毫秒级”

准！数据一致性不能“差之毫厘”

稳！流量洪峰下“屹立不倒”

省！存储成本要“精打细算”

技术选型：这3个“核心工具”缺一不可

Redis：内存数据库的“性能担当”

消息队列：流量削峰的“缓冲带”

MySQL：数据持久化的“安全锁”

架构拆解：高并发点赞系统的“四层逻辑”

前端层：用户体验的“第一关”

服务层：逻辑处理的“中央枢纽”

缓存层：高频访问的“加速引擎”

持久层：数据落地的“异步管道”

关键细节：这些“坑”踩过才懂

Redis用Hash还是Set存点赞状态？

Lua脚本：并发操作的“原子性保障”

缓存过期：点赞数的“更新策略”

优化技巧：从“能用”到“好用”的3个升级

分级缓存：本地缓存+Redis的“双重加速”

读写分离：MySQL的“压力分流”

限流熔断：流量洪峰的“安全阀”

扩展思考：技术选型的“权衡艺术”

为什么不用ZSet存点赞用户？

本地缓存和Redis的一致性怎么保证？

如何设计“点赞排行榜”？

总结：场景题分析的“万能思路”