2018年的双11即将到来,自2009年至今已举办十一年,交易额增长了280倍,交易峰值增长800多倍、客户咨询量呈现爆发式增长。
晓多投入这场大狂欢也有5年时光,面对服务客户的指数级增长,如何才能实现在高爆发量时稳定的客服机器人体验,这是极大挑战。
今天,我们邀请了晓多CTO黄鹏,分享晓多在技术稳定性上的保障和升级。
我们先来关注一个问题:双11对晓多的技术团队到底有哪些挑战?
1、双11当天的客流量,有数亿人在阿里网站上进行交易,晓多去年当天就接待客户440万人,是日常的5-10倍,要求必须保证自动回复的稳定性。
2、双11当天0:00-1:00存在数十倍的对话数据峰值,要求系统绝对稳定。
3、订单的多次催发、催付,每一笔订单的催发都必须保证其完整性和正确性。每一个订单都需要多个系统接口支撑。
那么,面对这些困难,我们技术团队都是如何处理的啦?
黄鹏:大家好,我是黄鹏,在技术层面,我们做了以下几部分工作:
一、基础设施升级:架构升级+带宽升级+扩容
1、为迎接流量的增长——基础架构设施做了全面升级,包括:提前扩容10-15倍,实现QPS提升10-15倍,也就是每秒处理会话量的能力。并将缓存架构从一组多备升级为分布式,缓存是后端用来存储订单等信息的,升级后提升了动态扩容的能力也提升了稳定性,并支持双11当天随着流量增加动态扩容。
2、为确保客户端的数据正常——提前排查可能存在的性能瓶颈点,将发消息能力提升了5倍。
3、为保证后端消息处理的及时性——服务器带宽升级了10倍。
4、为保证数据的完整性——提升缓存空间,避免数据丢失。
二、完备的监控系统
1、针对淘宝接口量进行动态观察,并进行实时升级准备以确保数据稳定。
2、双十一当天开发运维24小时密切关注所有环节的监控数据,对可能出现的故障隐患进行实时排查和修复。
除了我们技术团队的产品保障外,客服成功团队也将做以下安排,让大家使用中遇到任何情况都不慌乱。
Ø 实行24小时在线和电话服务,可实时沟通。
Ø 部分客户将提供驻场服务,安排相关人员现场坐镇,保障使用效果。
Ø 提前辅助商家进行人员和晓多使用的恰当安排,如需要多少台电脑、需要开启什么模式、话术如何配置等等出具相关的双11攻略。
晓多将在技术和售后客户成功团队的双重保障下陪伴你度过第六个双11,祝各位商家双11大卖。