每一张机票、酒店的订单都有两面,一面是人们对于诗和远方的美好期待,一面是对OTA(在线旅游Oline Travel Agency)平台体验平滑能力的考验。


(资料图片仅供参考)

尤其是每逢节假日来临之时,面对数以亿计的骤增流量,OTA平台压力倍增。以今年五一为例,文化和旅游部公布的数据显示,国内旅游人数共计2.74亿人次,也意味着平均每5个人中就有一个人在旅行。据去哪儿的数据显示,热门线路火车票平均40s被抢空,售罄速度超过春运。OTA平台去哪儿技术副总裁孙斌表示:“五一放假前的4月27日、28日左右,去哪儿平台同时在线购买火车票人数达到历史新高,热门城市酒店的预订量也达到了疫情前1.9倍,热门城市的机票预订量超过疫情前1.5倍。”

疫情三年,OTA平台几乎处于“放假”状态,当突然面临用户爆发式激增,服务器承载能力是否跟得上?上下数据回传时能否不卡顿、不宕机?前台用户能否像以前一样保持“丝滑”体验?

“在此之前,我们已经预料到,这将是疫情开放以后最‘疯狂’的一次五一,也已做好了充分的压力测试准备。”去哪儿技术副总裁孙斌表示。这轻描淡写背后,是去哪儿和华为云为期五个月的备战。

事实上,这不仅仅是为五一波峰准备,对去哪儿而言,更像是对业务和技术配合度的一次测试,决定了在行业持续复苏背景下,未来是否能以云上的创新竞争力,接住更大的机遇与挑战。

技术为“魂”,三次迭代

“技术力”是去哪儿贯穿始终的核心。这样的思路下,坚持以技术解决产品问题、以技术解决业务增长问题,用技术穿越发展新周期,通过一系列技术升级的关键动作,赋能业务,去哪儿实现了一次又一次跨越式增长。

2005年,一家以搜索为核心,实现线上比价机票和酒店的网站成立了,它的名字叫“去哪儿”,去哪儿创业之初就找到了自己的定位:“低价机票+年轻客群”。

这一年具有跨时代的特殊意义,中国网民数量首次突破一亿,成为仅次于美国的互联网第二大国,也意味着中国互联网迎来了爆发时代。去哪儿上线3个月内,独立用户每两周访问量以超过50%的速度增长,2007年10月访问量突破1200万,2008年突破2400万。

在用户激增的势头之下,去哪儿做出了第一个关键动作——上线了TTS(Total Solution)系统。

系统从根源上解决了用户登陆多个机票供应商网站注册的痛点,和机票供应商订票不出票、临时加价、黑票频出、退改流程繁琐等致命问题。2010年系统一经上线,部分机票供应商单日出票量达到3000-4000张,人工成本却直线下降了2/3。乘势而上,去哪儿决定对机票供应商实施CPC点击收费,当年就实现了盈利。

第二个关键动作,是快速完成PC向移动端迁徙。

2010年App Store 进入中国,随着智能手机的发展,互联网圈开启了一场PC端向移动端迁移的用户抢夺战,拼的是速度。同年10月,移动端的去哪儿旅行APP上线。

移动端一路“狂飙”,直接将这个创业8年的公司送进了纳斯达克。具体来看,机票方面,2011-2013年日均出票量从26000涨到74000张,截止到2013年,机票业务占整体业务的70%;酒店方面同步加速发力,据艾瑞咨询数据报道,截至2013年6月,去哪儿一跃成为酒店在线预订领域内的流量第一大入口。在当时,中国有30多万间酒店,其中70%以上是由小商户掌握,对平台方来说挖掘价值潜力巨大,因为酒店业务的利润比机票业务高得多。

捷报接连传来,2013年6月,去哪儿移动端下载量也突破一亿次,成为当时在线旅游行业移动下载量最高的企业,并保持领先地位至今。技术解决增长,在去哪儿面前体现的淋漓尽致。

“狂飙”之后,2022年去哪儿决定为自己“瘦身”,提出业务瘦身42%+和效率提升50%的计划,这是它的第三次迭代,即,用技术力降本增效。

一方面是因为企业在长期发展过程中,公司组织架构和人员流动非常大,导致目前开发者们维护的系统大多是交接过来的,对于系统全貌掌控力有限。

另一方面是,此前系统之间的耦合严重,模块系统彼此关联复杂,系统越来越冗杂,随即导致修改一个小的产品需求、回溯需求以及查找需要修改的功能点的工作时长都达到“天”量级,更别提修改带来的不可预知的影响。这项任务从产品、技术需求和工单问题排查等,都带来较高学习成本和开发成本。

于是去哪儿决定在不影响业务开展的前提下,边删、边拆、边改,演化式改造。当他们在专心修炼“内功”时,一次新的大考又来临了。

流量大考,弹性应对

流量大考的信号从“摘星”那一刻开始。

2022年6月29日,工信部信息通信管理局发布了一则消息:为了方便广大用户出行,即日起取消通信行程卡“星号”标记。消息一出当天冲上微博热搜,网友纷纷表示“终于可以回家了”,“终于可以尽情的出门撒欢了”。

据去哪儿数据显示,消息发布半小时后,平台上国际机票瞬时搜索量翻倍,达到过去两年以来平台国际机票搜索量最高峰。同时,酒店搜索量翻倍,火车票搜索量上涨达到1.5倍。

“瘦身”后的去哪儿能承受突如其来的流量大考吗?“这还只是开始,接下来将是春节、元旦、五一,三节紧密相连,我们也曾担心,服务器是否能承受同一时段涌入的波峰流量。”孙斌表示。

作为去哪儿的技术合作方,华为云的驻场技术团队,则在此时展现了专业而强大的技术服务能力。一方面,驻场团队可以深入了解企业运营逻辑,便于提供更符合客户运维的方案;另一方,可以及时响应客户的临时需求。

对于去哪儿来说,业务需求很明确:弹性上云、降本增效。针对这些需求,驻场的华为云技术团队持续深入去哪儿业务场景,在不修改基础架构和降低成本的基础上,基于华为云Serverless容器CCI提供的弹性上云方案,助力去哪儿“0改造”完成IDC业务的技术架构升级。

华为云云容器服务CCI,就好比内置了一个开关,在节假日等高峰时段自动“开闸”扩容,帮助去哪儿增加云上带宽、服务器、计算等资源使用,满足平台海量数据兼容、高速处理。而日常,这一“开关”则自动“关阀”,在保证去哪儿业务有序运营的同时,减少云资源的不必要浪费,满足了去哪儿对“弹性”扩容的诉求,也节省了大量固定成本投入和资源闲置,大幅降低运营成本。

另外,这一方案具有简单易用、安全快速开放兼容性强、IT开发投入低等特性,同时还在开源方案基础上形成主备加多活相结合的高可用方案。如果平台服务器等遇到了单点故障,可秒级切换备用方案,确保了去哪儿业务的稳定性和可靠性,并真正做到了“按需弹性、按秒计费”,实现弹性资源100%利用率。

在今年不仅如此,华为云的确定性运维体系也非常符合客户需要,去哪儿目前业务增长很快,同时也处于上云的关键期,通过引入华为云确定性运维能力以后,在指标体系建设、变更管理优化、故障管理优化、重保、混沌工程等领域展开合作,帮助去哪儿的业务更加稳定,有力地应对业务增长和上云。

五一黄金周到来之前,为应对可能的流量洪峰,双方合作成立了超过30人的重大保障项目组,提前3个月开始跨区域协调资源,累计为去哪儿高峰提供了充足的CCI资源。孙斌记得,在三月底的时候,去哪儿业务侧觉得资源可能还是不够,于是运维部跟华为云沟通再扩容,华为云快速响应,在四月初完成新一批资源扩容,上浮20%。

这是中国旅游业经历三年疫情后迎来的首个黄金周,业务侧也极难预估高峰业务量级,能做的就是做好充足的应对准备。

双方提前频繁进行各项子业务的压力测试,不断调试架构和时延等,每日超过五次巡检,五一假日期间持续保障,平均使用核数超过2.5万核。事实证明,这次充满不确定性的波峰大考,华为云稳稳地接住了。

从上好云到用好云、管好云,服务更多的企业在数字化的道路上更好做到“精益”与“创新”,不仅是云厂商的产品服务目标,也是千万企业发展的核心诉求。以服务力和创新力为核心,未来华为云还将继续支撑去哪儿云上创新,还将继续做好千行百业的数字化“云底座”和“使能器”。

推荐内容