语雀为什么崩了?

王福强

2023-10-23


截至目前,还没有一个正式的说法,但我们可以从零星的信息中挖掘出一些潜在的可能性。

系统层面

一开始的访问返回页面是没有的,只有浏览器端给出的网络层面的信号,所以,直觉上会让人觉得是不是DNS的问题,甚至有人谣传域名过期,但其实查一下公开记录,yuque的域名得到2024年才会过期,所以DNS层面的问题排除。

那下一步就是直接打到流量接入层,这一层在一开始肯定是挂了的,因为第二阶段发挥的页面是nginx的502状态码页面,这意味着,流量接入层的SLB已经恢复,nginx作为reverse proxy也已经恢复,但后端的应用没有恢复。

至此,基本上可以确认是整个语雀的应用挂掉了,而且从前端到服务到数据库,有可能都受到影响,但服务和数据看不一定有问题,前端应用一定是挂了,否则,不会卡在502这么长时间而恢复不了。

至于用户会担心数据安全,这个,按照福强老师从业20+年的经验来说,问题应该不大,有点儿分布式系统设计常识的,应该不会犯这种致命错误。

人与组织层面

据说语雀的负责人离职跑字节了(我没有考证,纯粹听说),那有没有可能是整个产品和技术团队塌方式崩塌? 但翻脸应该也不至于这么无底线吧,就算产品打算停掉不做了,也总得给用户备份留个时间窗口吧? 希望不是这种原因。

但人层面的影响通常是比较大的,尤其是负责人这个层面, 先不说能力是在人身上,这日常运营和流程也都得人去跟,前阵子还看到说某个公司的ERU(应该是Emergency Response Unit,应急小组的意思)就剩下2个人,其实多少也反映了裁员大潮下,日常运营和流程会受到什么样的影响了。

趋势层面

我在《坑获》里提到一个概念叫“雪锦霜花定律”,其实就是事态的发展“要么雪上加霜,要么锦上添花”, 而现在经济L型与公司都裁员保命的趋势下,雪上加霜的事儿肯定是少不了了。

希望语雀的这次事件不是雪崩的第一朵雪花,阿门…


>>>>>> 更多阅读 <<<<<<

「为AI疯狂」星球上,扶墙老师正在和朋友们讨论有趣的AI话题,你要不要⼀起来呀?^-^
这里

  1. 不但有及时新鲜的AI资讯和深度探讨
  2. 还分享AI工具、产品方法和商业机会
  3. 更有体系化精品付费内容等着你,加入星球(https://t.zsxq.com/0dI3ZA0sL) 即可免费领取。(加入之后一定记得看置顶消息呀!)

知识星球二维码

存量的时代,省钱就是赚钱。
在增量的时代,省钱其实是亏钱。
避坑儿是省钱的一种形式,更是真正聪明人的选择!
弯路虽然也是路,但还是能少走就少走,背后都是高昂的试错成本。
订阅「福报」,少踩坑,少走弯路,多走一步,就是不一样的胜率!

订阅「福报Premium订阅」