近日,中国科学院深圳先进技术研究院云计算研究中心须成忠和叶可江团队联合澳门大学、阿里巴巴集团撰写的论文Characterizing Microservice Dependency and Performance: Alibaba Trace Analysis(https://doi.org/10.1145/3472883.3487003)发表于云计算领域最顶尖会议ACM Symposium on Cloud Computing (SoCC) 2021,并获得大会唯一最佳论文奖,这是SoCC创建10余年来国内团队首次获得最佳论文奖。论文第一作者是云计算中心罗树添博士生,澳门大学助理教授徐欢乐博士是共同一作。
该论文深入分析了阿里巴巴超大规模生产集群一百多亿条微服务调用数据,揭示了微服务的调用拓扑图中微服务的个数服从长尾分布,结构呈现树状,部分微服务为热点。该工作总结了三种微服务间的调用依赖关系,可以用于进一步优化微服务系统架构。该工作还首次用概率模型对微服务进行建模,并进一步进行了深入的理论分析,还开发了微服务调用链路的生成器。同时,该工作开源了100G的阿里巴巴生产集群数据。该工作的相关结论可用于优化阿里巴巴集群的微服务系统,提升集群的资源利用率和在线应用的服务质量。该论文发表一个多月以来,引起了国内外多所著名高校的广泛关注,包括国外CMU,UIUC,国内上海交通大学等,进行深入了交流,并跟踪了该工作。
图:阿里巴巴复杂微服务调用关系
论文链接:
http://cloud.siat.ac.cn/pdca/socc2021-AlibabaTraceAnalysis.pdf
阿里巴巴微服务数据集开源链接:
https://github.com/alibaba/clusterdata/tree/master/cluster-trace-microservices-v2021