# MySpace 如何与 100 万个并发用户一起测试其实时站点
> 原文: [http://highscalability.com/blog/2010/3/4/how-myspace-tested-their-live-site-with-1-million-concurrent.html](http://highscalability.com/blog/2010/3/4/how-myspace-tested-their-live-site-with-1-million-concurrent.html)
这是 [SOASTA](http://www.soasta.com/) 副总裁 Dan Bartow 的嘉宾帖子,内容是他们如何使用 800 个 EC2 实例与 100 万并发用户共享 MySpace。 我认为这是一个有趣的故事,因为:用户很多,需要花费大量的精力来测试您的实时站点,而并非所有工作都能按预期进行。 我要感谢 Dan 抽出宝贵的时间写和分享这篇文章。
![](https://img.kancloud.cn/5d/53/5d53975cdffe32ba45f9ea74b8ecf5c5_240x164.png)
在 MySpace 音乐先前取得成功的基础上,MySpace 在 2009 年 12 月在新西兰掀起了新的流音乐视频产品浪潮。 这些新功能包括观看音乐视频,搜索艺术家的视频,创建收藏夹列表等等的功能。 在 MySpace 等热门网站上,此类功能的预期负载增加是巨大的,他们希望在启用这些功能之前先进行测试。
如果您管理高流量应用程序背后的基础架构,则不会感到意外。 您想了解自己的断裂点,定义容量阈值,并知道在超过这些阈值时如何应对。 用实际的预期负载水平测试生产基础架构是了解高峰流量到达时事物将如何运行的唯一方法。
对于 MySpace,目标是在其实时站点上测试另外的 100 万并发用户,以强调新的视频功能。 这里的关键词是“并发”。 不到一个小时或一天的时间……网站上同时有 100 万用户同时活动。 应当指出,一百万个虚拟用户只是 MySpace 在高峰期通常在站点上拥有的虚拟用户的一部分。 他们想用测试流量来补充实时流量,以了解新产品对整个基础架构的总体性能影响。 这需要大量的负载生成功能,而这正是云计算发挥作用的地方。 为了进行此测试,MySpace 与 SOASTA 一起使用了云作为负载生成平台。
以下是测试过程中生成的负载的详细信息。 所有数字均与虚拟用户的测试流量有关,不包括实时用户的指标:
* 100 万个并发虚拟用户
* 测试用例分为搜索和观看音乐视频,对视频进行评级,将视频添加到收藏夹以及查看艺术家的频道页面。
* 每秒 16 吉比特的传输速率
* 每小时传输 6 TB 的数据
* 每秒点击次数超过 77,000,不包括实时流量
* 800 个用于生成负载的 Amazon EC2 大型实例(3200 个云计算核心)
**测试环境体系结构**
SOASTA CloudTest™管理对云提供商(在本例中为 Amazon)的调出,并配置服务器以进行测试。 捕获 800 个 EC2 实例的过程用了不到 20 分钟的时间。 我们对 Amazon EC2 API 进行了调用,并以 25 个为一组请求服务器。在这种情况下,团队正在请求具有以下规范的 EC2 Large 实例充当负载生成器和结果收集器:
* 7.5 GB 内存
* 4 个 EC2 计算单元(2 个虚拟 CPU 内核,每个虚拟 CPU 内核具有 2 个 EC2 计算单元)
* 850 GB 实例存储(2×420 GB 加上 10 GB 根分区)
* 64 位平台
* Fedora Core 8
* 另外,有 2 个 EC2 Extra-Large 实例充当测试控制器实例和结果数据库,其规格如下:
* 15 GB 内存
* 8 个 EC2 计算单元(4 个虚拟内核,每个虚拟内核具有 2 个 EC2 计算单元)
* 1,690 GB 实例存储(4×420 GB 加上 10 GB 根分区)
* 64 位平台
* Fedora Core 8
* PostgreSQL 数据库
一旦拥有测试所需的所有服务器,便开始对它们进行运行状况检查,以确保它们响应并稳定。 当发现死服务器时,它将丢弃它们,并请求其他服务器来填补空白。 设置基础结构相对容易。 下图(图 1)显示了如何在 EC2 上设置测试云以将大量负载推入 MySpace 的数据中心。
![](https://img.kancloud.cn/05/54/0554fcdcca8c4f79201ac7961fda8772_500x342.png)
**图 1\.**
测试运行时,成批的负载生成器将其性能测试指标报告回单个分析服务。 每个分析服务都连接
到 PostgreSQL 数据库,以将性能数据存储在聚合存储库中。 这是这种规模的测试可以扩展以生成和存储大量数据的方式的一部分-通过将对数据库的访问限制为仅度量指标聚合器并水平扩展。
**挑战**
由于规模往往会破坏一切,因此在整个测试过程中会遇到许多挑战。
**该测试仅限于使用 800 个 EC2 实例**
SOASTA 是云计算资源的最大消费者之一,通常在多个云提供商之间一次使用数百台服务器来进行这些大规模负载测试。 在测试时,团队要求提供的 EC2 实例数量上限。 可用硬件的限制意味着每个服务器都需要模拟相对大量的用户。 每个负载生成器模拟了 1,300 至 1,500 个用户。 此负载水平约为典型 CloudTest™负载生成器将驱动的负载的 3 倍,这给产品带来了新的压力,工程团队需要一些创造性的工作来解决。 用于减轻负载生成器压力的一些策略包括:
* 错开了每个虚拟用户的请求,以免每个负载生成器的点击都一次触发
* 缩减收集的数据,仅包括性能分析所需的内容
## **MySpace 资产的很大一部分由 Akamai 提供,并且该测试反复使 Akamai 基础架构** 的部分服务能力最大化。
CDN 通常会根据访问者的地理位置从最接近访问者的位置向他们提供内容。 例如,如果您从亚马逊的东海岸可用区生成所有测试流量,那么您很可能只会遇到一个 Akamai 服务点。
在负载下,该测试正在向少量 Akamai 数据中心生成大量数据传输和连接流量。 这意味着这些数据中心的负载将超过典型高峰期间可能产生的负载,但是鉴于此功能启动仅针对新西兰流量,因此这不一定是不现实的。 这种压力导致新连接在某些负载水平下被 Akamai 破坏或拒绝,并在测试中产生许多错误。
这是在生产现场产生负载时需要克服的常见障碍。 需要设计大规模生产测试,以考虑到这一点并准确地对整个生产生态系统施加压力。 这意味着从多个地理位置生成负载,以便将流量分散到多个数据中心。 最终,了解地理 POPs 的能力是该测试的重要收获。
## **由于额外负载的影响,MySpace 必须即时调整其某些服务器的位置,以支持正在测试的功能**
在测试过程中,额外的虚拟用户流量使 MySpace 基础架构中的一些负担沉重。 MySpace 的运营团队能够在几分钟内从其他功能集群中获取未充分利用的服务器,并使用它们为视频站点集群增加容量。
也许最令人惊奇的是 MySpace 能够做到这一点。 他们能够实时监控整个基础架构的容量,并在需要时灵活地收缩和扩展。 人们一直在谈论弹性可伸缩性,这在实践中是一件很美的事情。
**经验教训**
1. 对于高流量网站,在生产中进行测试是准确了解容量和性能的唯一方法。 对于大型应用程序基础结构,如果您仅在实验室中进行测试然后尝试进行推断,那么就会出现太多“看不见的墙”。
2. 弹性可伸缩性正成为应用程序体系结构中越来越重要的部分。 应该构建应用程序,以便可以独立监视和扩展关键业务流程。 能够相对快速地增加容量将成为来年的关键体系结构主题,而大型企业早就知道了这一点。 Facebook,Ebay,Intuit 和许多其他大型网站都宣扬了这种设计原则。 使事物保持松散耦合具有以前宣传过的许多好处,但是容量和性能正在迅速移到该列表的前面。
3. 实时监控至关重要。 为了对容量或性能问题做出反应,您需要进行实时监控。 此监视应与您的关键业务流程和功能区域相关联,并且需要尽可能实时。
## 相关文章
* [MySpace 体系结构](/blog/2009/2/12/myspace-architecture.html)
* [如何在不进行实际尝试的情况下成功完成容量规划:Flickr 的 John Allspaw 专访他的新书](/blog/2009/6/29/how-to-succeed-at-capacity-planning-without-really-trying-an.html)
另一篇令人失望的简短文章:/
这篇文章对于学习和观察真实的云一样有用。
这本来真是令人赞叹的文章,但事实证明,更多的是 soasta 广告:(
嗯 我也希望有更多细节。 里面没有什么新东西,只是一则广告。
您想要保罗什么细节?
我想知道这项测试的亚马逊账单是多少?
虽然可能有点像广告,但我不认为这太过分了。 SOASTA 仅被特别提及了三遍,考虑到它们都执行了测试并撰写了有关测试的文章,这似乎是合理的。
总体而言,我认为这是一篇相当不错的文章,并为我提供了许多以前所没有的见识。 也许是因为我没有参与需要进行云部署测试的大型站点。 如果是的话,我可能会有所不同。
根据读者的不同,一篇文章几乎总是细节太少或太多,我认为这篇文章取得了很好的平衡。
感谢您的撰写。
这听起来像是广告,它实际上是一项糟糕的服务。
强调 Akamai 在美国的基础设施将如何帮助应对来自新西兰的流量猛增? 这些新西兰人最终将身处 Akamai 的新西兰基础设施中。
另外,如果要在 MySpace 上对后端进行负载测试,而不是 Akamai 提供内容,则根本不需要测试 Akamai 部分。 只需在 MySpace 网络中内部运行测试即可。
最后,哪种产品需要 16 GB 的 RAM 才能同时下载一些 http 请求? 你在开玩笑吧。 Java 用什么写的?
这篇文章让人印象深刻。 鉴于单核奔腾 M 笔记本电脑可以轻松使千兆位以太网连接(尤其是传入)饱和,因此没有理由使用 16 台以上的服务器。 从亚马逊那里购买它们特别愚蠢,因为与新西兰的 DSL 客户相比,它们往往连接良好。 如果启动该服务确实产生了如此大的影响,那么您将受到新西兰微薄的互联网连接的自然限制,并且必须与所有其他新西兰人共享。
关于先前的投诉,我认为您至少让读者停滞了一点:
(1)对于仅命中一个 Akamai 数据中心的问题有什么解决方案? 您是否能够克服该瓶颈并测试其他潜在瓶颈?
我也想知道:
(2)是否遇到任何挑战
-传输速率为每秒 16 吉比特
-每小时传输 6 TB 数据
进入 Amazon AWS? 还是仅仅是产生足够多的实例来获得这种传输速率?
您能否说明一下为什么选择 PostgreSQL 来存储日志数据?
我很确定某些键值存储系统会比常规 SQL 系统更快地占用资源,同时存储日志数据。
尽管它没有描述所有细节,但了解/听到使用 EC2 进行这种负载测试的方法仍然非常有趣。
谢谢
费利克斯(Felix),即使您的行为像孩子一样在 YouTube 上匿名发动,我还是决定,我会尽力为您解答问题。 他们来了:
>强调 Akamai 在美国的基础设施将如何帮助应对来自新西兰的流量猛增? 这些新西兰人最终将身处 Akamai 的新西兰基础设施中。
来自 Akamai 的内容只是正在测试的整个基础架构的一部分。 这是在测试设计期间提出的,并被团队接受,因为:
1)没有其他选择-尚无主要的云播放器在新西兰(但是)拥有与某些较大的播放器一样强大的 API,并且具有一定数量的服务器
2)大多数 Akamai 的存在都相对 在性能方面具有可重复性,因此,由于我们主要测试的不是 Akamai,因此我们假定来自新西兰其他数据中心的性能也与众不同,因为每个人都愿意接受这种风险。
有了 SLA,并且对数据中心进行的压力测试比预期的要高得多,这在逻辑上是可以接受的风险。
>
>如果要在 MySpace 上对后端进行负载测试,而不是 Akamai 提供的内容,则根本不需要测试 Akamai 部分。 只需在 MySpace 网络中内部运行测试即可。
如果您希望基础架构的所有部分都能承受预计的负载的 100%的信心,则每个组件都需要进行测试。 我们经常根据客户的要求测试 CDN。 在这种情况下,没有人想到 CDN 会遇到麻烦,但我们遇到了很多麻烦。 即使我们可能一直在强调一种持久性有机污染物,其强度比预期的要高,但我们观察到一个以前没有人知道的能力点。
要记住的一件事是,它不仅仅是从容量角度测试 Akamai。 当本应由 Akamai 提供服务但没有提供服务时,会发生不好的事情,最终回到原始服务器并破坏 MySpace 基础结构。 团队需要首先确保内容全部来自 Akamai。 其次,我们需要确保在 Akamai 缓存刷新等过程中没有负载传递到 MySpace。
同样,在内部运行测试不能像在防火墙外部进行测试那样准确地提供性能信息。
>
>哪种产品需要 16 gigs RAM 才能同时下载一些 http 请求? 你在开玩笑吧。 Java 用什么写的?
不值得花时间回答这个问题。 如果听起来读者理解这里发生的一切,就很乐意做出回应;)
>
>本文颇为令人印象深刻。 鉴于单核奔腾 M 笔记本电脑可以轻松使千兆位以太网连接(尤其是传入)饱和,因此没有理由使用 16 台以上的服务器。 从亚马逊那里购买它们特别愚蠢,因为与新西兰的 DSL 客户相比,它们往往连接良好。 如果启动该服务确实产生了如此大的影响,那么您将受到新西兰微薄的互联网连接的自然限制,并且必须与所有其他新西兰人共享。
在线应用程序的性能测试远不止于饱和。 在下载或流式传输内容时,实际上保持打开状态的打开线程和套接字是您逐个服务器消耗所有容量的地方。 下载内容需要时间,并且在下载或流式传输内容时,您失去了生成负载的能力。
除此之外,对于性能测试,您还不会发出请求以生成负载并将其释放。 您正在记录有关每个用户的大量性能数据。 每次命中所花费的时间,传输的带宽,错误以及类似性质的事情。
在 DSL 点上,带宽限制很少在性能测试中完成,因为如果最终用户连接不受应用程序公司的控制,则不会进行限制。
>
>(1)仅命中一个 Akamai 数据中心的问题的解决方案是什么? 您是否能够克服该瓶颈并测试其他潜在瓶颈?
>
我们接受了这样的风险,即我们实际上要测试一个 Akamai 的存在点,其强度要高于此次发布的程度。 但是,识别瓶颈是一项关键的学习,并且随着流量的增长,运营团队和他们的头脑现在已经知道了解其阈值,这可能是需要逐步解决的问题。
>我也想知道:
>
>(2)在获得
>
>方面是否存在任何挑战-每 16 吉比特的传输速率 第二
>-每小时传输 6 TB 的数据
>
>到 Amazon AWS? 还是仅仅是产生足够多的实例来获得这种传输速率?
>
我很想告诉您是否有,但完全没有挑战。 只是产生 EC2 实例就给我们带来了其他一切,包括看似开放的数据传输管道和磁盘访问,以及 I / O 都可以正常工作。 实际上,在与亚马逊合作进行了 3 年这些测试之后,我们从未遇到任何带宽或 I / O 问题。
我喜欢这篇文章,感谢您撰写。
托德(Todd)-如果您要花时间反驳某项陈述,最好花点时间进行拼写检查以提高信誉
除了 MySpace 本身之外,其他各方(Akamai 和/或沿途的其他运营商)是否也了解这种“受控 DoS”? 是否不增加容量来处理流量的突然增加,但至少要知道这是请求的合法流量,而不是某些 DoS 攻击?
您可以从 Amazon 获得如此多的实例和资源,这没有问题,因为 Amazon 知道您是谁以及这是一家什么样的公司,因此他们消除了对您帐户的任何限制? 还是亚马逊真的有这么多的产能供任何支付者使用?
该测试花了多长时间? 您准备了多长时间了?
您是否想念一些后来才意识到有用的数据?
您是在看到 MySpace 正在处理负载还是在从头到尾从 0 到 1 磨时增加点击量吗?
对于我的一项工作,我们进行了类似的测试; 一切顺利,直到我们开始生产为止。 即将发布的消息是,我们的某些后端日志记录和报告系统正在执行 DNS 反向查找。 由于我们的测试来自有限的 IP 空间,因此查找并不是全部可见-但是由于数千名用户使用不同的 IP 位置,我们发现这造成了巨大的瓶颈。 值得牢记。
哇,我无法想象必须处理所有的流量以及在“开放”期间可能出现的任何问题。 我已经处理了高流量的网站,但没有像 Myspace 这样的网站。
我从事表演业务,并使用云模拟了 40,000 个虚拟用户。 这篇文章强调了我面临的一些问题-大型数据集,将负载分散到可用区域等。还有一个我还没有解决的问题,那就是 jmeter 无法像浏览器一样进行并行下载。 当下载页面命中的所有资源时,这反映在较大的事务响应时间中。 在澳大利亚和美国西部之间的每次请求中,RTT 为 250 毫秒也会使情况变得更糟。 到目前为止,我不得不在报告中说明这一点,尽管结果表明事务 x 花费了 12 到 15 秒之间的时间,但这实际上相当于 0.5 到 3.5 秒的响应时间,并且总吞吐量并不是瓶颈。
SOASTA 加载工具是否可以执行并行下载,您是否考虑了 250 毫秒的 RTT?
另一件事-如果同时有 100 万新西兰人同时使用 Myspace,那么那里的街道将空无一人。
哦,还有一件事。 当然,您可以从一台笔记本电脑运行 1,000 个用户。 您不会达到 1GB /秒的速度。 您的响应时间度量将反映测试硬件(而不是被测系统)中的延迟。 关键在于您的负载生成器是否可以及时处理网卡生成的中断。
SeaPerf,为什么您不阅读他的讲话而不是寻找拼写错误? 获得生活。 没有人需要互联网上的另一位抱怨拼写的笨蛋。
你好
感谢您的文章,这很有趣。 我正在研究这个主题,并且有一些问题。 也许你可以帮忙。
您如何定义我们需要强调的计算机数量。
例如,如果我在瓶颈所在的位置使用 apache bench,那么我可以同时运行 1000 个用户吗?
网络,CPU 和 RAM 有一些瓶颈,如何定义它们?
对于较小的压力测试,您建议使用哪种软件? (Apache Bench,JMeter,Siege 等),以及如何定义场景? (使用 Jmeter 代理,处理 apache 访问日志吗?)
西里尔
- LiveJournal 体系结构
- mixi.jp 体系结构
- 友谊建筑
- FeedBurner 体系结构
- GoogleTalk 架构
- ThemBid 架构
- 使用 Amazon 服务以 100 美元的价格构建无限可扩展的基础架构
- TypePad 建筑
- 维基媒体架构
- Joost 网络架构
- 亚马逊建筑
- Fotolog 扩展成功的秘诀
- 普恩斯的教训-早期
- 论文:Wikipedia 的站点内部,配置,代码示例和管理问题
- 扩大早期创业规模
- Feedblendr 架构-使用 EC2 进行扩展
- Slashdot Architecture-互联网的老人如何学会扩展
- Flickr 架构
- Tailrank 架构-了解如何在整个徽标范围内跟踪模因
- Ruby on Rails 如何在 550k 网页浏览中幸存
- Mailinator 架构
- Rackspace 现在如何使用 MapReduce 和 Hadoop 查询 TB 的数据
- Yandex 架构
- YouTube 架构
- Skype 计划 PostgreSQL 扩展到 10 亿用户
- 易趣建筑
- FaceStat 的祸根与智慧赢得了胜利
- Flickr 的联合会:每天进行数十亿次查询
- EVE 在线架构
- Notify.me 体系结构-同步性
- Google 架构
- 第二人生架构-网格
- MySpace 体系结构
- 扩展 Digg 和其他 Web 应用程序
- Digg 建筑
- 在 Amazon EC2 中部署大规模基础架构的六个经验教训
- Wolfram | Alpha 建筑
- 为什么 Facebook,Digg 和 Twitter 很难扩展?
- 全球范围扩展的 10 个 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上扩展
- 《 FarmVille》如何扩展以每月收获 7500 万玩家
- Twitter 计划分析 1000 亿条推文
- MySpace 如何与 100 万个并发用户一起测试其实时站点
- FarmVille 如何扩展-后续
- Justin.tv 的实时视频广播架构
- 策略:缓存 404 在服务器时间上节省了洋葱 66%
- Poppen.de 建筑
- MocoSpace Architecture-一个月有 30 亿个移动页面浏览量
- Sify.com 体系结构-每秒 3900 个请求的门户
- 每月将 Reddit 打造为 2.7 亿页面浏览量时汲取的 7 个教训
- Playfish 的社交游戏架构-每月有 5000 万用户并且不断增长
- 扩展 BBC iPlayer 的 6 种策略
- Facebook 的新实时消息系统:HBase 每月可存储 135 亿条消息
- Pinboard.in Architecture-付费玩以保持系统小巧
- BankSimple 迷你架构-使用下一代工具链
- Riak 的 Bitcask-用于快速键/值数据的日志结构哈希表
- Mollom 体系结构-每秒以 100 个请求杀死超过 3.73 亿个垃圾邮件
- Wordnik-MongoDB 和 Scala 上每天有 1000 万个 API 请求
- Node.js 成为堆栈的一部分了吗? SimpleGeo 说是的。
- 堆栈溢出体系结构更新-现在每月有 9500 万页面浏览量
- Medialets 体系结构-击败艰巨的移动设备数据
- Facebook 的新实时分析系统:HBase 每天处理 200 亿个事件
- Microsoft Stack 是否杀死了 MySpace?
- Viddler Architecture-每天嵌入 700 万个和 1500 Req / Sec 高峰
- Facebook:用于扩展数十亿条消息的示例规范架构
- Evernote Architecture-每天有 900 万用户和 1.5 亿个请求
- TripAdvisor 的短
- TripAdvisor 架构-4,000 万访客,200M 动态页面浏览,30TB 数据
- ATMCash 利用虚拟化实现安全性-不变性和还原
- Google+是使用您也可以使用的工具构建的:闭包,Java Servlet,JavaScript,BigTable,Colossus,快速周转
- 新的文物建筑-每天收集 20 亿多个指标
- Peecho Architecture-鞋带上的可扩展性
- 标记式架构-扩展到 1 亿用户,1000 台服务器和 50 亿个页面视图
- 论文:Akamai 网络-70 个国家/地区的 61,000 台服务器,1,000 个网络
- 策略:在 S3 或 GitHub 上运行可扩展,可用且廉价的静态站点
- Pud 是反堆栈-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于扩展 Turntable.fm 和 Labmeeting 的数百万用户的 17 种技术
- StackExchange 体系结构更新-平稳运行,Amazon 4x 更昂贵
- DataSift 体系结构:每秒进行 120,000 条推文的实时数据挖掘
- Instagram 架构:1400 万用户,1 TB 的照片,数百个实例,数十种技术
- PlentyOfFish 更新-每月 60 亿次浏览量和 320 亿张图片
- Etsy Saga:从筒仓到开心到一个月的浏览量达到数十亿
- 数据范围项目-6PB 存储,500GBytes / sec 顺序 IO,20M IOPS,130TFlops
- 99designs 的设计-数以千万计的综合浏览量
- Tumblr Architecture-150 亿页面浏览量一个月,比 Twitter 更难扩展
- Berkeley DB 体系结构-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天对 2000 万张照片进行爬网,分析和排名
- LinkedIn:使用 Databus 创建低延迟更改数据捕获系统
- 在 30 分钟内进行 7 年的 YouTube 可扩展性课程
- YouPorn-每天定位 2 亿次观看
- Instagram 架构更新:Instagram 有何新功能?
- 搜索技术剖析:blekko 的 NoSQL 数据库
- Pinterest 体系结构更新-1800 万访问者,增长 10 倍,拥有 12 名员工,410 TB 数据
- 搜索技术剖析:使用组合器爬行
- iDoneThis-从头开始扩展基于电子邮件的应用程序
- StubHub 体系结构:全球最大的票务市场背后的惊人复杂性
- FictionPress:在网络上发布 600 万本小说
- Cinchcast 体系结构-每天产生 1,500 小时的音频
- 棱柱架构-使用社交网络上的机器学习来弄清您应该在网络上阅读的内容
- 棱镜更新:基于文档和用户的机器学习
- Zoosk-实时通信背后的工程
- WordPress.com 使用 NGINX 服务 70,000 req / sec 和超过 15 Gbit / sec 的流量
- 史诗般的 TripAdvisor 更新:为什么不在云上运行? 盛大的实验
- UltraDNS 如何处理数十万个区域和数千万条记录
- 更简单,更便宜,更快:Playtomic 从.NET 迁移到 Node 和 Heroku
- Spanner-关于程序员使用 NoSQL 规模的 SQL 语义构建应用程序
- BigData 使用 Erlang,C 和 Lisp 对抗移动数据海啸
- 分析数十亿笔信用卡交易并在云中提供低延迟的见解
- MongoDB 和 GridFS 用于内部和内部数据中心数据复制
- 每天处理 1 亿个像素-少量竞争会导致大规模问题
- DuckDuckGo 体系结构-每天进行 100 万次深度搜索并不断增长
- SongPop 在 GAE 上可扩展至 100 万活跃用户,表明 PaaS 未通过
- Iron.io 从 Ruby 迁移到 Go:减少了 28 台服务器并避免了巨大的 Clusterf ** ks
- 可汗学院支票簿每月在 GAE 上扩展至 600 万用户
- 在破坏之前先检查自己-鳄梨的建筑演进的 5 个早期阶段
- 缩放 Pinterest-两年内每月从 0 到十亿的页面浏览量
- Facebook 的网络秘密
- 神话:埃里克·布鲁尔(Eric Brewer)谈银行为什么不是碱-可用性就是收入
- 一千万个并发连接的秘密-内核是问题,而不是解决方案
- GOV.UK-不是你父亲的书库
- 缩放邮箱-在 6 周内从 0 到 100 万用户,每天 1 亿条消息
- 在 Yelp 上利用云计算-每月访问量为 1.02 亿,评论量为 3900 万
- 每台服务器将 PHP 扩展到 30,000 个并发用户的 5 条 Rockin'Tips
- Twitter 的架构用于在 5 秒内处理 1.5 亿活跃用户,300K QPS,22 MB / S Firehose 以及发送推文
- Salesforce Architecture-他们每天如何处理 13 亿笔交易
- 扩大流量的设计决策
- ESPN 的架构规模-每秒以 100,000 Duh Nuh Nuhs 运行
- 如何制作无限可扩展的关系数据库管理系统(RDBMS)
- Bazaarvoice 的架构每月发展到 500M 唯一用户
- HipChat 如何使用 ElasticSearch 和 Redis 存储和索引数十亿条消息
- NYTimes 架构:无头,无主控,无单点故障
- 接下来的大型声音如何使用 Hadoop 数据版本控制系统跟踪万亿首歌曲的播放,喜欢和更多内容
- Google 如何备份 Internet 和数十亿字节的其他数据
- 从 HackerEarth 用 Apache 扩展 Python 和 Django 的 13 个简单技巧
- AOL.com 体系结构如何发展到 99.999%的可用性,每天 800 万的访问者和每秒 200,000 个请求
- Facebook 以 190 亿美元的价格收购了 WhatsApp 体系结构
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 构建社交音乐服务
- 大,小,热还是冷-条带,Tapad,Etsy 和 Square 的健壮数据管道示例
- WhatsApp 如何每秒吸引近 5 亿用户,11,000 内核和 7,000 万条消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延迟进行实时处理
- 关于 Disqus 的更新:它仍然是实时的,但是 Go 摧毁了 Python
- 关于 Wayback 机器如何在银河系中存储比明星更多的页面的简短说明
- 在 PagerDuty 迁移到 EC2 中的 XtraDB 群集
- 扩展世界杯-Gambify 如何与 2 人组成的团队一起运行大型移动投注应用程序
- 一点点:建立一个可处理每月 60 亿次点击的分布式系统的经验教训
- StackOverflow 更新:一个月有 5.6 亿次网页浏览,25 台服务器,而这一切都与性能有关
- Tumblr:哈希处理每秒 23,000 个博客请求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 处理 10 亿个请求的简便方法来构建成长型启动架构
- MixRadio 体系结构-兼顾各种服务
- Twitter 如何使用 Redis 进行扩展-105TB RAM,39MM QPS,10,000 多个实例
- 正确处理事情:通过即时重放查看集中式系统与分散式系统
- Instagram 提高了其应用程序的性能。 这是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架构
- 英雄联盟如何将聊天扩大到 7000 万玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大规模构建发布平台
- Aeron:我们真的需要另一个消息传递系统吗?
- 机器:惠普基于忆阻器的新型数据中心规模计算机-一切仍在变化
- AWS 的惊人规模及其对云的未来意味着什么
- Vinted 体系结构:每天部署数百次,以保持繁忙的门户稳定
- 将 Kim Kardashian 扩展到 1 亿个页面
- HappyPancake:建立简单可扩展基金会的回顾
- 阿尔及利亚分布式搜索网络的体系结构
- AppLovin:通过每天处理 300 亿个请求向全球移动消费者进行营销
- Swiftype 如何以及为何从 EC2 迁移到真实硬件
- 我们如何扩展 VividCortex 的后端系统
- Appknox 架构-从 AWS 切换到 Google Cloud
- 阿尔及利亚通往全球 API 的愤怒之路
- 阿尔及利亚通往全球 API 步骤的愤怒之路第 2 部分
- 为社交产品设计后端
- 阿尔及利亚通往全球 API 第 3 部分的愤怒之路
- Google 如何创造只有他们才能创造的惊人的数据中心网络
- Autodesk 如何在 Mesos 上实施可扩展事件
- 构建全球分布式,关键任务应用程序:Trenches 部分的经验教训 1
- 构建全球分布式,关键任务应用程序:Trenches 第 2 部分的经验教训
- 需要物联网吗? 这是美国一家主要公用事业公司从 550 万米以上收集电力数据的方式
- Uber 如何扩展其实时市场平台
- 优步变得非常规:使用司机电话作为备份数据中心
- 在不到五分钟的时间里,Facebook 如何告诉您的朋友您在灾难中很安全
- Zappos 的网站与 Amazon 集成后冻结了两年
- 为在现代时代构建可扩展的有状态服务提供依据
- 细分:使用 Docker,ECS 和 Terraform 重建基础架构
- 十年 IT 失败的五个教训
- Shopify 如何扩展以处理来自 Kanye West 和 Superbowl 的 Flash 销售
- 整个 Netflix 堆栈的 360 度视图
- Wistia 如何每小时处理数百万个请求并处理丰富的视频分析
- Google 和 eBay 关于构建微服务生态系统的深刻教训
- 无服务器启动-服务器崩溃!
- 在 Amazon AWS 上扩展至 1100 万以上用户的入门指南
- 为 David Guetta 建立无限可扩展的在线录制活动
- Tinder:最大的推荐引擎之一如何决定您接下来会看到谁?
- 如何使用微服务建立财产管理系统集成
- Egnyte 体系结构:构建和扩展多 PB 分布式系统的经验教训
- Zapier 如何自动化数十亿个工作流自动化任务的旅程
- Jeff Dean 在 Google 进行大规模深度学习
- 如今 Etsy 的架构是什么样的?
- 我们如何在 Mail.Ru Cloud 中实现视频播放器
- Twitter 如何每秒处理 3,000 张图像
- 每天可处理数百万个请求的图像优化技术
- Facebook 如何向 80 万同时观看者直播
- Google 如何针对行星级基础设施进行行星级工程设计?
- 为 Mail.Ru Group 的电子邮件服务实施反垃圾邮件的猫捉老鼠的故事,以及 Tarantool 与此相关的内容
- The Dollar Shave Club Architecture Unilever 以 10 亿美元的价格被收购
- Uber 如何使用 Mesos 和 Cassandra 跨多个数据中心每秒管理一百万个写入
- 从将 Uber 扩展到 2000 名工程师,1000 个服务和 8000 个 Git 存储库获得的经验教训
- QuickBooks 平台
- 美国大选期间城市飞艇如何扩展到 25 亿个通知
- Probot 的体系结构-我的 Slack 和 Messenger Bot 用于回答问题
- AdStage 从 Heroku 迁移到 AWS
- 为何将 Morningstar 迁移到云端:降低 97%的成本
- ButterCMS 体系结构:关键任务 API 每月可处理数百万个请求
- Netflix:按下 Play 会发生什么?
- ipdata 如何以每月 150 美元的价格为来自 10 个无限扩展的全球端点的 2500 万个 API 调用提供服务
- 每天为 1000 亿个事件赋予意义-Teads 的 Analytics(分析)管道
- Auth0 体系结构:在多个云提供商和地区中运行
- 从裸机到 Kubernetes
- Egnyte Architecture:构建和扩展多 PB 内容平台的经验教训
- 缩放原理
- TripleLift 如何建立 Adtech 数据管道每天处理数十亿个事件
- Tinder:最大的推荐引擎之一如何决定您接下来会看到谁?
- 如何使用微服务建立财产管理系统集成
- Egnyte 体系结构:构建和扩展多 PB 分布式系统的经验教训
- Zapier 如何自动化数十亿个工作流自动化任务的旅程
- Jeff Dean 在 Google 进行大规模深度学习
- 如今 Etsy 的架构是什么样的?
- 我们如何在 Mail.Ru Cloud 中实现视频播放器
- Twitter 如何每秒处理 3,000 张图像
- 每天可处理数百万个请求的图像优化技术
- Facebook 如何向 80 万同时观看者直播
- Google 如何针对行星级基础设施进行行星级工程设计?
- 为 Mail.Ru Group 的电子邮件服务实施反垃圾邮件的猫捉老鼠的故事,以及 Tarantool 与此相关的内容
- The Dollar Shave Club Architecture Unilever 以 10 亿美元的价格被收购
- Uber 如何使用 Mesos 和 Cassandra 跨多个数据中心每秒管理一百万个写入
- 从将 Uber 扩展到 2000 名工程师,1000 个服务和 8000 个 Git 存储库获得的经验教训
- QuickBooks 平台
- 美国大选期间城市飞艇如何扩展到 25 亿条通知
- Probot 的体系结构-我的 Slack 和 Messenger Bot 用于回答问题
- AdStage 从 Heroku 迁移到 AWS
- 为何将 Morningstar 迁移到云端:降低 97%的成本
- ButterCMS 体系结构:关键任务 API 每月可处理数百万个请求
- Netflix:按下 Play 会发生什么?
- ipdata 如何以每月 150 美元的价格为来自 10 个无限扩展的全球端点的 2500 万个 API 调用提供服务
- 每天为 1000 亿个事件赋予意义-Teads 的 Analytics(分析)管道
- Auth0 体系结构:在多个云提供商和地区中运行
- 从裸机到 Kubernetes
- Egnyte Architecture:构建和扩展多 PB 内容平台的经验教训