# 为什么 Facebook,Digg 和 Twitter 很难扩展?
> 原文: [http://highscalability.com/blog/2009/10/13/why-are-facebook-digg-and-twitter-so-hard-to-scale.html](http://highscalability.com/blog/2009/10/13/why-are-facebook-digg-and-twitter-so-hard-to-scale.html)
实时社交图(人,地方和事物之间的连通性)。 这就是为什么要扩展 Facebook 很难[的原因,Facebook 技术副总裁 Jeff Rothschild](/blog/2009/10/12/high-performance-at-massive-scale-lessons-learned-at-faceboo-1.html) 说。 像 Facebook,Digg 和 Twitter 这样的社交网站要比传统网站难于扩展。 这是为什么? 为什么社交网站比传统网站更难扩展? 让我们找出答案。
传统网站比社交网站更易于扩展,原因有两个:
* 他们通常仅访问自己的数据和公共缓存的数据。
* 一次只有 1-2%的用户在该站点上处于活动状态。
想象一下像 Yahoo 这样的大型网站。 当您来到 Yahoo 时,他们可以一键获取您的个人资料记录,足以为您建立网站视图。 使用[分布式哈希方案](http://highscalability.com/blog/2009/8/5/anti-rdbms-a-list-of-distributed-key-value-stores.html)基于单个记录扩展系统相对简单。 而且由于一次只有很少一部分人同时访问该站点,因此只需较少的 RAM 缓存即可处理所有活动用户。
现在想想在 Facebook 上发生了什么。 假设您有 200 个朋友。 当您打您的 Facebook 帐户时,必须同时**收集所有 200 个朋友的状态**,以便您可以查看对他们有什么新变化。 这意味着需要同时发出 200 个请求,需要将答复合并在一起,需要联系其他服务以获取更多详细信息,所有这些都需要合并在一起并通过 PHP 和 Web 服务器发送,因此您可以看到 Facebook 页面在合理的时间内。 天啊。
这里有几个含义,特别是考虑到在社交网站上一次有大量用户同时在系统上(这是社交部分,人们闲逛):
* 所有数据始终处于活动状态。
* 由于每个人都已连接,因此很难对这种系统进行分区。
* 所有内容都必须保存在 RAM 缓存中,以便可以尽快访问数据。
分区意味着您希望找到某种方法将常用数据聚类在一起,以便可以更有效地对其进行访问。 由于数据的互连性,Facebook 没有找到任何可行的集群方案。 因此,Facebook **不会对数据进行分区和非规范化,而是保持数据规范化,并在数以千计的数据库中随机分配**数据。
这种方法需要非常快的缓存。 Facebook 使用 [memcached](http://highscalability.com/blog/category/memcached) 作为其缓存层。 所有数据都保存在缓存中,并且他们对 memcached 进行了大量修改,以加快数据传输速度并帮助其处理更多请求(所有信息都回馈社区)。
他们的**缓存层服务每秒提供 1.2 亿个查询**,这是站点的核心。 问题是 memcached 难以使用,因为它需要程序员的配合。 腐败也很容易。 他们开发了一个复杂的系统,以使缓存层中的数据与数据库保持一致,即使跨多个分布式数据中心也是如此。 请记住,它们是在此处缓存用户数据,而不是 HTML 页面或页面片段。 考虑到他们的数据更改量,将很难使页面缓存起作用。
我们在 Digg 看到了类似的问题。 例如,每当凯文·罗斯(Kevin Rose)挖掘链接时,Digg 就必须处理将更新发送给 [40,000 个关注者](http://highscalability.com/blog/2009/2/14/scaling-digg-and-other-web-applications.html)的问题。 Digg 和我认为 Twitter 也采取了与 Facebook 不同的方法。
Facebook 采用**按需拉动**方法。 要重新创建页面或显示片段,他们需要运行完整的查询。 为了确定您的朋友中是否添加了一个新的喜爱的乐队,Facebook 实际查询了所有朋友,以查找最新消息。 他们可以摆脱这种情况,但是由于其强大的基础架构。
但是,如果您曾经想过**,为什么 Facebook 的朋友数限制为 5,000 个用户**,这就是为什么。 在某一点上很难实现“按需”规模。
找出新功能的另一种方法是**随推即用**模型。 在此模型中,当用户进行更改时,会将其推送到所有相关用户,并且更改(以某种形式)与每个用户一起存储。 因此,当用户要查看其更新时,他们需要访问的就是他们自己的帐户数据。 无需轮询所有朋友的更改。
有了安全性和权限,要确定谁应该看到更新,可能会非常复杂。 如果用户拥有 200 万关注者,那么它的速度也可能令人惊讶地慢。 还有一个重复的问题。 存储了大量重复数据(或引用),因此这是一种非规范化方法,可能会导致一些一致性问题。 例如,在生产或使用数据时是否应征得许可? 或者,如果数据已经被复制后又被删除了怎么办?
尽管所有这些一致性和重复性问题都很有趣,但``推动变革''似乎为真正的追随者提供了更具可扩展性的方法。 推动所有更改确实需要很多工作,但是可以由作业排队系统处理,因此工作可以分布在整个集群中。
随着我们拥有越来越多的人,越来越多的相互联系,越来越快的变革以及对实时消耗所有这些的渴望,挑战将越来越大。 我们距离能够应对这个勇敢的新世界还有很长的路要走。
关于社交网站的整个可伸缩性问题的非常不错的概述。 但是,我确定下一个要紧推模型,特别是在经典聊天应用程序之外使用 XMPP 之类的协议。
感谢您的精彩文章。
我一直想知道 Facebook 如何摆脱庞大的互连数据库。
“他们的缓存层服务每秒提供 1.2 亿个查询,这是站点的核心。”
您可以为此找到参考吗? 在他的演讲中吗? 如果是这样,我会去看的。
网络行业可以向金融行业学习。 多年来,股票市场一直在以非常低的延迟向大量节点传递消息的股价信息。 有多种商业产品,例如 Tibco Rendezvous,都提供了这样的消息总线。 那时,向 40,000 个关注者(可能驻留在更少的分区上)发布更新不是一个真正的挑战。
Facebook 的限制也反映出我们注意力经济的自然限制:没有人可能知道(或保留)约 5000 名其他人的一切。
只要 Web 体系结构只需要围绕我们弱小的人脑扩展,我们就处于相当安全的领域。
我喜欢这篇文章,非常有帮助。 分布式系统和缓存始终是我感兴趣的主题:)
好帖子。
嗯..有趣的点。
涉及到影响可访问量如此大的站点的可伸缩性的一些重要点。
你好
我们最近有一篇文章涉及 OSN 的扩展,并且我们处理了
您提到的一些问题-包括分区问题。
可以在以下网站找到该论文:http://bit.ly/18Gqmx
请随时与作者联系以获取更多信息。
干杯,
欢呼
伟大的话题和问题的解释。 如果您对解决此问题的绝佳方法感兴趣,请查看附件链接和网络研讨会。
http://budurl.com/oct15wbnr
不错的发人深省的文章。 我想我有一个想法如何处理“同时收集所有 200 个朋友的状态”。 根本不要。 人们不太可能希望甚至无法一次查看全部大小的数据,因此请以不占优势的块形式提供数据。
不错的文章,但您错失了 5,000 个用户限制。 我记得前一段时间看过一位 Facebook 工程师的演讲(我认为那是 Yahoo Brickhouse 的 Jeff Hammerbacher 的演讲),他说限制是“产品决定”,而不是工程决定。 他还说,粉丝专页使用的样式与普通人完全一样,那里没有限制。 因此,基本上,5,000 个朋友的限制是完全任意的,明天他们可以毫无问题地将其删除。
有趣且很有见地。 从很长时间以来,我一直在寻找可扩展性问题的答案,甚至在博客上都对此发表了看法,但这是我遇到的最好的解释。
很棒的帖子。 当我们处理扩展这些大型站点的软件架构时,这真的变得很有趣:)
首先,facebook 和 dig 使用的方法是最好的方法。 然而,他们寻找更优化的解决方案的努力可能会触发数据管理的新发明。 如您所知,技术是在战争中最发达的,这就是在竞争激烈的市场中为金钱而战:)
是的,我为 Facebook,Flickr,Digg 等购买此产品。 它们具有相对简单的数据结构和非常小的数据库。 他们最近声称,在迈克尔·杰克逊(Michael Jackson)事件期间,他们每秒最多有 5,000 条消息。 即使我很慷慨地说,他们平均每秒平均连续发送 5,000 条消息,但一年仍然只能收到 20Tb 的消息。 当然他们有很多要求,但是要提取的数据并不多。 如果他们只愿意执行某种形式的实时推送而不是让人们投票,那么他们发现的 api 调用也可能会大大减少。 与 Facebook 相比,Twitter 并没有太多的借口来应对近期的所有故障。
帕特里克
听起来是时候将某个人的社交网络直接构建到硬件中了。 也许是社交网络 ASIC?
极端情况下的社交网络问题最终与神经网络面临的经典问题以及其他大规模并行计算问题(互连的阶乘扩展)密切相关。 每个附加节点 N 将潜在连接数增加 N-1 倍。 在大脑中,典型的神经元与大约 10,000 个接收器和 10,000 个发送器连接,因此乘数仅约为 10,000,而不是数十亿。 因此,Facebook 限制的数量级相似。 有趣的是,分组交换网络比硬交换具有更好的可伸缩性,因此,除非实现了类似于网络的总线层,否则 ASIC 可能不是走的路。 那是我一直在研究的设计。
生物神经网络还通过不修剪不带明显信号的互连部分解决了这一问题,而“表决权”得不到定期使用的神经元(它们的输出并未受到任何接收神经元的高度加权)实际上会死亡。
可悲的是,用户不在乎并且不容忍由可伸缩性问题(或缺乏可伸缩性问题)引起的可见错误。
非常有趣的文章。 谢谢!
- LiveJournal 体系结构
- mixi.jp 体系结构
- 友谊建筑
- FeedBurner 体系结构
- GoogleTalk 架构
- ThemBid 架构
- 使用 Amazon 服务以 100 美元的价格构建无限可扩展的基础架构
- TypePad 建筑
- 维基媒体架构
- Joost 网络架构
- 亚马逊建筑
- Fotolog 扩展成功的秘诀
- 普恩斯的教训-早期
- 论文:Wikipedia 的站点内部,配置,代码示例和管理问题
- 扩大早期创业规模
- Feedblendr 架构-使用 EC2 进行扩展
- Slashdot Architecture-互联网的老人如何学会扩展
- Flickr 架构
- Tailrank 架构-了解如何在整个徽标范围内跟踪模因
- Ruby on Rails 如何在 550k 网页浏览中幸存
- Mailinator 架构
- Rackspace 现在如何使用 MapReduce 和 Hadoop 查询 TB 的数据
- Yandex 架构
- YouTube 架构
- Skype 计划 PostgreSQL 扩展到 10 亿用户
- 易趣建筑
- FaceStat 的祸根与智慧赢得了胜利
- Flickr 的联合会:每天进行数十亿次查询
- EVE 在线架构
- Notify.me 体系结构-同步性
- Google 架构
- 第二人生架构-网格
- MySpace 体系结构
- 扩展 Digg 和其他 Web 应用程序
- Digg 建筑
- 在 Amazon EC2 中部署大规模基础架构的六个经验教训
- Wolfram | Alpha 建筑
- 为什么 Facebook,Digg 和 Twitter 很难扩展?
- 全球范围扩展的 10 个 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上扩展
- 《 FarmVille》如何扩展以每月收获 7500 万玩家
- Twitter 计划分析 1000 亿条推文
- MySpace 如何与 100 万个并发用户一起测试其实时站点
- FarmVille 如何扩展-后续
- Justin.tv 的实时视频广播架构
- 策略:缓存 404 在服务器时间上节省了洋葱 66%
- Poppen.de 建筑
- MocoSpace Architecture-一个月有 30 亿个移动页面浏览量
- Sify.com 体系结构-每秒 3900 个请求的门户
- 每月将 Reddit 打造为 2.7 亿页面浏览量时汲取的 7 个教训
- Playfish 的社交游戏架构-每月有 5000 万用户并且不断增长
- 扩展 BBC iPlayer 的 6 种策略
- Facebook 的新实时消息系统:HBase 每月可存储 135 亿条消息
- Pinboard.in Architecture-付费玩以保持系统小巧
- BankSimple 迷你架构-使用下一代工具链
- Riak 的 Bitcask-用于快速键/值数据的日志结构哈希表
- Mollom 体系结构-每秒以 100 个请求杀死超过 3.73 亿个垃圾邮件
- Wordnik-MongoDB 和 Scala 上每天有 1000 万个 API 请求
- Node.js 成为堆栈的一部分了吗? SimpleGeo 说是的。
- 堆栈溢出体系结构更新-现在每月有 9500 万页面浏览量
- Medialets 体系结构-击败艰巨的移动设备数据
- Facebook 的新实时分析系统:HBase 每天处理 200 亿个事件
- Microsoft Stack 是否杀死了 MySpace?
- Viddler Architecture-每天嵌入 700 万个和 1500 Req / Sec 高峰
- Facebook:用于扩展数十亿条消息的示例规范架构
- Evernote Architecture-每天有 900 万用户和 1.5 亿个请求
- TripAdvisor 的短
- TripAdvisor 架构-4,000 万访客,200M 动态页面浏览,30TB 数据
- ATMCash 利用虚拟化实现安全性-不变性和还原
- Google+是使用您也可以使用的工具构建的:闭包,Java Servlet,JavaScript,BigTable,Colossus,快速周转
- 新的文物建筑-每天收集 20 亿多个指标
- Peecho Architecture-鞋带上的可扩展性
- 标记式架构-扩展到 1 亿用户,1000 台服务器和 50 亿个页面视图
- 论文:Akamai 网络-70 个国家/地区的 61,000 台服务器,1,000 个网络
- 策略:在 S3 或 GitHub 上运行可扩展,可用且廉价的静态站点
- Pud 是反堆栈-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于扩展 Turntable.fm 和 Labmeeting 的数百万用户的 17 种技术
- StackExchange 体系结构更新-平稳运行,Amazon 4x 更昂贵
- DataSift 体系结构:每秒进行 120,000 条推文的实时数据挖掘
- Instagram 架构:1400 万用户,1 TB 的照片,数百个实例,数十种技术
- PlentyOfFish 更新-每月 60 亿次浏览量和 320 亿张图片
- Etsy Saga:从筒仓到开心到一个月的浏览量达到数十亿
- 数据范围项目-6PB 存储,500GBytes / sec 顺序 IO,20M IOPS,130TFlops
- 99designs 的设计-数以千万计的综合浏览量
- Tumblr Architecture-150 亿页面浏览量一个月,比 Twitter 更难扩展
- Berkeley DB 体系结构-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天对 2000 万张照片进行爬网,分析和排名
- LinkedIn:使用 Databus 创建低延迟更改数据捕获系统
- 在 30 分钟内进行 7 年的 YouTube 可扩展性课程
- YouPorn-每天定位 2 亿次观看
- Instagram 架构更新:Instagram 有何新功能?
- 搜索技术剖析:blekko 的 NoSQL 数据库
- Pinterest 体系结构更新-1800 万访问者,增长 10 倍,拥有 12 名员工,410 TB 数据
- 搜索技术剖析:使用组合器爬行
- iDoneThis-从头开始扩展基于电子邮件的应用程序
- StubHub 体系结构:全球最大的票务市场背后的惊人复杂性
- FictionPress:在网络上发布 600 万本小说
- Cinchcast 体系结构-每天产生 1,500 小时的音频
- 棱柱架构-使用社交网络上的机器学习来弄清您应该在网络上阅读的内容
- 棱镜更新:基于文档和用户的机器学习
- Zoosk-实时通信背后的工程
- WordPress.com 使用 NGINX 服务 70,000 req / sec 和超过 15 Gbit / sec 的流量
- 史诗般的 TripAdvisor 更新:为什么不在云上运行? 盛大的实验
- UltraDNS 如何处理数十万个区域和数千万条记录
- 更简单,更便宜,更快:Playtomic 从.NET 迁移到 Node 和 Heroku
- Spanner-关于程序员使用 NoSQL 规模的 SQL 语义构建应用程序
- BigData 使用 Erlang,C 和 Lisp 对抗移动数据海啸
- 分析数十亿笔信用卡交易并在云中提供低延迟的见解
- MongoDB 和 GridFS 用于内部和内部数据中心数据复制
- 每天处理 1 亿个像素-少量竞争会导致大规模问题
- DuckDuckGo 体系结构-每天进行 100 万次深度搜索并不断增长
- SongPop 在 GAE 上可扩展至 100 万活跃用户,表明 PaaS 未通过
- Iron.io 从 Ruby 迁移到 Go:减少了 28 台服务器并避免了巨大的 Clusterf ** ks
- 可汗学院支票簿每月在 GAE 上扩展至 600 万用户
- 在破坏之前先检查自己-鳄梨的建筑演进的 5 个早期阶段
- 缩放 Pinterest-两年内每月从 0 到十亿的页面浏览量
- Facebook 的网络秘密
- 神话:埃里克·布鲁尔(Eric Brewer)谈银行为什么不是碱-可用性就是收入
- 一千万个并发连接的秘密-内核是问题,而不是解决方案
- GOV.UK-不是你父亲的书库
- 缩放邮箱-在 6 周内从 0 到 100 万用户,每天 1 亿条消息
- 在 Yelp 上利用云计算-每月访问量为 1.02 亿,评论量为 3900 万
- 每台服务器将 PHP 扩展到 30,000 个并发用户的 5 条 Rockin'Tips
- Twitter 的架构用于在 5 秒内处理 1.5 亿活跃用户,300K QPS,22 MB / S Firehose 以及发送推文
- Salesforce Architecture-他们每天如何处理 13 亿笔交易
- 扩大流量的设计决策
- ESPN 的架构规模-每秒以 100,000 Duh Nuh Nuhs 运行
- 如何制作无限可扩展的关系数据库管理系统(RDBMS)
- Bazaarvoice 的架构每月发展到 500M 唯一用户
- HipChat 如何使用 ElasticSearch 和 Redis 存储和索引数十亿条消息
- NYTimes 架构:无头,无主控,无单点故障
- 接下来的大型声音如何使用 Hadoop 数据版本控制系统跟踪万亿首歌曲的播放,喜欢和更多内容
- Google 如何备份 Internet 和数十亿字节的其他数据
- 从 HackerEarth 用 Apache 扩展 Python 和 Django 的 13 个简单技巧
- AOL.com 体系结构如何发展到 99.999%的可用性,每天 800 万的访问者和每秒 200,000 个请求
- Facebook 以 190 亿美元的价格收购了 WhatsApp 体系结构
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 构建社交音乐服务
- 大,小,热还是冷-条带,Tapad,Etsy 和 Square 的健壮数据管道示例
- WhatsApp 如何每秒吸引近 5 亿用户,11,000 内核和 7,000 万条消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延迟进行实时处理
- 关于 Disqus 的更新:它仍然是实时的,但是 Go 摧毁了 Python
- 关于 Wayback 机器如何在银河系中存储比明星更多的页面的简短说明
- 在 PagerDuty 迁移到 EC2 中的 XtraDB 群集
- 扩展世界杯-Gambify 如何与 2 人组成的团队一起运行大型移动投注应用程序
- 一点点:建立一个可处理每月 60 亿次点击的分布式系统的经验教训
- StackOverflow 更新:一个月有 5.6 亿次网页浏览,25 台服务器,而这一切都与性能有关
- Tumblr:哈希处理每秒 23,000 个博客请求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 处理 10 亿个请求的简便方法来构建成长型启动架构
- MixRadio 体系结构-兼顾各种服务
- Twitter 如何使用 Redis 进行扩展-105TB RAM,39MM QPS,10,000 多个实例
- 正确处理事情:通过即时重放查看集中式系统与分散式系统
- Instagram 提高了其应用程序的性能。 这是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架构
- 英雄联盟如何将聊天扩大到 7000 万玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大规模构建发布平台
- Aeron:我们真的需要另一个消息传递系统吗?
- 机器:惠普基于忆阻器的新型数据中心规模计算机-一切仍在变化
- AWS 的惊人规模及其对云的未来意味着什么
- Vinted 体系结构:每天部署数百次,以保持繁忙的门户稳定
- 将 Kim Kardashian 扩展到 1 亿个页面
- HappyPancake:建立简单可扩展基金会的回顾
- 阿尔及利亚分布式搜索网络的体系结构
- AppLovin:通过每天处理 300 亿个请求向全球移动消费者进行营销
- Swiftype 如何以及为何从 EC2 迁移到真实硬件
- 我们如何扩展 VividCortex 的后端系统
- Appknox 架构-从 AWS 切换到 Google Cloud
- 阿尔及利亚通往全球 API 的愤怒之路
- 阿尔及利亚通往全球 API 步骤的愤怒之路第 2 部分
- 为社交产品设计后端
- 阿尔及利亚通往全球 API 第 3 部分的愤怒之路
- Google 如何创造只有他们才能创造的惊人的数据中心网络
- Autodesk 如何在 Mesos 上实施可扩展事件
- 构建全球分布式,关键任务应用程序:Trenches 部分的经验教训 1
- 构建全球分布式,关键任务应用程序:Trenches 第 2 部分的经验教训
- 需要物联网吗? 这是美国一家主要公用事业公司从 550 万米以上收集电力数据的方式
- Uber 如何扩展其实时市场平台
- 优步变得非常规:使用司机电话作为备份数据中心
- 在不到五分钟的时间里,Facebook 如何告诉您的朋友您在灾难中很安全
- Zappos 的网站与 Amazon 集成后冻结了两年
- 为在现代时代构建可扩展的有状态服务提供依据
- 细分:使用 Docker,ECS 和 Terraform 重建基础架构
- 十年 IT 失败的五个教训
- Shopify 如何扩展以处理来自 Kanye West 和 Superbowl 的 Flash 销售
- 整个 Netflix 堆栈的 360 度视图
- Wistia 如何每小时处理数百万个请求并处理丰富的视频分析
- Google 和 eBay 关于构建微服务生态系统的深刻教训
- 无服务器启动-服务器崩溃!
- 在 Amazon AWS 上扩展至 1100 万以上用户的入门指南
- 为 David Guetta 建立无限可扩展的在线录制活动
- Tinder:最大的推荐引擎之一如何决定您接下来会看到谁?
- 如何使用微服务建立财产管理系统集成
- Egnyte 体系结构:构建和扩展多 PB 分布式系统的经验教训
- Zapier 如何自动化数十亿个工作流自动化任务的旅程
- Jeff Dean 在 Google 进行大规模深度学习
- 如今 Etsy 的架构是什么样的?
- 我们如何在 Mail.Ru Cloud 中实现视频播放器
- Twitter 如何每秒处理 3,000 张图像
- 每天可处理数百万个请求的图像优化技术
- Facebook 如何向 80 万同时观看者直播
- Google 如何针对行星级基础设施进行行星级工程设计?
- 为 Mail.Ru Group 的电子邮件服务实施反垃圾邮件的猫捉老鼠的故事,以及 Tarantool 与此相关的内容
- The Dollar Shave Club Architecture Unilever 以 10 亿美元的价格被收购
- Uber 如何使用 Mesos 和 Cassandra 跨多个数据中心每秒管理一百万个写入
- 从将 Uber 扩展到 2000 名工程师,1000 个服务和 8000 个 Git 存储库获得的经验教训
- QuickBooks 平台
- 美国大选期间城市飞艇如何扩展到 25 亿个通知
- Probot 的体系结构-我的 Slack 和 Messenger Bot 用于回答问题
- AdStage 从 Heroku 迁移到 AWS
- 为何将 Morningstar 迁移到云端:降低 97%的成本
- ButterCMS 体系结构:关键任务 API 每月可处理数百万个请求
- Netflix:按下 Play 会发生什么?
- ipdata 如何以每月 150 美元的价格为来自 10 个无限扩展的全球端点的 2500 万个 API 调用提供服务
- 每天为 1000 亿个事件赋予意义-Teads 的 Analytics(分析)管道
- Auth0 体系结构:在多个云提供商和地区中运行
- 从裸机到 Kubernetes
- Egnyte Architecture:构建和扩展多 PB 内容平台的经验教训
- 缩放原理
- TripleLift 如何建立 Adtech 数据管道每天处理数十亿个事件
- Tinder:最大的推荐引擎之一如何决定您接下来会看到谁?
- 如何使用微服务建立财产管理系统集成
- Egnyte 体系结构:构建和扩展多 PB 分布式系统的经验教训
- Zapier 如何自动化数十亿个工作流自动化任务的旅程
- Jeff Dean 在 Google 进行大规模深度学习
- 如今 Etsy 的架构是什么样的?
- 我们如何在 Mail.Ru Cloud 中实现视频播放器
- Twitter 如何每秒处理 3,000 张图像
- 每天可处理数百万个请求的图像优化技术
- Facebook 如何向 80 万同时观看者直播
- Google 如何针对行星级基础设施进行行星级工程设计?
- 为 Mail.Ru Group 的电子邮件服务实施反垃圾邮件的猫捉老鼠的故事,以及 Tarantool 与此相关的内容
- The Dollar Shave Club Architecture Unilever 以 10 亿美元的价格被收购
- Uber 如何使用 Mesos 和 Cassandra 跨多个数据中心每秒管理一百万个写入
- 从将 Uber 扩展到 2000 名工程师,1000 个服务和 8000 个 Git 存储库获得的经验教训
- QuickBooks 平台
- 美国大选期间城市飞艇如何扩展到 25 亿条通知
- Probot 的体系结构-我的 Slack 和 Messenger Bot 用于回答问题
- AdStage 从 Heroku 迁移到 AWS
- 为何将 Morningstar 迁移到云端:降低 97%的成本
- ButterCMS 体系结构:关键任务 API 每月可处理数百万个请求
- Netflix:按下 Play 会发生什么?
- ipdata 如何以每月 150 美元的价格为来自 10 个无限扩展的全球端点的 2500 万个 API 调用提供服务
- 每天为 1000 亿个事件赋予意义-Teads 的 Analytics(分析)管道
- Auth0 体系结构:在多个云提供商和地区中运行
- 从裸机到 Kubernetes
- Egnyte Architecture:构建和扩展多 PB 内容平台的经验教训