YouTube 为何总能用完存储空间?这不仅仅是云的功劳!
你有没有想过,这么多年过去了,视频数据量已经达到了惊人的程度,为什么YouTube 的空间还没有用完?尤其是像下面这样的热门视频:
这太疯狂了吧?想象一下,一个平台拥有数百万个视频,却从未面临空间不足的问题。就算你试图用云计算来解决这个问题,到头来也只是以云的名义,在数据中心的某个地方放着一些物理硬件或硬盘而已 :)
从PB到EB:
YouTube 的运营规模空前,为了满足其庞大的用户群,存储了数以 PB和EB 计的视频内容。具体来说,1PB 相当于 100 万 GB,而1EB 则相当于 10 亿 GB。管理如此海量的数据简直是疯狂的🤯。
*因此,问题出现了:*
- 限制是多少?🤔
- 他们怎么就从来不丢失任何东西呢?
- 如何才能让世界任何地方的人都能即时访问数据?
让我们深入探究 YouTube 看似无限的存储能力背后更深入、更迷人的故事。
而且,别担心,我不会骗你去使用云计算 XD
超越云
嗯,这确实有道理,以前最高画质是 720p,但现在大多数视频都需要以 4K 分辨率存储。他们肯定开发了一些特殊的压缩算法或方法来最小化文件大小。
如果仅仅依靠云存储,无论公司规模如何,都需要巨大的空间并且成本高昂,尤其是考虑到任何人都可以免费上传大量数据。
首次尝试:压缩魔法
唯一合理的解释是数据压缩或某种压缩算法。视频在存储前会使用VP9、H.264、H.265 (HEVC)和AV1等尖端编解码器进行压缩。这可以将文件大小减少高达50%,从而显著提升存储容量,同时又不影响画质。
然而,这必须以完全不影响质量的方式进行。尽管如此,对于一般的压缩来说,无论其效率如何,压缩过程中仍然会存在最小的损失,以保持性能和速度。
这听起来确实像是《硅谷》系列中 Pied Piper 的革命性压缩算法 XD
此外,YouTube 利用先进的转码和优化技术,将上传的视频编码为多种格式和分辨率,以适应各种设备和网络条件。自适应比特率流媒体功能可根据可用带宽和设备性能动态调整视频质量,进一步提升用户体验。
第二次尝试:存储层
分层存储是主要因素之一,因为视频并非存储在单一云平台中。YouTube 采用分层系统,将频繁访问的内容存储在高性能、易于访问的存储中(例如速度飞快的 SSD),而观看次数较少的视频则迁移到更冷、更经济的存储层(例如硬盘)。这可以优化延迟、性能和存储成本。
第三次尝试:内容生命周期管理
-
内容评估: YouTube 会持续分析视频,了解其受欢迎程度和参与度。观看人数或参与度较低的视频会被标记存档或移除,从而腾出空间用于发布新内容。
(但仍然有大量不活跃的账户,里面全是旧视频) -
合作伙伴计划: YouTube 为创作者提供多种创收选项。参与此类计划的视频通常会因为潜在的创收潜力而获得更长时间的保留。
技术进步:
-
新兴技术:YouTube 积极探索DNA 存储等尖端技术,该技术与传统存储方式相比,可提供指数级更高的存储密度。虽然该技术仍处于早期阶段,但未来潜力巨大。
-
摩尔定律:随着硬件技术的进步,存储容量不断增长。这使得 YouTube 能够容纳不断增长的视频库,同时保持成本效益。
可用性如何?
好吧,如果你只谈论这些海量数据的可用性,那么这是因为:
- 全球网络: YouTube 的存储基础设施并非局限于单一地点。它分布在世界各地的数据中心,确保了冗余性和弹性。如果一个数据中心发生故障,其他数据中心可以无缝接管,从而避免服务中断。
- 内容复制:热门内容会在不同的数据中心进行复制。这确保了附近的观众也能随时观看,从而最大限度地减少延迟和缓冲问题。
有哪些可用信息?
Google 使用Google 文件系统 (GFS)和BigTable来管理海量数据。他们拥有数百万个磁盘,这些磁盘分布在多个数据中心,并配置为RAID阵列。我在 Twitter 上找到了一个来自“TechWelthEngine”的答案,听起来似乎很有道理。
“以每天4.3PB的速度计算,达到1EB需要232多天。如果我们假设他们有15EB的存储空间,那么按照这样的速度,他们需要9.5年才能填满。”
但如果这是真的,那么他们是否每 9.5 年就必须新建一个15EB 的设施? 我不太确定。也许他们只是删除了冗余数据? 而且别忘了,未来几年每天4.3PB 的数据量还会继续增长,尤其是随着大量视频由AI制作和录制!
如果他们真的只是不断升级他们的服务器(显然他们不会),那么这就解释了为什么我们必须观看 2 个广告,然后观看 1.5 分钟的实际视频,然后观看 2 个广告,然后观看 3 分钟,然后重复这个过程 :)
所以我相信一定有办法,因为他们不可能永远不停地建设服务器场......
我尝试联系YouTube 和 YouTube 的一些高级开发人员,以更清楚地了解此事,但到目前为止还没有任何回应。
因此,问题仍然没有得到解答:YouTube 到底能在云端保存我们的数据多久,YouTube 的存档流程是怎样的?
你觉得怎么样?请在评论区留言告诉我。
受到与 Ben Weddle 的 twitter/X 谈话的启发。
如果您喜欢这个博客,您可以关注我:
如果您想支持我,您可以在 GitHub 上赞助我或给我买杯咖啡。
鏂囩珷鏉ユ簮锛�https://dev.to/ujjawaltyagi/why-youtube-never-runs-out-of-storage-its-not-just-cloud-225f