找回密码
 骑士注册

QQ登录

微博登录

搜索
❏ 站外平台:

Linux中国开源社区 观点 查看内容

Wayback Machine收录4千亿网页 涵盖1996年至今历史记录

2014-05-11 10:06       

Internet Archive今日达成了一项里程碑式成就,其网站历史信息查询服务工具Wayback Machine收录了4千亿网页索引。数据涵盖了从1996年至今的几乎所有网站的历史网页记录。

以下是Internet Archive总结的Wayback Machine的历史和里程碑:

2001年 - Wayback Machine项目启动

2006年 - Arichive-It启动,允许创建订阅该服务的库以收集网络内容

2009年3月25日 - Internet Archive和Sun微系统公司共同启动了一个数据中心,存储整个互联网的文档及为Wayback Machine提供服务。该数据中心有3PB容量,每秒处理500个请求。

2011年6月15日 - 加入HTTP Archive,增加记录网站性能数据的功能。

2012年5月28日 - Wayback Machine在中国被封锁数年后再次上线。

2012年10月26日 - 被记录网站抓取数据达到了80TB,该抓取数据在2011年面向研究者开放。

2013年10月 - Wayback Machine新功能“保存页面”开放,可以在页面被记录后一小时再查看最新的内容;联邦政府关闭期间也可以通过该工具访问政府站点。

更多可以参见: http://www.techcn.com.cn/index.php?edition-view-196173-4.html 

最新评论

我也要发表评论

收藏

返回顶部

分享到微信

打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。