Twitter开源流量异常侦测工具:AnomalyDetection
Twitter本周宣布开源流量异常侦测工具AnomalyDetection,该工具可以发现那些能够影响网站服务质量的异常活动,例如流量拥堵或垃圾信息机器人。
AnomalyDetection是一个R语言程序包,Twitter通常会在重大新闻和体育赛事期间用AnomalyDetection扫描入站流量,发现那些使用僵尸账号发送大量垃圾(营销)信息的机器人。
AnomalyDetection异常扫描
据Twitter透露,AnomalyDetection与Twitter去年10月开源的BreakoutDetection存在互补关系。
流量异常侦测对于号称“地球脉搏”的Twitter来说非常具有挑战性,因为对流量进行长周期跨度(例如一年)的扫描分析时,一些异常活动往往会掩盖掉。此外,流量异常的原因也各有不同,有的是健康的,例如重大新闻事件导致的流量异常,而有的是不好的,例如QPS(每秒查询量)中point-in-time实时性下降可能意味着硬件或数据采集方面出了问题。
长周期流量异常侦测
AnomalyDetection通过GNU公众授权许可协议开源,目前可以在GitHub上下载到源码。