AWStats是首要的web分析报告工具,用于分析web服务器日志中的数据,以报告web、流媒体、邮件和FTP服务器等服务。我们与创始人Laurent Destailleur(Eldy)讨论了这一切是如何开始的,是什么让它优于其他工具,以及为什么他选择将其作为开源软件免费共享。
这篇采访最初发表于2020年4月19日
AWStats是一种分析web服务器技术日志的工具,用于以清晰易懂的方式编译数据并报告网站流量。
大多数其他日志分析器只是计算日志文件中的行数,以确定访问次数。由于许多原因,这种计算流量的方法会产生错误的结论。AWStats则不同,因为它使用了几种专用算法来获得更精确的结果。
AWStats只需要一个web服务器日志文件就可以运行,但可以从多个日志文件和多个web服务器编译数据,就像它是一个单一的服务器文件一样。这些日志文件包含大量信息,包括访问过的页面和下载的图像的数量,以及访问该网站的时间、IP地址和浏览器。AWStats使用这些信息来推断站点的流量是真实的、蠕虫还是机器人,并以图形视图显示这些信息
修改AWStat的引擎以分析其他日志文件很容易,因此该工具得到了增强,可以分析电子邮件服务器(报告输入和输出电子邮件)和媒体服务器日志(详细说明在媒体文件上花费的时间、从何处、何时等)。
因为AWStats是用Perl开发的,所以它将在所有平台和操作系统上运行。
AWStats可以分析任何日志文件,只要它是文本文件。我们的配置工具可以定义日志文件的格式,因此支持任何格式,甚至自定义文件。
2005年,法国领先的电视和媒体公司需要一个解决方案来分析其网站的流量。所有现有工具要么太慢,要么无法处理它们的大型日志文件。当他们接近AWStats时,我开发了一个解决方案,可以在不增加内存消耗的情况下分析这些异常大的文件,并且仍然保持高水平的性能。由于这次升级,AWStats可以分析任何大小的日志文件
虽然AWStats不需要对网站进行任何更改,但它确实需要访问日志文件才能运行报告。如有必要,可以下载日志文件,并在本地处理统计数据。
与其他日志分析器相比,AWStats内置的许多功能可以确保获得更准确的结果。例如:如果一个机器人被击中。我们知道访问是由机器人而不是人类完成的。其他日志分析器只是放弃了对robot的访问。txt。AWStats会记住用于获取机器人的IP。txt文件,所以之前或之后的任何其他访问,甚至在公共网页上,使用相同的IP,都可以解释为机器人访问。 AWStats可以随时运行。AWStats使用二进制指针和时间戳指针保存日志文件中分析的最后一个位置。这样,在运行后续分析时,即使日志文件已被清除或旋转,它也可以从上次结束的位置快速提取流程。运行AWStats的频率越高,速度就越快。 AWStats于2000年作为开源软件在Sourceforge上发布,原因有几个。 AWStats的主要贡献是其规则和签名数据库的增强,这些数据库用于检测关键字、蠕虫、病毒、浏览器、操作系统、智能手机等。 漏洞修复贡献也是非常有建设性的。收到bug修复总是一件很愉快的事,尤其是对于那些我不知道的bug! 插件体系结构,例如GeoIP插件,也主要由外部贡献者处理。
AWStats拥有一个签名数据库,不仅可以排除机器人,还可以排除蠕虫或蜘蛛攻击。在日志分析过程中,该数据库也会动态变化。启发式分析增强了检测能力。
AWStats可以区分对图像和页面的访问。因此,当访问了图像且仅访问了图像时,我们可以确定它不是人类访客,即使所有其他信息都表明它不是人类访客。
AWStats试图通过重定向整合页面访问,以便能够推断出未读取的页面,并避免在仅读取一个页面时将其计为两个页面。
AWStats可以通过外部插件进行增强。
AWStats有自己的算法,针对日志分析情况进行了优化,可以对结果进行排序,并提供前5名、前10名和前20名,比使用传统排序算法快得多。
AWStats使用可变延迟来估计会话的开始和结束,与传统的比较工具相比,该算法运行得更快。
AWStats使用规则数据库和启发式分析,以便能够假定用于查找网站的关键字。
只有在AWStats中才能找到许多其他功能,它们比任何其他日志分析器都能确保更好的准确性和性能AWStats多久运行一次
为什么选择将AWStats作为开源软件共享
I花了很多时间开发AWStats,并且觉得如果我是唯一的用户,那么花的时间不是一个好的投资。将其作为开源软件发布,大大减少了我为每个用户花费的时间。
这是AWStats获得人气和工具帮助的好方法。当我第一次搜索网络流量分析工具时,我对可用的糟糕选择感到失望。将AWStats共享为开放源代码确保了其他人不会发生这种情况贡献者对您的项目做了哪些重大更改或添加