服务器日志由服务器自动生成。它记录了搜索引擎蜘蛛的爬行情况、用户访问的页面以及服务器的异常状态。Windows系统称为IIS日志,Linux系统称为Apache日志。服务器日志在哪里?使用服务器日志可以分析哪些数据?让我们了解一下。

1、 服务器日志的位置。

服务器日志存在于网站空间,不同空间的商会略有不同。如果你找不到,你可以问空间商。这里以万旺为例来说明。登录阿里云账号→进入管理控制台→选择左侧列表中的云虚拟机→点击虚拟机最右侧的管理按钮,进入主机管理控制台→文件管理→网站日志下载(如下图所示)→下载。

下载网站日志后,会出现提示:“日志已下载到FTP服务器。请登录到FTP下载日志文件。”日志文件存在于FTP的wwwlogs文件夹中。我们可以登录到FTP并下载它。

2、 将服务器日志导入Excel

当我们以记事本的形式打开服务器日志时,它反映了大量的英文和数字。竞珠SEO在这里分享了一个将日志导入excel的方法,而且数据会一目了然。

创建新的WPS表格(Excel)→打开→数据→导入数据→选择数据源(注意:文件格式应更改为所有文件,否则将看不到日志)→打开→下一步→下一步→选择分隔符(同时选择制表符和空格)→完成。数据导入excel。

3、 服务器日志分析。

导入到表中的数据很清楚,每一行都是一次访问(包括spider和用户),每一列表示同一组数据。我们还需要用常识来判断一些数据。如下图所示,一栏是用户的IP地址,第四栏是日期和时间,“11/Jan/2016”是指2016年1月11日。二、三、五栏每行数据相同,无比较参考意义。在分析数据时可以隐藏或删除它。

网站日志数据中有很多栏目。当我们分析日志时,只需要留下“用户IP、用户信息、时间、访问页面和HTTP状态码”。排序后的日志如下图所示。(用户信息通常是信息量较多的一列)。我们可以清楚地看到哪个IP在什么时候访问了我们网站的哪个页面。搜索引擎蜘蛛也有自己的IP段,可以在百度上搜索。

4、 HTTP状态代码筛选。

用户访问任何一个页面,服务器都会返回一个三位数字的状态码,用户看不到的状态码,可以通过站长工具查询,每个状态码与站点不同,其中200位是能够正常访问的页面。有关更多状态代码信息,请参阅上一篇文章。您可以通过状态代码列查看服务器的实时状态。要筛选表,请选择“HTTP状态码”单元格,然后单击自动筛选。

然后单击单元格中的箭头以筛选出带有单个返回代码的页面。例如,如果您只选择404,您可以看到哪些页面不存在。根据HTTP状态码,找出问题并及时解决。