soho外贸建站如何分析 网站日志 ?
作为一个外贸建站人员,如果说不会看 网站日志 ,那是要被人笑话的。虽然这方面的工作需要一定的计算机基础知识储备,当也没有那么难以理解。今天我们就来实操讲解一下如何看自己的网站日志。先来看一下什么叫网站日志
一.网站日志的概念
网站日志是由服务器自动创建和维护的日志文件,其中包含其所执行活动的列表。简单的讲就是包含页面请求的历史记录的一个网站数据文件。包括客户端IP地址、请求日期/时间、请求的网页、HTTP代码、提供的字节数、用户代理、引用地址等相关信息。再通俗点讲可以理解为网站日志就相当于主机拿着个小本本,记录下来谁来过你的网站,做了些什么事情,包括正常访问,破坏性访问和搜索引擎蜘蛛的抓取信息。
二.什么时候会产生网站日志的记录
每当一个ip对你的网站主机发起内容请求的时候,你的主机会做很多事情,包括但不仅限于SSL安全证书验证,内容请求检查,内容数据包发送……等等,这个时候网站日志就会对远端计算器的请求进行记录,内容包括ip地址,请求的内容,请求的时间等等。这就好比是打入冷宫的后妃,默默的在心里记着这些年的心酸悲苦,但是你想不起去查看这些后妃(网站日志),它/她不会主动展示和汇报,只等着某一天你想起它/她的时候去临幸它,它才会告诉你这些年哪些太监欺负过她,哪些宫女一心为主。
三.网站日志包括哪些内容?
我们先来看一段典型的网站日志报告,如下所示:
108.179.226.62 – [09/Jan/2020:15:32:39 +0800] “GET/https://www.jackgoogleseo.com/top10-knowledges-for-google-seo/HTTP/1.0″200 25122
如果在没有学习如何看懂网站日志之前,是不是感觉上面这段日志根本就看不懂?接下来我们简单的分析一下这段网站日志的记录包含了哪些内容?
1.远程主机IP
108.179.226.62这一串数字相信大家应该都能理解,是的,这就是某个访客点击我们网站的时候他的电脑端ip地址。(为什么说是访问时候的ip,因为有些访客不一定用的是他的本地网络ip,这个用过梯子的同学就能够明白了)
2.页面请求发生时间
09/Jan/2020就是2020年1月9号该访客的远程主机发起对我网站页面内容请求的日期,15:32:39就是1月9号这天下午3点32分39秒那一刻它在发起对我的网页内容请求,+0800是因为我的时间设置的是北京时间,北京时间是东八区,也就是说比格林威治时间要晚8个小时
3.请求的页面内容
GET是请求的意思,就是说这个远程主机给我的网站主机发出了一个内容获取的请求,具体的请求内容就是我的这个页面,url=https://www.jackgoogleseo.com/top10-knowledges-for-google-seo
4.http的请求协议
HTTP/1.0是指远程主机和我的网站主机是通过HTTP/1.0的握手协议达成内容请求合作的,随后的200显示的就是请求的具体情况,200代表的就是请求正常,给予对方完整的我这个网页的全部前端显示内容
5.请求内容的长度
25122代表的是字节,大家都知道2个字节是代表一个汉字的内存量,这样算下来,差不多这个页面的内容有12000个汉字左右。因为Jack老师的这个页面内容没有太多的视频和图片。
此外,网站日志还会记录其他更多的相关内容信息,具体的还要根据自己网站主机的操作系统和CRM系统进行分析。
上面讲了这么多好像并没有什么特别要重点注意的地方,那么有些同学会疑惑网站日志对我们外贸建站有什么实质性的帮助吗?在这里Jack老师可以很负责任的告诉你,有帮助!而且可以说学会分析自己的网站日志是你从建站新手到建站老手的一个重要标准线,接下来我们来详细说一下研究分析网站日志能够给我们带来什么好处
1.网站日志实时的记录你网站所发生的任何事情
不管你同不同意,网站日志都在悄悄的记录网站发生的任何事情,只不过你没有特别大的兴趣去每时每刻关注它。哪怕是黑客入侵或者是其他访客的正常范围,任何网站上的风吹草动都会被网站日志如实的记录下来,当你有一天发现网站出问题的时候,你完全可以通过网站日志进行分析,查找出具体是谁对你的网站做了些什么事情。
2.可以分析各搜索引擎对你网站的爬取情况
很多同学喜欢用一些分析工具去查看自己网站的相关情况,比方说展现量,点击率,搜索引擎蜘蛛的爬取频率等等。但是这些数据不管是搜索引擎官方给出的也好,还是其他第三方分析工具给出的也罢,都不可避免的存在相关数据统计不够准确的情况。而网站日志则网站的统计了每一次人为或者机器访问的相关数据,更有利于你对自己网站的相关情况的掌握和了解
3.了解终端的访问设备情况
随着智能移动设备的不断发展,手机和平板成为了搜索引擎的新宠。便捷,快速,随时随地成了移动端搜索工具的最大优势。而谷歌等搜索引擎对于移动端页面搜索质量评估是非常看重的,如果移动端的搜索质量评估得分不高会直接影响我们外贸网站网页的排名情况。目前市场上最流行的就是android和ios两大系统。因为系统的不同,所以在移动端流量页面也会多少存在一些差异,特别是在一些js效果比较多的2c类型网站上。通过网站日志外贸可以清楚的看到android和IOS两者的使用数量统计,有助于我们针对不同的移动端操作系统设计全新的UI内容和效果
4.了解网站的内容服务情况
在上文中我们有提到过,当远程主机向我们的网站主机发起内容请求的时候,网站日志会记录这一行为,并对这一请求行为进行检测,如实的报告是否完成这一请求的内容传递,之前的网站日志显示了一个代码是200,说明这个请求是完全满足了,也就是意味着该远程主机用户的访客完整的得到了Jack老师那篇文章的全部内容。当然了如果我们的网页url进行了修改,那么这个请求就将得不到满足,网站日志就会如实的记录下404,这样,当我们下一次去查看自己网站的404页面之后,就不需要通过其他链接分析工具,直接在网站日志上就可以看到这些404页面的url,然后做重定向或者是删除该url
5.需要注意的一点
为了提升网页内容加载速度,我们很多同学都会选择用缓存或者内容分发式网络CDN,这样的好处就是打开你网页的速度变的快了,但同时也存在一个问题就是,当访客的浏览器发送内容获取请求的时候,这个内容先到了CDN服务商,因为你的网页很大部分上是长久不发生新的内容的增添的基本都是之前的内容,所以CDN服务商就直接把它所拥有的该请求内容直接发到访客的浏览器上,这样的情况下,访客真实的访问了你的网站也看到了你网站的全部内容,但是该记录却因为远程主机的页面内容请求没有发送到你的网站主机服务器上,所以你的网站日志也就没有对其进行记录,从而在总的网站访客数据统计量上会比真实的少一些。
上面的讲了这么多纯属科普,同学们大概的看一下明白网站日志是干嘛的就行了,接下来我们讲实操部分。Jack老师网站系统是Nginx的,我用了filezilla这个FTP软件(不要问我FTP软件是干嘛的,谷歌一下你就知道)。在连上我的网站主机后台之后,选择Log文件夹进行内容查找,如下图所示
右键点击该文件,然后点击“下载”,当该文件下载到本地电脑上的时候,先新建一个文件夹,然后将下载好的网站日志文件解压到该文件夹,如下图所示:
为了考虑到一些没有代码基础的同学更加方便的理解和分析网站日志的内容,Jack老师这里会用360星图这款网站日志工具进行分析
360星图的下载地址:点击此处下载360星图网站日志分析工具
下载好360星图分析工具之后,进行解压和安装,在使用之前,看一下解压文件中的“使用前必读”txt文件,这里Jack老师把最重要的三点照抄列出来
第一步:打开配置文件/conf/config.ini:填写日志路径[log_file配置项],其他配置项可以选择配置
第二步:点击start.bat,运行程序;
第三部:运行完毕,分析结果在当前程序根目录下的/result/文件夹下。
1.然后我们按着它的要求进行第一步操作,打开/conf/config.ini:文件
注意:log_file:后面添加的文件地址是前面我们用filezilla这个ftp文件下载的网站的log文件并进行解压存放的本地电脑地址,如上图所示,Jack老师将这个文件解压后放在了桌面上的名为“2”的文件夹,我们解压好的网站日志文件就叫“1”,1这个文件的格式就是.com-Dec-2019
2.点击360星图文件夹中的start.bat文件进行运行解析上面添加的网站日志文件
3.这个程序运行需要一点时间,时间的长短和我们刚才提交的网站日志文件大小直接相关,分析完成后,其结果已经在360星图文件夹的“result”文件中,我们点击进行查看,该文件夹中这时候有4个分析统计文件,分别是安全分析报告,常规分析报告,可疑访问和漏洞攻击;我们先点击查看安全分析报告,如下图所示
好吧,Jack老师承认自己的网站访问量确实有点低,需要多多努力,一个月下来才6000来个访问量,实在是对不起这些年吹的牛,哈哈。在这张图表上,我们可以清楚的看到,近期有多个ip对我的网站进行了100次的漏洞攻击,用了9种不同的办法来试图搞我的网站,主要以文件和服务器攻击为主。下面就来曝光他们的ip吧
看到上面的数据,我只想和江苏的这位大兄弟说一声,我网站上没啥值钱的,别搞我了,消停点吧,至于如何防范这种恶意攻击,Jack老师将在另外的章节进行详细实操讲解,这里因为篇幅和文章内容的关系先按下不表,接下来我们再看一下第二个文件内容—常规日志分析报告,这个是我们平时要分析的重点内容,如下图所示
依然是惨不忍睹的数据,看来要是不排名到首页是没什么资格吹牛了。其中有这五个数据要我们引起重视
1.IP流量分析(TOP200):这里的的统计数据详细的记录了在这段统计时间范围内的访问次数最多的前200名ip,某些异常多的访问次数ip就需要引起我们的重视了,如果有需要的话就应该对其进行屏蔽ip,特别是当我们后期做google ads的时候,比方说我们的目标市场是欧美不想做印度市场,这时候偏偏有很多印度的ip出现在网站日志的统计数据上,那我们就要果断的对印度段的IP进行屏蔽,以免不必要的谷歌广告费用的流失
2.页面访问分析(TOP200)
在这个统计数据中,我们可以看到范围页面最多的还是一些php文件,但是在第6行和第15行,这两个页面是我的文章页面。第一个页面是因为jack老师的网点新文章基本都指向了它(它类似于一个网站导航文字链接页面)所以访问量拍第一,第二个页面是因为这篇文章Jack老师写的比较用心,如果做适当的引流和关键词优化的话应该会有一个比较好的排名结果。这个统计数据就是让我们知道哪些页面做的好哪些页面做的不好,当然了付费推广和社交引流的页面所造成的排名靠前结果不在这个讨论范围之内
3.静态资源访问分析
这个静态资源包括的内容就比较多了,比方说我们的网站robot.txt文件,上传在网站上的图片等等,对于一些访问次数比较多大静态资源我们要尽可能的对其进行优化,比方说某些图片文件比较大,我们需要对其进行无损压缩或者其他内容替换等,这样做的好处是提升一定程度的访客端页面加载速度
4.死链分析
死链分析没有什么太多好说的内容,看一下具体的死链情况,如果内容比较重要就新增内链来打通该页面,如果页面不重要或者页面已经失效,那么干脆就删除算了,以免占用网站主机资源还给谷歌这小机灵鬼留下不好的印象。
5.搜索引擎爬虫分析
这个搜索引擎爬虫分析还是比较重要的,直接显示了主要的搜索引擎对你网站的爬取频率,如图所示
如果做中文内容的话,还是建议要在百度搜索引擎上再多花点功夫,没办法,谁让中文搜索引擎的老大是百度呢,当然如果是做外贸建站就不要去理会百度搜索引擎了,国外的采购基本没什么人用,更谷歌比确实是差了很多,不管是搜索引擎的技术上还是排名的公正性上。
其他还有很多的分析内容,受限于文章篇幅的关系这里就不一一展开讨论了。我们再说一下刚才360星图分析的另外两个结果:可疑访问和漏洞攻击。这两个文件都是txt格式的文件,看起来也比较累。没什么计算机基础的同学虽然也能看的懂,但是看懂了也不太明白该怎么去操作,所以我想同学们可以也不太想听我讲那些具体的理论分析,有兴趣的同学可以私聊我,Jack老师对这方面不是很专业,欢迎大家来给Jack老师上上课。
好了,以上就是本章关于soho外贸建站如何分析 网站日志 的全部内容,内容比较偏向技术性讲解,需要同学们慢慢去阅读和操作,如果有其他不理解的地方,没关系,解决方案如下:
QQ:3233269705
QQ群:645296397
微信公众号: