+ -
当前位置:首页 → 问答吧 → 网站统计,如果从IIS日志中取出准确的访客量(也就是相当于取到独立IP的数量)..

网站统计,如果从IIS日志中取出准确的访客量(也就是相当于取到独立IP的数量)..

时间:2011-12-24

来源:互联网

暂时我假设 访客量的数量就等于独立IP数量
那么
我从日志中取到了IP的总数(去重后),然后再去掉蜘蛛的独立IP数量,最后得到的结果是3500个..

但事实上我公司做网站的那些人告诉我这个数太大了,实际上的访客还没到1000,那么多出来的这2000多个IP是怎么回事?
求有经验的达人指点一二!!!
 

作者: ximomomoxinei10   发布时间: 2011-12-24

附下SQL语句

总IP数量->
 select COUNT(distinct c-ip) as allIPCount from '{0}' where (sc-status=200 or sc-status=60)

总蜘蛛IP数量->
select COUNT(distinct c-ip) as spiderCount from '{0}' where (sc-status=200 or sc-status=60) and (cs(User-Agent) like '%baidu%' or cs(User-Agent) like '%Yahoo!+Slurp%' or cs(User-Agent) like '%google%' or cs(User-Agent) like '%YoudaoBot%' or cs(User-Agent) like '%sogou%' or cs(User-Agent) like '%msnbot%' or cs(User-Agent) like '%+bingbot%' or cs(User-Agent) like '%jikespider%')

作者: ximomomoxinei11   发布时间: 2011-12-24

可能有人采集,但并没有按照蜘蛛格式来报


--signature--------------------------
http://www.purji.com/qklist.htm

作者: amowker   发布时间: 2011-12-24

引用 2 楼 amowker 的回复:
可能有人采集,但并没有按照蜘蛛格式来报


--signature--------------------------
http://www.purji.com/qklist.htm

你说的这种情况是肯定存在的,但我怀疑不会是因为这个原因导致ip数量差距那么大。
如果是这样 还存在一个技术难点,就是蜘蛛要是和普通的地址一摸一样(或非常相似)那编程起来难度系数就大了

作者: ximomomoxinei15   发布时间: 2011-12-24

热门下载

更多