tuto:ipasserelle:web:requetes_sql_logs_squid

Requêtes SQL sur les journaux de squid

Avec la contrib WebFiltering, tous les journaux de squid sont inscrit dans une base de données MySQL. Cette page recense quelques requêtes utiles pour l'analyse de ces données

  • Les 60 noms de domaines les plus visités sur les 3 derniers mois
SELECT DOMAIN, COUNT( DOMAIN ) AS occurances
FROM access_log
WHERE date_day > DATE_SUB( CURDATE( ) , INTERVAL 2 MONTH ) 
AND DOMAIN NOT LIKE  '192.168.%'
GROUP BY DOMAIN
ORDER BY occurances DESC
LIMIT 60;
  • La même chose, en essayant d'enlever des résultats les serveurs de pub et autres traceurs les plus courants
SELECT DOMAIN, COUNT( DOMAIN ) AS occurances
FROM access_log
WHERE date_day > DATE_SUB( CURDATE( ) , INTERVAL 2 MONTH ) 
AND DOMAIN NOT LIKE '192.168.%'
AND DOMAIN NOT LIKE '%adnxs.com'
AND DOMAIN NOT LIKE '%google-analytics.com'
AND DOMAIN NOT LIKE '%cedexis.com'
AND DOMAIN NOT LIKE '%cedexis-radar.net'
AND DOMAIN NOT LIKE '%xiti.com'
AND DOMAIN NOT LIKE 'ads.%'
AND DOMAIN NOT LIKE '%adnext.fr'
AND DOMAIN NOT LIKE '%.addthis.com'
AND DOMAIN NOT LIKE '%.googleadservices.com'
AND DOMAIN NOT LIKE '%.scorecardresearch.com'
AND DOMAIN NOT LIKE '%.estat.com'
AND DOMAIN NOT LIKE '%.doubleclick.net'
AND DOMAIN NOT LIKE 'pubs.lemonde.fr'
AND DOMAIN NOT LIKE '%.quantserve.com'
AND DOMAIN NOT LIKE '%.pubdirecte.com'
AND DOMAIN NOT LIKE '%.ligatus.com'
AND DOMAIN NOT LIKE '%.ezakus.net'
AND DOMAIN NOT LIKE 'adserver.adtech.de'
AND DOMAIN NOT LIKE '%.yieldmanager.com'
AND DOMAIN NOT LIKE 'stats.wordpress.com'
AND DOMAIN NOT LIKE '%.smartadserver.com'
GROUP BY DOMAIN
ORDER BY occurances DESC
LIMIT 60
  • Les 30 plus gros consommateurs de web (en bande passante), sur les 3 derniers mois
SELECT client_ip AS  'Adresse IP', username AS Utilisateur, SUM( reply_size / ( 1024 *1024 ) ) AS Volume
FROM access_log WHERE client_ip!='127.0.0.1' 
AND date_day > DATE_SUB( CURDATE( ) , INTERVAL 2 MONTH ) 
GROUP BY client_ip
ORDER BY Volume DESC 
LIMIT 30;
  • tuto/ipasserelle/web/requetes_sql_logs_squid.txt
  • Dernière modification: 25/03/2013 14:57
  • de dani