# robots.txt for www.sp-kerzen.de # Diese Datei regelt, welche Inhalte von Suchmaschinen gecrawlt werden dürfen # Sitemap Sitemap: https://www.sp-kerzen.de/sitemap/sitemap.xml # Allgemeine Regeln für alle Bots User-agent: * Disallow: /404/ Disallow: /app/ Disallow: /cgi-bin/ Disallow: /includes/ Disallow: /lib/ Disallow: /magento/ Disallow: /pkginfo/ Disallow: /report/ Disallow: /stats/ Disallow: /var/ Disallow: /index.php/ Disallow: /index.html/ Disallow: /catalog/product_compare/ Disallow: /catalogsearch/ Disallow: /checkout/ Disallow: /control/ Disallow: /contacts/ Disallow: /customer/ Disallow: /customize/ Disallow: /cron.php Disallow: /cron.sh Disallow: /error_log Disallow: /install.php Disallow: /LICENSE.html Disallow: /LICENSE.txt Disallow: /LICENSE_AFL.txt Disallow: /STATUS.txt # Zusätzliche Sperrung problematischer URLs # Suchparameter Disallow: /*?q= Disallow: /*?___from_store= # Auffällige kryptische URLs (z. B. /-1234/) Disallow: /-327/ Disallow: /-4141/ Disallow: /-5895/ Disallow: /-4387/ Disallow: /-1684/ Disallow: /-3736/ Disallow: /-1157/ Disallow: /-873/ Disallow: /-2134/ Disallow: /-455/ # (optional: vollständige Liste einfügen, z. B. 50–100 Einträge, wenn nötig) # Google Image Crawler User-agent: Googlebot-Image Allow: /* # Google AdSense Crawler User-agent: Mediapartners-Google* Disallow: Allow: /* # Google Ads Crawler User-agent: AdsBot-Google Disallow: Allow: /* # Baidu Crawler blockieren User-agent: Baiduspider Disallow: / # Bots blockieren (unerwünschte Crawler) User-agent: 360Spider Disallow: / User-agent: Imgur.com Disallow: / User-agent: AhrefsBot Disallow: / User-agent: MJ12bot Disallow: / # Zusätzliche Bots (nach Bedarf blockieren) User-agent: SemrushBot Disallow: / User-agent: DotBot Disallow: / User-agent: YandexBot Disallow: /