Arama Motorları Nasıl Engellenir (Resimlerle)

İçindekiler:

Arama Motorları Nasıl Engellenir (Resimlerle)
Arama Motorları Nasıl Engellenir (Resimlerle)

Video: Arama Motorları Nasıl Engellenir (Resimlerle)

Video: Arama Motorları Nasıl Engellenir (Resimlerle)
Video: Macbook Bilgisayarlarda Sıkıştırılmış Dosyalar (RAR - ZİB) Nasıl Açılır? 2024, Mayıs
Anonim

Arama motorları, web sayfalarını tarayan ve dizine ekleyen örümcekler veya botlar olarak da bilinen robotlarla donatılmıştır. Siteniz veya sayfanız geliştirme aşamasındaysa veya hassas içerik içeriyorsa, botların sitenizi taramasını ve dizine eklemesini engellemek isteyebilirsiniz. Tüm web sitelerini, sayfaları ve bağlantıları robots.txt dosyalarıyla nasıl engelleyeceğinizi ve html etiketleriyle belirli sayfaları ve bağlantıları nasıl engelleyeceğinizi öğrenin. Belirli botların içeriğinize erişmesini nasıl engelleyeceğinizi öğrenmek için okumaya devam edin.

adımlar

Yöntem 1/2: Arama Motorlarını robots.txt Dosyalarıyla Engelleme

576315 1
576315 1

1. Adım. robots.txt dosyalarını anlayın

Bir robots.txt dosyası, arama motoru örümceklerine sitenizde neye erişmelerine izin verildiğini bildiren düz veya ASCII metin dosyasıdır. Bir robots.txt dosyasında listelenen dosya ve klasörler, bir arama motoru örümcekleri tarafından taranamaz ve dizine eklenemez. Aşağıdaki durumlarda bir robots.txt dosyasına ihtiyacınız olabilir:

  • Arama motoru örümceklerinden gelen belirli içeriği engellemek istiyorsunuz.
  • Canlı bir site geliştiriyorsunuz ve arama motoru örümceklerinin siteyi taramasına ve dizine eklemesine hazır değilsiniz
  • Saygın botlara erişimi sınırlamak istiyorsunuz.
576315 2
576315 2

Adım 2. Robots.txt dosyasını oluşturun ve kaydedin

Dosyayı oluşturmak için bir düz metin düzenleyicisi veya bir kod düzenleyicisi başlatın. Dosyayı şu şekilde kaydedin: robots.txt. Dosya adının tamamı küçük harf olmalıdır.

  • "s" yi unutmayın.
  • Dosyayı kaydettiğinizde “'.txt”' uzantısını seçin. Word kullanıyorsanız, “Düz Metin” seçeneğini seçin.
576315 3 1
576315 3 1

Adım 3. Tam izin verilmeyen bir robots.txt dosyası yazın

Her saygın arama motoru örümceğinin sitenizi taramasını ve dizine eklemesini "tam izin verilmeyen" bir robots.txt dosyasıyla engellemek mümkündür. Metin dosyanıza aşağıdaki satırları yazın:

    Kullanıcı aracısı: * İzin verme: /

  • "Tam izin verilmeyen" bir robots.txt dosyasının kullanılması kesinlikle önerilmez. Bingbot gibi bir bot bu dosyayı okuduğunda sitenizi dizine eklemez ve arama motoru web sitenizi görüntülemez.
  • Kullanıcı aracıları: bu, arama motoru örümcekleri veya robotlar için başka bir terimdir
  • *: yıldız işareti, kodun tüm kullanıcı aracıları için geçerli olduğunu belirtir
  • İzin verme: /: eğik çizgi, tüm sitenin botlara yasak olduğunu gösterir
576315 4 1
576315 4 1

Adım 4. Koşullu izin verilen bir robots.txt dosyası yazın

Tüm botları engellemek yerine, sitenizin belirli alanlarından belirli örümcekleri engellemeyi düşünün. Ortak koşullu izin verme komutları şunları içerir:

  • Belirli bir botu engelle: yanındaki yıldızları değiştirin kullanıcı aracısı ile birlikte googlebot, googlebot-haberler, googlebot-image, bingobot, veya teoma.
  • Bir dizini ve içeriğini engelleyin:

    Kullanıcı aracısı: * İzin verme: /sample-directory/

  • Bir web sayfasını engelle:

    Kullanıcı aracısı: * İzin verme: /private_file.html

  • Bir resmi engelle:

    Kullanıcı aracısı: googlebot-image İzin verme: /images_mypicture.jpg

  • Tüm resimleri engelle:

    Kullanıcı aracısı: googlebot-image İzin verme: /

  • Belirli bir dosya biçimini engelle:

    Kullanıcı aracısı: * İzin verme: /p*.gif$

576315 5
576315 5

Adım 5. Botları sitenizi dizine eklemeye ve taramaya teşvik edin

Birçok kişi, sitelerinin tamamının dizine eklenmesini istedikleri için, arama motoru örümceklerini engellemek yerine hoş geldiniz istiyor. Bunu başarmak için üç seçeneğiniz var. İlk olarak, robots.txt dosyası oluşturmayı devre dışı bırakabilirsiniz; robot bir robots.txt dosyası bulamadığında, sitenizin tamamını taramaya ve dizine eklemeye devam eder. İkinci olarak, boş bir robots.txt dosyası oluşturabilirsiniz; robot robots.txt dosyasını bulur, dosyanın boş olduğunu anlar ve sitenizi taramaya ve dizine eklemeye devam eder. Son olarak, tam izin verilen bir robots.txt dosyası yazabilirsiniz. Kodu kullanın:

    Kullanıcı aracısı: * İzin verme:

  • Googlebot gibi bir bot bu dosyayı okuduğunda, sitenizin tamamını ziyaret etmekten çekinmeyecektir.
  • Kullanıcı aracıları: bu, arama motoru örümcekleri veya robotlar için başka bir terimdir
  • *: yıldız işareti, kodun tüm kullanıcı aracıları için geçerli olduğunu belirtir
  • izin verme: boş izin verme komutu, tüm dosya ve klasörlerin erişilebilir olduğunu gösterir
576315 6
576315 6

6. Adım. txt dosyasını alan adınızın kök dizinine kaydedin

robots.txt dosyasını yazdıktan sonra değişiklikleri kaydedin. Dosyayı sitenizin kök dizinine yükleyin. Örneğin, alan adınız www.alaniniz.com, robots.txt dosyasını şuraya yerleştirin www.alaniniz.com/robots.txt.

Yöntem 2/2: Arama Motorlarını Meta Etiketlerle Engelleme

576315 7
576315 7

Adım 1. HTML robotları meta etiketlerini anlayın

Robots meta etiketi, programcıların botlar veya arama motoru örümcekleri için parametreleri ayarlamasına olanak tanır. Bu etiketler, botların bir sitenin tamamını veya sitenin yalnızca bir bölümünü dizine eklemesini ve taramasını engellemek için kullanılır. Bu etiketleri, belirli bir arama motoru örümceğinin içeriğinizi dizine eklemesini engellemek için de kullanabilirsiniz. Bu etiketler, HTML dosyanızın başında görünür.

Bu yöntem, bir web sitesinin kök dizinine erişimi olmayan programcılar tarafından yaygın olarak kullanılır

576315 8
576315 8

Adım 2. Tek bir sayfadan botları engelleyin

Tüm botların bir sayfayı dizine eklemesini ve/veya bir sayfanın bağlantılarını takip etmesini engellemek mümkündür. Bu etiket, yayında olan bir site geliştirme aşamasındayken yaygın olarak kullanılır. Site tamamlandıktan sonra bu etiketi kaldırmanız şiddetle önerilir. Etiketi kaldırmazsanız, sayfanız dizine eklenemez veya arama motorları tarafından aranamaz.

  • Botların sayfayı dizine eklemesini ve bağlantılardan herhangi birini izlemesini engelleyebilirsiniz:
  • Tüm botların sayfayı dizine eklemesini engelleyebilirsiniz:
  • Tüm botların sayfanın bağlantılarını takip etmesini engelleyebilirsiniz:
576315 9
576315 9

Adım 3. Botların bir sayfayı dizine eklemesine izin verin, ancak bağlantılarını takip etmeyin

Botların sayfayı dizine eklemesine izin verirseniz, sayfa dizine eklenir; Örümceklerin bağlantıları izlemesini engellerseniz, bu belirli sayfadan diğer sayfalara olan bağlantı yolu bozulur. Aşağıdaki kod satırını başlığınıza ekleyin:

576315 10
576315 10

Adım 4. Arama motoru örümceklerinin bağlantıları izlemesine izin verin, ancak sayfayı dizine eklemeyin

Botların bağlantıları izlemesine izin verirseniz, bu belirli sayfadan diğer sayfalara giden bağlantı yolu inceliğini korur; Sayfayı dizine eklemelerini kısıtlarsanız, web sayfanız dizinde görünmez. Aşağıdaki kod satırını başlığınıza ekleyin:

576315 11
576315 11

Adım 5. Tek bir giden bağlantıyı engelleyin

Bir sayfada tek bir bağlantıyı gizlemek için rel bağlantı etiketi içindeki etiket. Engellemek istediğiniz belirli sayfaya yönlendiren diğer sayfalardaki bağlantıları engellemek için bu etiketi kullanmak isteyebilirsiniz.

    Engellenen Sayfaya Bağlantı Ekle

576315 12
576315 12

Adım 6. Belirli bir arama motoru örümceğini engelleyin

Web sayfanızdaki tüm botları engellemek yerine, bir botun sayfayı taramasını ve dizine eklemesini engellemek isteyebilirsiniz. Bunu başarmak için meta etiket içindeki “robot”u belirli bir botun adıyla değiştirin. Örnekler şunları içerir: googlebot, googlebot-haberler, googlebot-image, bingobot, ve teoma.

576315 13
576315 13

Adım 7. Botları sayfanızı taramaya ve dizine eklemeye teşvik edin

Sayfanızın dizine eklenmesini ve bağlantılarının takip edilmesini istiyorsanız, bir takip izni ekleyebilirsiniz. meta "robot" başlığınıza etiketleyin. Aşağıdaki kodu kullanın:

Önerilen: