طبق ادعای عجیب یکی از تحلیلگران گوگل، 60 درصد از کل اینترنت را محتوای تکراری تشکیل میدهد؛ اما دقیقاً منظور از محتوای تکراری یا کپی چیست؟
مدتی قبل یکی از اعضای گوگل اعتراف کرده بود گوگل معیار مشخصی برای تعیین محتوای کپی ندارد. با این حال، به تازگی «گری ایلیز» (Gary Illyes) به عنوان تحلیلگر وبمستر گوگل طی رویداد Google Search Central Live در سنگاپور ادعای عجیبی کرده است. به گفته او 60 درصد از کل اینترنت را محتوای تکراری در بر میگیرد.
حالا با این ادعای عجیب گوگل، این سوال مطرح است که محتوای «تکراری» یا «کپی» چطور تعریف میشوند؛ به طور دقیقتر، آیا دو مطلب باید کاملاً یکسان باشند یا حتی شباهتهای جزئی هم میتواند در تشخیص محتوا به عنوان تکراری تاثیرگذار باشد؟ گوگل محتوای تکراری (Duplicate) را بلوکهایی از محتوا داخل یا در میان دامنهها تعریف کرده است که دقیقاً یکساناند یا شباهتی آشکار به محتویات دیگر دارند.
با چنین رقم چشمگیری از محتوای تکراری، اهمیت تولید محتوای منحصر به فرد و بهینهسازی تمام و کمال برای موتور جستجو یا سئو (SEO) دو چندان میشود. گذشته از اینها، تحلیلگر مذکور معیارهای گوگل برای حذف محتوای تکراری را ذکر کرده است که عبارتاند از: حذف پروتکلهای تکراری با ارجحیت HTTPS، نسخه دارای اسلش یا بدون اسلش، WWW یا غیر WWW، نشانیهای دارای مولفههای بیفایده و چکسامهای یکسان (بلوکی کوچک از دادهها برای ارزیابی). ضمناً باید به این نکته اشاره کرد که اگر دو جفت چکسام حاصل از محتوای اصلی همسان باشند، گوگل آنها را تکراری در نظر میگیرد.