- عنوان کتاب: Supplementary Material for “Probabilistic Machine Learning: Advanced Topics”
- نویسنده: Kevin Murphy
- حوزه: یادگیری ماشین
- سال انتشار: 2022
- تعداد صفحه: 214
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 7.13 مگابایت
PageRank غیرقابل اشتباه نیست. به عنوان مثال، استراتژی اتخاذ شده توسط JC Penney، یک فروشگاه بزرگ در ایالات متحده را در نظر بگیرید. در طول فصل کریسمس سال 2010، پیوندهای زیادی به صفحه اصلی خود در 1000 صفحه وب بی ربط قرار داد، بنابراین رتبه خود را در موتور جستجوی Google افزایش داد. حتی اگر هر یک از این صفحات منبع رتبه پایینی دارند، تعداد آنها به قدری زیاد بود که تأثیر آنها افزایش یافت. کسب و کارها این را بهینه سازی موتور جستجو می نامند. گوگل آن را وب اسپم می نامد. هنگامی که گوگل از این کلاهبرداری مطلع شد (توسط نیویورک تایمز)، به صورت دستی جی سی پنی را کاهش داد، زیرا چنین رفتاری قوانین رفتار گوگل را نقض می کند. نتیجه این بود که جی سی پنی از رتبه 1 به رتبه 65 سقوط کرد و اساساً آن را از دید ناپدید کرد. تشخیص خودکار چنین کلاهبرداریهایی به تکنیکهای مختلفی بستگی دارد که خارج از محدوده این فصل است….
PageRank is not foolproof. For example, consider the strategy adopted by JC Penney, a department store in the USA. During the Christmas season of 2010, it planted many links to its home page on 1000s of irrelevant web pages, thus increasing its ranking on Google’s search engine. Even though each of these source pages has low PageRank, there were so many of them that their effect added up. Businesses call this search engine optimization; Google calls it web spam. When Google was notified of this scam (by the New York Times), it manually downweighted JC Penney, since such behavior violates Google’s code of conduct. The result was that JC Penney dropped from rank 1 to rank 65, essentially making it disappear from view. Automatically detecting such scams relies on various techniques which are beyond the scope of this chapter.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Supplementary Material for “Probabilistic Machine Learning: Advanced Topics”
نظرات کاربران