مجله علمی تفریحی بیبیس
0

دانلود کتاب بیش از 200 نکته پایتون و علم داده

بازدید 1328
  • عنوان کتاب: 200+ Python & Data Science Tips
  • نویسنده: avichawla.substack.com
  • حوزه: برنامه نویسی پایتون
  • سال انتشار: 2023
  • تعداد صفحه: 263
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 18.2 مگابایت

عملکرد KMeans کاملاً به مرحله اولیه سازی مرکز بستگی دارد. بنابراین، به دست آوردن خوشه های نادرست بسیار محتمل است. در حالی که KMeans++ مقداردهی اولیه مرکزی هوشمندتر را ارائه می دهد، همیشه همگرایی دقیق را تضمین نمی کند (در پست قبلی من بخوانید که KMeans++ چگونه کار می کند). این امر به ویژه زمانی صادق است که تعداد خوشه ها زیاد باشد. در اینجا، تکرار الگوریتم ممکن است کمک کند. اما سربار غیر ضروری را در زمان اجرا معرفی می کند. در عوض، Breathing KMeans در اینجا جایگزین بهتری است. نحوه کار به این صورت است: • مرحله 1: k centroid را راه اندازی کنید و KMeans را بدون تکرار اجرا کنید. به عبارت دیگر، آن را با مقداردهی اولیه متفاوت دوباره اجرا نکنید. فقط یکبار اجراش کن • مرحله 2 – تنفس در مرحله: m مرکز جدید اضافه کنید و KMeans را با (k+m) مرکز بدون تکرار اجرا کنید. • مرحله 3 – مرحله بازدم: m centroids را از مرکز (k+m) موجود حذف کنید. KMeans را با k مرکز باقیمانده بدون تکرار اجرا کنید. • مرحله 4: m را 1 کاهش دهید. • مرحله 5: مراحل 2 تا 4 را تا m=0 تکرار کنید.

The performance of KMeans is entirely dependent on the centroid initialization step. Thus, obtaining inaccurate clusters is highly likely. While KMeans++ offers smarter centroid initialization, it does not always guarantee accurate convergence (read how KMeans++ works in my previous post). This is especially true when the number of clusters is high. Here, repeating the algorithm may help. But it introduces an unnecessary overhead in run-time. Instead, Breathing KMeans is a better alternative here. Here’s how it works: • Step 1: Initialise k centroids and run KMeans without repeating. In other words, don’t re-run it with different initializations. Just run it once. • Step 2 — Breathe in step: Add m new centroids and run KMeans with (k+m) centroids without repeating. • Step 3 — Breathe out step: Remove m centroids from existing (k+m) centroids. Run KMeans with the remaining k centroids without repeating. • Step 4: Decrease m by 1. • Step 5: Repeat Steps 2 to 4 until m=0.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: 200+ Python & Data Science Tips

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

بیشتر بخوانید