- عنوان کتاب: Advanced Methods and Deep Learning in Computer Vision
- نویسنده: Roy Davies
- حوزه: بینایی کامپیوتر
- سال انتشار: 2022
- تعداد صفحه: 584
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 25.6 مگابایت
اکنون نزدیک به یک دهه از رشد انفجاری در توسعه و کاربرد شبکههای عصبی عمیق (DNN) میگذرد و پیشرفتهای بعدی آنها چندان قابل توجه نبوده است. درست است، به این پیشرفت کمک قابل توجهی با استقرار سخت افزار ویژه در قالب GPU های قدرتمند شده است. و پیشرفت آنها از درک این موضوع بود که CNNها یک پایگاه معماری مهم را تشکیل میدهند، که ویژگیهایی مانند ReLUs، ادغام، لایههای کاملاً متصل، unpooling و deconvolution را نیز میتوان در آن گنجاند. در واقع، همه این تکنیکها به جان بخشیدن به DNN و گسترش استفاده از آنها کمک کردند، بنابراین رشد تقریباً تصاعدی اولیه در استفاده از آنها بدون وقفه برای کل دوره بعدی حفظ شد. نه تنها قدرت این رویکرد چشمگیر بوده است، بلکه کاربرد آن به طور قابل توجهی از تاکید اولیه بر مکان یابی سریع شی و تقسیم بندی تصویر – و حتی تقسیم بندی معنایی – به جنبه های مربوط به ویدئو به جای تجزیه و تحلیل تصویر صرف، گسترش یافته است. بیهوده است اگر ادعا کنیم که کل توسعه بینایی رایانه از سال 2012 صرفاً به دلیل ظهور DNN ها بوده است. سایر تکنیکهای مهم مانند یادگیری تقویتی، یادگیری انتقالی، خود نظارتی، توصیف زبانی تصاویر، انتشار برچسب، و کاربردهایی مانند تشخیص تازگی و ناهنجاری، نقاشی و ردیابی تصویر، همگی نقش داشته و در گسترش و بلوغ رایانه نقش داشتهاند. چشم انداز. با این وجود، بسیاری از چنین تکنیکها و حوزههای کاربردی با جذب بسیار سریع DNN تحریک، به چالش کشیده و تقویت شدهاند. هدف این جلد بررسی نحوه پیشرفت بینایی کامپیوتر از زمان ایجاد این تغییرات چشمگیر است. در واقع، ما میتوانیم بهطور معتبر بپرسیم که اکنون کجا هستیم، و پایگاه یادگیری ماشینی و عصبی عمیقی که بینایی کامپیوتر اخیراً بر روی آن قرار گرفته است، چقدر محکم است. آیا این یک حرکت منسجم یا یک عجله کورکورانه فرصت طلبانه به جلو بوده است که در آن کارگران احتمالات مهم را نادیده گرفته اند و آیا می توانیم آینده را بیشتر ببینیم و مطمئن باشیم که در مسیر درست پیش می رویم؟ یا آیا این موردی است که هر کارگر می تواند دیدگاه خود را داشته باشد و برای هر کاربرد معین صرفاً به آنچه ضروری به نظر می رسد توجه کند، و اگر چنین است، آیا با به کارگیری رویکرد محدودی از این دست چیزی از دست می رود؟ در واقع، سوالات بسیار مرتبط دیگری نیز وجود دارد که باید به آنها پاسخ داده شود، مانند سوالی که یک شبکه عمیق تا چه حد می تواند به اندازه مجموعه داده ای که روی آن آموزش داده شده است، قدرتمند باشد. این سؤال احتمالاً برای هر رویکرد مبتنی بر یادگیری جایگزین، چه قابل توصیف به عنوان یک DNN باشد یا نباشد، اعمال می شود. استفاده از یادگیری تقویتی یا خود نظارتی یا رویکردهای دیگر مطمئناً بر این محدودیت احتمالی تأثیر نخواهد گذاشت. و توجه داشته باشید که انسان ها به سختی نمونه هایی هستند که چگونه می توان از آموزش گسترده به هر طریقی اجتناب کرد. قابلیتهای یادگیری انتقالی آنها جنبهای حیاتی از کارآمدی فرآیند یادگیری خواهد بود.
It is now close to a decade since the explosive growth in the development and application of deep neural networks (DNNs) came about, and their subsequent progress has been little short of remarkable. True, this progress has been helped considerably by the deployment of special hardware in the form of powerful GPUs; and their progress followed from the realization that CNNs constituted a crucial architectural base, to which features such as ReLUs, pooling, fully connected layers, unpooling and deconvolution could also be included. In fact, all these techniques helped to breathe life into DNNs and to extend their use dramatically, so the initial near-exponential growth in their use has been maintained without break for the whole subsequent period. Not only has the power of the approach been impressive but its application has widened considerably from the initial emphasis on rapid object location and image segmentation—and even semantic segmentation—to aspects pertaining to video rather than mere image analysis. It would be idle to assert that the whole of the development of computer vision since 2012 has been due solely to the advent of DNNs. Other important techniques such as reinforcement learning, transfer learning, self-supervision, linguistic description of images, label propagation, and applications such as novelty and anomaly detection, image inpainting and tracking have all played a part and contributed to the widening and maturing of computer vision. Nevertheless, many such techniques and application areas have been stimulated, challenged, and enhanced by the extremely rapid take-up of DNNs. It is the purpose of this volume to explore the way computer vision has advanced since these dramatic changes were instigated. Indeed, we can validly ask where we are now, and how solid is the deep neural and machine learning base on which computer vision has recently embarked. Has this been a coherent movement or a blind opportunistic rush forward in which workers have ignored important possibilities, and can we see further into the future and be sure that we are advancing in the right direction? Or is this a case where each worker can take his or her own viewpoint and for any given application merely attend to what appears to be necessary, and if so, is anything lost by employing a limited approach of this sort? In fact, there are other highly pertinent questions to be answered, such as the thorny one of the extent to which a deep network can only be as powerful as the dataset it is trained on; this question will presumably apply to any alternative learning-based approach, whether describable as a DNN or not. Employing reinforcement learning or self-supervision or other approaches will surely not affect this likely limitation. And note that human beings are hardly examples of how extensive training can in any way be avoided; their transfer learning capabilities will be a vital aspect of how efficient the learning process can be made.
این کتاب را میتوانید بصورت رایگان از لینک زیر دانلود نمایید.
Download: Advanced Methods and Deep Learning in Computer Vision
نظرات کاربران