- عنوان کتاب: Computer Vision -Metrics Survey, Taxonomy, and Analysis of Computer Vision, Visual Neuroscience, and Visual AI
- نویسنده: Scott Krig
- حوزه: بینایی کامپیوتر
- سال انتشار: 2025
- تعداد صفحه: 806
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 23.0 مگابایت
محاسبات بصری و هوش مصنوعی بصری در نقطه عطفی قرار دارند که در آن علوم محاسبات بصری تاریخی، به تدریج، توسط روشهای جدیدتر هوش مصنوعی بصری جایگزین میشوند. برنامههای محاسبات بصری که به نظر بالغ میرسند، با استفاده از روشهای هوش مصنوعی، مانند الگوریتمهای گرافیک کامپیوتری، پردازش تصویر، تجزیه و تحلیل صحنه، نمایش ویژگیها، تشخیص اشیاء و غیره، در حال بهبود هستند. پردازنده گرافیکی (GPU) در حال بازسازی است تا روشهای هوش مصنوعی بصری را در خود جای دهد و بینایی کامپیوتر را با گرافیک کامپیوتری ترکیب کند. این بهروزرسانی در معیارهای بینایی کامپیوتر، مروری بر روشها و برنامههای محاسبات بصری جدیدتر و قابل توجه، با طبقهبندی بهروز شدهای از معماریها و مفاهیم تحقیقاتی، از جمله آخرین پیشرفتها در مبدلها، مکانیسمهای توجه، مدلهای یادگیری نوآورانه، سنتز نما با استفاده از طبقهبندیکنندههای عنوان با یادگیری zero-shot و DNNهای ترکیبی با استفاده از انواع ویژگیهای اساسی علاوه بر فیلترهای کانولوشن، اضافه میکند. بحث و تحلیل برای کشف شهود و کاوش در جوهره پیشرفتهای کلیدی، با نگاهی به آینده هوش مصنوعی بصری نسل سوم، ارائه شده است.
Visual Computing and Visual AI is at an inflexion point where historical visual computing sciences are being superseded, piece by piece, by newer Visual AI methods. Seemingly mature visual computing applications are being improved using AI methods, such as computer graphics algorithms, image processing, scene analysis, feature representation, object detection, to name a few. The GPU is being recast to incorporate Visual AI methods, combining computer vision with computer graphics. This update to Computer Vision Metrics adds a survey of more recent and noteworthy visual computing methods and applications, with an updated taxonomy of architectures and research concepts, including the latest advances in transformers, attention mechanisms, innovative learning models, view synthesis using caption classifiers with zero-shot learning, and hybrid DNNs using a variety of basic features besides convolutional filters. Discussion and analysis are provided to uncover intuition and delve into the essence of key advancements, with an eye towards the future of third-generation Visual AI.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Computer Vision
نظرات کاربران