- عنوان کتاب: Natural Language Processing and Applications
- نویسنده: Huaping Zhang, Jianyun Shang
- حوزه: پردازش زبان طبیعی
- سال انتشار: 2025
- تعداد صفحه: 454
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 7.79 مگابایت
پردازش زبان طبیعی رشتهای است که زبانشناسی، علوم کامپیوتر و ریاضیات را با هم ادغام میکند و نظریهها و روشهای مختلفی را برای ارتباط مؤثر بین انسانها و کامپیوترها با استفاده از زبان طبیعی مطالعه میکند. هدف پردازش زبان طبیعی این است که ماشینها بتوانند زبان را به همان اندازه هوشمندانهای که انسانها درک میکنند، درک کنند و هدف نهایی آن کاهش شکاف بین ارتباط انسانی (زبان طبیعی) و درک کامپیوتر (زبان ماشین) است. پردازش زبان طبیعی به عنوان “جواهر تاج هوش مصنوعی” مورد ستایش قرار گرفته است. شن شیانگیانگ، معاون رئیس جهانی مایکروسافت و متخصص مشهور هوش مصنوعی، در کنفرانس کامپیوتر چین به وضوح اظهار داشت: “کسی که بر زبان تسلط دارد، بر جهان تسلط دارد.” پردازش زبان طبیعی به یک نقطه دشوار و داغ در تحقیقات هوش مصنوعی تبدیل شده است و فرصتهایی را برای تغییر آینده جهان در خود جای داده است. گزارشی از Mordor Intelligence نشان میدهد که بازار جهانی پردازش زبان طبیعی در سال ۲۰۲۰، ۱۰.۷۲ میلیارد دلار بوده است و انتظار میرود تا سال ۲۰۲۶ با نرخ رشد مرکب سالانه ۲۶.۸۴ درصد به ۴۸.۴۶ میلیارد دلار افزایش یابد. با شیوع جهانی بیماری همهگیر کووید-۱۹، رشد پردازش زبان طبیعی در حوزه مراقبتهای بهداشتی به طور ویژهای سریع بوده است. در سالهای اخیر، مونوگرافها یا کتابهای درسی بسیار خوبی در زمینه پردازش زبان طبیعی منتشر شده است، اما اکثر آنها عمدتاً الگوریتمهای کلاسیک و فناوریهای مرتبط با پردازش زبان طبیعی را معرفی میکنند و تعداد کمی از آنها سیستمها و شیوههای کاربردی واقعی را با هم ترکیب میکنند. من در سال ۲۰۱۶ ارائه درس اختیاری «تحلیل و کاربرد کلانداده» را در موسسه فناوری پکن آغاز کردم و در سال ۲۰۲۲ ارائه درس اجباری «فناوری پردازش کلانداده» را برای دانشجویان سال سوم رشته هوش مصنوعی در موسسه فناوری پکن آغاز کردم و سعی کردم پردازش زبان طبیعی را با کلانداده و هوش مصنوعی ترکیب کنم. با استفاده از یک روش تدریس مبتنی بر تحقیق، من گزارههای تکلیف کلاسیک پردازش زبان طبیعی را ارائه میدهم و دانشجویان موظفند گزارش مروری را به صورت گروهی ارائه دهند که در آن الگوریتمهای کلاسیک هر نکته فنی پردازش زبان طبیعی را با جزئیات شرح داده و پیشرفتهای مرزی تحقیقات دانشگاهی بینالمللی در ۳ سال گذشته را منعکس کرده و در نهایت یک سیستم نمایشی شهودی ارائه داده و تأیید تجربی را انجام دهند. آزمون نهایی این دوره مستلزم همکاری تیمی برای تکمیل یک پروژه پردازش زبان طبیعی با درجه خاصی از نوآوری است که به طور مستقل توسط متخصصان صنعت، دانشگاه و تحقیقات خارج از مدرسه بررسی میشود. پس از 6 سال کاوش مداوم، این دوره با استقبال گسترده بیش از 1000 دانشآموزی که این دوره را گذراندهاند، با میانگین نمره نهایی 94.73 مواجه شده است. با بهبود مستمر سیستم تمرین تدریس، امیدوارم نتایج بیش از 20 سال تحقیق در پردازش زبان طبیعی و 6 سال تمرین تدریس را به اشتراک بگذارم و در نهایت این کتاب درسی را که به طور دقیق با پردازش زبان طبیعی و کاربرد آن ترکیب شده است، تکمیل کنم. این کتاب به پنج بخش تقسیم شده است: بخش اول عمدتاً شامل مروری بر پردازش زبان طبیعی و کاربردهای آن، پلتفرمها و الگوریتمهای کلاسیک یادگیری عمیق، آخرین تحولات در یادگیری عمیق و مدلهای زبانی از پیش آموزش دیده است. بخش دوم عمدتاً شامل فناوری خزنده وب، تجزیه و مدیریت اسناد چند فرمتی، تشخیص گفتار به متن، نمایش معنایی تصویر و تشخیص کاراکتر، تقسیمبندی کلمات چینی و برچسبگذاری اجزای کلام است. بخش سوم شامل تحلیل احساسات، کشف کلمات جدید، تشخیص موجودیتهای اسمی و استخراج کلمات کلیدی، ساخت خودکار، کاربرد نمودارهای دانش کلانداده و غیره است. بخش چهارم شامل فیلتر کردن اطلاعات، طبقهبندی متن، خوشهبندی متن، تصحیح متن، خلاصهسازی خودکار است. بخش پنجم عمدتاً به معرفی برخی از پروژهها و موارد کاربردی متمایز پردازش زبان طبیعی میپردازد. ویژگی این کتاب این است که مرزهای دانشگاهی، کاربردهای عملی و دستاوردهای آموزشی را ادغام میکند و به طور کامل پیشرفت مرزهای دانشگاهی بینالمللی در جهت کلانداده، هوش مصنوعی و پردازش زبان طبیعی را منعکس میکند و دستاوردهای نوآورانه تیم نویسنده را در جهت پردازش زبان طبیعی و کاربردها برای بیش از 20 سال در بر میگیرد. دستاوردهای مرتبط به طور متوالی جوایز اول و دوم جایزه پیشرفت علم و فناوری منطقه خودمختار سین کیانگ اویغور و جایزه اول جایزه علم و فناوری پردازش اطلاعات چین چیان ویچانگ را از آن خود کردهاند. این کتاب بیش از 6 سال است که دستاوردهای آموزشی «تحلیل و کاربرد کلانداده» و «فناوری پردازش کلانداده» را در خود جای داده و شامل چندین پروژه عالی از گروههای تحقیقاتی به عنوان موارد کاربردی است…
Natural language processing is a discipline that integrates linguistics, computer science, and mathematics, studying various theories and methods for effective communication between humans and computers using natural language. The goal of natural language processing is to enable machines to understand language as intelligently as humans do, with the ultimate goal of narrowing the gap between human communication (natural language) and computer understanding (machine language). Natural language processing is hailed as the “jewel in the crown of artificial intelligence.” Microsoft’s global vice president and renowned artificial intelligence expert Shen Xiangyang clearly stated at the China Computer Conference: “He who masters language masters the world.” Natural language processing has become a difficult and hot spot in artificial intelligence research, harboring opportunities to change the future of the world. A report by Mordor Intelligence shows that the global natural language processing market was $10.72 billion in 2020, and is expected to grow to $48.46 billion by 2026, with a compound annual growth rate of 26.84%. With the global spread of the COVID-19 pandemic, the growth of natural language processing in the field of healthcare has been particularly rapid. In recent years, there have been many excellent monographs or textbooks in the field of natural language processing, but most of them mainly introduce classic algorithms and related technologies of natural language processing, and there are not many that combine actual systems and application practices. I started offering the elective course “Big Data Analysis and Application” at Beijing Institute of Technology in 2016, and started offering the compulsory course “Big Data Processing Technology” for third-year students majoring in artificial intelligence at Beijing Institute of Technology in 2022, trying to combine natural language processing with big data and artificial intelligence. Using a research-based teaching method, I give classic task propositions of natural language processing, and students are required to give a review report in groups, detailing the classic algorithms of each technical point of natural language processing, reflecting the frontier progress of international academic research in the past 3 years, and finally giving an intuitive demonstration system and conducting experimental verification. The final exam of the course requires team cooperation to complete a natural language processing project with a certain degree of innovation, which is independently reviewed by experts from industry, academia, and research outside the school. After 6 years of continuous exploration, the course has received wide acclaim from more than 1000 students who have taken the course, with an average final score of 94.73. With the continuous improvement of the teaching practice system, I hope to share the results of more than 20 years of research in natural language processing and 6 years of teaching practice, and finally complete this textbook closely combined with natural language processing and application. This book is divided into five parts: The Part I mainly includes an overview of natural language processing and its applications, classic deep learning platforms and algorithms, the latest developments in deep learning, and pre-trained language models; The Part II mainly includes web crawler technology, multi-format document parsing and management, speech-to-text recognition, image semantic representation and character recognition, Chinese word segmentation, and part-of-speech tagging; The Part III includes sentiment analysis, new word discovery, named entity recognition and keyword extraction, automatic construction, application of big data knowledge graphs, etc.; The Part IV includes information filtering, text classification, text clustering, text proofreading, automatic summarization; The Part V mainly introduces some distinctive natural language processing application projects and cases. The feature of this book is that it integrates academic frontiers, practical applications, and teaching achievements, fully reflecting the international academic frontier progress in the direction of big data, artificial intelligence, and natural language processing, and incorporating the innovative achievements of the author team in the direction of natural language processing and applications for more than 20 years. The related achievements have successively won the first and second prizes of the Science and Technology Progress Award of the Xinjiang Uygur Autonomous Region, and the first prize of the Qian Weichang Chinese Information Processing Science and Technology Award. This book has absorbed the teaching achievements of “Big Data Analysis and Application” and “Big Data Processing Technology” for more than 6 years, and included several excellent projects of research groups as application cases. As a supporting website and download base for the achievements of this book, the NLPIR (Natural Language Processing and Information Retrieval) sharing platform provides demonstrations of actual results and downloads of various resources. This book can be used as a textbook for graduate students and senior undergraduates in the direction of natural language processing, and can also be used as a reference for researchers, engineering technicians, and enthusiasts in the direction of natural language processing.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
نظرات کاربران