- عنوان کتاب: Becoming a Data Analyst
- نویسنده: Kedeisha Bryan
- حوزه: تحلیل داده
- سال انتشار: 2023
- تعداد صفحه: 348
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 9.85 مگابایت
چرخه حیات تجزیه و تحلیل داده ها از استاندارد بین صنعت برای داده کاوی توسعه یافته است. همچنین به عنوان CRISP-DM شناخته می شود. مراحل اصلی شامل درک کسب و کار، درک داده ها، آماده سازی داده ها، مدل سازی، ارزیابی و استقرار است. از آنجایی که تمرکز ما بر ایجاد مدل ها نیست، چرخه حیات تجزیه و تحلیل داده ها مشابه است به جز جایگزینی تجزیه و تحلیل داده های اکتشافی، اعتبارسنجی داده ها و ارائه. اولین و احتمالاً مهمترین مرحله درک کسب و کار است زیرا کار شما در اینجا جهت بقیه پروژه را تعیین می کند. اشتباهات در اینجا منجر به انجام کارهای غیر ضروری یا ارائه راه حلی می شود که مشکل مورد نظر را حل نمی کند. حدود 3 حوزه اصلی این مرحله وجود دارد: 1. تعریف اهداف تجاری: در اینجا شما هدف واقعی پروژه داده را تعریف خواهید کرد. اساس هر پروژه ارائه راه حلی است که یک مشکل را حل کند یا یک فرآیند را بهبود بخشد. یک مفهوم مهم درک علائم در مقابل علت اصلی است. علائم علائم بصری یا اثرات یک مشکل از یک سیستم خواهد بود. علائم باعث بررسی یک موضوع یا نیاز به راه حل می شود. علت اصلی مشکل اساسی است که همه علائم از آن سرچشمه می گیرند. برخلاف علائم، علل ریشه اغلب بدون بررسی کامل قابل مشاهده یا آشکار نیستند. پرداختن به علائم تنها راهحلهای موقتی را ارائه میکند، در حالی که رسیدگی به علت اصلی، مشکل را برای همیشه حل میکند. هنگام صحبت با ذینفعان، اغلب آنها ممکن است بیشتر وقت خود را صرف صحبت در مورد علائم کنند. خیلی اوقات، آنچه می گویند این است که مشکل واقعاً مشکل نیست. به عنوان یک تحلیلگر داده، باید بدانید که چگونه سؤالات درست را بپرسید تا علائم را بررسی کنید تا علت اصلی و مشکل صحیح کسب و کار را کشف کنید. ابزارهای موفقیت: پنج چرا و نمودارهای استخوان ماهی. پنج چرا یک تکنیک سریع و موثر برای کشف علت اصلی است. جایی که شما با یک بیانیه مشکل شروع میکنید و با پرسیدن «چرا» پنج بار یا هر مقداری که برای رسیدن به علت اصلی لازم است، دنبال کنید. در زیر نموداری است که به صورت بصری این روند را به تصویر می کشد.
The data analytics lifecycle is developed from the cross-industry standard for data mining. Also known as CRISP-DM. The major phases include business understanding, data understanding, data preparation, modeling, evaluation, and deployment.As our focus will not be creating models, the data analytics lifecycle is similar except the substitution of exploratory data analysis, data validation, and presentation. The first and probably most important phase is business understanding as your work here will set the direction for the rest of the project. Mistakes here result in performing unnecessary work or providing a solution that does not solve the intended problem. There are about 3 main areas of this phase: 1. Defining business objectives: Here you will be defining the actual goal of the data project. The basis for every project is to provide a solution that solves a problem or improve a process. An important concept is to understand symptoms vs the root cause. The symptoms will be the visual signs or effects of an issue of a system. Symptoms trigger the investigation of an issue or the need for a solution. The root cause is the underlying issue that all the symptoms stem from. Unlike symptoms, root causes are often not visible or apparent without a thorough investigation. Addressing the symptoms will only provide temporary fixes, while addressing the root cause will resolve the problem more permanently. When speaking with stakeholders, often they may spend most of their time speaking about the symptoms. Many times, what they say is the problem really isn’t the problem. As a data analyst, you must know how to ask the right questions to sift through symptoms to figure out the root cause and the correct business problem. Tools for success: Five Whys and Fishbone diagrams. The Five Whys is a quick and effective technique to uncover a root cause. Where you begin with a problem statement and follow with asking “why” five times or any amount needed to land at the underlying root cause. Below is a diagram the visually depicts the process.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Becoming a Data Analyst
نظرات کاربران