Posts

Showing posts with the label Statistical learning

با داده ها چه می توان کرد؟ 15- پردازش لجستیک

Image
  هنگامی که پاسخ در باره متغیر مورد نظر ما که قرار است آن را تحلیل و پیش بینی کنیم، آری یا نه باشد، یعنی یک انتخاب دو گانه، از پردازش لجستیک استفاده می کنیم.

با داده‌ها چه می‌توان کرد؟ 14 - بیان و تحلیل تصویری

Image
در این قسمت به بیان و تحلیل بصری و تصویری از داده ها می پردازیم. در رشته مورد بحث ما، تجسم و روایت تصویری آنچه که داده ها می گویند  بسیار اهمیت دارند. زبان پایتون بسته های متعددی در این زمینه دارد که می تواند به تصویر سازی از داده ها و نتایج بدست آمده از آن کمک کند اما matplotlib بدون شک یکی از مهمترین آنهاست.

با داده‌ها چه می‌توان کرد؟ 13 - کار با پانداز - 4

Image
کار با نرم افزار پانداز را ادامه می دهیم. در این قسمت به یکی از مهمترین شیوه های کار با جدول داده ها می پردازیم. همانگونه که از ابتدا توضیح دادم، هدف از بررسی داده ها تحلیل آنها در پیدا کردن ارتباط میان متغیرها و در نهایت نتیجه گیری و پیش بینی آینده با توجه به آنچه که در گذشته و تاکنون دیده و ثبت شده است، می باشد.

با داده‌ها چه می‌توان کرد؟ 12 - کار با پانداز - 3 چگونه داده‌ها را وارد کنیم؟

Image
در این قسمت در ادامه موضوع کار با پانداز، به چگونگی وارد کردن داده ها به پانداز و خواندن و کار با داده های وارد شده، می پردازیم. در دنیای واقعی، داده ها تمیز و مرتب نیستند و از منابع مختلفی حاصل می شوند. مهمترین منابع داده ها که ما از آنها برای وارد کردن به پانداز استفاده می کنیم جدولها Table، داده های جدا شده توسط ویرگول csv، بانکهای اطلاعاتی database مانند sql وبسایتها html، جیسان json و غیره است. در زیر مهمترینهایی که گفته شد، به این صورت وارد پانداز می شود:

با داده‌ها چه می‌توان کرد؟ 11 - کار با پانداز - 2

Image
در ادامه قسمت گذشته، در این بخش به کار با پانداز ادامه می دهیم. نیاز به یک یادآوری کوچک ضرروی است. نرم افزار پانداز در علم داده ها تنها یک وسیله است. وسیله ای که با آن می توان داده ها را در یکجا جمع کرد، تمیز و آماده کرده و بر روی آن مدلهای آماری را اجرا نمود. پس از همه این مراحل تحلیل و بررسی و استخراج نتیجه به میان می آید. از آنجاییکه تمیز و آماده کردن داده ها 70 تا حتی 80 درصد این مراحل را در بر می گیرد، آشنایی با خم و چم پانداز اهمیت ویژه ای می یابد، اما همه کار نیست.

با داده‌ها چه می‌توان کرد؟ 10 - کار با پانداز 1

Image
این قسمت را به معرفی و کار با نرم افزار پانداز اختصاص می دهیم. در بخش سوم این سلسه از مطالب نحوه چگونی نصب و فعال کردن پانداز را نشان دادیم و در بخش چهارم  به همراه معرفی پایتون، چند عمل ساده، مانند اجرا کردن، افزودن سلول، نوشتن کد درون سلول و غیره را باختصار دیدیم. در اینجا بیشتر و دقیقتر با نحوه کارکرد پانداز آشنا می شویم.

با داده‌ها چه می‌توان کرد؟ 9 - پردازش خطی بصورت عملی

Image
در این قسمت پردازش خطی که بصورت تئوری و کلی در شماره 6 این سلسله مطالب بررسی کردیم را بصورت عملی و با استفاده از پایتون و پانداز انجام می دهیم و نتیجه نهایی را که در آن شماره صرفا نمایش داده بودیم، بدست می آوریم. در اینجا تنها به معرفی پانداز و چند عمل ساده (و البته فرمول پردازش خطی در پانداز) می پردازیم و در قسمتهای آینده کل یک شماره را برای کار با پانداز و یادگیری فرامین مربوط به آن اختصاص خواهیم داد.

با داده‌ها چه می‌توان کرد؟ 6 بررسی آماری - بخش دوم، پردازش خطی

Image
در بررسی آماری، چندین رویکرد مختلف قادر به پیش بینی Y یا همان نتیجه استخراج شده بر اساس داده ها و متغیرهای موجود  X1,...,Xp است. در دسته بندی بررسی تحت نظارت Supervised که در قسمت گذشته از آن یاد کردیم، بدون شک رویکرد پردازش خطی (رگراسیون خطی Linear Regression) بیشترین مورد استفاده را به خود اختصاص می دهد.

با داده‌ها چه می‌توان کرد؟ 5 - بررسی آماری

Image
بررسی آماری  Statistical Learning  به مجموعه ابزاری گفته می شود که می تواند به درک و فهم ما نسبت داده های موجود یا جمع آوری شده کمک کند. در نظر کلی، این ابزار به دو دسته تحت نظارت Supervised و نظارت نشده Unsupervised تقسیم می شود.