هوش مصنوعي و يادگيري ماشين

در اين وبسايت شما را در جريان تازه هاي هوش مصنوعي و يادگيري ماشين قرار مي دهيم.

تحلیل آماری

۲۶ بازديد
تحلیل آماری چیست؟
اگر بخواهیم تحلیل آماری را دقیق ­تر توضیح دهیم باید ابتدا به تعریف واژه­ ی آمار بپردازیم.علم آمار از گذشته تا کنون نقشی اساسی و مهم را در علوم مختلف داشته است که از اولین کاربردهای آن می ­توان به مالیات گیری و خراج بستن بر دارایی ها اشاره کرد. بعدها در دوره رنسانس، از علم آمار استفاده­ نوینی صورت گرفت و به آمار استنباطی نیز توجه زیادی شد. در دنیای امروز علم آمار و آمارگیری بسیار پررونق است. اکثر دانش آموختگان حداقل یکبار مطلبی را در ارتباط با آمار خوانده اند و نیاز بوده تا با استفاده از روش­ های آمارگیری، تحلیل ­هایی انجام دهند.

تحلیل آماری پایان نامه یک روش ریاضی برای بررسی داده های به دست آمده از تحقیقات است. این کار با بررسی ارتباطات گروه های مختلف داده ها انجام می گیرد. تحلیل آماری ممکن است برخی اوقات پیچیده باشد.
برای مطالعه بیشتر در این زمینه و همچنین انجام آسان و سریع تحلیل آماری روی لینک زیر کلیک کنید.

https://bigpro1.com/fa/statistical-analysis/

یادگیری با نظارت

۲۹ بازديد
یادگیری با نظارت چیست؟
یادگیری ماشین با نظارت، Supervised learning یا یادگیری نظارت شده، یکی از زیرمجموعه های یادگیری ماشین است که بر اساس مجموعه داده های ورودی و خروجی، سیستم را برای یادگیری یک موضوع آماده می کند. متخصصا ن ماشین لرنینگ، معمولا برای آموزش نظارت شده به ماشین از دو دسته داده به نام های داده های آموزشی و داده های تست استفاده می کنند.

فاز اول Supervised learning، استفاده از داده آموزشی
در یادگیری ماشین با نظارت برای آموزش به سیستم از داده ها و اطلاعاتی استفاده می شود که پاسخ آن ها برای سیستم مشخص است. مثلا اگر سیستم برای تشخیص اشکال مربعی شکل طراحی شده باشد، مجموعه داده، شامل اشکال مربع، مثلث، دایره، لوزی و… است که مربع بودن یا نبودن هرکدام از این داده ها با برچسب (label) های 0 و 1 مشخص می شود. بدین ترتیب پس از ورود هر داده (در اینجا شکل هندسی) به سیستم و مشاهده برچسب آن، ماشین متوجه می شود که شکل مورد نظر مربع است (برچسب 1) یا مربع نیست (برچسب 0).

ماشین با دریافت تعداد زیادی تصویر از اشکال هندسی مختلف، به صورت خودکار برای خود تابعی تشکیل می دهد که به کمک آن بتواند شکل مربع را تشخیص دهد. در این زمان آموزش تکمیل شده است.

فاز دوم، تست سیستم
پس از اینکه آموزش به ماشین به اتمام رسید، نوبت به امتحان گرفتن و تست سیستم است. در این مرحله محققان مجموعه داده ای تهیه می کنند که برچسب داده های آن مشخص است. اما تنها داده ها را (بدون برچسب هایشان) وارد سیستم می کنند تا بسنجند که سیستم تا چه حد قادر به ارائه خروجی صحیح است.

در همین مثال اشکال هندسی، وقتی چندین شکل مختلف و بدون برچسب در اختیار سیستم قرار داده شد، ماشین بر اساس آموخته های قبلی خود اشکال را در دو گروه مربع و غیر مربع قرار می دهد. سپس طراحان سیستم با توجه به برچسب هایی که در اختیار دارند، نتیجه کار ماشین را می سنجند.

فاز سوم، سنجش
سنجش عملکرد در یادگیری ماشین با نظارت امر مهمی است. زیرا در صورتی که ماشین تمامی اشکال را بدون کوچکترین خطایی دسته بندی کرده باشد، ممکن است اشکال بزرگی به نام Overfitting بوجود آمده باشد و به اصطلاح سیستم به جای یادگیری، داده ها را حفظ کرده باشد. در مورد این مشکل در مطالب آتی صحبت خواهیم کرد.

حالت دوم این است که سیستم خطای قابل توجهی داشته باشد. در این حالت مجددا باید به آموزش ادامه داد. در روش هایی مثل استفاده از شبکه های عصبی، ممکن است با تغییر تعداد لایه ها یادگیری بهبود یابد.

اما در صورتی که سیستم به مقدار منطقی خطا داشت و پاسخ های نسبتا منطقی ومعقولی ارائه نمود، می توان از آن برای اجرای هدف اصلی بهره برداری نمود.


جهت مطالعه مطالب بیشتر درمورد یادگیری ماشین با نظارت اینجا کلیک کنید



توجه

تشخیص شکل مربع تنها یک مثال است و همین مساله در مورد مسائل بسیار پیچیده تر مثل پیشبینی وضعیت بورس یا پرواز هواپیما در شرایط جوی مختلف نیز قابل پیاده سازی می باشد. یادگیری ماشین با نظارت درست مانند کودک انسان که پس از مشاهده چند نوع لیوان، قادر به تشخیص هر نوع لیوانی در هر رنگ، جنس یا اندازه ای خواهد بود، عمل می کند.

همچنین هر سیستم براساس مساله خاصی طراحی می شود و ممکن است داده ها را به دو یا چند دسته تقسیم کند. در مثال فوق اگر آموزش به نحوی دیگر بود، سیستم می توانست اشکال را در گروه های مربع، مثلث، دایره و… قرار دهد.

یادگیری ماشین با نظارت چه کاربردهایی دارد؟
از Supervised learning در مسائل مختلفی چون فیلتر اسپم ها، تشخیص سرطان، تشخیص تقلب و… استفاده می شود.

معایب یادگیری نظارت شده

بزرگترین ایراد یادگیری ماشین با نظار آن است که داده های جمع آوری شده دارای برچسب نیستند.در نتیجه یک یا چند نیروی انسانی باید یا صرف روزها و یا ماه ها وقت، مجموعه داده ها را برچسب گذاری نمایند. این مساله علاوه بر وقت گیر و هزینه بر بودن، خطای انسانی را نیز در پی خواهد داشت.

کاربرد یادگیری ماشین در شبکه های مجازی

۳۹ بازديد
بسیاری از ما روزانه دست کم یک ساعت را به گردش در شبکه های مجازی، خصوصا اینستاگرام اختصاص می دهیم و به همین سادگی به استفاده از ماشین لرنینگ می پردازیم. بخش Explore اینستاگرام با استفاده از الگوریتم های یادگیری ماشین، دقیقا مطابق با علاقه مندی های ما تنظیم می شود. برای مثال اگر مدت کوتاهی (مثلا دو روز) به تماشای فیلم های کوتاه حیوانات بپردازید، در روزهای آتی فیلم های مشابه بیشتری در این بخش مشاهده خواهید کرد. این قابلیت در سایت youtube نیز دیده می شود.

همچنین فیس بوک به طور وسیع از الگوریتم های ماشین لرنینگ برای تشخیص چهره استفاده می کند و می تواند با دقتی حدود 97.25 چهره افراد را در تصاویر مختلف تشخیص دهد.
درآخر پیشنهاد من به شما مراجعه به وبسایت بیگ پرو1 و مطالعه مطالب مفید این وبسایت است؛ همچنین میتوانید از ابزارهای دقیق این وبسایت استفاده کنید و پروژه های یادگیری ماشین خود را در سریعترین حالت ممکن انجام دهید.

patient registry چیست؟

۳۶ بازديد
patient registry عبارت است از یک سیستم سازمان یافته که کار جمع آوری، ذخیره سازی، بازیابی، تجزیه و تحلیل و اشاعه اطلاعات افراد خاصی که دارای بیماری بخصوصی هستند یا شرایط خاصی (مثلاً risk factor) را دارند که انها را مستعد به وقوع یک رویداد مرتبط با سلامت بنماید.
همچنین این اطلاعات می تواند شامل اطلاعات تماس فرد با مواردی شناخته شده یا مشکوک باشد که منجر به عوارض نامطلوبی در سلامت فرد بگردند.
Population based Registry: یا ثبت مبتنی بر جمعیت، عبارتست از ثبت اطلاعات بیمارانی که در یک منطقه جغرافیایی خاص ساکن بوده و اطلاعات کلیه افراد آن جمعیت ثبت گردد.
Clinical Based Registry: ثبت اطلاعات بر پایه مراجعین به مراکز درمانی خاص که در این حالت پوشش جمعیتی ممکن است روشن نباشد
 
برای اطلاعات بیشتر درمورد رجیستری پزشکی و یا ایجاد رجیستری پزشکی می تو.انید به وبسایت بیگ پرو1 مراجعه کنید و از ابزارهای دقیق این وبسایت استفاده کنید. برای ورود به این وبسایت اینجا کلیک کنید.

پرسشنامه چیست؟

۳۸ بازديد
درک پرسشنامه و ویژگی های پرسشنامه و نقاط قوت و ضعف آن، و همین‌طور حساسیت‌هایی که باید در مورد یک پرسشنامه وجود داشته باشد، کار ساده‌ای نیست.

با جرأت می‌توان گفت یکی از مهم‌ترین دستاوردهای کسی که در مقاطع تحصیلی رسمی دانشگاهی، سطح PhD را به پایان می‌رساند، این است که می‌تواند این ظرافت‌ها را درک کند.

هنوز هم کم نیستند پرسشنامه هایی که سالها در مقیاس میلیونی مورد استفاده قرار می‌گیرند و دانشگاه‌های بزرگ جهان آنها را تایید می‌کنند و بعداً مشخص می‌شود که در طراحی آنها مشکلاتی وجود داشته است.

برای درک دشواری ماجرا، کافی است به عنوان مثال، این مسئله را در نظر بگیرید که پس از سالها رواج پرسشنامه MBTI در جهان، هانس آیزنک در کتاب خود گزارش می‌کند که چیزی که در پرسشنامه MBTI تحت عنوان درونگرایی – برونگرایی اندازه گیری می‌شود، دارای سوگیری سنجش (Loading) با نوروتیسیزم است و نمی‌تواند درونگرایی – برونگرایی را به صورت کاملاً مستقل اندازه گیری نماید!

اگر دوست دارید که بیشتر درمورد پرسشنامه ها و نحوه ایجاد آنها بدانید و یا درحال انجام پاباننامه خود هستید و نیاز به ایجاد و انتشار پرسشنامه دارید پیشنهاد می کنم به وبسایت بیگ پرو1 سر بزنید و از امکانات بی نظیر این وبسایت استفاده کنید.

يادگيري اتوماتيك چيست؟

۴۵ بازديد

يادگيري خودكار يكي از الگوريتم هاي يادگيري ماشين است. اين الگوريتم كه كمتر شناخته شده است كاربردهاي متعددي دارد. يكي از كاربردهاي يادگيري ماشين، الگوريتم يادگيري ماشين خودكار است.

يادگيري ماشين خودكار را مي توان به سه بخش اصلي آماده‌سازي داده‌ها، مهندسي ويژگي‌ها، ايجاد و تخمين عملكرد مدل تقسيم كرد. 

براي خواندن مطالب بيشتر درمورد يادگيري خودكار مي توانيد مطالب وبسايت بيگ پرو1 را مطالعه كنيد كه يك وبسايت جامع در حوزه هوش مصنوعي، ماشين لرنينگ و ديتا ساينس است.

آمار توصيفي

۴۶ بازديد

نگاه اجمالي

هنگامي كه توده‌اي از اطلاعات كمي ‌براي تحقيق گرد آوري مي‌شود، ابتدا سازمان بندي و خلاصه كردن آنها به طريقي كه به صورت معني داري قابل درك و ارتباط باشند، ضروري است.روشهاي آمار توصيفي (Descriptive Statistics) به همين منظور بكار برده مي‌شوند. غالبا مفيدترين و در عين حال اولين قدم در سازمان داده‌ها مرتب كردن داده‌ها بر اساس يك ملاك منطقي است و سپس استخراج شاخص‌هاي مركزي و پراكندگي و در صورت لزوم محاسبه همبستگي ميان دو دسته اطلاعات و استفاده از تحليل‌هاي پيشرفته تر نظير رگراسيون (Regression) و پيش بيني (Prediction) مي‌باشد. در يك جمعبندي با استفاده مناسب از روشهاي آمار توصيفي مي‌توان دقيقا ويژگيهاي يك دسته از اطلاعات را بيان كرد. آمار توصيفي هميشه براي تعيين و بيان ويژگيهاي اطلاعات پژوهش‌ها بكار برده مي‌شوند.

روشهاي آمار توصيفي

تشكيل جدول توزيع فراواني

توزيع فراواني عبارت است از سازمان دادن داده‌ها يا مشاهدات به صورت طبقات همراه با فراواني هر طبقه. براي تشكيل يك جدول توزيع فراواني بايد دامنه تغييرات ، تعداد طبقات و حجم طبقات توسط فرمولهاي مربوطه محاسبه شده و سپس اقدام به نوشتن جدول توزيع در دو ستون X (ستون طبقات) و F (فراواني طبقات) شود. پس از اين مرحله در صورت تمايل يا لزوم پژوهشگر مي‌تواند شاخص‌هاي ديگري نظير فراواني تراكمي‌ ، فراواني تراكمي‌ درصدي را محاسبه نمايد. تشكيل جدول توزيع فراواني يك روش اقتصادي و در عين حال آسان براي نمايش انبوهي از داده‌هاي نامنظم است. اما در طبقه بندي كردن ، برخي از اطلاعات به علت خطاي گروه بندي از دست مي‌روند كه در محاسبه شاخصهاي آماري نيز منعكس مي‌شود. ولي مقدار آن ناچيز بوده و اشكال عمده‌اي ايفا نمي‌كند.

ترسيم نمودار

يكي از نقاط ضعف نمايش داده‌ها به صورت جدول فراواني عدم درك سريع اطلاعات جدول است. نمودارها ابزار مناسبي براي نمايش تصويري اطلاعات هستند. انواع مختلفي از نمودار وجود دارد كه از جمله مي‌توان به نمودار هيستوگرام ، نمودار ستوني ، نمودار چند ضلعي تراكمي ‌، نمودار دايره‌اي ، نمودار سريهاي زماني و …اشاره كرد.

محاسبه شاخصهاي مركزي

در محاسبات آماري لازم است كه ويژگيها و موقعيت كلي داده‌ها تعيين شود. براي اين منظور شاخصهاي مركزي محاسبه مي‌شوند. شاخصهاي مركزي در سه نوع نما (Mode) ، ميانه (Median) و ميانگين (Mean) هستند كه هر يك كاربرد خاص خود را دارا مي‌باشند. در تحقيقاتي كه مقياس اندازه گيري داده‌ها حداقل فاصله‌اي است ميانگين بهترين شاخص است. ولي در تحقيقاتي كه مقياس اندازه گيري داده‌ها رتبه‌اي يا اسمي‌ است، ميانه يا نما مورد استفاده قرار مي‌گيرند.

محاسبه شاخصهاي پراكندگي

شاخصهاي پراكندگي برخلاف شاخصهاي مركزي هستند. آنها ميزان پراكندگي يا تغييراتي را كه در بين داده‌هاي يك توزيع (نتايج تحقيق) وجود دارد، نشان مي‌دهند. دامنه تغييرات ، انحراف چاركي (Quartile Deviation) ، واريانس (Variance) و انحراف استاندارد (Standard Deviation) شاخصهايي هستند كه به همين منظور در تحقيقات مورد استفاده قرار مي‌گيرند. پس از محاسبه شاخصهاي مركزي و پراكندگي مي‌توان نمره‌هاي استاندارد را محاسبه و منحني طبيعي (Z) را ترسيم كرد.

محاسبه همبستگي

تحقيقاتي وجود دارد كه پژوهشگر مي‌خواهد رابطه بين دو متغير را تعيين كند و به همين منظور از روشهاي همبستگي (Correlation) استفاده مي‌كند. در محاسبه همبستگي ، نوع مقياس اندازه گيري دخالت دارد و بطور كلي به دو دسته پارامتري و ناپارامتري تقسيم مي‌شوند. محاسبه همبستگي براي تحقيقات پارامتري : چنانچه دو متغير در مقياسهاي فاصله يا نسبي اندازه گيري شده باشند، مي‌توان براي تعيين رابطه بين آنها از ضريب همبستگي گشتاوري پيرسون استفاده كرد. ولي اگر در تمام مفروضات ضريب همبستگي پيرسون صادق نباشد، نمي‌توان از آنها استفاده كرد و به جاي آن مي‌توان از روشهاي ديگري مانند ضريب همبستگي دو رشته‌اي () ، دورشته‌اي () و يا ضريب تتراكوريك () استفاده كرد.

محاسبه همبستگي براي تحقيقات ناپارامتري : در تحقيقاتي كه در سطح مقياس‌هاي اسمي ‌و رتبه‌اي انجام مي‌گيرد، بايد از روش‌هاي ديگري براي محاسبه همبستگي بين دو متغير استفاده كرد. برخي از اين روشها عبارتند از : ضريب همبستگي في (ِ) ضريب كريمر (C) ، ضريب كپا (K) و ضريب لامبدا ، در تحقيقات اسمي ‌و ضريب همبستگي اسپرمن () ، ضريب كندال و آماده گاما (G) براي تحقيقات ترتيبي.

رگراسيون و پيش بيني رگراسيون (Regression) روشي براي مطالعه سهم يك يا چند متغير مستقل در پيش بيني متغير وابسته است. از تحليل رگراسيون هم در تحقيقات توصيفي (غير آزمايشي) و هم در تحقيقات آزمايشي مي‌توان استفاده كرد. با توجه به نوع تحقيق و متغيرهاي آن روش متنوعي براي تحليل رگراسيون وجود دارد كه برخي از آنها عبارتند از : رگراسيون خطي (با سه راهبرد همزمان ، گام به گام ، سلسله مراتبي) ، رگراسيون انحنايي ، رگراسيون لوجيستيك و تحليل كواريانس.

تحليل داده‌هاي ماتريس كواريانس از جمله تحليل‌هاي همبستگي ، تحليل ماتريس كواريانس يا ماتريس همبستگي است. دو نوع از معروفترين اين تحليل‌ها عبارتند از : مدل تحليل عاملي براي پي بردن به متغيرهاي زير بنايي يك پديده در دو دسته اكتشافي و تاييدي و مدل معادلات ساختاري براي بررسي روابط علي بين متغيرها.

مطالب بيشتر در مورد تحليل آماري را ميتوانيد در سايت بيگ پرو1 بخوانيد.