logo

انتخاب محل سایدبار

لورم ایپسوم متن ساختگی با تولید سادگی نامفهوم از صنعت چاپ و با استفاده از طراحان گرافیک است. چاپگرها و متون بلکه روزنامه و مجله در ستون و سطرآنچنان که لازم است و برای شرایط فعلی تکنولوژی مورد نیاز و کاربردهای متنوع با هدف بهبود ابزارهای کاربردی می باشد.
hello@youremail.com
+1234567890

R نرم افزاری برای تحلیل داده ها در تمام شاخه های علمی

R-Logo1

R نرم افزاری برای تحلیل داده ها در تمام شاخه های علمی

فکر می کنم نامنصفانه باشد که بنیان گذاران R نتیجه زحمات خود را به رایگان در اختیار تمام افراد دنیا گذاشته باشند ولی کسانی که از این نرم افزار استفاده می کنند، از معرفی آن به سایرین دریغ کنند. 

زماني كه پژوهشگری براي رسيدن به اهداف علمي خود تلاش می نمايد به منظور دستیابی به نتایج روا و قابل دفاع، لازم است فعاليت هايش بر پايه ي روش هاي علمي درست و مناسب بنا شود و همانطور که کرلینجر می گوید باید بتواند مسیر علمی خود را شخصا ترسیم نماید و به جزئیات آنچه در پژوهشش می گذرد آشنا باشد. یکی از بخش های مهم هر پژوهش علمی (چه کیفی و چه کمی) تحلیل اطلاعات یا دیتا است. در حوزه ي تحليل داده ها و استخراج اطلاعات از داده ها روش هاي مختلف و پيشرفته اي وجود دارد كه هر كدام مزيت ها و محدوديت هاي خاص خود را دارند. امروزه تمام تحليل هاي آماري در شركت ها و موسسات با نرم افزارها انجام مي شود. بنابراين ضروري است نرم افزاري براي تحليل داده ها انتخاب شود كه معقول و مقبول جامعه ي علمي باشد. شاید در جامعه ی علمی ما این نکته جا افتاده باشد که می توان به خروجی نرم افزارها اعتماد نمود. اما با مرور تاریخچه ی نرم افزارهای آماری در می یابیم که گاهی روش های بکار گرفته شده در آنها مقبول جامعه ی علمی نیست. مثلا شرکت SPSS قبل از این که به IBM بپیوندد به دلیل بکار بردن روش های نامناسب در تحلیل های خود (تحلیل عاملی) یکبار در دادگاه آمریکا به پرداخت جریمه محکوم شده است. براي تحليل داده هاي آماري  نرم افزارهاي مختلفي وجود دارد از صفحه گسترده هايي مانند اكسل،سيستم هاي مبتني بر GUI كه نقطه كليك مي باشند )مانند SPSS) گرفته تا سيستم هاي داده كاوي و نرم افزارهاي مبتني بر روش گروهي مانند SAS.

 مطالب ذیل از مقاله Ashlee Vance به آدرس:

http://www.nytimes.com/2009/01/07/technology/business-computing/07program.html

گرفته شده است.

برای بعضی ها R فقط ۱۸همین حرف الفبای انگلیسی است. برای برخی دیگر R یک رتبه (درجه دسته بندی) در فیلم­های مهیج است. برای برخی ها نیز یک درجه عایق استفاده شده برای اتاق زیر شیروانی و یا حرفی هست که دزدان دریایی در فیلم ها می­گویند.

R همچنین نام یک زبان برنامه نویسی و نرم­افزار مهم و کاربرپسند است که برای آنالیز داده­ ها استفاده می­ شود. این برنامه در حال تبدیل شدن به یک زبان برنامه نویسی بین المللی است. چرا که امروز داده کاوی یکی از کارهای اجتناب ناپذیر هر علمی شده است. امروزه شرکت های مختلف از جمله Google, Pfizer, Merck, Bank of America, the InterContinental Hotels Group و Shell از آن به صورت روزمره استفاده می­کنند.

اما شاید این سوال برای شما پیش بیاید چرا این برنامه را R نامیده اند؟ این سوالی است که برای خودم هم پیش آمده اما فقط همین را میتوانم بگویم که R اولین بار در سال ۱۹۹۶ ظهور یافت که دو پروفسور آمار نیوزلندی به نام های Robert Gentleman و Ross Ihaka یک کد برنامه نویسی را به همراه نرم افزار به صورت رایگان منتشر کردند. شاید دلیل نامگذاری R به خاطر حرف اول اسم کوچک این دو پرفسور آمار باشد.

یک محقق در شرکت Google که از نرم افزار R استفاده می کند گفته نرم ­افزار R آنقدر مهم است که ارزش آن قابل شمردن نیست. این نرم افزار به محققان و دانشجویان این اجازه را می دهد که آنالیزهای پیچیده و برهمکنشی را بدون اینکه از پس زمینه نرم افزار و روش های آماری اطلاعی داشته باشد را انجام دهند.

جالب اینکه این نرم افزار مجانی است. این قابلیت را دارد که کدهای خود را که در زبان برنامه نویسی مانند C++ نوشته ای را در اینجا برای محققان دیگر به اشتراک بگذاری، کدهای نوشته شده را اصلاح کنید و از بسته های نرم افزاری دیگران استفاده کنی. پس هم یک زبان برنامه نویسی است و هم یک بسته نرم­افزاری برای کاربران می باشد. خیلی اوقات محققان آماری در زمینه برنامه نویسی به توابع و الگوریتم های نیاز دارند که نوشتن آنها به زمان بسیار زیادی نیاز دارد. اما با استفاده از R کاربر میتواند به راحتی از متدها و توابعی که دیگران نوشته اند استفاده کند. برخی از کاربران R آن را به عنوان یک نسخه پیشرفته excel می داند زیرا به راحتی میتواند ویرایش و آنالیزهای دادها را با آن انجام داد.

در حال حاضر بیش از ۳۱۱۷ بسته نرم افزاری برای R نوشته شده است. واقعیتش من فکر نمی کنم تا حالا هیچ نرم­ افزاری به این گستردگی نوشته شده باشد. برخی از دانشجویان به من گفته اند که این نرم افزار به زودی جایگزین SAS می شود. اما باید بگم SAS که چه عرض کنم، دیگر نرم افزارهای برآورد پارامتر هم دارند کنار میروند. فقط بگم این نرم افزار واقعاً محشر است، هر چه دلت بخواد توی آن پیدا میکنی. بعضی ها میگن شبیه نرم­افزار Matlab است. از این جنبه که قابلیت نوشتن برنامه در ان هست بله. مثل Matlab است. اما شما برید ببینید آیا میتوانید به نرم افزار Matlab فایل شجره و داده را بدی برایتون BV یا پارامتر ژنتیکی محاسبه کنه. برای اینکار در نرم افزار Matlab مجبور بودید صدها خط برنامه مینوشتید اما با R همین کار را با ۱۰ خط میتونید انجام بدید.

اینکه تعداد کاربران نرم افزار R چقدر است را نمی توان دقیق گفت اما در سال ۲۰۰۹ حدود ۲۵۰۰۰۰ نفر تخمین زده شد. که من شک ندارم تا امروز این تعداد از ۵۰۰۰۰۰ نفر هم گذشته است. همچنین در این مقاله نوشته شده کاربرپسندی و قابلیت های دیگر R میتواند تجارت موسسئسه هایی که SAS را سازماندهی می کننند تهدید کند که قطعاً همینطور هست. مثل خود من، از زمانی که با R آشنا شده ام خیلی کمتر از SAS استفاده میکنم. البته شرکتی که SAS را نوشته و پخش می کند هم بیکار ننشسته و امروز SAS نسخه ۹.۲ با قابلیت بالاتر و با کتابهای راهنمای بسیار باکیفیتی را وارد بازار کرده است.

بااین وجود R یکسری نقایصی هم دارد که قطعاً به زودی حل خواهند شد. یکی از آنها این است که برای برخی packageها و متدها به حافظه کامپیوتری بالایی نیاز دارد. برخی از packageهای آن روی برخی سیستم عامل ها جواب نمی دهند مثلاً package MCMCGlmm گاهی اوقات روی ویندوز ۷ کار نمی کند باید حتماً از XP یا لینوکس استفاده شود. از نظر حافظه محدودیت دارد. سرعت ان نسبتاً کند است. اما همچنان تهیه کنندگان این نرم افزار در تلاشند تا کاستی های آن را جبران کنند. که قطعاً به زودی این کاستی ها را نیز برطرف خواهند کرد.

منبع: http://geneticz.blogfa.com/post-129.aspx

همانطور که در ابتدا گفته شد مقاله ترجمه شده مربوط به سال ۲۰۰۹ است. در حال حاضر تمام مشکلات ذکر شده در نرم افزار آر حل شده است. به صورت نسبی به لحاظ سرعت در اجرای الگوریتم های مختلف نرم افزار آر گوی سبقت را از سایر نرم افزارها ربوده است، بهترین قدرت و قابلیت گرافیکی را دارد و تعداد بسته های آن حدودا دو برابر شده است. تعداد کاربران فوق العاده چشمگیر و تعداد وب لاگ ها و سایت های آموزشی آن نسبت به تمام نرم افزارهای تحلیل داده با سابقه های طولانی تر، بیشتر شده است. شتاب گسترش آر به گونه ای است که بعضی از تحلیل گران به آن گوگل تحلیل داده می گویند.

موارد ذیل از لینک

 http://measurement.blogfa.com/post-865.aspx    گرفته شده است

دلایل استفاده از نرم افزار R

 در بين نرم افزارهاي مختلف براي تحليل هاي آماري و سنجشي بهتر است از نرم افزار R استفاده شود. دلايلي كه اين نرم افزار را از ساير نرم افزارها جدا مي سازد در زیر ارائه شده اند.

۱.اين نرم افزار رايگان است: مي دانيم كه بيشتر نرم افزارهايي كه در كشور استفاده مي شوند نرم افزارهايي هستند كه نسخه ي اصلي آنها نيست و نسخه هاي قفل شکسته،  نرم افزارها قابل اطمینانی نمی باشند. اين موضوع در کشور ما چندان مورد توجه پژوهشگران قرار نمی گیرد. نرم افزار R علاوه بر اين كه رايگان است از طریق اینترنت و سایت اصلی آن یعنی www.r-project.org قابل دانلود است.

۲.دانلود نسخه ي اوليه ي اين نرم افزار بسيار آسان و كم حجم است و تنها بسته هاي ضروري را همراه دارد پژوهشگر مي تواند بر اساس نيازي كه به ساير بسته ها دارد آنها را جداگانه دانلود كند و نصب نمايد.

۳.نرم افزار R يك پروژه ي منبع آزاد است كه هر كس مي تواند كدهاي مختلف را بررسي كرده و آنها را سرهم نمايد و يك بسته ي نرم افزاري جديد ارائه دهد كه هم خود از آن بهره برد و هم در اختيار سايرين در سراسر دنيا قرار دهد.

۴. R يك زبان برنامه نویسی است. زبان برنامه نویسی که برای انجام تحلیل های آماری و گرافیکی تدوین شده است. در این نرم افزار دستورات باید نوشته شوند. زماني كه از نوشتن دستورات صحبت مي شود به نظر كار مشكلي پيش رو است اما كار با اين نرم افزار بسيار راحت بوده و فراگيري آن مخصوصا زمانی که فرد با اصول اولیه ی آن آشنا باشد، به سرعت انجام مي شود.

۵. یکی از مزایای اصلی کار با نرم افزار آر این است که پژوهشگر شخصا در فرايند تحليل قرار می گیرد كه منجر به تقويت فهم آماري وي مي شود و مانند ساير نرم افزارها، تحليل ها در جعبه سياه انجام نمی شود. به بيان ديگر اين نرم افزار سبب كاهش فاصله ي بين آمار و برنامه نویسی آماری می شود.

۶. نرم افزار R مي تواند به عنوان منبعي براي تدريس و آموزش استفاده شود. نرم افزار R به دلیل قابلیت های برنامه نویسی آن می تواند مانند نرم افزار اکسل منبعی برای یادگیری و آموزش موضوعات مختلف آماری و روش شناسی علمی باشد.

۷. از طريق نرم افزار R مي توان كليه ي تحليل هاي آماري را در هر رشته علمی انجام داد. به دليل باز بودن منبع اين نرم افزار، هر روزه افراد در اقصی نقاط دنیا بر اساس نياز خود بسته هاي نرم افزاري جديد تهيه كرده و در اختيار سايرين قرار مي دهند. تا كنون بالغ بر ۵۰۰۰ بسته ي نرم افزاري مختلف براي اين نرم افزار توليد شده است.

۸. كاربران روز افزون اين نرم افزار دست به ايجاد وب لاگ ها و وب سايت هاي مختلف زده اند تا از اين طريق بسته هاي مختلف را معرفي كرده و به سوالات سايرين پاسخ دهند، بنابراين در صورت برخورد با مشكل مي توان از اين منابع استفاده نمود و یا مشکل خود را با سایرین در میان گذاشت.

۹. انعطاف پذيري نرم افزار R: اين نرم افزار به اين دليل كه يك زبان برنامه نويسي است مي تواند تحليل ها را بر اساس نياز و مطابق دلخواه پژوهشگر تغییر دهد. تحليل ها از كشيدن نمودارهاي ستوني و پراكنش تا روش هاي پيشرفته مانند مدلهاي پيش بيني و يادگيري ماشين را در بر مي گيرد.

۱۰. قدرت گرافيكي ديداري سازي بالاي نرم افزار R: گرافيك و ديداري سازي داده ها که به عنوان قسمت ضروري فرآيند تحليل بشمار می رود يكي از اصول طراحي نرم افزار است. سيستم گرافيكي نرم افزار متاثر از تفكر رهبران ديداري سازي داده ها مانند بيل كلوند و ادوارد توفت است.

۱۱. استفاده از آن در نوشتن مقالات در مجامع علمي دنيا قابل قبول است. بعضي از نشريات ممكن است تحليل هاي انجام شده توسط نرم افزارهاي خاصي را قبول نداشته باشند ولي انجام تحليل ها از طريق اين نرم افزار در تمام دنيا قابل قبول است.

۱۲. ارائه ي خروجي هاي به صورت عكس هاي با كيفيت عالي براي گراف ها و نمودارها و خروجي هاي دقيق براي تحليل هاي آماري غير گرافيكي.

۱۳. انتقال فايل ها از نرم افزارهاي مختلف و پذيريش پسوند هاي كاربردي.

۱۴. Copyو paste راحت فرمان ها خروجي ها و دادها.

۱۵. قابلیت استفاده از نرم افزار در تمام حوزه های علمی. این نرم افزار می تواند به طور کاملا اختصاصی در تمام رشته های علمی استفاده شود. فراگیری این نرم افزار کاربر را از فراگیری نرم افزارهای دیگر بی نیاز می سازد. به عنوان مثال نرم افزار spss توانایی تحلیل های SEM و Path analysis را ندارد برای انجام این تحلیل ها لازم است کاربر نرم افزارهای دیگری مانند R را فراگیرد. مثلا کسی که در رشته سنجش و اندازه گیری تحصیل می کند در صورتی که از نرم افزار spss استفاده کند لازم است از نرم افزارهای LIZREL,AMOS,TESTFACT,BILOG,MULTILOG,PARSCALE,SAS,STATISTICA  و موارد دیگر استفاده نماید. اما با فراگرفتن کار بانرم افزار آر، از فراگیری سایر نرم افزارها رها می شود. بنابراین هزینه زمانی و مالی بسیار کمتری متحمل می شود.

۱۶. یادگیری زبان برنامه نویسی آن به دلیل سطح بالا بودن زبان R ، نسبت به هر زبان دیگری راحت تر است.

۱۷. از دید مجلات معتبر دنیا (مانند ساینس و نیچر) در رشته های مختلف قابل اعتماد است و به دلیل رایگان بودن برای درج مقالات در این مجلات نیاز به لایسنس ندارد.

بدون دیدگاه

ارسال یک نظر

نظر
نام
ایمیل
وبسایت