نظر به درخواست های رسیده به هیئت مدیره ی انجمن آمار ایران و مسئولین کنفرانس برای تمدید آخرین مهلت دریافت مقالات، کمیته ی علمی دهمین کنفرانس آمار ایران در آخرین جلسه ی خود تاریخ پذیرش مقاله ی کامل را تا تاریخ 30 بهمن ماه 88 تمدید نمود.
توجه شود که این مهلت به هیچ عنوان مجددا تمدید نخواهد شد.
+ نوشته شده توسط نورالله تازیکه میاندره در یکشنبه 29 آذر1388 و ساعت 12:5 بعد از ظهر |

آمار ناپارامتری[1]

گاهی با دانستن توزیع داده ها به راحتی می توانیم برآورد گرها را بیابیم مثلا اگر داده های ما دارای توزیع نرمال باشند میانه و میانگین بر هم منطبقند پس در این حالت ما از آمار پارامتری استفاده می کنیم ...

در نقطه مقابل این کار وقتی ما توزیع احتمال داده هایمان را نداریم برای برآورد  میانه از آمار ناپارامتری استفاده می کنیم ....

چیزهایی که در آمار ناپارامتری باید بدانیم:



[1] - برای کسب اطلاعات بیشتر به کتب روشهای ناپارامتری- دکتر جواد بهبودیان- انتشارات پیام نور مراجعه کنید.


ادامه مطلب
+ نوشته شده توسط نورالله تازیکه میاندره در چهارشنبه 8 مهر1388 و ساعت 11:46 قبل از ظهر |
جامعه آماری و نمونه گیری[1]
    جامعه عبارت است از همه اعضای واقعی یا فرضی که علاقه مند هستیم یافته های پژوهش را به آنها تعمیم دهیم (دلاور ۱۳۷۴ص۱۱۲) یا به عبارت دیگر جامعه عبارت است از گروهی از افراد ،اشیاء یا حوادث که حداقل دارای یک صفت یا ویژگی مشترک هستند (دلاور ۱۳۸۰ص۴) جامعه آماری همان جامعه اصلی است که از آن نمونه یا نما یا معرف بدست می آید (ساروخانی ۱۳۷۲ص۱۵۸).
نمونه گیری sampling یعنی انتخاب تعدادی از افراد، حوادث و اشیاء از یک جامعه تعریف شده به عنوان نماینده ان جامعه . به عبارت دیگر نمونه گیری عبارت از انتخاب درصدی از یک جامعه به عنوان نماینده ان جامعه است.
 نمونه گیری تصادفی عبارت است از انتخاب نمونه و جمع آوری داده ها به گونه ای که بتوان نتایج حاصل را با احتساب اندازه های خطا (که با استفاده از روشهای آماری تعیین می شوند) به یک جامعه بزرگ تعمیم داد . نمونه گیری تصادفی به این علت که اساس آن استفاده از روشهای آمار استنباطی است درسایر روشها ترجیح دارد . (دلاور ۱۳۷۴ص۱۱۵)

ادامه مطلب
+ نوشته شده توسط نورالله تازیکه میاندره در سه شنبه 6 مرداد1388 و ساعت 12:52 بعد از ظهر |

سامانه اطلاعات مکانی به عنوان یک سامانه پشتیبانی از تصمیم‌گیری توانسته است به لطف بهره‌گیری از فناوری‌های روز و تخصیص‌های مربوط، کمک شایانی به مدیران در تصمیم‌گیری‌های بهینه کند. امروزه در زمینه بهره‌گیری از سامانه اطلاعات مکانی، استفاده از GIS در زمینه‌های گردآوری، تحلیل  و ارائه اطلاعات جمعیتی و اقتصادی – اجتماعی از جایگاه ویژه‌ای برخوردار است،  زیرا اساساً کلیه‌ی فعالیت‌ها و خصوصیات اجتماعی و اقتصادی انسان‌ها از قبیل سکونت، مهاجرت و توسعه در بستر زمان و مکان ساری و جاری است. هم اکنون در بسیاری از کشورهای جهان به منظور بهره‌گیری از از جنبه‌ی مکانی داده‌های جمعیتی، متولیان امر سرمایه‌گذاری و مطالعات فراوانی  را در زمینه  پیاده‌سازی سامانه‌ی اطلاعات مکانی در سازمان‌های مربوطه انجام داده اند. سامانه‌ی اطلاعات مکانی مجموعه‌ای ساختاریافته  از سخت افزار، نرم افزار، داده، قابلیت‌های تحلیلی و افراد متخصص است که اطلاعات را با توجه به موقعیت جغرافیایی آن‌ها مدیریت و ارائه می کند.

گردآوری، ذخیر‌ه‌سازی، بازیابی، بهنگام سازی، پردازش، نمایش، به کارگیری و تبادل داده‌های مکانی، وظایف کلّی یک سامانه‌ی اطلاعات مکانی را تشکیل می‌دهند.

به طور کلّی، GIS تلفیقی از چند زمینه‌ی تخصصی شامل کارتوگرافی، نقشه برداری، علوم کاربردی و فناوری اطلاع رسانی(IT) است که در کنار تخصص مربوط به کاربر( مثلاً آمار)، به ابزاری بسیار قدرتمند برای تصمیم‌گیری و مد یریت تبدیل می شود.  GIS  با سامان دهی اطلاعات مختلف مربوط به یک کاربرد و تلفیق آن‌ها با یکدیگر، بستری را فراهم می‌آورد که درآن، مد یران قادرند با در کنار هم قرار دادن وجوه مختلف فنی، عملياتی، حقوقی و مالی مربوط به یک کاربرد، برنامه ریزی صحیحی انجام دهند.


ادامه مطلب
+ نوشته شده توسط نورالله تازیکه میاندره در سه شنبه 23 تیر1388 و ساعت 1:26 بعد از ظهر |

در تحلیل چند متغیره یک مسأله ممکن است با تعداد زیادی از متغیرهای همبسته شروع شود. در چنین شرایطی، هدف از تحلیل مولفه  های اصلی،رتشکیل تعداد کمی از متغیرهایی اسن گه ناهمبسته اند و اکثر تغییرات در داده های اصلی را توضیح می دهند. دلیل اصلی برای کاهش تعداد متغیرها با این روش، کمک به فهم ساختار اساسی داده هاست. به این دلیل تحلیل مولفه های اصلی در رشته هایی از قبیل پردازش سیگنال، تشخیص هویت و فشرده سازی تصویر مورد استفاده قرار می گیرند.

در هر یک از لینک های زیر یک فایل با فرمت PDF قرار داده شده است، هر چند مطالب مندرج در این فایل در سطح بالایی نمیباشند با این حال یک منبع مناسب برای درک ساده تر تحلیل مولفه های اصلی در اختیار خوانندگان قرار می دهد..

شایان  توجه است از دوستانی عزیزی که در گردهم آوردن این مطالب ما را یاری کردند تشکر و قدردانی کنیم. در نهایت لازم می دانم هر گونه اشتباهی را در نگارش به دلیل علاقه مولفین به درج هر چه سریعتر این مطالب در وبلاگ بدانم؛ لذا از دوستان برای تصحیح آن مدد می جوییم.

 لینک اول در سایت megaupload

لینک دوم در سایت  mediafire 

+ نوشته شده توسط نورالله تازیکه میاندره در چهارشنبه 27 خرداد1388 و ساعت 1:37 قبل از ظهر |

اگر از ما پرسيده شود منطق فازي چيست شايد ساده ترين پاسخ بر اساس شنيده ها اين باشد که Fuzzy Logic يا Fuzzy Theory يک نوع منطق است که روش هاي نتيجه گيري در مغز بشر را جايگزين مي کند.

مفهوم منطق فازي توسط دکتر لطفي زاده ، پروفسور دانشگاه کاليفورنيا در برکلي، ارائه گرديد و نه تنهابه عنوان متدولوژي کنترل ارائه شد بلکه راهي براي پردازش داده ها، بر مبناي مجاز کردن عضويت گروهي کوچک به جاي عضويت گروهي دسته اي ارائه کرد.به جهت نارسا ونا بسنده بودن قابليت کامپيوتر هاي ابتدايي تا دهه 70 اين تئوري در سيستم هاي کنترلي به کار برده نشد.

پروفسور لطفي زاده اينطور استدلال کرد که بشر به وروديهاي اطلاعاتي دقيق نيازي ندارد بلکه قادر است تا کنترل تطبيقي را به صورت بالايي  انجام دهد.پس اگر ماکنترل کننده هاي فيدبک را در سيستم ها طوري طراحي کنيم که بتواند داده هاي مبهم را دريافت کند، اين داده ها ميتوانند به طور ساده تر و موثرتري در اجرا به کار برده شوند.

با اين تعاريف منطق فازي داراي اين قدرت است که در تنظيم سيستم ها از ميکرو کنترلهاي ساده وکوچک و جاسازي شده گرفته تا PC هاي چند کاناله شبکه شده بزرگ ياسيستم هاي کنترلي به کار برده شود.اين منطق داراي قدرت اجرايي در سخت افزار ،نرم افزار يا ترکيبي از هر دوي اينهاست.در واقع   منطق فازي راه ساده اي را براي رسيدن به يک نتيجه قطعي و معين بر پايه اطلاعات ورودي ناقص ، خطا دار، مبهم ودوپهلو فراهم ميکند.منطق فازي يک قانون ساده بر مبناي

  ” IF  x  And  y THEN  z “

را بيان ميکند.

به عنوان مثال به جاي برخورد با اصطلاحاتي نظير

“SP=500F” ،”210

اصطلاحاتي نظير

“IF (process is too cool) AND (process is getting colder) THEN

(Add heat to the process) “

Or 

“IF (process is too hot) AND (process is heating rapidly) THEN

(Cool the process quickly)”

به کار برده شود.

درست مثل کاري که در هنگام دوش گرفتن انجام مي دهيم: در صورتي که آب خيلي سرد يا خيلي گرم باشد  بدون اينکه از درجه دقيق آب اطلاعي داشته باشيم تنها بر اساس پردازش انجام شده در مغز به کمک دريافت دماي هوا  از طريق حسگرهاي پوست با کمي سختي کشيدن آب را به سرعت به دماي دلخواه در مي آوريم يا آنکه ميتوانيم در يک اتاق به اشياءگوناگوني نگاه کنيم وتصميم بگيريم کداميک بيشتر شبيه صندلي است ويا به مردم نگاه کنيم و بگوييم کداميک شبيهJohn Wayne ويا کداميک بيشتر شبيه گاندي است.


نکته جالب اينجاست که اگرچه سيستم هاي فازي پديده هاي غير قطعي و نامشخص را توصيف مي کند با اين حال تئوري فازي يک تئوري دقيق مي باشد. 
منطق فازي قادر به تقليد اينگونه رفتارها  اما با سرعت بسيار بالايي است.از طرفي بايد به اين نکته هم توجه کنيم که تمامي سيستم هاي طبقه بندي ساخته ذهن انسان هستند و برچسب درست تا زماني به يک سيستم طبقه بندي نسبت داده ميشود که سيستم کنترلي ديگر آن را رد نکند مثلا در تئوري نسبيت ديگر درست نيست بگوييم زمين دور خورشيد ميگردد پس خورشيد هم دور زمين مي گردد! يا به عنوان مثال ديگر، کشف موجودي عجيب در استراليا  که پلاتي پوس ناميده مي شودو بر خلاف پستانداران ديگر همانند خزندگان تخم ميگذارد و جوجه هاي جوان را شير مي دهد!  با اين تعاريف مي توان گفت که منطق فازي يک تکنولوژي کنترلي بسيار قدرتمند است که به جاي ساختن يک حصار در اطراف يک طبقه بندي سعي دارد آن را به گونه اي توصيف کند که به ايده نزديک تر است. 


ادامه مطلب
+ نوشته شده توسط نورالله تازیکه میاندره در پنجشنبه 3 اردیبهشت1388 و ساعت 4:48 بعد از ظهر |

داده‌ها يكي از با ارزش ترين دارائي هاي هر شركت مي‌باشند. البته اين ارزش در صورتي واقعي است كه شركت توانايي استخراج دانش نهفته در داده‌هاي خام را داشته باشد. داده‌كاوي امكان استخراج دانش را از داده ها فراهم مي‌كند و بوسيله‌ي اين دانش مي‌توان آينده شركت را پيش‌بيني كرد. همچنين داده كاوي در بهبود تصميمات تجاري كمك مي‌كند و مي‌تواند ميزان رضايت مشتري را افزايش دهد. در واقع داده‌كاوي، پروسه استخراج اطلاعات ناشناخته ار پايگاه داده‌هاي بزرگ در قالب الگوها و روابط مي‌باشد. امروزه در بيشتر سازمان‌ها ارزش داده‌كاوي شناخته شده است. داده‌كاوي در درك بهتر حجم بالاي داده‌اي كه توسط سيستم‌هاي ‍CRM و ساير سيستم ها جمع آوري شده است، كمك مي‌كند.


داده‌كاوي ابزاري است كه براي استخراج اطلاعات مهم از داده‌هاي موجود به كار گرفته مي‌شود و امكان تصميم‌گيري بهتر را فراهم مي كند. ابتدا از data warehouse براي تركيب داده‌هاي مختلف از پايگاه داده‌هاي مختلف در فالب يك فرمت قابل قبول استفاده مي‌شود و در مرحله بعد داده‌ها تحليل شده و اطلاعاتي استخراج مي‌شوند كه سازمان‌ها مي‌توانند از آنها براي پشتيباني فرآيندهاي تصميم‌گيري خود استفاده كنند. بانك‌ها نيز براي حفظ قدرت رقابت خود، داده‌كاوي را  در فرآيندهاي تصميم گيري خود به كار مي‌گيرند واز مزاياي آن در كسب و حفظ مشتري و در نتيجه افزايش سود آوري بهره مي‌گيرند.


 از جمله كاربردهاي داده‌كاوي در بانكداري، شركت‌هاي بيمه،‌ مخابرات، بازاريابي، پيش بيني فروش و پيداكردن عوامل بحراني و حياتي در خط توليد واحدهاي توليدي مي‌باشد. به داده‌كاوي هوش تحليلي نيز گفته مي‌شود. داده‌كاوي مي تواند به سازمان‌ها در درك بهتر تجارتشان، سرويس دهي بهتر به مشتريان و بالا بردن كارايي كمك كند. اين امر سازمان‌ها را قادر مي‌سازد كه فقط برروي مهمترين اطلاعات تمركز كنند و براي مديران اين امكان را فراهم مي‌آورد كه بوسيله پيش بيني رفتارها و روند آينده، تصميمات علمي تر و موفقيت آميزتري بگيرند. با پيشرفت‌هايي كه در كل جهان در صنعت بانكداري اتفاق افتاده است و با به كارگيري بانكداري الكترونيكي، جمع‌آوري و ثبت اطلاعات مربوط به تراكنش‌ها ساده‌تر شده است، اما در عين حال حجم داده‌ها به صورت قابل توجهي افزايش يافته است. با به كارگيري داده‌كاوي، رؤسا و مسئولين اجرايي بانك مي‌توانند با دقت بالا پيش بيني كنند كه مشتريان چگونه در برابر تعديل نرخ بهره‌ها عكس‌العمل نشان مي‌دهندچه مشترياني محصولات جديد را مي‌پذيرند و وام دادن به چه مشترياني داراي ريسك بيشتري است. بانك‌ها داراي مخازن بزرگي از اطلاعات آماري مشتريان مي‌باشند، اين اطلاعات شامل داده‌هاي مربوط به تراكنش‌ها الگوي استفاده از كارت‌هاي اعتباري مي‌باشد. بانك بوسيله تكنيك‌هاي داده‌كاوي مي تواند الگوي موجود در داده‌هاي مشتريان را كشف كند و براساس اين الگو تصميم مناسب‌تري بگيرد.

در قسمت ادامه مطلب مثالی کاربردی در این زمینه آورده شده است.


ادامه مطلب
+ نوشته شده توسط نورالله تازیکه میاندره در سه شنبه 18 فروردین1388 و ساعت 5:0 بعد از ظهر |

با افزايش روز افزون تقاضا براي اطلاعات آماري در عرصه‌هاي جديدي مانند زيستي، جنسي، فرهنگي و اجتماعي، سازمان‌هاي‌ آماري اقدام به برنامه‌ريزي براي انتشار ادواري داده‌هاي حاصل از سرشماري‌ها و نمونه‌گيري‌ها  كرده‌اند. اما هرچه اين اطلاعات منتشره جامعتر و دقيقتر باشد، ‌خطر افشاي اطلاعات محرمانه نيز در آنها افزايش مي‌يابد. از سوي ديگر كامل بودن اطلاعات دزدان اطلاعاتي را بيشتر وسوسه مي‌كند تا  به اطلاعات محرمانه دسترسي پيدا كنند، اين امر در مورد اطلاعات محرمانه لشگري و كشوري نيز صادق است و در پاره‌اي از مواقع  موجب آسیب­های  جبران ناپذیری در عرصه‌هاي گوناگون اجتماعي، اقتصادي، سياسي،‌‌‌ فرهنگي و نظامي مي‌شود. سازمان‌هاي آماري براساس وظيفه قانوني و اخلاقي خويش باید داده‌ها را به گونه‌اي منتشر كنند كه منجر به شناسايي پاسخ‌دهندگان نشود، لذا اين امر همواره بهانه‌اي براي عدم انتشار داده‌هاي حاصل از آمارگيري‌ها بوده است. از طرفي عدم انتشار كافي داده‌ها، برنامه‌ريزي‌هاي كلان مديريتي را دچار اخلال مي‌كند. بنابراين سازمان‌های‌ آماري وظيفه دارند علاوه بر انتشار داده‌ها، امانت‌دار اطلاعات خصوصي افراد باشند و بايد بين اين دو امر نوعي تعادل را ايجاد نمایند.


سازمان های آماری داده ها را به دو گونه داده های جدولی و داده های خام منتشر می کنند.


در اين راستا سازمان‌های آماری از روشهاي دسترسي محدود به اطلاعات كه در اصطلاح روشهاي كنترل افشاي آماري[1] ناميده مي‌شوند، استفاده مي‌كنند. اين روشها كه براي دسترسي محدود به داده‌ها هستند،‌ بايد در صورتي استفاده شوند كه حفظ جنبه‌ي محرمانه بودن اطلاعات از راههاي ديگر غير ممكن باشد. در اين روش‌ها داده‌هاي آماري به گونه‌اي تعديل مي‌شوند كه امكان تجزيه و تحليل روي آن‌ها وجود داشته باشد،‌ اما ضرري متوجه پاسخگو‌ نباشد.

در ادامه مطلب مطالب بیشتری خواهید آموخت.


[1] (Statistical Disclosure Control (SDC


ادامه مطلب
+ نوشته شده توسط نورالله تازیکه میاندره در یکشنبه 11 اسفند1387 و ساعت 2:46 بعد از ظهر |

آمارگيري (Survey)  از روشهای پرکاربرد پژوهش و گردآوری داده ها در علوم مختلف و از جمله در  پزشكي، مهندسي، کتابداری و اطلاع رسانی است که با گسترش فناوری اطلاعات و بویژه اینترنت، بر دامنه کاربرد آن روز به روز افزوده می شود.

امروزه جستجو براي انجام آمارگيري به روش هاي مختلف كه دو اصل كمترين هزينه و  زمان را با هم به همراه داشته باشد به شدت مورد علاقه و در حال انجام است. 

براي اين منظور  مطلب زير را كه در مورد  استفاده از فناوري و اينترنت براي انجام آمارگيري است،  تهيه و در   ادامه مطلب قرار داده شده است..


ادامه مطلب
+ نوشته شده توسط نورالله تازیکه میاندره در شنبه 17 آذر1386 و ساعت 8:30 بعد از ظهر |
در بیشتر مسائل عملی نیازمندیم که از بین بیشمار متغیری نامزد حضور در مدل برخی از آنها را انتخاب کنیم. برا ی این کا ر معیارهای  مختلفی وجود دارد از جمله مهم ترین آنها می توان به C-p مالوس، ضریب تعیین و معیار تورم ریسک  و معیار اطلاع آکائیک اشاره کرد. این موارد در مقاله ای که در لینک زیر قرار داده شده است توسط آقای هادی موقری بررسی شده است.

 

لینک 1:                                              Linear- selection-regression

لینک 2:                                              Linear- selection-regression 

+ نوشته شده توسط نورالله تازیکه میاندره در یکشنبه 8 مهر1386 و ساعت 2:40 بعد از ظهر |
 عبارت آمار رسمی از دو واژه "آمار“ و "رسمی" تشکیل یافته است.

جنس آمار، نوعی آگاهی و اطلاعات است و فرق آن با اطلاعات دیگر این است که
این گونه اطلاعات در قالب کمّی  اندازه گیری شده و تجلی می یابد و مشاهده ای از
 پدیده ها در قالب کمی جمع آوری و سپس تجزیه و تحلیل، استنباط تفسیر می شود.
بنابراین آمار اطلاعاتی‌ است عددی ازپدیده‌های مشاهده شده که با جمع آوری،
طبقه‌بندی و سازمان ‌دهی‌ به‌ دست مي‌آيد و سپس نتیجه‌گیری، تجزیه و تحلیل،
استنباط ، تفسیر و تعمیم داده می‌شود.
 
در زیر لینک مربوط به دانلود اسلایدهایی در مورد سرشماری و آمار رسمی
قرار داده شده است
 
 
 
official statistics   (لینک ۱)                
official statistics   (لینک ۲)               
+ نوشته شده توسط نورالله تازیکه میاندره در چهارشنبه 13 تیر1386 و ساعت 9:19 بعد از ظهر |

یکی از مهمترین کاربردهای سری هه اینست که می توان توابع مختلف ریاضی را به صورت مجموع توابع ساده تر نمایش داد. عین همین نکته در مورد حاصلضرب های نامتناهی وجود دارد. می توان توابع تحلیلی را به صورت حاصلضربی از توابع ......

مطلب زیر توسط هادی موقری گرداوری شده است را در اختیار شما قرار می دهیم.

برای دریافت مقاله روی یکی از لینک های زیر کلیک کنید:

لینک ۱:

حاصلضرب های نامتناهی

لینک ۲ (rapidshare):

حاصلضرب های نامتناهی

+ نوشته شده توسط نورالله تازیکه میاندره در یکشنبه 2 اردیبهشت1386 و ساعت 5:12 بعد از ظهر |

در اینجا یک روش ابتکاری برای براورد درستنمایی ماکزیمم داده های ناقص، که به طور معمول الگوریتم  E-M  نامیده می شود را مورد بحث و بررسی قرار می دهیم. دلیل اصلی کاربرد این الگوریتم در چند متغیره ها، برای براورد پارامترهای توزیع های آمیخته متناهی می باشد و....

ادامه مطلب را در ترجمه متن که از کتاب با عنوان مقدمه بر آنالیز چند متغیره می باشد بخوانید که در لینک زیر قرار داده شده است:

 لینک ۱ :

 الگوریتم E-M

لینک ۲ (Rapidshare) :

الگوریتم E-M

+ نوشته شده توسط نورالله تازیکه میاندره در جمعه 31 فروردین1386 و ساعت 11:57 بعد از ظهر |

در زیر لینک مقاله ای که توسط هادی موقری  به عنوان سمینار شده است را برای دوستان عزیز ارائه می کنیم. این مقالات شامل توضیحاتی در مورد شبیه سازی مونت کارلو نیز می شود.

لینک 1:

 روش های کاهش واریانس براوردهای مونت کارلو

لینک 2(rapidshare):

 روش های کاهش واریانس براوردهای مونت کارلو

+ نوشته شده توسط نورالله تازیکه میاندره در چهارشنبه 29 فروردین1386 و ساعت 11:8 قبل از ظهر |