پست مهمان: رابطه استفاده از کلمه مهمل توی وبلاگ جادی و میزان بارون در تهران

ایمیل از هادی بنایی، دانشجوی علوم کامپیوتر، دانشگاه اوربرو، سوئد و یکسری کار تحلیلی جالب:

با سلام بر شما جناب جادی

پستی که در مورد کلمه‌ی مهمل نوشته بودی خوب بود و به‌لحاظ آماری جالب! اما من بد ندیدم که یه داده‌کاوی عمیق‌تری روی داده‌ها انجام بدم. اول چی‌کار کردم؟ اومدم داده‌های مشترک بین دو سال ۲۰۱۱ و ۲۰۱۲ رو کنار هم قرار دادم (از ماه ۵ تا ۱۱) و بعدش اومدم از این داده میانگین گرفتم. به‌این ترتیب تونستم یه الگوی رفتاری از وجود کلمه‌ی مهمل در هر ماه رو به‌طور متوسط به‌دست بیارم (جدول ۱)

جدول۱:

Month 2011 2012 Average
May 1 0 0.5
June 1 3 2
July 0 1 0.5
August 1 1 1
September 2 0 1
October 4 5 4.5
November 1 6 3.5

داده‌ی به‌دست اومده نشون می‌داد که به‌طور تقریبی گفتن کلمه‌ی مهمل به فصل سال و یه‌جورایی به آب و هوا ربط داره. از طرفی مکان نوشتن پست‌ها هم حتما روی بروز کلمه‌ی مهمل اثر داشته. بنابراین بهترین داده‌ای که می‌تونست برای مقایسه و ارزیابی انتخاب بشه، میانگین میزان بارش در ماه‌های سال در شهر تهران بود که به لطف ودر بیس برای ماه‌های میلادی داده‌ها رو یافتم (داده‌ها بر اساس میلی‌متر). از اون‌جایی که هر داده‌ای نیاز به نرمال‌سازی داده‌، تو قدم بعد لگاریتم داده‌های مورد نظر رو محاسبه کردم. (جدول ۲)

جدول ۲:

Month Mean Rainfall in Tehran Log
May 15 3.9068905956
June 3 1.5849625007
July 2 1
August 2 1
September 3 1.5849625007
October 10 3.3219280949
November 25 4.6438561898

اما نکته‌ی شگفت‌انگیز هم‌بستگی بسیار بالای این داده‌ها با داده‌های کلمه‌ی مهمل بود. نمودار ۱ گویای همه‌ی اطلاعات و نتیجه‌گیری ها است:

نمودار۱:

نتیجه‌گیری علمی! تخصصی!: نتایج فوق نشون می‌ده که میزان ادا کردن کلمه‌ی مهمل توسط جادی در پست‌هاش رابطه‌ی مستقیمی داره با میزان بارندگی در تهران.
نتیجه‌گیری فلسفی!: میزان رطوبت هوا می‌تونه سلول‌های مغز رو تحت تاثیر قرار بده که به‌جای استفاده از لغات مهمل دیگه! از لغت مهمل استفاده کنه!
نتیجه‌گیری منطقی و کلی: می‌شه یه‌سری داده‌ی مهمل رو طوری تحلیل کرد که نتایج مهملش آدم رو به‌ فکر فرو ببره تا به‌زور روی نتایج حاصله فلسفه ببافه!

سپاس(اگه دوست داشتی می‌تونی ضمیمه‌ی همون پست اضافش کنی)

توجه کنین که همونطور که خود هادی می گه، بازی با اعداد بدون داشتن نظریه می تونه نتایج متنوعی بده که الزاما نمی تونن منجر به نظریه بشن. آمار و اعداد وقتی معنا دار می شن که از یک نظریه دفاع کنن یعنی از یک فرض اندیشیده شده. اگر نتونین ربط علی دو چیز رو با هم از نظر منطقی نشون بدین ،‌ اعدادی که به دست آوردین فقط به درد گول زدن می خوره یا حتی ممکنه باعث گمراهی بشه.

  • voltan

    اطلاعات مهملی بود ! پست قبلی رو دیده بودم توی شاخه چرا لینوکس رو دوست دارم گذاشته بودید ( ربطش هم همونجا بود ) این تحلیل ها هم با لینوکس انجام شده؟

    • هادی

      نکته‌ی پست هم همینه که طعنه بزنه به این همه کار مهملی که تو جامعه انجام می‌شه و به‌عنوان فکت به‌خورد ملت داده می‌شه!
      … بله. همه چی تو لینوکس انجام شده.

  • امید

    نتیجه منطقی! دیگه‌ای که میشه گرفت اینه که جادی از بارون خوشش نمیاد و تو روزای بارونی بی حوصله میشه :)
    بهتره انکار نکنی جادی کار “کارشناسی شده” اینو میگه

  • amin

    البته از اونجایی که بارندگی با ترافیک رابطه مستقیم داره نمیشه این عامل رو از معادله حذف کرد، ادامه بحث رو به همکارم دکتر شلدون کوپر می سپارم
    ;)

    • sheldon coper

      Bazinga !

      • جادی

        هه هه (: خوش اومدی شلدون. البته فقط دارم کامنت می دم سیستم آیدنت که سینا اصلاحش کرده رو تست کنم (:

  • محمد

    جادی جان برو شمال زندگی کن…

  • مطلب مهمل و مهمل شناسانه‌ای بود. باشد که در فصل بارش مهملات اسمانی، نوشتن مهملات از مهامل جامعه بیشتر شود و چنین فرضیه مهملی را به عرصه ثبوت نزدیک کند.
    اهلالتان مهمل، وبلاگتان پر بر، دو جیبتان پر زر، لینوکستان بهتر

  • جاوید

    نمیدونم چرا، ولی ارتباط جادی و بارون منو یاد ارتباط زیاد شدن دزدان دریایی در سومالی و تولید کم گازهای کلخانه ای در اونجا انداخت ;-)

  • امیر

    یکی از بهترین پست ها

  • یک چیزی بهش اشاره نشد! تعداد پست‌های جادی در اون ماه ها! من فکر می‌کنم جادی توی فصل‌های بارونی بیشتر پست می‌زده، در نتیجه احتمال این که تعداد کلمه مهمل در اون استفاده بشه مسلما بیشتر هست!

  • Pingback: قانون زیف و زندگی روزمره با محوریت کلمات وبلاگ()

  • amir

    تعداد لغت مهمل انقدر کمه که این وابستگی آماری به نظرم خیلی به سختی معنی داره! ولی تلاش جالبی بود…. خندیدم.

    • هادی

      اصولا قرار نبوده کار آماری درستی انجام بشه. نکته‌ی پست هم همینه که طعنه بزنه به این همه کار مهملی که انجام می‌شه، بدون پشتوانه‌ی نظری درست :)

  • Pingback: آمارهای مهمل یا گردشی آماری در کلمات فارسی وبلاگ؛ آخرین قسمت()

  • سیاوش

    سلام جادی
    می دونم که این پست قدیمیه اما جدیدا یه ایده ای در همین موضوع پست به ذهنم رسید که نیاز به یه مقدار راهنمایی و مشورت در موردش دارم
    امکانش هست ایمیل این آقای هادی بنایی رو برای من بفرستی یا اینکه ایمیل منو بهشون بدی با من یه تماسی بگیرن
    اگر بتونی منو با ایشون مرتبط کنی ممنون میشم

    • جادی

      یک ایمیل بهش زدم و گفتم این کامنت رو ببینه و اگر خواست تماس بگیره (: ایمیلت رو هم براش فرستادم.

      • سیاوش

        ببخشید من یه مدت خیلی درگیر بودم اصلا حواسم نبود بیام اینجارو چک کنم
        ممنونم از لطفت جادی جان

    • هادی

      من در خدمتم سیاوش، اگه سوالت سخت نباشه :) hadi.banaee تو جی‌میل

  • ناشناس

    جادی دوستتون نوشته که:
    “…نتیجه‌گیری منطقی و کلی: می‌شه یه‌سری داده‌ی مهمل رو طوری تحلیل کرد که نتایج مهملش آدم رو به‌ فکر فرو ببره تا به‌زور روی نتایج حاصله فلسفه ببافه!”

    و خودتون نوشتین که:
    “بازی با اعداد بدون داشتن نظریه می تونه نتایج متنوعی بده که الزاما نمی تونن منجر به نظریه بشن. آمار و اعداد وقتی معنا دار می شن که از یک نظریه دفاع کنن یعنی از یک فرض اندیشیده شده. اگر نتونین ربط علی دو چیز رو با هم از نظر منطقی نشون بدین ،‌ اعدادی که به دست آوردین فقط به درد گول زدن می خوره یا حتی ممکنه باعث گمراهی بشه. ”

    من هم باهاتون موافقم ولی دوست داشتم، کمی توضیح بیشتری می دادی که درسته از این راه نباید نظریه تولید کرد، ولی میشه ازش به عنوان ابزاری کمکی برای حدس نظریات استفاده کرد یا اینکه ما در زندگی روزمزه بسیار از این مدلسازی ها می کنیم و در زندگی واقعی امون استفاده ی زیادی میکنیم (مثلاً شبکه های عصبی)، بدون اینکه به دنبال استخراج نظریه باشم و صرفاً دنبال روش بهینه ای هستیم که قبل از اینکه به “اون نظریه ی دقیق تر ناشی شده از منطق” برسیم، کارمون راه بیفته و زندگی امون لنگ نمونه

  • Pingback: مهملترین کاری که ممکنه این هفته با پایتون، پردازش تصویر، آر و آمار استنباطی انجام بدین: بررسی کبریت‌های توکلی | کیبرد آزاد()

  • Pingback: آیا ما ایرانی ‌ها بی‌جنبه ایم؟ | مینیموم()