پست مهمان: رابطه استفاده از کلمه مهمل توی وبلاگ جادی و میزان بارون در تهران

ایمیل از هادی بنایی، دانشجوی علوم کامپیوتر، دانشگاه اوربرو، سوئد و یکسری کار تحلیلی جالب:

با سلام بر شما جناب جادی

پستی که در مورد کلمه‌ی مهمل نوشته بودی خوب بود و به‌لحاظ آماری جالب! اما من بد ندیدم که یه داده‌کاوی عمیق‌تری روی داده‌ها انجام بدم. اول چی‌کار کردم؟ اومدم داده‌های مشترک بین دو سال ۲۰۱۱ و ۲۰۱۲ رو کنار هم قرار دادم (از ماه ۵ تا ۱۱) و بعدش اومدم از این داده میانگین گرفتم. به‌این ترتیب تونستم یه الگوی رفتاری از وجود کلمه‌ی مهمل در هر ماه رو به‌طور متوسط به‌دست بیارم (جدول ۱)

جدول۱:

Month 2011 2012 Average
May 1 0 0.5
June 1 3 2
July 0 1 0.5
August 1 1 1
September 2 0 1
October 4 5 4.5
November 1 6 3.5

داده‌ی به‌دست اومده نشون می‌داد که به‌طور تقریبی گفتن کلمه‌ی مهمل به فصل سال و یه‌جورایی به آب و هوا ربط داره. از طرفی مکان نوشتن پست‌ها هم حتما روی بروز کلمه‌ی مهمل اثر داشته. بنابراین بهترین داده‌ای که می‌تونست برای مقایسه و ارزیابی انتخاب بشه، میانگین میزان بارش در ماه‌های سال در شهر تهران بود که به لطف ودر بیس برای ماه‌های میلادی داده‌ها رو یافتم (داده‌ها بر اساس میلی‌متر). از اون‌جایی که هر داده‌ای نیاز به نرمال‌سازی داده‌، تو قدم بعد لگاریتم داده‌های مورد نظر رو محاسبه کردم. (جدول ۲)

جدول ۲:

Month Mean Rainfall in Tehran Log
May 15 3.9068905956
June 3 1.5849625007
July 2 1
August 2 1
September 3 1.5849625007
October 10 3.3219280949
November 25 4.6438561898

اما نکته‌ی شگفت‌انگیز هم‌بستگی بسیار بالای این داده‌ها با داده‌های کلمه‌ی مهمل بود. نمودار ۱ گویای همه‌ی اطلاعات و نتیجه‌گیری ها است:

نمودار۱:

نتیجه‌گیری علمی! تخصصی!: نتایج فوق نشون می‌ده که میزان ادا کردن کلمه‌ی مهمل توسط جادی در پست‌هاش رابطه‌ی مستقیمی داره با میزان بارندگی در تهران.
نتیجه‌گیری فلسفی!: میزان رطوبت هوا می‌تونه سلول‌های مغز رو تحت تاثیر قرار بده که به‌جای استفاده از لغات مهمل دیگه! از لغت مهمل استفاده کنه!
نتیجه‌گیری منطقی و کلی: می‌شه یه‌سری داده‌ی مهمل رو طوری تحلیل کرد که نتایج مهملش آدم رو به‌ فکر فرو ببره تا به‌زور روی نتایج حاصله فلسفه ببافه!

سپاس(اگه دوست داشتی می‌تونی ضمیمه‌ی همون پست اضافش کنی)

توجه کنین که همونطور که خود هادی می گه، بازی با اعداد بدون داشتن نظریه می تونه نتایج متنوعی بده که الزاما نمی تونن منجر به نظریه بشن. آمار و اعداد وقتی معنا دار می شن که از یک نظریه دفاع کنن یعنی از یک فرض اندیشیده شده. اگر نتونین ربط علی دو چیز رو با هم از نظر منطقی نشون بدین ،‌ اعدادی که به دست آوردین فقط به درد گول زدن می خوره یا حتی ممکنه باعث گمراهی بشه.