ایمیل از هادی بنایی، دانشجوی علوم کامپیوتر، دانشگاه اوربرو، سوئد و یکسری کار تحلیلی جالب:
با سلام بر شما جناب جادی
پستی که در مورد کلمهی مهمل نوشته بودی خوب بود و بهلحاظ آماری جالب! اما من بد ندیدم که یه دادهکاوی عمیقتری روی دادهها انجام بدم. اول چیکار کردم؟ اومدم دادههای مشترک بین دو سال ۲۰۱۱ و ۲۰۱۲ رو کنار هم قرار دادم (از ماه ۵ تا ۱۱) و بعدش اومدم از این داده میانگین گرفتم. بهاین ترتیب تونستم یه الگوی رفتاری از وجود کلمهی مهمل در هر ماه رو بهطور متوسط بهدست بیارم (جدول ۱)
جدول۱:
Month 2011 2012 Average May 1 0 0.5 June 1 3 2 July 0 1 0.5 August 1 1 1 September 2 0 1 October 4 5 4.5 November 1 6 3.5 دادهی بهدست اومده نشون میداد که بهطور تقریبی گفتن کلمهی مهمل به فصل سال و یهجورایی به آب و هوا ربط داره. از طرفی مکان نوشتن پستها هم حتما روی بروز کلمهی مهمل اثر داشته. بنابراین بهترین دادهای که میتونست برای مقایسه و ارزیابی انتخاب بشه، میانگین میزان بارش در ماههای سال در شهر تهران بود که به لطف ودر بیس برای ماههای میلادی دادهها رو یافتم (دادهها بر اساس میلیمتر). از اونجایی که هر دادهای نیاز به نرمالسازی داده، تو قدم بعد لگاریتم دادههای مورد نظر رو محاسبه کردم. (جدول ۲)
جدول ۲:
Month Mean Rainfall in Tehran Log May 15 3.9068905956 June 3 1.5849625007 July 2 1 August 2 1 September 3 1.5849625007 October 10 3.3219280949 November 25 4.6438561898 اما نکتهی شگفتانگیز همبستگی بسیار بالای این دادهها با دادههای کلمهی مهمل بود. نمودار ۱ گویای همهی اطلاعات و نتیجهگیری ها است:
نمودار۱:
نتیجهگیری علمی! تخصصی!: نتایج فوق نشون میده که میزان ادا کردن کلمهی مهمل توسط جادی در پستهاش رابطهی مستقیمی داره با میزان بارندگی در تهران.
نتیجهگیری فلسفی!: میزان رطوبت هوا میتونه سلولهای مغز رو تحت تاثیر قرار بده که بهجای استفاده از لغات مهمل دیگه! از لغت مهمل استفاده کنه!
…نتیجهگیری منطقی و کلی: میشه یهسری دادهی مهمل رو طوری تحلیل کرد که نتایج مهملش آدم رو به فکر فرو ببره تا بهزور روی نتایج حاصله فلسفه ببافه!سپاس(اگه دوست داشتی میتونی ضمیمهی همون پست اضافش کنی)
توجه کنین که همونطور که خود هادی می گه، بازی با اعداد بدون داشتن نظریه می تونه نتایج متنوعی بده که الزاما نمی تونن منجر به نظریه بشن. آمار و اعداد وقتی معنا دار می شن که از یک نظریه دفاع کنن یعنی از یک فرض اندیشیده شده. اگر نتونین ربط علی دو چیز رو با هم از نظر منطقی نشون بدین ، اعدادی که به دست آوردین فقط به درد گول زدن می خوره یا حتی ممکنه باعث گمراهی بشه.