پست مهمان: رابطه استفاده از کلمه مهمل توی وبلاگ جادی و میزان بارون در تهران

ایمیل از هادی بنایی، دانشجوی علوم کامپیوتر، دانشگاه اوربرو، سوئد و یکسری کار تحلیلی جالب:

با سلام بر شما جناب جادی

پستی که در مورد کلمه‌ی مهمل نوشته بودی خوب بود و به‌لحاظ آماری جالب! اما من بد ندیدم که یه داده‌کاوی عمیق‌تری روی داده‌ها انجام بدم. اول چی‌کار کردم؟ اومدم داده‌های مشترک بین دو سال ۲۰۱۱ و ۲۰۱۲ رو کنار هم قرار دادم (از ماه ۵ تا ۱۱) و بعدش اومدم از این داده میانگین گرفتم. به‌این ترتیب تونستم یه الگوی رفتاری از وجود کلمه‌ی مهمل در هر ماه رو به‌طور متوسط به‌دست بیارم (جدول ۱)

جدول۱:

Month 2011 2012 Average
May 1 0 0.5
June 1 3 2
July 0 1 0.5
August 1 1 1
September 2 0 1
October 4 5 4.5
November 1 6 3.5

داده‌ی به‌دست اومده نشون می‌داد که به‌طور تقریبی گفتن کلمه‌ی مهمل به فصل سال و یه‌جورایی به آب و هوا ربط داره. از طرفی مکان نوشتن پست‌ها هم حتما روی بروز کلمه‌ی مهمل اثر داشته. بنابراین بهترین داده‌ای که می‌تونست برای مقایسه و ارزیابی انتخاب بشه، میانگین میزان بارش در ماه‌های سال در شهر تهران بود که به لطف ودر بیس برای ماه‌های میلادی داده‌ها رو یافتم (داده‌ها بر اساس میلی‌متر). از اون‌جایی که هر داده‌ای نیاز به نرمال‌سازی داده‌، تو قدم بعد لگاریتم داده‌های مورد نظر رو محاسبه کردم. (جدول ۲)

جدول ۲:

Month Mean Rainfall in Tehran Log
May 15 3.9068905956
June 3 1.5849625007
July 2 1
August 2 1
September 3 1.5849625007
October 10 3.3219280949
November 25 4.6438561898

اما نکته‌ی شگفت‌انگیز هم‌بستگی بسیار بالای این داده‌ها با داده‌های کلمه‌ی مهمل بود. نمودار ۱ گویای همه‌ی اطلاعات و نتیجه‌گیری ها است:

نمودار۱:

نتیجه‌گیری علمی! تخصصی!: نتایج فوق نشون می‌ده که میزان ادا کردن کلمه‌ی مهمل توسط جادی در پست‌هاش رابطه‌ی مستقیمی داره با میزان بارندگی در تهران.
نتیجه‌گیری فلسفی!: میزان رطوبت هوا می‌تونه سلول‌های مغز رو تحت تاثیر قرار بده که به‌جای استفاده از لغات مهمل دیگه! از لغت مهمل استفاده کنه!
نتیجه‌گیری منطقی و کلی: می‌شه یه‌سری داده‌ی مهمل رو طوری تحلیل کرد که نتایج مهملش آدم رو به‌ فکر فرو ببره تا به‌زور روی نتایج حاصله فلسفه ببافه!

سپاس(اگه دوست داشتی می‌تونی ضمیمه‌ی همون پست اضافش کنی)

توجه کنین که همونطور که خود هادی می گه، بازی با اعداد بدون داشتن نظریه می تونه نتایج متنوعی بده که الزاما نمی تونن منجر به نظریه بشن. آمار و اعداد وقتی معنا دار می شن که از یک نظریه دفاع کنن یعنی از یک فرض اندیشیده شده. اگر نتونین ربط علی دو چیز رو با هم از نظر منطقی نشون بدین ،‌ اعدادی که به دست آوردین فقط به درد گول زدن می خوره یا حتی ممکنه باعث گمراهی بشه.

چرا گنو/لینوکس رو دوست دارم: اینجا چند بار از کلمه مهمل استفاده شده

یک ایمیل عجیب داشتم که توش مهدی خیلی جدی می‌گفت براش جالبه که من چند بار در مطالب وبلاگم از کلمه «مهمل» استفاده کردم (: و خواسته بود اگر می شه اینو پیدا کنم و بگم (: شاید درخواست غیرمعمولی باشه ولی برای یک روز تعطیل پر از آلودگی مناسب است. به هرحال تا سال دیگه که روز دانشجو به سنت همیشگی به خاطر آلودگی تعطیل بشه، ممکنه اینهمه وقت اضافی گیرمون نیاد.

چیکار می کنیم؟ من با وردپرس وبلاگ می‌نویسم. پس اول از بخش مدیریت از منوی Tools، کل پست‌ها و کامنت‌های سایت رو Export میکنم. اینجوری یک فایل ایکس ام ال دارم که همه مطالب سایت توش هستن.

شمردن کلمات مهمل که بسیار ساده است. دستور grep عالی لینوکس. این دستور می‌تونه خطوطی که یک کلمه رو دارن رو جدا کنه یا کارهای مشابه. یک سوییچ عالی به اسم o هم داره که میگه فقط بخش پیدا شده رو در یک خط مجزا بنویسه. اگر این تعداد خطها رو بشمریم در می یاد که اون کلمه مورد جستجو چند بار در فایل بوده:


 jadi@jeducation:~/Downloads$ grep -o مهمل wordpress.2012-12-05.xml | wc -l 
 29


بعله (: من بیست و نه بار از کلمه مهمل استفاده کردم (: اما چیزی که جالبتره اینه که از کی شروع کردم به استفاده. اینبار باید برنامه بنویسم. پایتون همیشه انتخاب راحت و خوبیه. برنامه ایکس ام ال رو می خونه، درختش رو بررسی می کنه و توی همه مطالب و کامنت‌هایی که از عبارت مهمل استفاده کردن، تاریخ رو توی خروجی می نویسه:
# -*- coding: utf8 -*- 

from xml.dom import minidom
import xml.etree.cElementTree as et
import re

tree=et.parse('wordpress.2012-12-05.xml')
root=tree.getroot();

for child in root.iter('item'):
	date = child.find('wppost_date').text
	body = child.find('content_encoded').text
	title = child.find('title').text

	try:
		if re.search (u'مهمل', body) or re.search(u'مهمل', title):
			print date;
	except:
		print date;

for child in root.iter('wpcomment'):
	date = child.find('wpcomment_date').text
	body = child.find('wpcomment_content').text

	try:
		if re.search (u'مهمل', body):
			print date
	except:
		print date;


اگر پایتون بلدین (یا حتی بلد نیستین ولی جرات داشتین کد رو نگاه کنین) می بینین که کد اصلا خوب نیست. دلیل تاریخی داره. اول نمی دونستم تو کامنت هم هست و بعد کامنت ها رو با یک کپی پیست جدا کردم. بعد دیدم گاهی اکسپشن می گیرم و بعد از بررسی فهمیدم بعضی مطالب متن یا عنوان نداره (چرا؟!) و در نتیجه خروجی مشکل پیدا می کنه که با یک اکسپشن اضافه کردن سر و ته مشکل رو هم آوردم و رسیدم به نتیجه‌ای که می‌خواستم:
jadi@jeducation:~/Downloads$ time python parsejadi.py 
2011-12
2012-07
2012-11
2011-09
2011-10
2011-10
2012-02
2012-06
2012-10
2012-11
2012-11
2012-11
2012-11
2012-12
2009-06
2009-05
2011-08
2011-09
2011-10
2011-10
2011-11
2012-06
2012-06
2012-08
2012-10
2012-10
2012-10
2012-10
2012-11

real	0m0.738s
user	0m0.700s
sys	0m0.028s
jadi@jeducation:~/Downloads$ 

میبینین که توی اون خطی که تاریخ رو حساب کردیم یک [7:] دارم که باعث می‌شه فقط سال و ماه رو ذخیره کنم چون این نمودار با معنی‌تری بهمون می‌ده. راستی گفتم نمودار. اینم نمودارش (مشخصه که با لیبره آفیس لینوکس):

ظاهرا که همیشه از کلمه مهمل استفاده می‌کردم ولی این دو ماه بیشتر هم شده (:

پی.نوشت: وبلاگ من قدیم‌ها روی سیستم‌های دیگه بوده و از ماه پنج دوهزار و یازده روی وردپرس است که اطلاعاتش اینجا دیده می‌شه.

نکته مهم: این مطلب ربط خیلی خاصی به لینوکس نداره. البته ابزار گرپ گنویی است و همینطور لیبره آفیس. پایتون ممکنه هر جا اجرا بشه و شاید نمودار با آفیس مایکروسافت قشنگتر هم می شد ولی به هرحال برای من این یک تجربه لینوکسی است چون لحظه ای که اراده کردم همه اینها زیر دستم بود و از انجامش هم لذت بردم (: چون شبیه سری های چرا گنو لینوکس رو دوست دارم است با همون عنوان رفتم جلو.

اپی برای قصه گفتن

داستان گفتن برای بچه‌ها جالبه. برای بزرگترها هم همینطور. اما ساختن داستان خوب برای بزرگ‌ها نیازمند یک روند داستانی نسبتا پخته است که حوادث طی اون اتفاق بیافتن و برای بچه‌ها نیازمند تخیل. برای بزرگ‌ها یکسری کتاب هست که پلات داستان رو می‌سازن و برای بچه‌ها هم این اپلیکیشن بامزه به اسم تاس داستان که می‌تونین بعد از مشخص کردن تعداد تاس‌ها، اونها رو بریزین و بر اساس شکل‌های اومده، برای بچه‌ها داستان بگین یا از اونها بخواین از روی تاس‌ها داستانی بسازن و تعریف کنن. در ضمن! درسته که ظاهر تاس‌ها شش وجه داره اما در عمل تعداد تصاویری که ممکنه ظاهر بشن خیلی زیاده.

من که همیشه با بچه ها سخت رابطه برقرار کردم اما به نظرم اگر چنین تاس هایی بهم ایده بده، قصه گفتن برام کار راحت تری است.

این یک نمونه از اجرای برنامه است. ببینین میتونین داستان خوبی براش پرورش بدین و توی کامنت‌ها پلات اصلی اش رو بگین؟

منبع

نکاتی فراواقعی در مورد فیلم من مادر هستم

فیلم رو دیشب دیدم. در یک سینمای پر پر که آدم‌ها دم باجه داشتن بلیت‌های سانس‌های بعدی رو رزرو می کردن. این چند نکته الزاما واقعگرایانه نیستن، نقد حرفه‌ای هم نیستن. فکرهای من هستن بعد از دیدن فیلم. من ذهن شاد و مثبتی ددارم. در ضمن بولت لیست زیر ممکنه نکات حساسی از فیلم رو لو بده – به قول خارجی‌ها اسپویلر الرت!. اگر می خواین خوندن رو ادامه بدین سریع می رم سر اصل مطلب.

  • کارگردانی فریدون جیرانی بده. نماهای دوربین به نظر من که مسخره است و گرفتن کلی نما از پشت گیلاس و دور بطری و با کادر پنجره جلوی ماشین و از لای اشیای روی میز و زوم کردن توی حدقه چشم و اینها به نظرم بیشتر مناسب انگار دوربین رو تازه دادی دست یک نفر و هیجان داره هنر نمایی کنه باهاش. در بسیاری از فیلم‌های خوبی که من این چند وقت دیدم تقریبا هیچ نمای عجیب غریب اینطوری نبود و اصولا فیلم برداری و کارگردانی چیزی نبود که مستقل از داستان و روایت احساس بشه.
  • داستان و طرحش ضعیف بودن. گذاشتن کلی عنصر عجیب توی یک داستان (سقط جنین ناموفق، تجاوز، بارداری با اولین سکس، دو تا خانواده از هم پاشیده، دوست دختر یک مرد که الان همسر دوستشه، دوست مرد که عاشق دخترش می شه، خودکشی، اعدام، پسر گیتارنواز که استخدام شده پیانو بزنه، مستی – توی فیلم های ایران -، زن فلانی که بعد از فلان سال از فرانسه اومده و این یکی می ره دنبالش تو فرودگاه، وکیل فاسد که می شه وکیل درخواست اعدام یکی دیگه، دار زدن، قتل، …) و در آوردن یک داستان هنر نیست. هنر اینه که در یک رابطه انسانی ساده و مرسوم پیچیدگی‌ها رو نشون بدیم.
  • عده ای به این فیلم می گن مبتذل و می گن باید جمع بشه. چشم‌هاشون رو باز کنین و جامعه ای که در سه دهه اخیر ساختن رو نگاه کنن و اینهمه اداره عریض و طویل سانسور رو.
  • عده‌ای فکر میکنن دیدن این فیلم مبارزه است. مبتذل‌ترین مبارزه اینه که من امن و امان برم در یک جای قشنگ یک بعد از ظهر تفریحی رو بگذرونم و حس کنم مبارزه کردم به نفع یک مجری تلویزیون که یک برنامه کمی قابل قبول رو تبدیل کرد به یک برنامه مهمل و کسی که حقوقش از کوبیدن نامنصفانه یکسری آدم شریف در می یاد.
  • عده‌ای می‌گن خودشون سر و صدا راه انداختن که فیلم فروش بره. اگر اینطور باشه نشونه بسیار خوبیه چون می‌گه خودشون می‌دونن که اگر فیملی مشهور بشه به مخالفت با ارزش‌هایی که پلیس در جامعه اجبار می کنه یا اگر طرفداران دو آ‌تیشه سیستم سیاسی حاکم به چیزی حمله کنن، اکثریت جامعه از اون موضوع استقبال می کنن. در پله دوم اگر این آدم‌ها (که مهره‌های فرهنگی ساخته همین سیستم هستن) برای رسیدن به پول از آگاهی به «اقبال اکثریت جامعه به ارزش‌های متضاد با ارزش‌های تبلیغی / پلیسی» استفاده کنن کلا فضا به سمتی حرکت می کنن که احتمالا خودشون دلشون نمی خواد ولی خب پول ظاهرا مهمتره. راستش این نظریه از نظر من خیلی دور از ذهنه چون واقعا به خاطر بالا رفتن فروش یک فیلم اینها حاضرن اعتراف به چنین آگاهی‌ای در سمت خودشون و چنین تضادی در جامعه بکنن؟ اونهم در حالی که تبلیغاتشون برای دیدن فیلم مهملی که طرفدار خودشونه هیچ تاثیر خاصی نداره و آخرش باید بلیت مجانی توزیع کنن شاید کسی بره ببینه اونو.
  • با خنده میتونیم بگیم فیلم در طرفداری از سقط جنینه. کل مشکلات برای این درست شده که سقط جنینی غیرقانونی و در نتیجه در شرایط نامناسب انجام و منجر به ناباروری شده. قابل تذکره که سقط جنین در شرایط درست هیچ خطری برای مادر نداره و اگر اینکار انجام شده بود الان هیچ کدوم از این انتقام‌های توی فیلم جریان نمی‌داشت. این از نکات جالب فیلمه به نظرم.
  • به شلکی بی سابقه، این فیلم بهتون نشون می ده که چقدر سیستم قضایی بدون هیات منصفه ناکارآمده. یک نفر توی این سیستم می تونه با استناد صرف به حقوق و نشون دادن اینکه دختری با عموش راحت بوده، تجاوز عمو به اون رو خواست دختر جا بزنه و بدون قضاوت افکار عمومی و هیات منصفه، کل نظریات دفاع از خود یا جنون آنی و تجاوز رو علیرغم اینکه دختر رفته توی اتاق، بعد عمو پشتش رفته تو و دختر عمو رو توی تخت به قتل رسونده متنفی بدونه. جالبی جریان اینه که کل سینما که نشستن و دارن نگاه می کنن با کمی فاصله زمانی از دادگاه همون هیات منصفه ای هستن که نظرشون حتی دیده نمی شه تا دختر به دار کشیده بشه. چند تا فیلم توی ایران می تونین نشون بدین که توش قاضی رایی بده که از نظر بسیاری تماشاچی ها درست نباشه؟
  • اعدام هم خیلی واقعی نشون داده شده: آدمکشی ای رسمی در یک صحنه تلخ، بی فایده برای جامعه و بی فایده برای انتقام گیرنده. مستقل از نمایش ناکارآمد بودن اعدام، دار زدن دختر نه التیامی است برای درد زن و نه از جرمی پیش گیری می کنه و بدون شک یک اشتباه غیرقابل جبرانه. به نظرم هیچ فیلمی در جمهوری اسلامی نبوده که اینطور برهنه اعدام رو ناکارآمد نشون بده. قابل توجه است که اعدام در اکثر کشورهای جهان حذف شده یا در حال حذف شدن است چون دیدن که اشتباهه و بر خلاف تبلغی که دائما سعی می کنن توی کله آدم هایی که مستقل در این مورد چیز نخوندن بکنن، تاثیری توی بهبود جامعه نداره
  • فیلم پر است از مشروب. اونم مشروب خوب در زندگی‌های طبیعی. این هم جدیده. کارگردان با اصرار مارک شراب‌ها رو نشون می‌داد و استفاده شون رو توی زندگی عادی. قبلا مشروب اگر هم دیده می شد در زندگی یکسری جوون منحرف در پارتی بود در حالی که الان آدم‌هایی می خوردن که طبیعی می رفتن خونه و با شام یک مشروبی هم می زدن (:

در کل به نظرم فیلمی بود قابل توجه به خاطر مسایل حاشیه ای اش ولی به خاطر کارگردانی بسیار بد و داستان مغشوش و همینطور شخصیت زشت کارگردان به کسی توصیه نمی کنم فیلم رو ببینه. اگر دنبال دیدن فیلم قابل قبول روی پرده های سینما هستین، پیشنهاد من هنوز آینه های روبرو است.


کامنت خوبی از مسعود زمانی داشتم که اینجا نقلش میکنم:

منم دیشب فیلم رو دیدم… جسارتاً منم چند تا نکته به نظرم میرسه:
یک – در اینکه فریدون جیرانی آدم موج سواری هست هیچ شکی نداشتم، و این فیلم همه شک‌های من رو برطرف کرد.

دو – فیلم ملغمه ای بود از هزاران نما و دیالوگ دزدی از انبوهی از فیلمهای خارجی و داخلی…

سه – پیام فیلم خیلی مسخره بود، عین فیلمهای آموزشی دهه شصت و هفتاد بود که مثلاً نشون میداد هرکی ویدیو داره حتماً آدم کثیفیه، و یا هرکسی ماهواره نگاه میکنه مطمئناً یه عذابی چیزی میاد سراغش…

چهار – جزئیات رفتاری آدمهای مست و یا شهوتران و یا مشکل دار به مسخره ترین و گل درشت ترین حالت ممکن نشان داده شده… هنوزم تنها پارامترهای رفتاری مستها برای کارگردانهای ایرانی تلوتلو خوردن و شل حرف زدنه…

پنج – جمله اول فیلم از آناکارنینا، بوضوح نشون داد که کارگردان میخواد خودش و فیلمش رو خیلی تحویل بگیره و تیریپ “شاهد اعظم” ورش داشته… بنظرم اگه یه جمله از کتاب جنایت مکافات انتخاب میکرد خیلی بهتر بود… هرچند که خیلی از حرفها و داستان فیلم از نمایش “ملاقات با بانوی سالخورده” گرته برداری شده بود

شش – تو یه صحنه ای که پسره که خاطرخواه دختره بود میاد تو خونه (بعد از قضیه دادگاه) و میگه من دخترتون رو دوست دارم با شلیک خنده تماشاچی ها تو سینما مواجه شد… یعنی خاک بر سر کارگردانی که فراز احساسی فیلمش از سوی اکثریت مخاطبان عامش به سخره گرفته میشه… البته از این خنده ها تو فیلم کم نبود که خداییش نمیدونم چقدر به خاطر درپیت بودن داستان بود و چقدرش هم سطح فرهنگی مخاطبانش

هفت – جیرانی یکاری رو خوب بلده، اونم نشون دادن ساختار روان پریش آدمهای مشکل دار هست… تنها جاهایی از فیلم که یه نموره قابل تحمل بود همین صحنه ها بود… نظیر جلسه مشاوره، یا اون صحنه ای که باران کوثری بعد از قتل سعید به مادرش گفت، سی دی خودمو پیدا نمیکنم… یا کنش های هیستریک فرهاد اصلانی به همسرش در خانه بعد از دادگاه

هشت – اینهمه کوبیدم فیلمو اینم بگم: فیلم دو صحنه قوی هم داشت… سکانسی که بعد از دادگاه نهایی “سیمین” با گرفتن حکم قصاص از توی دادگاه بیرون میاد و به سمت درب خروجی دادگاه و نور! میره و در آخرین لحظه مسیرش رو به سمت مستراح کج میکنه و حالش بهم میخوره… ریتم و نورپردازی و فیلمبرداری عالی بود در این صحنه…. و البته سکانس اعدام و بازی فرهاد اصلانی خیلی خوب بود… من فکر کنم هرکس که یه نخود هم به مکانیزم اعدام باور داشته باشه، تو این صحنه حالش بهم میخورد از این کار

نه – در مجموع فیلم ضعیف، کارگردانی ضعیف، فیلمبرداری (جو استفاده از استدی کم گرفته بودتشون) داغون، موسیقی تعطیل (بهترین استفاده موسیقیایی همون استفاده از ترانه Don’t Cry گروه Guns N’Roses بود که زنگ موبایل پسرک گیتاریست پیانیست هم بود)، بازیهای فیلم متوسط (باران کوثری همه فیلمهاشو یکج.ر بازی میکنه، فقط فرهاد اصلانی خوب بود)، فیلمنامه هم پر از سوراخ سنبه… دیدن فیلم رو اصلاً پیشنهاد نمیکنم.

ده – کل قضیه شلوغ بازیهای پیرامون فیلم بنظر بیشتر یجور Show Off برای جلب مخاطب به یکی از کارهای بسیار ضعیف یک کارگردان خودی است… فیلم نه سرگرم کننده بود و نه حداقل برای من خروجی قابل اعتنایی داشت.

ببخشید که طولانی شد