چون تقریبا مثل قبلی ها است، توضیح نمی دهم. فقط نمودار…
برچسب: بررسی
نمودار نشان دهنده تعداد پست در هر ساعت با احتساب طبقه بندی
این کار نمایش نمودار میله ای تعداد پست در هر ساعت از شبانه روز یک وبلاگ به شکل جالبی در حال پیشرفت است. در نمودار مربوط به امیرپویان به این نتیجه رسیده بودیم که اگر بتوان موضوع را هم در نمودار گنجاند، نمودار شکل جالب تری پیدا می کند.
در آن پست گفته بودم که اگر کسی نمودار را می خواهد اطلاع دهد، یکی از داوطلبین وبلاگ «نوشته های پراکنده بچه مخفی» بود. این وبلاگ خوشبختانه هم آرشیو خوبی دارد و هم ساعت را نمایش می دهد و هم می توان از طریق بررسی لینک، به طبقه بندی (رسته درست تر است ؟ منظورم Category است) هر مطلب پی برد. دوباره برنامه را کمی پیشرفته تر می کنیم تا برود آرشیوها را بخواند و تعداد هر پست از هر طبقه بندی در هر ساعت از شبانه روز را در بیاورد. نتیجه طبقه معمول هیجان انگیز و زیبا است:
نمودار یک نمودار کلاسیک میله ای است که در هر میله رنگ های مختلف، طبقه بندی های مختلف را مشخص می کنند. مثلا به ساعت یک نصفه شب نگاه کنید. یک میله کوچک داریم که نشان از ارسال دو پست در ساعت یک نصفه شب دارد. یک پست قرمز (سرخابی؟ جگری؟ بنفش؟) است و یک پست آبی کم رنگ. به راهنمای جدول نگاه می کنیم و می بینیم قرمز یعنی طبقه بندی general و آبی کم رنگ یعنی طبقه بندی lovely ! نتیجه ؟ اگر تا نصفه شب بیدار باشید و پست بفرستید به احتمال پنجاه درصد احساسی عاشقانه دارید !
بقیه نمودار هم واضح است: بچه مخفی اصولا حوالی ساعت ۷ بیدار می شود (حتی یک پست هم ساعت شش صبح نفرستاده) و قبل از رفتن به مدرسه / محل کار وبلاگنویسی می کند (احتمالا حین خوردن صبحانه). تا ظهر وبلاگنویسی ادامه دارد (احتمالا اگر مدرسه رو باشد به خاطر تابستان) ولی بعد از ظهرها اصولا انگار سراغ اینترنت نمی رود.
نتیجه بامزه دیگر این است که بچه مخفی شب ها خوب می خوابد چون بیشترین پست های بامزه (funny) و عاشقانه (lovely) مربوط می شود به ساعات بعد از بیدار شدن و هر چقدر که از روز می گذرد، تعداد این پست ها کم می شود (رنگ های آبی کم رنگ و آبی پررنگ).
تحلیل های بیشتری هم می شود کرد که بیشتر مطلب را به یک مطلب طنز نزدیک می کند (: حتما یک پست درباره شیوه ایجاد این نمودارها خواهم نوشت. به هرحال این تحقیقات چیزی هستند بین برنامه نویسی شبکه و جامعه شناسی به همراه استفاده موثر از ابزارهای خوب لینوکس.
این جریان در حال گسترش است و من دقیقا نمی دانم چه کاربردهایی دارد. اگر کسی دنبال تحقیقی نزدیک به این جریان بود یا ایده ای داشت می تواند ایمیل بزند به jadijadi در گوگل. اگر هم کسی اطلاعات در مورد سایت خودش می خواست تماس بگیرد یا کامنت بگذارد. البته اول مطمئن شود که ساعت و طبقه بندی و اینجور چیزها در آرشیوهای سایت اش ذکر شده است.
بلاگرها در چه ساعاتی از شبانه روز مطلب می فرستند ؟
فکر می کنم جواب دادن به این سوال ساده نباشد و شاید به خاطر تنوع بسیار زیاد، اصولا کاربردی هم نداشته باشد. به نظر من این مساله آنقدر شخصی است و آنقدر وابسته به رفتار آدم ها که جواب اش فقط در مورد یک فرد خاص قابل بررسی است. ولی کدام فرد خاص ؟ مثلا امیرپویان در وبلاگ راز را در نظر بگیرید.
یک برنامه جمع و جور می نویسیم که اولا می رود کل بخش آرشیو یک سایت را دریافت می کند و بعد هر مطلب را می خواند و پیدا می کند که در چه ساعتی از شبانه روز نوشته شده و در نهایت نمودار زیر را رسم می کند (برنامه ام منطقا باید بعد از خواندن کل نوشته های فلسلفی و جامعه شناختی پویان الان کلی چیز سرش بشود). نتیجه همچین چیزی است:
جالب است نه ؟ به نظر من همیشه تصویری شدن اعداد جالب هستند. پویان قبل از شام و ناهار وبلاگ می نویسد و شب ها هم گاهی خیلی دیر می خوابد (حدود پنجاه مطلب از هفتصد و خورده ای مطلب اش بعد از دوازده شب پست شده اند)
اگر قرار شود برنامه کاملتر شود و چیزهای جالب تری را نشان بدهد می شود چند فاکتور دیگر مثل روز هفته و ماه از سال را هم به نمایش اضافه کرد. آن وقت می فهمیم که امیرپویان جمعه ها که خانه است چه تفاوت رفتاری با مواقع دیگر دارد یا تابستان ها که مدرسه(!) نمی رود چه تاثیری در وبلاگ نویسی اش می گذارد. راستی همکاری ندارید که بخواهید ببینید چقدر سر کار وبلاگنویسی می کند ؟
دو نکته: اول اینکه در صحبتی که با امیرپویان داشتم به این نتیجه رسیدیم که جالب است اگر مثلا طبقه بندی مطلب در کنار ساعت های ارسال لحاظ شود و کشف شود که امیرپویان وقتی سیر است فلسفی می نویسد یا وقتی گرسنه است ! نکته دوم هم اینکه اگر کسی علاقمند است این جدول را در مورد وبلاگ خودش داشته باشد در کامنت ها بگوید. بخصوص اگر وبلاگ شما در بلاگفا باشد کار بسیار راحت است.
کنفرانس کلاه سیاه: نمایش سیستم آزمایش بیطرفی شبکه
«بیطرفی» شبکه یا Net neutrality از مباحث روز جامعه مدنی و کنگره آمریکا است که طی آن شهروندان تلاش می کنند کاری کنند کهISPها مجبور باشند با همه اطلاعاتی که به آن ها وارد و خارج می شود به یک شکل برخورد کنند و مثلا حق نداشته باشند بعضی انواع ارتباطات TCP/IP را به بقیه ارجح بدانند و مثلا ارتباطات رمزگذاری شده یا ارتباطات صوتی را در درجه دوم اولیت قرار دهند یا آن ها را از دستگاهی خاص عبور دهند.
طرفداران بیطرفی شبکه می گویند که این قانون – برابر برخورد کردن با کلیه ارتباطات اینترنتی – در باز نگاه داشتن اینترنت نقشی اساسی دارند و این باز بودن ذات و دلیل موفقیت اینترنت است. در مقابل سرویس دهنده های تجاری پهنای باند بالا ادعا می کنند که تصویب بی طرفی شبکه باعث خواهد شد آن ها نتوانند سرویس های جدیدی ارائه بدهند.
در کنفرانس اخیر گروه کلاه سیاه در لاس وگاس، دان کامینسکی قرار است شیوه ابداعی خود برای تشخیص بی طرفی یک شبکه را توضیح دهد و بعدها آن را به صورت یک نرم افزار آزاد عرضه کند.
بر اساس گفته کامینسکی این برنامه (که وی آن را «بررسی فعال TCP برای یافتن ایرادها» می خواند) تقریبا شبیه به TraceRoute کار می کند با این اختلاف که می تواند شبکه را مجاب کند که منبع اطلاعات سرویس های گوناگونی مانند VoIP است و بعد بررسی کند که آیا با دادن این اطلاعات، شبکه رفتار متفاوتی با آن پاکت پیش می گیرد یا نه.
این متخصص شبکه می گوید که منتظر است واکنش مردم نسبت به این برنامه را ببیند، احتمالا مردم شروع به چک کردن شبکه های خود خواهند کرد و با دیدن طرفداری شبکه از بعضی انواع ارتباط، زبان به شکایت خواهند گشود.
کامینسکی اطلاعات بیشتر درباره این برنامه را در این محل منتشر خواهد کرد: Doxpara.com
مقایسه موضوعات وبلاگهای دو سرویس دهنده اصلی وبلاگستان
وبلاگستان فارسی دو سرویس دهنده رایگان اصلی دارد: PersianBlog.com و Blogfa.com. از این دو، پرشین بلاگ قدیمی تر بوده و کاربران قدیمی تر وبلاگستان فارسی را پشتیبانی می کند و بلاگفا جدیدتر بوده و به خاطر امکانات بیشتر و راحت تر، وبلاگ نویسان جدید را به خود جلب کرده است.
حالا اجازه بدهید بر اساس صفحه اول هر یک از این دو سرویس دهنده، نگاهی به موضوعات وبلاگ های موجود در آن ها بیندازیم:
ذات جریان جالب است هرچند که چیز زیادی را نمایش نمی دهد. عملا یک ایده جالب است برای کار بیشتر. در مرحله بعد باید طبقه بندی ها را کمی شبیه کنیم تا هر دو نمودار تقریبا از یک طبقه بندی پیروی کنند (یعنی طبقه بندی های ریز بلاگفا را جمع بزنیم در طبقه بندی ها وسیعتر پرشین بلاگ) و بعد رنگ های مشابه برای طبقه بندی های مشابه بکار ببریم. بخصوص با توجه به اینکه کاربران جدیدتر روی بلاگفا هستند و کاربران قدیمی تر روی پرشین بلاگ، نمودار حاصل می تواند نشان دهنده چیزهای جالبی باشد.
اگر فرصت کردم حتما این کار را امروز یا فردا می کنم و در این باره بیشتر می نویسم.
فراوانی اعداد در سایت های فارسی زبان و حضور هشت مارس
سر و کله زدن با گوگل همیشه جذاب است. تصور اینکه جایی کل اطلاعات نامرتبط با هم ذخیره شده است تا کسی در آن جستجو کند، جالب و هیجان انگیز است. از طرف دیگر نمایش تصویری اطلاعات برای منی که ریاضیات را دوست نداشته ام همیشه آرامش بخش است و حتی گاهی هست که نمی دانید این نمودارها واقعا چه کاربردی دارند ولی به هرحال زیبا هستند. مثلا به این یکی نگاه کنید: فراوانی اعداد یک تا بیست در سایت های فارسی زبان.
طبیعی است که عدد یک بیشترین کاربرد را دارد و دو از آن کمتر و سه از دو کمتر و … و این روند تا رسیدن به هشت تکرار می شود. هشت عدد مهمی است و اولین عددی است که از عدد قبلی بیشتر استفاده شده می دانید چرا ؟ در یک بررسی نسبتا ساده به نظر می رسد کاربرد زیاد عدد ۸ در سایت های فارسی زبان به خاطر مطالب مربوط به مراسم روز جهانی زن ( ۸ مارس ) باشد. تبریک به مدافعان برابری زن و مرد ! که توانسته اند حضور این عدد در وبلاگستان را حدود سیصد هزار بار از عددی که روند طبیعی ایجاد می کرد بیشتر کنند. البته مشخص است که نباید همه این سیصد هزار را به حساب هشت مارس گذاشت ولی با مرور چند صفحه از نمایش جستجو، به نظر می رسد این مراسم تاثیر نسبتا زیادی در افزایش حضور این عدد در اینترنت دارد.
جادوی هشت، یکبار دیگر در دوازده تکرار می شود. این بار هم جریان منطقی است چون دوازده مطمئنا عدد بسیار پر کاربردی در بین فارسی زبانان است: دوازده امام، دوازده ماه، دوازده ساعت صبح، دوازده ساعت شب، انتخابات ۱۲ فروردین و ….
در ادامه چیز خاصی نداریم، حتی شیب منفی هم دیگر وجود ندارد و اعداد نوسان می کنند. تنها نکته قابل توجه این است که یادمان نگه داریم کم استفاده ترین عدد یک تا بیست، عدد ۱۹ است (حدود دومیلیون و چهارصد و پنجاه بار).
آمار استفاده از مسنجرها در می ۲۰۰۶
آمار زیر که توسط comScore منتشر شده نشان دهنده میزان استفاده مردم از مسنجرهای گوناگون است. اعداد به میلیون هستند.
MSN |
203 |
Yahoo! |
77 |
AIM |
33 |
Google Talk |
3 |
اولین چیزی که نظر بیننده را جلب می کند نبود نام Skype در میان مسنجرها است ولی با دیدن رتبه افتضاح گوگل، این نکته اصولا فراموش می شود. گوگل در حال حاضر و پس از یکسال از عرضه مسنجر Google Talk خود با اختلافی بسیار بسیار فاحش در رتبه آخر قرار دارد. MSN مانند همیشه به خاطر همراهی اش با ویندوز و استفاده گسترده در آمریکا، رتبه اول را دارد و یاهو به لطف چت روم های باز و امکان دوست یابی در آن، دارای رتبه دوم است.
عشق ها و نفرت های وبلاگستان به روایت گوگل
اشاره: این لیست در اصل توسط گوگل ایجاد شده و ایده اولیه آن هم از GoogleBlogscope گرفته شده است. برای ایجاد این لیست یک برنامه کوتاه پیتون نوشته شده است که با استفاده از APIهای گوگل، در آن به دنبال دو عبارت "از * متنفرم" inurl:blog
و "عاشق * هستم" inurl:blog
استفاده شده ااست.
در صورت دیدن لغات نامناسب یا عباراتی که دوستش ندارید (مثلا اینکه کسی از زن بودن اش متنفر است یا عاشق توالت هواپیما است) جریان را چندان هم جدی نگیرید چون این حرفی است که کسی زمانی در وبلاگش زده. در عین حال توجه کنید که خیلی از این عبارات ممکن است اصولا در کلیت متن معنا پیدا کنند و به تنهایی.
اگر به لیست نگاه کنید، چیزهای جالبی می بینید. مثلا اینکه کسی عاشق گلدکوئست است و دیگری متنفر از چاق بودن. در عین حال میزان برای تنفر حدود ۲۶۰ جواب پیدا می شود و برای عشق حدود ۲۰۰ تا. وبلاگ نویس های ما بیشتر از آنکه عاشق باشند، متنفرند. برام جالبه بدونم شما از کدومشون خوشتون اومده و روی کدوم ها کلیک کرده اید که ببینید طرف برای چی از این متنفره یا عاشقه. من شخصا روی اونی کلیک کردم که عاشق روابط عمومی بود !
احتمالا برای همچین مطلبی هرچقدر کمتر حرف بزنم بهتر است. جالبترین کار این است که خودتان لیست را بررسی کنید …