تعداد فراوانی حروف فارسی در نوشته‌های روزمره

در مقاله با چینش صفحه کلید دووراک آشنا شوید دیده بودیم که بهترین حالت کیبرد، این است که پرکاربردترین حروف در ردیف وسط بیافتند و بعد در ردیف بالا و در نهایت در ردیف پایین. برای اینکار نیاز داریم بدونیم که کدوم حروف فارسی بیشترین کاربرد رو دارند. جالب است که این جدول یا اطلاعات (که کاربرد زیادی در رمزنگاری هم دارد)‌ هیچ جای اینترنت نبود.

این بود که یک برنامه نوشتم تا در یک متن طولانی تعداد درصد تکرار هر حرف را بشمرد. متن کامل همه مقالات موجود در صفحه اول سایت تغییر برای برابری را انتخاب کردم. این انتخاب کاملا نقد پذیره و شاید مثلا بهتر باشه از مجموعه ویکیپدیا چند مقاله در علوم مستقل رو انتخاب کنیم ولی خب به هرحال این انتخاب اول بود و نتیجه اش این شد:


واقعیت اینه که هر نموداری زیبا و لذت بخشه و البته جای «و» در کیبرد فارسی دردناک. این کاراکتر با اینکه اینهمه استفاده می‌شه ولی جاش خیلی بده و عملا باعث مچ درد دست راست. نکته بامزه هم عملا اضافه بودن این «ژ» بیچاره است که خیلی خیلی کم ظاهر می شه.

اگر همچین نموداری قبل از طراحی کیبردفارسی توسط کشیده شده بود احتمالا طی چندین نسل کلی به سلامت دست و مچ ایرانیان کمک می‌کرد. مثلا بهترین جای ممکن در کیبرد الان داده شده به حرف «ت» که از نظر اهمیت در جای نهم است و جای برتر بعدی داده شده به «ب» که رتبه دهم رو از نظر ارزش تایپ داره.

کاری که باقی می مونه این است که اولا یکبار دیگه برنامه رو روی یک متن معرف‌تر اجرا کنیم و دوم هم این که جالبه یکبار روی چیزهایی مثل قانون اساسی یا وبلاگ‌های مختلف اجرا کنیم و ببینیم درصد استفاده از حروف خیلی فارسی (مثل گچپز) و خیلی عربی (صضطظغعذ) در اونها چه تفاوتی می کنه. بامزه است.