بایگانی ماهیانه: آگوست 2019

در مورد خدمات ارزش افزوده به سبک ایرانی

کشور ما تخصص خاصی داره که بدترین بخش های هر چیزی رو نگه داره و بخش های خوبش رو غیب کنه (: مثلا خصوصی سازی به هیچ وجه باعث رقابت و افزایش کیفیت و بهره وری نشد و فقط رانت و انحصار و سرکوب سرمایه داری رو بیشتر کرد. مثال های خیلی بیشتر هم داریم که فعلا بیخیالش می شیم و می ریم سراغ VAS یا همون خدمات ارزش افزوده.

زمانی که موبایل اختراع شد فقط امکان تماس صوتی داشت و منطقا فرستادن فکس. اما بعد شرکت ها دیدن که می شه با دادن یکسری خدمات دیگه، درآمد موبایل رو بالاتر برد و شروع کردن به کشف و ارائه سرویس هایی که ارزش یک گوشی همراه رو بیشتر کنه: خدمات ارزش افزوده. چیزهایی مثل امکان فرستادن پیامک، پیامک تصویری، انتقال پول، ویدئوکنفرانس، اینترنت روی گوشی، بازی آنلاین، پیام صوتی، خبر دادن میسدکال و چیزهای مشابه. شاید براتون جالب باشه که کل مدتی که من توی نوکیا / زیمنس کار کردم در بخش VAS یا همون خدمات ارزش افزوده بودم و تخصص اصلی ام توی اون سیستمی بود که توش می تونین شارژ گوشی خودتون رو بفرستین به گوشی یک نفر دیگه (هنوزم هست؟).

این خدمات ارزش افزوده رو می شد در دو گروه گذاشت: خدماتی که مردم به هم می دن و می گیرن و خدماتی که یک شرکت به بقیه می ده. مثلا اگر من به شما اسمس می زنم، رابطه دو نفره است ولی اگر یک شرکت برای کلی آدم اسمس می فرسته، می شه خدمات پرمیویم یا شرکتی مشهور به MVAS که در واقع همون چیزی است که ما بهش می گیم VAS. این خدمات ذاتا بد نیستن و یک شکلی از سرویس هستن ولی تو ایران یک شکل خاص این سرویسها، تبدیل شد به همون وس بدنام. این شکل از سرویس، این امکان بود که شرکت مخابراتی می تونست آدم هایی که عضو یک سرویس خاص هستن رو یکبار یا به شکل دوره ای شارژ کنه. یعنی از وقتی این امکان درست شد که من اسمس بزنم به فلان شماره، و فلان مقدار ازم کم بشه (چه یکبار و چه دوره ای)، سه جور شرکت حول این ماجرا شکل گرفت: شرکت های مرسوم و طبیعی، شرکت های قمار، شرکت های دزدی.

شرکت های مرسوم و طبیعی کسانی بودن که سعی کردن منطقی از این سرویس پول در بیارن. مثلا ممکنه شما واقعا دوست داشته باشین ماهی ۱۰۰۰ تومن بدین و هر روز یک جمله انگیزشی دریافت کنین. هیچ اشکالی هم نداره. یا مثلا دوست داشته باشین درگیر یه بازی بشین که توش با USSD مراحلی رو پیش برین و به جوابی برسین یا هر جور چیز مشابه. می دونین که در تعریف درست تر ارزش افزوده، اصولا ممکنه شما بگین دوست دارین امکان منشی تلفنی داشته باشین و برای این ماهی مثلا ۲ تومن به ایرانسل بدین یا بگین علاقمند به سیستم کنفرانس تلفنی هستین و خرجش می شه سالی ۱۰ تومن روی سرویس اصلی. اما می بینین که تقریبا هیچ کسی از ما طرفدار اینها نیست چون با اومدن اینترنت روی گوشی، اینها به سرویس هایی تبدیل شدن که ما از اپ هامون میگیریم و نه از سرویس دهندگان موبایلمون.

شرکت های قمار هم اونهایی هستن که ارزش افزوده رو یک کلاه شرعی کردن برای قماری که به من و شما می گن ممنوعه. تو این سیستم شما باید به مثلا ۱۰ سوال جواب بدین که هزینه هر سوال مثلا هزار تومنه. سوال ها در این حد هستن که «کدوم پرواز می کنه؟‌ قناری، قورباغه، مداد» یا حداکثر چیزهایی که با یک پرس و جو جوابش مشخصه. این سیستم حسابی تبلیغ می شه و شرکت کننده ها هم می دونن که مشغول بازی نیستن و هدفشون فقط دادن اون ۱۰ هزار تومن به امید برنده شدن مثلا اون بی ام و یا چه می دونم یک میلیون تومن جایزه روزانه است. در سطحی بالاتر این مساله در مورد اپلیکیشن ها هم اتفاق می افته. مثلا می گن فلان اپلیکیشن رو دانلود و نصب کنین و بعد باید با اسمس فعالش کنین که اسمسش ۱۰ هزار تومنه اما به جاش آخر ماه از بین همه شرکت کننده ها یک نفر سفر فلان رو برنده می شه. در این حالت اگر هدف اکثر شرکت کننده ها، برنده شدن در سفر کیش باشه، منطقا با یک سیستم قمار به بهانه فلان اپلیکیشن مواجه هستیم و نه با یک سرویس. در واقع شرکت مخابراتی مون داره مجوز اجرای لاتاری و قمار رو به شرکت ها می ده و سهم بزرگی هم ازش برمی داره. در یک کشور درست افرادی که امید دارن با اینکارها پولدار بشن، در لاتاری های ملی / دولتی شرکت می کنن و حجم بزرگی از سود در نهایت به دولتی منتخب مردم می رسه که اونو برای بهتر شدن وضع کشور خرج می کنه.

شرکت های دزد / کلاهبردار هم اونهایی هستن که رسما سعی می کنن پول بدزدن. چه با نوشتن اپ های که با استفاده از انواع باگ های تلفن ها، یواشکی اسمس می زنن و آدم ها رو عضو سرویس های پولی می کنن چه با درست کردن اپ هایی که توشون کاربر دقیقا نمی فهمه داره چیکار می کنه و بدون اینکه واقعا و روشن بدونه، عضو یک سرویس می شه. شاید براتون جالب باشه که این روزها سخت گیری در مورد این «عضو سرویس شدن»ها بیشتره و در نتیجه اگر شرکتی واقعا داره کلاه برداری می کنه، در خیلی از موارد هنوز می تونه بگه که «آره دیگه بیا ببین اینجا نوشتیم اگر این دگمه اوکی رو بزنی به فلان جا اسمس عضویت سرویس می فرستیم» ولی اینو جایی و جوری می نویسه که تقریبا هیچ کس متوجه اش نمی شه.

شکل اول (شرکت های مرسوم و طبیعی) بازی رو کاملا به اومدن اینترنت واقعی روی گوشی و تلفن های هوشمند باختن اما در عوض شکل های دوم و سوم رشد زیادی داشتن. کلاهبردارها با سود زیادی که به شرکت های مخابراتی می رسوندن تو بازار موندن تا بالاخره قوانین کمی دست و پاشون رو بست ولی هنوزم حضور پر رنگ دارن. شرکت های قمار هم که فعلا کارشون سکه است و نتیجه افزایش دائمی آدم هایی است که امیدشون برای زندگی بهتر، برنده شدن توی لاتاری است و حکومتی که سودش براش مهتر از اخلاقی است که ازش دم می زنه. من و شما هم تنها کاری که فعلا می تونیم بکنیم، چک کردن گوشی های اطرافیان برای اطمینان از عضو نبودن اونها تو ارزش افزوده است و نگه داشتن امید دل دلمون است به اینکه روزی حکومتون قمار رو به نفع مردم استفاده کنه نه برای پر کردن جیب اونهایی که رابطه اش رو دارن.

محیط کار جادی برای ضبط ویدئوهای آموزشی + دو درس از زندگی (:

من چندین ساله که فیلم آموزش درست می کنم و اینکار تقریبا همیشه توی خونه خودم و اتاق کارم بوده. توی این چند سال من تمرکز زیادی برای ایده آل کردن شرایط ضبطم نکرده‌ام ولی به هرحال تکنیک‌م کمی پیش رفته – هرچند که با چیزی قابل قبول هنوز خیلی فاصله داره.

فرمولی در وبلاگنویسی من می گه «اگر مطلب واحدی رو بیشتر از سه بار بنویسی، داری اشتباه می زنی» پس در مقابل ایمیل های زیادی که می پرسن با چی ضبط می کنم و چطوری تصویر پس زمینه رو حذف می کنم و … تصمیم گرفتم یه بار همینجا تو وبلاگ بنویسم و بعد فقط لینک بدم و اگر لازم شد اینجا رو آپدیت کنم.

اما قبل از معرفی محیط خودم، این رو بگم که محیط چندان مهم نیست. برای ساخت آموزش، کافیه شما آموزش بسازین و برای ساخت آموزش خوب، کافیه آموزش با محتوای خوب بسازین. اینکه خودتون تو فیلم باشین، اولش اینترو داشته باشه، فیلمبرداری با سه تا دوربین باشه، نورش عالی باشه، تصویر پس زمینه شما حذف شده باشه و کلی چیز دیگه، بازی های جانبی هستن. اگر برای مخاطب حرفه ای ویدئو می سازین، مهمترین چیز کیفیت محتوای شما است نه این جینگولک بازی ها (: هرچند که جینگولک بازی خوب، باعث می شه مخاطب راحتتر / خوشحالتر باشه.

نور و پرده سبز

برای رسیدن به یک افکت پرده سبز عالی (حذف بک گراوند)، انتظار می ره شما یک پرده سبز صاف و یکدست داشته باشین، نورهایی که اونو یکدست و خوب روشن کنن و یک نور که صورت شما رو به خوبی روشن کنه. انتظار می ره انعکاس نور سبز پرده روی بدن و موهای شما نیافته. برای اینکار ستاپ های مختلفی هست که می تونین با سرچ به دنبال chroma key setup بهشون برسین و حتی اگر در کشوری آزاد زندگی می کنین یا بهش دسترسی دارین، مستقیما یک کیت کامل نو رو پرده سبز مناسبش رو از جاهایی مثل آمازون بخرین.

اما محیط کار من نتیجه تجربه با نورها و پایه ها و .. توسط یک آدمی است که تخصصی نداشته و اهل پرسش در مغازه ها هم نیست (: در حال حاضر محیط کار من چیزی شبیه به اینه.. یا درواقع در این لحظه دقیقا اینه:

می بینین که اون پشت یه پرده سبز آویزون شده و چهار تا نور اصلی هست. دو تاشون از چپ و راست پرده رو روشن می کنن که سایه چندانی روش نباشه. یه نور سفید (که سمت تصویرش کمی از اون رو می بینین) سعی می کنه صورت من رو روشن می کنه و یک نور از پایین باعث می شه سایه ای که نور روبرو از من روی پرده می ندازه، از بین بره. وقتی من جلوی این پرده بشینم و ضبط کنم، افکتی مثل chroma key که خیلی از نرم افزارهای ادیت تصور اونو دارن می تونه اون سبز رو تشخیص بده و از تصویر حذفش کنه. اما می بینین که کلی اشکال هست. پرده صاف نصب نشده، نورها یکنواخت و قوی روشنش نکردن. چراغ روبروی من نسبتا ضعیفه و صورت من معمولا خیلی هم روشن نیست و انعکاس نور سبز پرده روی موهام می افته و نور عقب هم خیلی قویه! نتیجه این ستاپ در بهترین حالت چیزی شبیه اینه:

اینجا یه تقلب ریز دارم: لباس قرمز. قرمز در تضادی خوب با سبزه و در تنیجه کار افکت کروما کی در تشخیص خط سبز و حذفش راحتتره. اما می بینین که خط دور بدن من کماکان عالی نیست و خودم هم روشن نیستم! احتمالا مشاوره گرفتن از کسی که نور رو می شناسه یا فهمیدن اینکه اصولا این نورها باید به چه پایه هایی وصل بشن یا چه لامپی می تونه توی اون نور سمت راست، روشنایی کافی تولید کنه و … نتیجه کار رو بهتر خواهد کرد.

دوربین

حداقل یک دوربین لازمه که تصویر صورت شما رو ضبط کنه. من از وبکم استفاده می کنم که از نظر خیلی حرفه های عملا غیرممکنه (: ولی می بینین که نتیجه قابل استفاده است. دلیل اینکه وبکم بده، اینه که تنظیماتش خیلی کمه و به تغییرات نور خیلی حساسه. در نتیجه ممکنه در حین ضبط با کم و زیاد شدن نور جایی دیگه یا جلو عقب رفتن من تنظیمش تغییر کنه و سبز پشت دیگه به اندازه کافی سبز نباشه و بقیه قصه ها. اگر می خواین حرفه ای تر کار کنین منطقا باید تصویر خودتون رو با چیزی به جز وبکم بگیرین. ولی برای من مهم نیست (: و همین کار می کنه.

یک فلسفه دیگه زندگی من «حداقل دست انداز» است. در مسیر کارهای روزانه باید دست اندازها رو کم کرد. اگر ضبط وابسته به بودن فلان دوربین باشه، احتمالش میاد پایین. اگر پادکست نیازمند گرفتن نتیجه از ادیتور باشه احتمال استمرارش میاد پایین و … البته می شه در یک کار حرفه ای مثلا به ادیتور حقوق داد تا دیگه «دست انداز» به حساب نیاد.. ولی در نهایت توی مسیر صافی که توش چیزهای کمتری هست، راحتتر پیش می ریم تا مسیری که توش چند تا دست انداز هست.

صدا

برای ضبط صدا، من از کارت صوتی خود لپ تاپ و یه میکروفون کوچولوی سیمی یقه ای استفاده می کنم. از این:

قبلا از میکروفون خود لپ تاپ هم استفاده می کردم و به نظرم مشکل خاصی نداشت. اینو بیشتر برای ضبط با موبایل خریدم ولی اینجا هم استفاده می کنم. قبل از این میکروفون یه میکروفون Rode یو اس بی خرید که خیلی از پادکسترها دارن ولی به نظرم دردسرش زیاده و من هم نیازی به کمی کیفیت بهترش ندارم (:‌ باید یه بار بذارمش و بگم اگر کسی اونو میخواد، ازم بخره (: اگر فلسفه «حداقل دست انداز» رو یادتون باشه، می دونین که من باید چیز سیم دار رو به بی سیم ترجیح بدم (: نیازی نداره قبلش حواسم باشه که حالا باتری داره یا نه. و سیم این ۳ متر است که در سطح اتاق کار من مثل میکروفون بی سیم عمل می کنه. هرچند که بارها پیش میاد که یادم می ره میکروفون رو بزنم به بقیه ام و ضبط رو شروع می کنم.

تبلت / قلم

همونطور که توی عکس بالا هم می بینین، من خیلی وقت ها با قلم روی صفحه می نویسم. برای اینکار اولا از برنامه gromit-mpx استفاده می کنم که اجازه می ده در محیط ایکس، با یک شورتکات (به شکل دیفالت F9) بتونم روی صفحه بنویسم. البته مشکل اینه که برنامه برای محیط ایکس نوشته شده و اگر محیط گرافیکی شما ویلند باشه که داره مطرح تر می شه مشکلاتی خواهید داشت. اما مساله جدی نیست و اونجا هم سریعا چیزی کشف / پیدا خواهد شد. برای خود عمل نوشتن، من به جای ماوس از یک تبلت wacom سری bamboo استفاده می کنم؛ مدل CTH-670. ساده و سر راست است و نتیجه اش برای من به اندازه کافی خوب. اگر برنامه دیگه ای بود که مثلا با گرفتن شیفت رنگش عوض می شد خیلی باحالتر بود ولی دنبالش نگشتم. منطقا وظیفه خودمه که سعی کنم به گرومیت اضافه اش کنم (:

نرم افزار ضبط و ادیت

برای ضبط من از نرم افزار OBS استفاده می کنم (Open Broadcast Studio). بی دردسر است و راحت. می شه براش شورتکات شروع ضبط تعریف کنین و صحنه های مختلف که می شه به هر صحنه ورودی هایی رو وصل کرد. مثلا صحنه مرسوم من سه تا منبع داره: صفحه مانیتور + تصویر وبکم + صدای میکروفون. اینها رو اضافه می کنم و جاهاشون و اندازه هاشون رو مشخص می کنم و یک فیلتر chroma key هم به تصویر وبکم اضافه می کنم که پرده رو از پشتم حذف می کنه و در نتیجه صفحه مانیتور در پشتم دیده می شه.

البته در سیستم عامل های دیگه برنامه های مناسبتری هم هست – متاسفانه با کرک و اینها. مثلا خوب می بود اگر این منابع جدا جدا ضبط می شدن و بعد من حین ادیت می تونستم بگم چه لحظه ای کدوم تصویر در چه سایزی کجا باشه. در اون صورت افکت هایی مثل کروماکی و نوشتن متن روی صفحه و اینجور چیزها با کیفیت بهتری انجام می شدن اما obs اونها رو لایو انجام می ده و نتیجه کم کیفیت تر است – ولی مهم نیست. یادتونه دیگه؟ محتوا مهم است و دردسر کمتر بهتر، من عملا هیچ وقتی برای ادیت نمی ذارم (:

البته در مواقعی هم که لازمه بخشی از فیلم ادیت بشه یا بریده بشه یا هر چیز مشابهی، با استفاده از برنامه kdenlive اینکار رو انجام می دم. در نهایت هم اگر لازم باشه با دستوری مثل این، حجم رو کمتر می کنم:

ffmpeg -i inputfile.mp4 -acodec aac  -s 1366x768   inputfile_smaller.mp4

همونطور که می بینین همه برنامه ها آزاد هستن و سخت افزارها واقعا گرون نیستن. مساله اصلی هم واقعا این ابزارها نیست بلکه کیفیت نهایی کار است. اگر پرده سبز ندارین اصلا نگران نباشین، من یک مدت یه ملحفه سبز داشتم و مدتی هم دیوار رو رنگ سبز زده بودم (: بد هم کار نمی کرد. مهم کیفیت و استمرار است و مطمئنا مطالعه و پیدا کردن حالت های بهینه و سعی و خطا و استفاده از فیدبکها. اگر نکته ای هست که گفته نشده یا سواله بپرسین و اگر بهبودی ساده توش می بینین، بگین. منتظر دیدن ویدئوهای شما هم هستم.

برای بهتر شدن تشخیص صدای فارسی، در پروژه صدای مشترک موزیلا، مشارکت کنین

سیستم‌های یادگیری بر اساس نمونه‌ها کار می کنن. باید از چیزها نمونه های زیادی داشته باشیم تا بتونیم به ماشین ها بگیم «اینها رو نگاه کن، حالا سعی کن تکرارش کنی». مثلا اگر قراره ماشین یاد بگیره گربه چیه باید چند هزار عکس گربه ببینه یا اگر قراره صدای ما رو به متن تبدیل کنه، باید چند صد ساعت صدا و متن داشته باشه. حالا معلومه که چرا سیستم های مرتبط با صوت فارسی، عقب از بقیه هستن: چون نمونه هاشون کمه.

شرکت های مختلف برای حل این مشکل راه حل های مختلف دارن. مثلا ممکنه یک شرکت ارائه دهنده نقشه، چند ده نفر رو بذاره که اسم همه خیابون ها رو چندین بار بخونن تا بعدا کامپیوتر بفهمه «یوسف آباد» چطوری تلفظ می شه و اگر شما گفتین «یوسف آباد» بفهمه ماجرا چیه. اما همه که یه مرکز تماس ندارن و حتی اگر هم داشته باشن، در نهایت به چند صد ساعت صدا می رسن. پس چیکار کنیم؟

پروژه بنیاد موزیلا قراره با هممون کمک کنه. هم به همه تولید کننده های سیستم های مرتبط با صوت فارسی [و هر زبون دیگه] و هم به همه مصرف کننده هایی که لازم داریم کامپیوترها صدامون رو بفهمن. توی پروژه صدای مشترک موزیلا، شما صداتون رو اهدا می کنین، ترسناک نیست! در واقع می رین و چند تا جمله رو با صدای طبیعی خودتون می خونین و دیتابیسی از متن و صدا رو کامل می کنن. اگر هم ترجیح دادین، می تونین به جای خوندن جمله، جمله های بقیه رو گوش بدین و اعتبار سنجی کنین. دیتابیسی که درسته می شه، آزاد است و در اختیار هر کسی که بعدا بخواد روش کار کنه.

پروژه صدای مشترک ابتکار موزیلا برای کمک به آموزش ابزارهای یادگیری ماشین است تا بدانند مردم واقعی چگونه صحبت می‌کنند.

توی این پروژه شما حتی می تونین سن و جنس خودتون رو هم بزنین و دیتایی غنی تر برای هر کسی درست کنین که می خواد به کامپیوترها «فهمیدن» صدا رو آموزش بده. همونطور که گفتم این دیتابیس کاملا آزاد و قابل استفاده توسط همه است و مشارکت توش باعث می شه زندگی همه فارسی زبان ها آسونتر و با کیفیت تر بشه. پس به صفحه پروژه صدای مشترک موزیلا برین و چند تا جمله بخونین و حتی مثل من صفحه اش رو باز بذارین و گاه گداری برای رفع کسالت هم که شده، چند تا جمله از خودتون اهدا کنین یا به جمله های بقیه گوش بدین و بگین درست خوندنش یا نه. اینطوری همه با هم به پیشرفت زبان فارسی در دنیای کامپیوتر کمک کردیم و زودتر به دنیایی می رسیم که توش اگر کسی دوست نداره، مجبور نباشه تایپ کنه.