یک دوستی پرسیده که چطوری می تونیم فهرست همه فایلهای قابل دانلود در سروری مثل dl.folan.net رو داشته باشیم. این سرور اجازه میده شما دایرکتوریهاش رو ببینین:
و مثلا توی دایرکتوری فیلمها:
درست؟ دوست همیشگی ما در سری چرا گنو/لینوکس رو دوست دارم دستور جذاب wget است. پس شروع می کنیم!
$ wget --spider --force-html -r -l5 htp://dl.folan.net/Movie/
می تونه به شکل یک اسپایدر فایلهای اچ تی ام ال رو میگیره و توشون رو نگاه می کنه و پاک می کنه و اینکار رو تا پنج شاخه داخل دایرکتوریها هم پی میگیره. البته اگر ارور بگیریم، دردسر درست میشه پس با اضافه کردن یک عبارت کوچیک، ارورها رو هم به خروجی اضافه می کنیم:
$ wget --spider --force-html -r -l5 htp://dl.folan.net/Movie/ 2>&1
این دستور خروجیهایی شبیه به این تولید می کنه:
Spider mode enabled. Check if remote file exists. --2015-11-25 12:02:51-- htp://dl.folan.net/Movie/5/American.History.X.1998.720p.folan.Net.mkv Reusing existing connection to dl.folan.net:80. htp request sent, awaiting response... 200 OK Length: 785963069 (750M) [application/octet-stream] Remote file exists but does not contain any link -- not retrieving. Removing dl.folan.net/Movie/5/American.History.X.1998.720p.folan.Net.mkv. unlink: No such file or directory Spider mode enabled. Check if remote file exists. --2015-11-25 12:02:51-- htp://dl.folan.net/Movie/5/American.Justice.2015.1080p.folan.Net.mkv Reusing existing connection to dl.folan.net:80.
من خطهایی رو میخوام که اولشون — داره و پس می ریم سراغ grep که میتونه توی یک متن خطهایی رو جدا کنه که چیز خاصی توشون هست:
$ wget --spider --force-html -r -l5 htp://dl.folan.net/Movie/ 2>&1 | grep '^--' --2015-11-25 12:04:57-- htp://dl.folan.net/Movie/4/A.Good.Day.to.Die.Hard.2013.720p.folan.Net.mkv --2015-11-25 12:04:57-- htp://dl.folan.net/Movie/4/A.Good.Marriage.2014.BluRay.720p.folan.Net.Mkv --2015-11-25 12:04:57-- htp://dl.folan.net/Movie/4/A.Hijacking.2012.720p.folan.Net.mkv
و خب حالا می تونیم فقط بخش یو آر ال رو جدا کنیم. با استفاده از awk:
$ wget --spider --force-html -r -l5 htp://dl.folan.net/Movie/ 2>&1 | grep '^--' | awk '{ print $3 }' htp://dl.folan.net/6piljd5xepub7trr13ke.gif htp://dl.folan.net/85film3.gif htp://dl.folan.net/Movie/1/Into.the.Woods.2014.720p.%5Bfolan.Net%5D.mkv htp://dl.folan.net/Movie/1/Iyobinte.Pusthakam.2014.720p.DVDrip.%5Bfolan.Net%5D.mp4 htp://dl.folan.net/Movie/1/Kick.2014.720p.BluRay.%5Bfolan.Net%5D.mkv htp://dl.folan.net/Movie/1/La.Grande.Illusion.1937.720p.Farsi.Dubbed.%5Bfolan.Net%5D.mkv htp://dl.folan.net/Movie/1/Late.Phases.2014.720p.%5Bfolan.Net%5D.mkv htp://dl.folan.net/Movie/1/Le-Week-End.720p.%5Bfolan.net%5D.mkv htp://dl.folan.net/Movie/1/Legendary.2010.LIMITED.720p.%5Bfolan.Net%5D.mkv
و بعد فقط خطهایی رو نگه داریم که آخرشون چیزهایی مثل / یا css یا html و .. نداره:
$ wget --spider --force-html -r -l5 htp://dl.folan.net/Movie/ 2>&1 | grep '^--' | awk '{ print $3 }' | grep -v '\.\(css\|js\|png\|gif\|jpg\)$' | grep -v '\/$' htp://dl.folan.net/Movie/1/Into.the.Woods.2014.720p.%5Bfolan.Net%5D.mkv htp://dl.folan.net/Movie/1/Iyobinte.Pusthakam.2014.720p.DVDrip.%5Bfolan.Net%5D.mp4 htp://dl.folan.net/Movie/1/Kick.2014.720p.BluRay.%5Bfolan.Net%5D.mkv htp://dl.folan.net/Movie/1/La.Grande.Illusion.1937.720p.Farsi.Dubbed.%5Bfolan.Net%5D.mkv htp://dl.folan.net/Movie/1/Late.Phases.2014.720p.%5Bfolan.Net%5D.mkv htp://dl.folan.net/Movie/1/Le-Week-End.720p.%5Bfolan.net%5D.mkv htp://dl.folan.net/Movie/1/Legendary.2010.LIMITED.720p.%5Bfolan.Net%5D.mkv
ایول. حالا کافیه همه چیز رو بریزیم توی یک فایل و خرویها رو یک چکی بکنیم که درست باشه:
$ sort -R all.urls | head htp://dl.folan.net/Movie/5/Modern.Times.1936.720p.Farsi.Dubbed.folan.Net.mkv htp://dl.folan.net/Serial/The%20Killing/S01/The.Killing.S01E08.480p.folan.Net.mkv.folan.Net.mkv.mkv htp://dl.folan.net/Serial/Breaking%20Bad/S05/BreakingBad.S05E06.folan.Net.mkv htp://dl.folan.net/Movie/2/Priest.of.Evil.2010.720p.%5Bfolan.Net%5D.mkv htp://dl.folan.net/Movie/5/A.Midsummer.Nights.Dream.1999.720p.WEB-DL.folan.Net.mkv htp://dl.folan.net/Serial/Castle/S05/Castle.S05E22.480p.folan.Net.mkv htp://dl.folan.net/Serial/Twin%20Peaks/S02/Twin.Peaks.S02E22.480p.folan.Net.mkv htp://dl.folan.net/Serial/Supernatural/S04/SN-S04_E11.folan.Net.mkv htp://dl.folan.net/Movie/Problem%20Child%201990/Bacheye.DardesarSaz.1990.720pWEB-DL.HQ_folan.info.mkv htp://dl.folan.net/Serial/Archer/S01/Archer.S01E08.folan.Net.mkv $ wc -l all.urls 11284 all.urls
اینجوری فهرستی از ۱۱هزار فایل قابل دانلود اون سایتی که تصمیم گرفتم به خاطر حفظ بیزنسش، آدرسش رو ندم رو داشته باشیم (: هدف این پست دانلود نیست، یاد گرفتن شیوه کار با لینوکسه و همچنین دقت کنین که http ها رو کردم htp که وبلاگ سعی نکنه به عنوان فیلم لودشون کنه از یو آر ال گفته شده (: خوش باشین و خندون و توانمند.