تور لحظه آخری
امروز : چهارشنبه ، 16 آبان 1403    احادیث و روایات:  پیامبر اکرم (ص):سه چيز است كه اگر مردم آثار آن را مى‏دانستند، به جهت حريص بودن به خير و بركتى ...
سرگرمی سبک زندگی سینما و تلویزیون فرهنگ و هنر پزشکی و سلامت اجتماع و خانواده تصویری دین و اندیشه ورزش اقتصادی سیاسی حوادث علم و فناوری سایتهای دانلود گوناگون شرکت ها

تبلیغات

تبلیغات متنی

صرافی ارکی چنج

صرافی rkchange

سایبان ماشین

دزدگیر منزل

تشریفات روناک

اجاره سند در شیراز

قیمت فنس

armanekasbokar

armanetejarat

صندوق تضمین

Future Innovate Tech

پی جو مشاغل برتر شیراز

لوله بازکنی تهران

آراد برندینگ

موسسه خیریه

واردات از چین

حمية السكري النوع الثاني

ناب مووی

دانلود فیلم

بانک کتاب

دریافت دیه موتورسیکلت از بیمه

قیمت پنجره دوجداره

بازسازی ساختمان

طراحی سایت تهران سایت

irspeedy

درج اگهی ویژه

تعمیرات مک بوک

دانلود فیلم هندی

قیمت فرش

درب فریم لس

زانوبند زاپیامکس

روغن بهران بردبار ۳۲۰

قیمت سرور اچ پی

خرید بلیط هواپیما

بلیط اتوبوس پایانه

قیمت سرور dl380 g10

تعمیرات پکیج کرج

لیست قیمت گوشی شیائومی

خرید فالوور

پوستر آنلاین

بهترین وکیل کرج

بهترین وکیل تهران

اوزمپیک چیست

خرید اکانت تریدینگ ویو

خرید از چین

خرید از چین

تجهیزات کافی شاپ

نگهداری از سالمند شبانه روزی در منزل

بی متال زیمنس

ساختمان پزشکان

ویزای چک

محصولات فوراور

خرید سرور اچ پی ماهان شبکه

دوربین سیمکارتی چرخشی

همکاری آی نو و گزینه دو

کاشت ابرو طبیعی و‌ سریع

الک آزمایشگاهی

الک آزمایشگاهی

 






آمار وبسایت

 تعداد کل بازدیدها : 1826738741




هواشناسی

نرخ طلا سکه و  ارز

قیمت خودرو

فال حافظ

تعبیر خواب

فال انبیاء

متن قرآن



اضافه به علاقمنديها ارسال اين مطلب به دوستان آرشيو تمام مطالب
archive  refresh

اطلاعاتي در مورد فايل robot.txt -


واضح آرشیو وب فارسی:سایت ریسک: t=31557">اطلاعاتي در مورد فايل robot.txt zanis 27 ارديبهشت 1384, 20:19ميخواستم اطلاعاتي در مورد اين فايل كسب كنم و بدونم اين فايل (robot.txt) چجوري ساخته ميشه و اگه بشه يه نمونش رو ببينم . Ali_ix 27 ارديبهشت 1384, 22:54این فایل مرجعی برای دسترسی Robot ها و Spider هاست که معمولا برای Search Engine ها فعالیت میکنند. داخل این فایل میشه مشخص کرد که چه روبوتها و اسپایدرهایی به چه قسمتهایی از سایت نمیتونند دسترسی داشته باشند. مثلا پنل ادمین یا ... نمونه فایلش : User-agent: * Disallow: /admin/ Disallow: /common/ Disallow: /count/ Disallow: /data/ Disallow: /lang/ Disallow: /style/ Disallow: /view/ Disallow: /aa.php Disallow: /cdata.php Disallow: /code.php Disallow: /errors.php Disallow: /img.php Disallow: /pict.php که البته این به این معنی نیست که روبوتی با دیدن این فایل نتونه به فلان شاخه دسترسی نداشته باشه ... بیشتر یک نوع باید و نباید اخلاقی محسوب میشه و به سادگی میشه زیر پا گذاشتش. :wink: اطلاعات بیشتر : zanis 28 ارديبهشت 1384, 00:11آقا علی دمت گرم که ما رو از اطلاعات ارزشمندت بهرمند کردی . سوال دیگه من از شما اینه که اگه بخوایم در این فایل robot.txt یه تدابیری بکار ببریم که موتور جستجو تشویق بشه که ما رو تو رتبه بندی خودش رتبه بهتری بده این کار امکانش هست آخه من شنیدم که امکان داره تو این فایل یه سری صفحات رو به موتور جستجو معرفی کنیم . Ali_ix 28 ارديبهشت 1384, 07:22آقا علی دمت گرم که ما رو از اطلاعات ارزشمندت بهرمند کردی . سوال دیگه من از شما اینه که اگه بخوایم در این فایل robot.txt یه تدابیری بکار ببریم که موتور جستجو تشویق بشه که ما رو تو رتبه بندی خودش رتبه بهتری بده این کار امکانش هست آخه من شنیدم که امکان داره تو این فایل یه سری صفحات رو به موتور جستجو معرفی کنیم . خواهش میکنم ... اصولا شما به هیچ طریقی نمیتونید اسپایدرهای موتور جستجو رو وادار به Index کردن صفحات سایتتون بکنید. البته یکسری تگ Meta هست ولی رسما هیچ تاثیر خاصی در عملکردشون نداره.... شما اگر میخواید که سایتتون خوب Index بشه باید روی موضوع SEO یا ( Search Engine Optimization ) مطالعه بیشتری بکنید. آدرسهای تمیز (Clean URI) - کد نویسی استاندارد - محتوای مناسب - لینکهای درست و ... از موارد موثر هست. zanis 02 خرداد 1384, 00:53مرسی nax00 23 خرداد 1387, 16:07سلام به دوستان عزیز دیدم یه چند سالی هست که در مورد این مبحث بحثی نشده گفتم اگه بحث تازه بشه خیلی بهتره . رازهای Google Page Rank چه خوب میشد اگر به یکباره در نتایج جستجوی گوگل در بالاترین درجه قرار میگرفتیم ! براستی تاکنون به این موضوع فکر کرده اید که ملاک موتورهای جستجو در نمایش نتایج جستجو و قرار دادن یک سایت بالاتر از دیگری در چیست؟ در این قسمت قصد دارم شما را با یکی از این تکنیک ها به نام Google Page Rank و یا بطور اختصار Google PR آشنا کنم. با ما باشید. بطور خلاصه Page Rank یک سیستم جستجوی مبتنی بر شبکه بهم پیوسته لینک هاست که به هر کدام از اجزای آن(یعنی در حقیقت به هر وب سایت مورد اشاره) یک ارزش وزنی اختصاص میدهد که این خود به تنهائی درجه اهمیت یک سایت را مشخص میکند (هرچه به سایتی بیشتر لینک داده شده است خب حتما مهمتر است دیگر!). Page Rank بعنوان یک پروژه تحقیقاتی در سال 1995 در دانشگاه استنفورد و توسط Larry Page (که لابد اسمش را هم گذاشته روی پروژه اش) و Sergey Brin آغاز شد و هدفش دستیابی به نسل جدیدی از موتورهای جستجو بود که در سال 1998 بلاخره به یک پروژه عملی تبدیل شد و در آن سال گوگل متولد گردید. چندی بعد Page و Brin شرکت Google Inc را بعنوان شرکت اصلی موتور جستجوی گوگل تاسیس نمودند. ولی هنوز پروژه اولیه منجر به تولد گوگل (Page Rank) را فراموش نکرده و بعنوان یکی از فاکتورهای جستجوی گوگل جهت تعیین مرتبه صفحات ، مورد استفاده قرار میدادند. گوگل خود درباره Page Rank چنین میگوید : Page Rank یک روش ابتکاری مبتنی بر ساختار دموکراتیک وب است که از شبکه گسترده لینک ها جهت تعیین مرتبه و امتیاز یک صفحه معین استفاده میکند بعنوان مثال تفسیر گوگل از لینک موجود در صفحه A که به صفحه B اشاره میکند ، در واقع نوعی رأی مثبت صفحه A به صفحه B میباشد که البته مبنای امتیاز دهی گوگل صرفا تعداد این رأی ها نیست بلکه صفحه ای هم که این لینک را داده است توسط گوگل بررسی میشود . مسلم است که هر چه رتبه این صفحه اول، خود بالاتر باشد تاثیر مستقیم در رتبه سایت دوم یعنی B دارد. پس هرچه یک سایت مهمتر به صفحه شما لینک داده باشد صفحه شما نیز در رده بندی گوگل بالاتر خواهد ایستاد. از لحظه ارائه این الگوریتم تاکنون بررسی های متعددی پیرامون روش کار آن و راههای بهبود عملکرد آن ارائه گردیده است. یکی از مشکلاتی که ممکن است در این الگوریتم پیش آید هنگامی است که شخصی جهت بالا بردن درجه اهمیت سایت خود اقدام به تولید لینکهای کاذب به صفحه مورد نظر خود بنماید که با اینکار Page rank را به اشتباه بیاندازد. برای رفع این مشکل گوگل اقدام به تهیه یک کد به صورت rel=nofollow نمود که با قرار دادن این کد قبل از لینک مورد نظر گوگل از آن جهت بررسی در Page Rank صرفنظر میکند. از دیگر موارد جدید Page Rank قرار دادن باصطلاح Toolbar آن در صفحه مورد نظر است که رتبه صفحه شما را از میان اعداد از یک تا ده نمایش میدهد که عدد بالاتر رتبه بالاتری دارد که البته چون بنا به گفته گوگل این Toolbar هر سه ماه یکبار Update میشود زیاد نمیتوان به آن بعنوان یک ابزار قابل اطمینان جهت تعیین رتبه صفحه مورد نظر تکیه کرد. همچنین بر همین سیاق میتوان به مورد Google Directory Page Rank اشاره کرد که همانند Toolbar یک ابزار بررسی رتبه سایت میباشد با این تفاوت که در Toolbar با قرار دادن موس بروی آیکن سبزرنگ آن رتبه سایت از بین یک تا ده به نمایش در می آید ولی در مورد Directory رتبه سایت در حالت عادی قابل مشاهده نیست و در اصل یک ابزار نشان دهنده به خود گوگل و Page Rank برای شناسائی این رتبه میباشد. در یک بررسی دقیقتر Page Rank متشکل از یک جدول توزیع احتمال است که میزان شانس کلیک های احتمالی بصورت تصادفی از صفحات مختلف به مقصد یک صفحه فرضی را بنمایش میگذارد که برای صفحه ای با هر اندازه دلخواه قابل محاسبه است. بطور کلی در اکثر تحقیقات علمی برای شروع عمل محاسبه رتبه سایت با توجه به تعداد سایت های مورد بررسی احتمال اولیه بین آنها تقسیم میشود (مثلا اگر در حال بررسی 5 سایت متفاوت هستیم در ابتدا برای هرکدام شانس 20 درصد را در نظر میگیریم). در عمل Page Rank برای انجام پروسه خود به عملی به نام تکرار (iterations) احتیاج دارد که منظور از آن عمل گشتن در میان لینک های مختلف از سایت های متفاوت است (از یک سایت شروع و همینطور لینکها را دنبال میکند). که در اینجا عددی مابین صفر و یک را به هرصفحه نسبت میدهد مثلا یک صفحه با Rank 0.5 یعنی احتمال اینکه شخصی با فشردن یک لینک بطور تصادفی به این قسمت هدایت شود 50 درصد میباشد. فکر کنم یک مثال وضعیت پیچیده بالا را کمی روشن کند : فرض کنید در حال بررسی چهار صفحه A،B،C و D هستیم. طبق آنچه که در بالا تشریح کردیم در ابتدا برای هرکدام شانس مساوی و برابر 0.25 را در نظر میگیریم. خب حالا باز فرض کنید که هر سه صفحه B،C و D هرکدام به تنهائی به صفحه A لینک داده اند به همین خاطر Rank صفحه A برابر حاصل جمع Rank صفحات B،C وD میباشد که میشود 0.75 . اگر در این لحظه فرض کنیم که صفحه B علاوه بر A به صفحه C نیز لینک داده است و همچنین صفحه D نیز به تمامی سه صفحه دیگر لینک داده است آنوقت ارزش رأی صفحه ای که به چندین صفحه لینک داده است به تعداد لینک هایش تقسیم میشود مثلا در این مورد ارزش صفحه A عبارت است از: محاسبه Page Rank بهمراه ضریب تعدیل (Damping Factor): مکانیزم عملکرد Page Rank در نظر میگیرد که حتی یک User موهومی (که میتواند یک روبات مخصوص کلیک کردن باشد) هم در نهایت به کلیک کردن خود پایان میدهد بهمین خاطر و برای دقیق تر کردن رتبه بندی خود ، Page Rank فاکتوری به نام فاکتور تصحیح یا d را معرفی میکند که عبارت است از احتمال اینکه User (در هر مرحله ای که باشد) به عمل کلیک کردن خود ادامه دهد. این فاکتور تاکنون از روش های متفاوتی محاسبه شده است ولی در عمل برای آن مقداری در حدود 0.85 را در نظر میگیرند که در محاسبه رتبه سایت این فاکتور را از عدد یک کسر کرده و حاصل را با حاصلضرب فاکتور تصحیح و Rank قبلی ، جمع مینمایند بصورت زیر : (عمرا فکر میکردید گوگل به این پیچیدگی باشد؟) بدین صورت رتبه هر صفحه بطور گسترده ای وابسته به رتبه صفحات دیگری که به آن لینک داده اند میباشد. گوگل هرگاه که اقدام به Update کردن خود مینماید این Rank ها نیز به روز میشوند و البته با افزایش صفحات موجود در آرشیو گوگل رتبه ابتدائی برای صفحات نیز خود بخود کاهش می یابد (چون بین تعداد بیشتری تقسیم میشود) برای Update شدن این Rank ها گوگل بصورت تصادفی از یک URL (آدرس اینترنتی) آغازکرده و با دنبال کردن لینکهای موجود در آن صفحه به صفحات و صفحات دیگر میرود و این روند را دنبال میکند خب حالا اگر در این میان به صفحه ای بر بخورد که در آن هیچ لینکی موجود نباشد(Sink) آنوقت تکلیف چیست ؟ پاسخ راحت است در آن لحظه یک URL دیگر بطور تصادفی اتنخاب میگردد. بطور حتم Google Page Rank یکی از چندین راه شناساندن صفحات مهم به جستجو گر Google میباشد که ارزش آن تا به جائی رسیده است که بسیاری از وب سایت ها برای گذاشته شدن لینک صفحه شان در سایتهای معروف مبالغ هنگفتی را پرداخت میکنند که البته این نیز از دید گوگل پنهان نمانده است و به آنها اخطار کرده که در صورت محرز شدن این امر آن لینک ها را نادیده میگیرد. راستی دوست داشتید که لینک سایت شما درست زیر صفحه معروف جستجوی گوگل می بود؟ منبع : () nax00 23 خرداد 1387, 16:18برخی از مفاهیم و اصطلاحات دنیای موتور های جستجو: Spider نرم افزاري است كه كار جمع آوري اطلاعات از صفحات مختلف را بر عهده دارد. Crawler نرم افزاري كه مسير حركت اسپايدر را مشخص مي كند. Directory فهرست. نوعي از موتورهاي جستجوگر كه پايگاه داده آن توسط ويراستاران تكميل مي گردد. Keyword بــه واژه ها ي مهم (کليدی) هر صفحه گفته مي شود. اما غالبا" منظور كلماتي است كه دوست داريم با آنها رتبه هاي مناسبي كسب كنيم. Keyword Density چگالي كلمه، منظور تعداد دفعات تكرار واژه های كليدي در مقايسه با ساير كلمات متن است. Keyword Staffing تكرار يك كلمه به دفعات و پشت سر هم به منظور بالا بردن چگالی کلمه. اين کار تقلب محسوب می شود. Tinny Text نوشتن متن با اندازه های بسیار کوچک و ریز به گونه ای که کلمات بسیاری بدین ترتیب در یک خط قرار داده می شود و به سختی نیز در صفحه قابل رویت هستند. نوشتن مطالب به اين صورت، تقلب محسوب است. Invisible Text متن نامرئی. منظور استفاده از متن هاي همرنگ با پس زمينه صفحه است. متن هايی که از ديد کاربران مخفی می ماند. به عنوان مثال اگر پس زمينه يك صفحه سياه است، متن صفحه نيز با رنگ سياه نوشته می شود تا ديده نشود . اين نوع متن ها از مصاديق تقلب می باشند. Spam تقلب، به تمام تلاش هايي گفته مي شود كه به كمك آن سعي مي شود از راه هاي غير معمول، رتبه هاي بالايي كسب شود. يا در اختيار گذاردن اطلاعاتي كه موتورهاي جستجوگر آنرا دوست ندارند (اطلاعات ناخواسته) مانند تكرار يك كلمه به دفعات و پشت سر هم، استفاده از متن هاي هم رنگ زمينه و ... ALT tag محتواي اين شناسه، متني است كه يك عكس را توضيح مي دهد. Deep Crawl به معناي اين است كه موتور جستجوگر، مي تواندصفحات زيادي از يك سايت را در پايگاه داده اش قرار دهد. موتور جستجوگر هرچه پايگاه داده اش بزرگتر باشد، صفحات بيشتري از يك سايت را می تواند در پايگاه داده اش قرار دهد. همه موتورهاي جستجوگر داراي اين ويژگي نمي باشند. Robots.txt با اين فايل متني و ساده، ميزان دسترسي موتور جستجوگر به محتواي يك "سايت" را مي توان كنترل كرد. META robots tag به كمك اين شناسه ميزان دسترسي موتور جستجوگر به محتواي يك "صفحه" را مي توان كنترل كرد. Link پيوند. در واقع پلی بين دو صفحه است. به کمک آن می توان از يک صفحه به صفحه ديگر رفت. Link Popularity مقصود اين است که چه تعداد از سايت هاي ديگر به سايتي مشخص لينك کرده اند يا اينكه از چند سايت ديگر می توان به کمک پيوندها به سايتی مشخص رفت. Link Reputation اشاره به اين دارد كه ساير سايتها درباره سايتي كه بدان لينك داده اند، چه مي گويند. عموما در اين موارد عنوان، متن لينك و كلمات اطراف لينك در سايت مقصد، بررسي مي شوند. Learn Frequency بعضي از موتورهای جستجوگر مي توانند تشخيص دهند كه محتواي صفحات پس از چه مدتی تغيير مي كند (به روز می گردد) و بعد از آن مدت به آن صفحات مراجعه می کنند. URL-Uniform Resource Locator به آدرس منحصر به فرد هر منبع موجود در اينترنت گفته می شود. اين منبع می تواند يک صفحه وب، يک فايل متنی و... باشد Stop Word به کلماتی گفته می شود که در کل اینترنت از آنها بسيار استفاده شده است. کلماتی نظيرthe, a, an, web home page, و ... Meta tags به كمك اين شناسه ها، اطلاعاتي از صفحه در اختيار بينندگان (موتور جستجوگر، مرورگرها و ...) قرار داده مي شود. META Keywords به كمك آن، كلمات کليدی صفحه در اختيار موتورهاي جستجوگر قرار داده می شود. META Description به كمك آن، توضيحي مختصر از صفحه در اختيار موتورهاي جستجوگر قرار داده می شود. Stemming به معناي اين است كه موتور جستجوگر مي تواند صورت هاي مختلف يک كلمه را جستجو كند. به عنوان مثال با جستجوي swim موتور جستجوگر به دنبال swimmer ، swimming نيز مي گردد. همه موتورهاي جستجوگر داراي اين ويژگي نمي باشند. Rank رتبه يك صفحه در نتايج جستجو است زماني كه جستجويي مرتبط با محتواي آن صفحه انجام مي شود. Spamdexing مختصر شده spam indexing است. منظور طراحی و معرفي صفحاتي به موتورهاي جستجوگر است كه كيفيت نتايج جستجو را پايين مي آورند. موتورهای جستجوگر تمايل دارند که كاربران بارها و بارها به آنها مراجعه كنند و كيفيت بالاي نتايج مي تواند اين روند را تضمين كند. لذا آنها هركدام به نوعي سعي در تشخيص صفحاتي دارند كه كيفيت نتايج جستجو را پايين مي آورد. برخی از اين موارد عبارتند از: ساختن صفحاتي كه همگي داراي محتواي يكساني اند، تكرار يك كلمه بيش از حد و ... Comment توضيحاتي است كه طراحان سايت در لا به لاي كدهاي HTML مي گنجانند تا برای فهميدن وظيفه بخش هاي متفاوت كدهای HTML در مراجعات آتی نيازی به صرف وقت بسيار نداشته باشند.




این صفحه را در گوگل محبوب کنید

[ارسال شده از: سایت ریسک]
[مشاهده در: www.ri3k.eu]
[تعداد بازديد از اين مطلب: 613]

bt

اضافه شدن مطلب/حذف مطلب







-


گوناگون

پربازدیدترینها
طراحی وب>


صفحه اول | تمام مطالب | RSS | ارتباط با ما
1390© تمامی حقوق این سایت متعلق به سایت واضح می باشد.
این سایت در ستاد ساماندهی وزارت فرهنگ و ارشاد اسلامی ثبت شده است و پیرو قوانین جمهوری اسلامی ایران می باشد. لطفا در صورت برخورد با مطالب و صفحات خلاف قوانین در سایت آن را به ما اطلاع دهید
پایگاه خبری واضح کاری از شرکت طراحی سایت اینتن