محبوبترینها
نمایش جنگ دینامیت شو در تهران [از بیوگرافی میلاد صالح پور تا خرید بلیط]
9 روش جرم گیری ماشین لباسشویی سامسونگ برای از بین بردن بوی بد
ساندویچ پانل: بهترین گزینه برای ساخت و ساز سریع
خرید بیمه، استعلام و مقایسه انواع بیمه درمان ✅?
پروازهای مشهد به دبی چه زمانی ارزان میشوند؟
تجربه غذاهای فرانسوی در قلب پاریس بهترین رستورانها و کافهها
دلایل زنگ زدن فلزات و روش های جلوگیری از آن
خرید بلیط چارتر هواپیمایی ماهان _ ماهان گشت
سیگنال در ترید چیست؟ بررسی انواع سیگنال در ترید
بهترین هدیه تولد برای متولدین زمستان: هدیههای کاربردی برای روزهای سرد
در خرید پارچه برزنتی به چه نکاتی باید توجه کنیم؟
صفحه اول
آرشیو مطالب
ورود/عضویت
هواشناسی
قیمت طلا سکه و ارز
قیمت خودرو
مطالب در سایت شما
تبادل لینک
ارتباط با ما
مطالب سایت سرگرمی سبک زندگی سینما و تلویزیون فرهنگ و هنر پزشکی و سلامت اجتماع و خانواده تصویری دین و اندیشه ورزش اقتصادی سیاسی حوادث علم و فناوری سایتهای دانلود گوناگون
مطالب سایت سرگرمی سبک زندگی سینما و تلویزیون فرهنگ و هنر پزشکی و سلامت اجتماع و خانواده تصویری دین و اندیشه ورزش اقتصادی سیاسی حوادث علم و فناوری سایتهای دانلود گوناگون
آمار وبسایت
تعداد کل بازدیدها :
1826738741
اطلاعاتي در مورد فايل robot.txt -
واضح آرشیو وب فارسی:سایت ریسک: t=31557">اطلاعاتي در مورد فايل robot.txt zanis 27 ارديبهشت 1384, 20:19ميخواستم اطلاعاتي در مورد اين فايل كسب كنم و بدونم اين فايل (robot.txt) چجوري ساخته ميشه و اگه بشه يه نمونش رو ببينم . Ali_ix 27 ارديبهشت 1384, 22:54این فایل مرجعی برای دسترسی Robot ها و Spider هاست که معمولا برای Search Engine ها فعالیت میکنند. داخل این فایل میشه مشخص کرد که چه روبوتها و اسپایدرهایی به چه قسمتهایی از سایت نمیتونند دسترسی داشته باشند. مثلا پنل ادمین یا ... نمونه فایلش : User-agent: * Disallow: /admin/ Disallow: /common/ Disallow: /count/ Disallow: /data/ Disallow: /lang/ Disallow: /style/ Disallow: /view/ Disallow: /aa.php Disallow: /cdata.php Disallow: /code.php Disallow: /errors.php Disallow: /img.php Disallow: /pict.php که البته این به این معنی نیست که روبوتی با دیدن این فایل نتونه به فلان شاخه دسترسی نداشته باشه ... بیشتر یک نوع باید و نباید اخلاقی محسوب میشه و به سادگی میشه زیر پا گذاشتش. :wink: اطلاعات بیشتر : zanis 28 ارديبهشت 1384, 00:11آقا علی دمت گرم که ما رو از اطلاعات ارزشمندت بهرمند کردی . سوال دیگه من از شما اینه که اگه بخوایم در این فایل robot.txt یه تدابیری بکار ببریم که موتور جستجو تشویق بشه که ما رو تو رتبه بندی خودش رتبه بهتری بده این کار امکانش هست آخه من شنیدم که امکان داره تو این فایل یه سری صفحات رو به موتور جستجو معرفی کنیم . Ali_ix 28 ارديبهشت 1384, 07:22آقا علی دمت گرم که ما رو از اطلاعات ارزشمندت بهرمند کردی . سوال دیگه من از شما اینه که اگه بخوایم در این فایل robot.txt یه تدابیری بکار ببریم که موتور جستجو تشویق بشه که ما رو تو رتبه بندی خودش رتبه بهتری بده این کار امکانش هست آخه من شنیدم که امکان داره تو این فایل یه سری صفحات رو به موتور جستجو معرفی کنیم . خواهش میکنم ... اصولا شما به هیچ طریقی نمیتونید اسپایدرهای موتور جستجو رو وادار به Index کردن صفحات سایتتون بکنید. البته یکسری تگ Meta هست ولی رسما هیچ تاثیر خاصی در عملکردشون نداره.... شما اگر میخواید که سایتتون خوب Index بشه باید روی موضوع SEO یا ( Search Engine Optimization ) مطالعه بیشتری بکنید. آدرسهای تمیز (Clean URI) - کد نویسی استاندارد - محتوای مناسب - لینکهای درست و ... از موارد موثر هست. zanis 02 خرداد 1384, 00:53مرسی nax00 23 خرداد 1387, 16:07سلام به دوستان عزیز دیدم یه چند سالی هست که در مورد این مبحث بحثی نشده گفتم اگه بحث تازه بشه خیلی بهتره . رازهای Google Page Rank چه خوب میشد اگر به یکباره در نتایج جستجوی گوگل در بالاترین درجه قرار میگرفتیم ! براستی تاکنون به این موضوع فکر کرده اید که ملاک موتورهای جستجو در نمایش نتایج جستجو و قرار دادن یک سایت بالاتر از دیگری در چیست؟ در این قسمت قصد دارم شما را با یکی از این تکنیک ها به نام Google Page Rank و یا بطور اختصار Google PR آشنا کنم. با ما باشید. بطور خلاصه Page Rank یک سیستم جستجوی مبتنی بر شبکه بهم پیوسته لینک هاست که به هر کدام از اجزای آن(یعنی در حقیقت به هر وب سایت مورد اشاره) یک ارزش وزنی اختصاص میدهد که این خود به تنهائی درجه اهمیت یک سایت را مشخص میکند (هرچه به سایتی بیشتر لینک داده شده است خب حتما مهمتر است دیگر!). Page Rank بعنوان یک پروژه تحقیقاتی در سال 1995 در دانشگاه استنفورد و توسط Larry Page (که لابد اسمش را هم گذاشته روی پروژه اش) و Sergey Brin آغاز شد و هدفش دستیابی به نسل جدیدی از موتورهای جستجو بود که در سال 1998 بلاخره به یک پروژه عملی تبدیل شد و در آن سال گوگل متولد گردید. چندی بعد Page و Brin شرکت Google Inc را بعنوان شرکت اصلی موتور جستجوی گوگل تاسیس نمودند. ولی هنوز پروژه اولیه منجر به تولد گوگل (Page Rank) را فراموش نکرده و بعنوان یکی از فاکتورهای جستجوی گوگل جهت تعیین مرتبه صفحات ، مورد استفاده قرار میدادند. گوگل خود درباره Page Rank چنین میگوید : Page Rank یک روش ابتکاری مبتنی بر ساختار دموکراتیک وب است که از شبکه گسترده لینک ها جهت تعیین مرتبه و امتیاز یک صفحه معین استفاده میکند بعنوان مثال تفسیر گوگل از لینک موجود در صفحه A که به صفحه B اشاره میکند ، در واقع نوعی رأی مثبت صفحه A به صفحه B میباشد که البته مبنای امتیاز دهی گوگل صرفا تعداد این رأی ها نیست بلکه صفحه ای هم که این لینک را داده است توسط گوگل بررسی میشود . مسلم است که هر چه رتبه این صفحه اول، خود بالاتر باشد تاثیر مستقیم در رتبه سایت دوم یعنی B دارد. پس هرچه یک سایت مهمتر به صفحه شما لینک داده باشد صفحه شما نیز در رده بندی گوگل بالاتر خواهد ایستاد. از لحظه ارائه این الگوریتم تاکنون بررسی های متعددی پیرامون روش کار آن و راههای بهبود عملکرد آن ارائه گردیده است. یکی از مشکلاتی که ممکن است در این الگوریتم پیش آید هنگامی است که شخصی جهت بالا بردن درجه اهمیت سایت خود اقدام به تولید لینکهای کاذب به صفحه مورد نظر خود بنماید که با اینکار Page rank را به اشتباه بیاندازد. برای رفع این مشکل گوگل اقدام به تهیه یک کد به صورت rel=nofollow نمود که با قرار دادن این کد قبل از لینک مورد نظر گوگل از آن جهت بررسی در Page Rank صرفنظر میکند. از دیگر موارد جدید Page Rank قرار دادن باصطلاح Toolbar آن در صفحه مورد نظر است که رتبه صفحه شما را از میان اعداد از یک تا ده نمایش میدهد که عدد بالاتر رتبه بالاتری دارد که البته چون بنا به گفته گوگل این Toolbar هر سه ماه یکبار Update میشود زیاد نمیتوان به آن بعنوان یک ابزار قابل اطمینان جهت تعیین رتبه صفحه مورد نظر تکیه کرد. همچنین بر همین سیاق میتوان به مورد Google Directory Page Rank اشاره کرد که همانند Toolbar یک ابزار بررسی رتبه سایت میباشد با این تفاوت که در Toolbar با قرار دادن موس بروی آیکن سبزرنگ آن رتبه سایت از بین یک تا ده به نمایش در می آید ولی در مورد Directory رتبه سایت در حالت عادی قابل مشاهده نیست و در اصل یک ابزار نشان دهنده به خود گوگل و Page Rank برای شناسائی این رتبه میباشد. در یک بررسی دقیقتر Page Rank متشکل از یک جدول توزیع احتمال است که میزان شانس کلیک های احتمالی بصورت تصادفی از صفحات مختلف به مقصد یک صفحه فرضی را بنمایش میگذارد که برای صفحه ای با هر اندازه دلخواه قابل محاسبه است. بطور کلی در اکثر تحقیقات علمی برای شروع عمل محاسبه رتبه سایت با توجه به تعداد سایت های مورد بررسی احتمال اولیه بین آنها تقسیم میشود (مثلا اگر در حال بررسی 5 سایت متفاوت هستیم در ابتدا برای هرکدام شانس 20 درصد را در نظر میگیریم). در عمل Page Rank برای انجام پروسه خود به عملی به نام تکرار (iterations) احتیاج دارد که منظور از آن عمل گشتن در میان لینک های مختلف از سایت های متفاوت است (از یک سایت شروع و همینطور لینکها را دنبال میکند). که در اینجا عددی مابین صفر و یک را به هرصفحه نسبت میدهد مثلا یک صفحه با Rank 0.5 یعنی احتمال اینکه شخصی با فشردن یک لینک بطور تصادفی به این قسمت هدایت شود 50 درصد میباشد. فکر کنم یک مثال وضعیت پیچیده بالا را کمی روشن کند : فرض کنید در حال بررسی چهار صفحه A،B،C و D هستیم. طبق آنچه که در بالا تشریح کردیم در ابتدا برای هرکدام شانس مساوی و برابر 0.25 را در نظر میگیریم. خب حالا باز فرض کنید که هر سه صفحه B،C و D هرکدام به تنهائی به صفحه A لینک داده اند به همین خاطر Rank صفحه A برابر حاصل جمع Rank صفحات B،C وD میباشد که میشود 0.75 . اگر در این لحظه فرض کنیم که صفحه B علاوه بر A به صفحه C نیز لینک داده است و همچنین صفحه D نیز به تمامی سه صفحه دیگر لینک داده است آنوقت ارزش رأی صفحه ای که به چندین صفحه لینک داده است به تعداد لینک هایش تقسیم میشود مثلا در این مورد ارزش صفحه A عبارت است از: محاسبه Page Rank بهمراه ضریب تعدیل (Damping Factor): مکانیزم عملکرد Page Rank در نظر میگیرد که حتی یک User موهومی (که میتواند یک روبات مخصوص کلیک کردن باشد) هم در نهایت به کلیک کردن خود پایان میدهد بهمین خاطر و برای دقیق تر کردن رتبه بندی خود ، Page Rank فاکتوری به نام فاکتور تصحیح یا d را معرفی میکند که عبارت است از احتمال اینکه User (در هر مرحله ای که باشد) به عمل کلیک کردن خود ادامه دهد. این فاکتور تاکنون از روش های متفاوتی محاسبه شده است ولی در عمل برای آن مقداری در حدود 0.85 را در نظر میگیرند که در محاسبه رتبه سایت این فاکتور را از عدد یک کسر کرده و حاصل را با حاصلضرب فاکتور تصحیح و Rank قبلی ، جمع مینمایند بصورت زیر : (عمرا فکر میکردید گوگل به این پیچیدگی باشد؟) بدین صورت رتبه هر صفحه بطور گسترده ای وابسته به رتبه صفحات دیگری که به آن لینک داده اند میباشد. گوگل هرگاه که اقدام به Update کردن خود مینماید این Rank ها نیز به روز میشوند و البته با افزایش صفحات موجود در آرشیو گوگل رتبه ابتدائی برای صفحات نیز خود بخود کاهش می یابد (چون بین تعداد بیشتری تقسیم میشود) برای Update شدن این Rank ها گوگل بصورت تصادفی از یک URL (آدرس اینترنتی) آغازکرده و با دنبال کردن لینکهای موجود در آن صفحه به صفحات و صفحات دیگر میرود و این روند را دنبال میکند خب حالا اگر در این میان به صفحه ای بر بخورد که در آن هیچ لینکی موجود نباشد(Sink) آنوقت تکلیف چیست ؟ پاسخ راحت است در آن لحظه یک URL دیگر بطور تصادفی اتنخاب میگردد. بطور حتم Google Page Rank یکی از چندین راه شناساندن صفحات مهم به جستجو گر Google میباشد که ارزش آن تا به جائی رسیده است که بسیاری از وب سایت ها برای گذاشته شدن لینک صفحه شان در سایتهای معروف مبالغ هنگفتی را پرداخت میکنند که البته این نیز از دید گوگل پنهان نمانده است و به آنها اخطار کرده که در صورت محرز شدن این امر آن لینک ها را نادیده میگیرد. راستی دوست داشتید که لینک سایت شما درست زیر صفحه معروف جستجوی گوگل می بود؟ منبع : () nax00 23 خرداد 1387, 16:18برخی از مفاهیم و اصطلاحات دنیای موتور های جستجو: Spider نرم افزاري است كه كار جمع آوري اطلاعات از صفحات مختلف را بر عهده دارد. Crawler نرم افزاري كه مسير حركت اسپايدر را مشخص مي كند. Directory فهرست. نوعي از موتورهاي جستجوگر كه پايگاه داده آن توسط ويراستاران تكميل مي گردد. Keyword بــه واژه ها ي مهم (کليدی) هر صفحه گفته مي شود. اما غالبا" منظور كلماتي است كه دوست داريم با آنها رتبه هاي مناسبي كسب كنيم. Keyword Density چگالي كلمه، منظور تعداد دفعات تكرار واژه های كليدي در مقايسه با ساير كلمات متن است. Keyword Staffing تكرار يك كلمه به دفعات و پشت سر هم به منظور بالا بردن چگالی کلمه. اين کار تقلب محسوب می شود. Tinny Text نوشتن متن با اندازه های بسیار کوچک و ریز به گونه ای که کلمات بسیاری بدین ترتیب در یک خط قرار داده می شود و به سختی نیز در صفحه قابل رویت هستند. نوشتن مطالب به اين صورت، تقلب محسوب است. Invisible Text متن نامرئی. منظور استفاده از متن هاي همرنگ با پس زمينه صفحه است. متن هايی که از ديد کاربران مخفی می ماند. به عنوان مثال اگر پس زمينه يك صفحه سياه است، متن صفحه نيز با رنگ سياه نوشته می شود تا ديده نشود . اين نوع متن ها از مصاديق تقلب می باشند. Spam تقلب، به تمام تلاش هايي گفته مي شود كه به كمك آن سعي مي شود از راه هاي غير معمول، رتبه هاي بالايي كسب شود. يا در اختيار گذاردن اطلاعاتي كه موتورهاي جستجوگر آنرا دوست ندارند (اطلاعات ناخواسته) مانند تكرار يك كلمه به دفعات و پشت سر هم، استفاده از متن هاي هم رنگ زمينه و ... ALT tag محتواي اين شناسه، متني است كه يك عكس را توضيح مي دهد. Deep Crawl به معناي اين است كه موتور جستجوگر، مي تواندصفحات زيادي از يك سايت را در پايگاه داده اش قرار دهد. موتور جستجوگر هرچه پايگاه داده اش بزرگتر باشد، صفحات بيشتري از يك سايت را می تواند در پايگاه داده اش قرار دهد. همه موتورهاي جستجوگر داراي اين ويژگي نمي باشند. Robots.txt با اين فايل متني و ساده، ميزان دسترسي موتور جستجوگر به محتواي يك "سايت" را مي توان كنترل كرد. META robots tag به كمك اين شناسه ميزان دسترسي موتور جستجوگر به محتواي يك "صفحه" را مي توان كنترل كرد. Link پيوند. در واقع پلی بين دو صفحه است. به کمک آن می توان از يک صفحه به صفحه ديگر رفت. Link Popularity مقصود اين است که چه تعداد از سايت هاي ديگر به سايتي مشخص لينك کرده اند يا اينكه از چند سايت ديگر می توان به کمک پيوندها به سايتی مشخص رفت. Link Reputation اشاره به اين دارد كه ساير سايتها درباره سايتي كه بدان لينك داده اند، چه مي گويند. عموما در اين موارد عنوان، متن لينك و كلمات اطراف لينك در سايت مقصد، بررسي مي شوند. Learn Frequency بعضي از موتورهای جستجوگر مي توانند تشخيص دهند كه محتواي صفحات پس از چه مدتی تغيير مي كند (به روز می گردد) و بعد از آن مدت به آن صفحات مراجعه می کنند. URL-Uniform Resource Locator به آدرس منحصر به فرد هر منبع موجود در اينترنت گفته می شود. اين منبع می تواند يک صفحه وب، يک فايل متنی و... باشد Stop Word به کلماتی گفته می شود که در کل اینترنت از آنها بسيار استفاده شده است. کلماتی نظيرthe, a, an, web home page, و ... Meta tags به كمك اين شناسه ها، اطلاعاتي از صفحه در اختيار بينندگان (موتور جستجوگر، مرورگرها و ...) قرار داده مي شود. META Keywords به كمك آن، كلمات کليدی صفحه در اختيار موتورهاي جستجوگر قرار داده می شود. META Description به كمك آن، توضيحي مختصر از صفحه در اختيار موتورهاي جستجوگر قرار داده می شود. Stemming به معناي اين است كه موتور جستجوگر مي تواند صورت هاي مختلف يک كلمه را جستجو كند. به عنوان مثال با جستجوي swim موتور جستجوگر به دنبال swimmer ، swimming نيز مي گردد. همه موتورهاي جستجوگر داراي اين ويژگي نمي باشند. Rank رتبه يك صفحه در نتايج جستجو است زماني كه جستجويي مرتبط با محتواي آن صفحه انجام مي شود. Spamdexing مختصر شده spam indexing است. منظور طراحی و معرفي صفحاتي به موتورهاي جستجوگر است كه كيفيت نتايج جستجو را پايين مي آورند. موتورهای جستجوگر تمايل دارند که كاربران بارها و بارها به آنها مراجعه كنند و كيفيت بالاي نتايج مي تواند اين روند را تضمين كند. لذا آنها هركدام به نوعي سعي در تشخيص صفحاتي دارند كه كيفيت نتايج جستجو را پايين مي آورد. برخی از اين موارد عبارتند از: ساختن صفحاتي كه همگي داراي محتواي يكساني اند، تكرار يك كلمه بيش از حد و ... Comment توضيحاتي است كه طراحان سايت در لا به لاي كدهاي HTML مي گنجانند تا برای فهميدن وظيفه بخش هاي متفاوت كدهای HTML در مراجعات آتی نيازی به صرف وقت بسيار نداشته باشند.
این صفحه را در گوگل محبوب کنید
[ارسال شده از: سایت ریسک]
[مشاهده در: www.ri3k.eu]
[تعداد بازديد از اين مطلب: 613]
صفحات پیشنهادی
اطلاعاتي در مورد فايل robot.txt -
t=31557">اطلاعاتي در مورد فايل robot.txt zanis 27 ارديبهشت 1384, 20:19ميخواستم اطلاعاتي در مورد اين فايل كسب كنم و بدونم اين فايل (robot.txt) چجوري ساخته ميشه و ...
t=31557">اطلاعاتي در مورد فايل robot.txt zanis 27 ارديبهشت 1384, 20:19ميخواستم اطلاعاتي در مورد اين فايل كسب كنم و بدونم اين فايل (robot.txt) چجوري ساخته ميشه و ...
ویروس در سایت و فایل های سایت -
6 جولای 2009 – وقتی یکی از فایل های سایت را باز کردم و سورسش رو دیدم متوجه شدم ... همین قضیه در مورد وب سایت هایی که مرتب در حال حملات ناموفق هکر ها .... فایل Robot.txt! ... بعد از تگ head بسته قرار می دهد که می تواند اطلاعات کاربران شما و اطلاعات ...
6 جولای 2009 – وقتی یکی از فایل های سایت را باز کردم و سورسش رو دیدم متوجه شدم ... همین قضیه در مورد وب سایت هایی که مرتب در حال حملات ناموفق هکر ها .... فایل Robot.txt! ... بعد از تگ head بسته قرار می دهد که می تواند اطلاعات کاربران شما و اطلاعات ...
مواظب باشيد! گوگل شما را میبيند! -
اينهمه اطلاعاتی که در گوگل انباشته شده، همهی قدرتهای سياسی، اقتصادی، ... جاسوسی مستقيم با استفاده از گوگل، کارفرمايان میتوانند اطلاعات مورد نيازشان و نيز، .... شما میتونید با استفاده از فایل robot.txt به موتور جستجوی گوگل بفهمونید به کجا وارد ...
اينهمه اطلاعاتی که در گوگل انباشته شده، همهی قدرتهای سياسی، اقتصادی، ... جاسوسی مستقيم با استفاده از گوگل، کارفرمايان میتوانند اطلاعات مورد نيازشان و نيز، .... شما میتونید با استفاده از فایل robot.txt به موتور جستجوی گوگل بفهمونید به کجا وارد ...
برترین فروشگاه ساز کشور -
10 ژانويه 2010 – ثبت تمامی سفارش ها در بانک اطلاعاتی سایت # ثبت سفارشات خرید ... نقشه سایت به صورت xml و html # ساخت فایل راهنمای سایت های جستجوگر(robot.txt) ... ثبت اطلاعات مربوط به هرکالا مانند نام کالا، قیمت ، شرح مختصر در مورد کالا، ...
10 ژانويه 2010 – ثبت تمامی سفارش ها در بانک اطلاعاتی سایت # ثبت سفارشات خرید ... نقشه سایت به صورت xml و html # ساخت فایل راهنمای سایت های جستجوگر(robot.txt) ... ثبت اطلاعات مربوط به هرکالا مانند نام کالا، قیمت ، شرح مختصر در مورد کالا، ...
ارتقا رتبه انجمنهای خود در موتورهای جستجو -
خب بیشتر از این وقتتون رو نمیگیرم برای اطلاعات بیشتر از این MOD به آدرس ... خوندن توضیحات بالا رو نداری کافیه این فایل رو دانلود کنی و نصبش کنی تا همه ... Majid 21 آذر 1383, 20:56حمید جان در مورد گفته شما باید بگم که این اصلا دلیل نیستش. .... در زیر شاخه نصب کردم و دیگه اینکه یه قسمت دیگه هم هست به نام robot.txt که این ...
خب بیشتر از این وقتتون رو نمیگیرم برای اطلاعات بیشتر از این MOD به آدرس ... خوندن توضیحات بالا رو نداری کافیه این فایل رو دانلود کنی و نصبش کنی تا همه ... Majid 21 آذر 1383, 20:56حمید جان در مورد گفته شما باید بگم که این اصلا دلیل نیستش. .... در زیر شاخه نصب کردم و دیگه اینکه یه قسمت دیگه هم هست به نام robot.txt که این ...
-
گوناگون
پربازدیدترینها