تور لحظه آخری
امروز : چهارشنبه ، 7 آذر 1403    احادیث و روایات:  پیامبر اکرم (ص):سفره‏هايتان را با سبزى، زينت دهيد ؛ زيرا سبزى با بسم اللّه‏ الرحمن الرحيم، شيطا...
سرگرمی سبک زندگی سینما و تلویزیون فرهنگ و هنر پزشکی و سلامت اجتماع و خانواده تصویری دین و اندیشه ورزش اقتصادی سیاسی حوادث علم و فناوری سایتهای دانلود گوناگون شرکت ها

تبلیغات

تبلیغات متنی

صرافی ارکی چنج

صرافی rkchange

سایبان ماشین

دزدگیر منزل

تشریفات روناک

اجاره سند در شیراز

قیمت فنس

armanekasbokar

armanetejarat

صندوق تضمین

Future Innovate Tech

پی جو مشاغل برتر شیراز

لوله بازکنی تهران

آراد برندینگ

خرید یخچال خارجی

موسسه خیریه

واردات از چین

حمية السكري النوع الثاني

ناب مووی

دانلود فیلم

بانک کتاب

دریافت دیه موتورسیکلت از بیمه

طراحی سایت تهران سایت

irspeedy

درج اگهی ویژه

تعمیرات مک بوک

دانلود فیلم هندی

قیمت فرش

درب فریم لس

زانوبند زاپیامکس

روغن بهران بردبار ۳۲۰

قیمت سرور اچ پی

خرید بلیط هواپیما

بلیط اتوبوس پایانه

قیمت سرور dl380 g10

تعمیرات پکیج کرج

لیست قیمت گوشی شیائومی

خرید فالوور

بهترین وکیل کرج

بهترین وکیل تهران

خرید اکانت تریدینگ ویو

خرید از چین

خرید از چین

تجهیزات کافی شاپ

ویزای چک

محصولات فوراور

خرید سرور اچ پی ماهان شبکه

دوربین سیمکارتی چرخشی

همکاری آی نو و گزینه دو

کاشت ابرو طبیعی و‌ سریع

الک آزمایشگاهی

الک آزمایشگاهی

خرید سرور مجازی

قیمت بالابر هیدرولیکی

قیمت بالابر هیدرولیکی

قیمت بالابر هیدرولیکی

لوله و اتصالات آذین

قرص گلوریا

نمایندگی دوو در کرج

خرید نهال سیب

وکیل ایرانی در استانبول

وکیل ایرانی در استانبول

وکیل ایرانی در استانبول

رفع تاری و تشخیص پلاک

پرگابالین

 






آمار وبسایت

 تعداد کل بازدیدها : 1834795686




هواشناسی

نرخ طلا سکه و  ارز

قیمت خودرو

فال حافظ

تعبیر خواب

فال انبیاء

متن قرآن



اضافه به علاقمنديها ارسال اين مطلب به دوستان آرشيو تمام مطالب
 refresh

هوشمندترین موتور جستجوی مستندات فارسی ایجاد شد


واضح آرشیو وب فارسی:جام جم آنلاین:
موتور جستجوی مستندات فارسی,موتور استخراج متون فارسی,دانشگاه امیرکبیر,جستجوی متون فارسی,موتور جستجوی ایرانی,سایت نبیک
توسط محققان دانشگاه امیرکبیر هوشمندترین موتور جستجوی مستندات فارسی ایجاد شد نبیک، موتور جستجوی مستندات فارسی است که هوشمندترین موتور استخراج متون فارسی به شمار می رود این موتور جستجو به تازگی توسط محققان دانشگاه صنعتی امیرکبیر ایجاد شده است.




مهدی شجری، عضو هیات علمی دانشگاه امیرکبیر گفت: با توجه به گسترش اینترنت و رواج استفاده از رایانه ها، تبلت ها، گوشی های تلفن همراه و مشکلات نشر سنتی نظیر گرانی کاغذ، مشکلات توزیع کتاب ها در سراسر کشور، کمیاب یا نایاب شدن برخی کتاب های قدیمی و نبود امکانات مناسب تبلیغات کتاب مخاطبان به مطالعه منابع نوشتاری موجود در اینترنت و کتاب های الکترونیک روی آورده اند. بنیانگذار «نبیک» با بیان اینکه مشکلات پردازش مستندات فارسی که از فونت ها و صفحه آرایی هایی متنوعی استفاده می کنند به حدی است که حتی گوگل به دلیل عدم سرمایه گذاری کافی در حوزه مستندات فارسی قادر به استخراج محتوای متنی و جستجوپذیر کردن بسیاری از مستندات فارسی موجود در اینترنت نیست، افزود: از سوی دیگر محققان و پژوهشگران و حتی کاربران عادی برای یافتن اطلاعات و تحقیق روی موضوعات مختلف وب را جستجو می کنند، در حالی که تا کنون هیچ ابزار مؤثری برای جستجوی مستندات فارسی که گنجینه ای ارزشمند محسوب می شود وجود نداشته است. وی گفت: از این رو به دلیل مشکلات فراوانی که در زمینه جستجوی متون فارسی وجود داشت، به فکر ایجاد موتور جستجوی ایرانی افتادیم که این موتور جستجوی ایرانی کاملترین موتور پردازش و جستجوی مستندات فارسی با نام نبیک (nebeek.com) است. عضو هیات علمی دانشگاه امیر کبیر افزود: برای راه اندازی سایت نبیک یک موتور قوی استخراج متن از فایل های «pdf» توسعه داده شده است که با توجه به چالش های فنی پردازش فایل های مستندات فارسی و علی الخصوص فایل های «pdf» فارسی قطعاً هوشمندترین موتور استخراج متون فارسی از این فایل ها است که تا کنون ارائه شده است. وی با اشاره به اینکه در نبیک متون فارسی با دقت بالا به صورت خام استخراج می شوند، گفت: پس از استخراج متن فارسی، بر روی آن پس پردازش هایی انجام می گیرد از جمله استخراج کلمات و عبارات محوری در متن، استخراج خودکار فهرست مطالب و استخراج اطلاعات نحوه شماره گذاری صفحات مستند. علاوه بر آن اطلاعاتی در مورد عناوین اصلی و فرعی و شروع وپایان هر پاراگراف و هر بخش و زیربخش مستند نیز استخراج می شوند.در حال حاضر صدها فونت فارسی در نبیک حمایت می شود. شجری افزود: سایت نبیک از یک موتور جستجوگر با امکاناتی نظیر نرمال سازی نگارش های مختلف از یک کلمه، ریشه یابی کلمات برای حذف ملحقات اضافی آن، بکارگیری ابرداده های منابع نوشتاری برای اجرای جستجوی پیشرفته، تصحیح خطا و غلط یاب املایی و ارائه پیشنهادات برای تکمیل پرسمان جستجو سود می برد. عضو هیأت علمی دانشگاه امیرکبیر گفت: علاوه بر جستجوپذیر شدن مستندات در سایت نبیک موتورهای جستجوی رایج مانند گوگل هم اکنون صدها هزار صفحه از مستنداتی که متن فارسی آنها توسط نبیک استخراج شده است را در نمایه خود جای داده اند که این نشان می دهد نبیک می تواند در ارتقا جایگاه مستندات فارسی بسیار موفق عمل کند. وی با اشاره به اینکه فناوری توسعه یافته در نبیک می تواند توسط سازمانها و مراکزی که حجم زیادی از مستندات فارسی دارند مورد استفاده قرار گیرد، افزود: چالش هایی که اخیرا در رابطه با تشخیص سرقت علمی از منابع فارسی توسط مسئولان بیان شده است با تکمیل فناوری نبیک قابل حل می باشد. شجری بخشی از امکانات کتابخوان فارسی نبیک را نام برد و گفت: مطالعه با دیدهای متنوع تک صفحه ای، دو صفحه ای و بیشتر، علامت گذاری و حاشیه نویسی روی صفحات کتاب، جستجو در متن کتاب و مکان یابی دقیق نتایج جستجوی کلیدواژه و پررنگ کردن آنها روی تصاویر صفحات کتاب (highlight)، مشاهده فهرست عناوین در کنار متن، بهینه سازی شده برای استفاده با ماوس، کیبورد و یا صفحه های لمسی، فشرده سازی تصاویر در بهترین شرایط برای افزایش سرعت و کارآیی، انعطاف پذیری برای تطابق حداکثری با انواع قالب های محتوای نوشتاری از قبیل کتاب ها، مجلات، روزنامه ها، مقالات علمی و پایان نامه ها، قابلیت حفاظت از حقوق مولف با ذخیره سازی و انتقال هر صفحه از مستند در قالب یک تصویر درهم شده (scramble) و آشکارسازی آن در زمان نمایش صفحه و سازماندهی مستندات مورد نیاز کاربر در کتابخانه های نبیک از ویژگیهای این کتابخوان است که توسط متخصصان نبیک طراحی و توسعه داده شده است. وی با بیان این مطلب که بخش مدیریت سایت و پرتال کتابخانه های اختصاصی ناشران و صاحبان محتوی بخش مهم دیگری است که توسط تیم نبیک توسعه داده شده است، افزود: ناشران و صاحبان محتوا با قراردادن پیش نمایش و یا متن کامل محتوای الکترونیکی در نبیک نه تنها آنها را جستجوپذیر کرده بلکه با فراهم کردن امکان ورق زدن بخشی از مستندات خود در فضای مجازی احساس نیازی که گام اول در فرایند تصمیم گیری کاربران برای استفاده از این محتوا است را ایجاد می نمایند. ضمن اینکه نبیک حقوق مولفین را نقض نمی کند و صاحبان محتوی می توانند از طریق پنل اختصاصی خود همواره دسترسی به مستندات و کتابخانه های خود را کنترل کرده و محدود به افراد مجاز نمایند. عضو هیات علمی دانشگاه امیرکبیر با اشاره به اینکه پروژه نبیک با هدف جستجوپذیر کردن تمامی مستندات الکترونیکی فارسی است، گفت: پروژه نبیک با توجه به اینکه پیوند دهنده بسیاری از بحث های مهم روز در زمینه علوم کامپیوتری است، یک پروژه مولد و پایه به شمار می رود و نیاز به توسعه مستمر، بهبود دقت الگوریتمهای مورد استفاده و افزایش قابلیت های متنوع توسط تیم توسعه دهنده دارد. وی افزود: نبیک موتور جستجوی متون فارسی، به همراه تعدادی از دانش آموختگان دانشگاه امیرکبیر در یک شرکت دانش بنیان ایجاد شده است.(مهر)


یکشنبه 02 شهریور 1393 14:28    بازدید:0





این صفحه را در گوگل محبوب کنید

[ارسال شده از: جام جم آنلاین]
[مشاهده در: www.jamejamonline.ir]
[تعداد بازديد از اين مطلب: 91]

bt

اضافه شدن مطلب/حذف مطلب







-


گوناگون

پربازدیدترینها
طراحی وب>


صفحه اول | تمام مطالب | RSS | ارتباط با ما
1390© تمامی حقوق این سایت متعلق به سایت واضح می باشد.
این سایت در ستاد ساماندهی وزارت فرهنگ و ارشاد اسلامی ثبت شده است و پیرو قوانین جمهوری اسلامی ایران می باشد. لطفا در صورت برخورد با مطالب و صفحات خلاف قوانین در سایت آن را به ما اطلاع دهید
پایگاه خبری واضح کاری از شرکت طراحی سایت اینتن