واضح آرشیو وب فارسی:فارس:
آشفتگی غیرقابل قبول در اطلاعات وبسایت کتابخانه ملی
در ایران، هیچ پایگاهی منابع اطلاعاتی سازمان کتابخانه ملی را ندارد و توسعه دهندگان وب و اپلیکیشن، هیچ دسترسی جامع و منظم و کمنقصی به این اطلاعات ندارند.
به گزارش خبرگزاری فارس، تصمیم گرفتیم برای آسایش حال کاربر، هنگام درج اطلاعات کتاب در نرمافزار یا وب سایت چند پیکسل کتاب، امکانی برایش فراهم کنیم تا با واردکردن شابک کتاب، از درج نام کتاب، نویسنده، مترجمین و ناشر خلاصش کنیم و از اشتباهات احتمالی در تایپ و ایجاد کتاب تکراری و ... جلوگیری کنیم و پس از دریافت شابک، اطلاعات کتاب را از سایت سازمان اسناد و کتابخانه ملی جمهوری اسلامی ایران به آدرس www.nlai.ir استخراج کنیم. پس آغاز به مکاتبه با آنها کردیم و متوجه شدیم که آنها Api خاصی را برای ارتباط توسعه دهندگان با سایت در نظر نگرفتهاند. از این روی سعی کردیم از طریق شبیه سازی جستجوی انسانی در سایت، اطلاعات مورد نظر را استخراج کنیم. در این روش دریافت اطلاعات کتاب به دو قسمت تقسیم میشود: گام اول جستجو بر مبنای شابک مورد نظر است و گام دوم استخراج اطلاعات کتاب از طریق نتایج حاصل از جستجو است. در هر مرحله درخواستی به سمت سرور سازمان ارسال میشود و پاسخ دریافت میگردد. دو مرحلهای بودن این راه، خود به تنهایی سبب کند شدن دریافت اطلاعات است. عیب دیگر این روش، این است: پاسخی که از سرور دریافت میکنیم؛ بسیار بیشتر از احتیاج ما، حاوی اطلاعات زائد است (چرا که ما ساختار اطلاعات را به صورت html دریافت میکنیم)، به طور میانگین ما 40KB بیشتر از آنچه که احتیاج داشته باشیم دانلود میکنیم که خود این مسئله در کند شدن این روند تاثیر بسزایی دارد. ولی با این حال ما همین روش را پیش گرفتیم ولی مسئله به همین جا ختم نمیشود. متاسفانه اطلاعاتی که سایت سازمان اسناد و کتابخانه ملی جمهوری اسلامی ایران به کاربر میدهد، در فرمت کاملا منظمی مدون نشده و گاه دارای غلطهای نوشتاری است. به عنوان نمونه در اطلاعات شناسنامهای کتاب، عنوان و نام پدیدآور را در کنار هم نشان میدهد و متاسفانه برای برای نام پدید آورنده و مترجم(ها) هیچ الگوی ثابتی را در پیش نگرفته است. نمونههای زیر را که از کتابهای مختلف جمعآوری شده است را ملاحظه کنید: قیدار/ رضا امیرخانی. ابله/داستایوسکی؛ ترجمه: مشفق همدانی هری پاتر و سنگ جادو/ نوشته جی.کی. رولینگ؛ ترجمه سعید کبریایی؛ [ویراستار] ویدا اسلامیه. Harry potter and the chamber of secrets [by] J. K Rowling/ Compiler Moslem khabbazi khaneqah Harry Potter and the order of the phoenix/ J.k. Rowling آخرین تازههای 2002/ اشتری، بیژن آزکابان خوب بود اما .../ نوریپور، رعنا در مورد اول، نام نویسنده (رضا امیر خانی) توسط نقطه به اتمام رسیده است. در مورد دوم، نام نویسنده (داستایوسکی) توسط نقطه-ویرگول به اتمام رسیده است. همچنین آغاز نام مترجم با «ترجمه :» و با هیچ کاراکتری تمام نشده. در مورد سوم، نام نویسنده (جی.کی. رولینگ) توسط نقطه-ویرگول به اتمام رسیده و پیش از آن کلمه «نوشته»(!!!) درج شده است. همچنین آغاز نام مترجم با «ترجمه »(این بار بدون دونقطه) و با کاراکتر نقطه ویرگول تمام شده. در مورد چهارم، عنوان کتاب با الفبای لاتین (!!!) آمده به همراه نام نویسنده که توسط «[by]» جدا شده است. همچنین نام مترجم با کلمه «Compiler»(!!!) آغاز شده است و باز هم با الفبای لاتین آمده. در مورد پنجم، باز هم عنوان کتاب و پدیدآور با الفبای لاتین آمده است. و همچنین نام نویسنده (J.k. Rowling) غلط نوشتاری دارد(حرف k به صورت کوچک آمده درحالیکه باید به صورت بزرگ بیاید). در مورد ششم، نام و نام خانوادگی نویسنده (اشتری، بیژن) توسط ویرگول جدا شده و نام خانوادگی برخلاف موردهای قبلی، بر نام کوچک مقدم شده است. نمونه دیگری از این آشفتگی را میتوان در مشخصات نشر دید. نمونههای زیر را ملاحظه کنید: بهشهر: مهتاب سحر، 1384 = م2005. تهرانتوسعه آموزش، 1383 = م2004. تهران : ابتدا، 1384 = م2005. یزدنیکو روش ، 1384 = م2005. در مورد اول، ابتدا نام شهر(بهشهر) آمده و سپس توسط دو نقطه از نام ناشر(مهتاب سحر) جدا شده است. در مورد دوم، ابتدا نام شهر(تهران) آمده ولی متاسفانه با هیچ کاراکتری(!!) تمام نشده است. در مورد چهارم نیز، نام شهر(یزد) توسط هیچ کاراکتری از نام ناشر جدا نشده است. از مجموع این مشاهدات چنین به نظر میرسد که این سازمان پایگاه داده مرتب و ساختارمندی را فراهم نکرده است؛ در حالت درست باید هر موجودیتی (شامل عنوان، نام نویسنده، نام مترجم، نام ناشر و ...) ابتدا در جدول ذخیره شود و سپس شناسه آن در جاهای دیگر استفاده شود تا به این ترتیب جلوی افزونگی اطلاعات و همچنین غلطهای نوشتاری گرفته شود. جا دارد که سازمانی دولتی که چنین مسؤلیتی مهم و ملی را متقبل شده است، آن را به شکلی درست و استاندارد انجام دهد و همچینی تمهیداتی را برای توسعه دهندگان فراهم آورد تا امکان بهرهگیری بهتر و بیشتر از چنین اطلاعات ارزشمندی ایجاد شود. در ایران، هیچ پایگاهی منابع اطلاعاتی سازمان کتابخانه ملی را ندارد و توسعه دهندگان وب و اپلیکیشن، هیچ دسترسی جامع و منظم و کمنقصی به این اطلاعات ندارند. امیدواریم هر چه زودتر یک تصمیم جدی در این مورد گرفته شود و هزاران محصول جدیدی که سالانه به منابع این مجموعه اضافه می شود، دچار این آفت نشوند و منابع قبلی به هر روش و هزینهای، در اسرع وقت بازبینی و ویرایش شوند. منبع: وب سایت «چند پیکسل کتاب» انتهای پیام/و
94/01/15 - 12:19
این صفحه را در گوگل محبوب کنید
[ارسال شده از: فارس]
[تعداد بازديد از اين مطلب: 41]