تور لحظه آخری
امروز : جمعه ، 9 آذر 1403    احادیث و روایات:  امام علی (ع):ایمان هیچ بنده ای راستین نمی شود مگر زمانیکه اعتمادش به آنچه نزد خداست از اعتمادش به آن...
سرگرمی سبک زندگی سینما و تلویزیون فرهنگ و هنر پزشکی و سلامت اجتماع و خانواده تصویری دین و اندیشه ورزش اقتصادی سیاسی حوادث علم و فناوری سایتهای دانلود گوناگون شرکت ها

تبلیغات

تبلیغات متنی

صرافی ارکی چنج

صرافی rkchange

سایبان ماشین

دزدگیر منزل

تشریفات روناک

اجاره سند در شیراز

قیمت فنس

armanekasbokar

armanetejarat

صندوق تضمین

Future Innovate Tech

پی جو مشاغل برتر شیراز

لوله بازکنی تهران

آراد برندینگ

خرید یخچال خارجی

موسسه خیریه

واردات از چین

حمية السكري النوع الثاني

ناب مووی

دانلود فیلم

بانک کتاب

دریافت دیه موتورسیکلت از بیمه

طراحی سایت تهران سایت

irspeedy

درج اگهی ویژه

تعمیرات مک بوک

دانلود فیلم هندی

قیمت فرش

درب فریم لس

زانوبند زاپیامکس

روغن بهران بردبار ۳۲۰

قیمت سرور اچ پی

خرید بلیط هواپیما

بلیط اتوبوس پایانه

قیمت سرور dl380 g10

تعمیرات پکیج کرج

لیست قیمت گوشی شیائومی

خرید فالوور

بهترین وکیل کرج

بهترین وکیل تهران

خرید اکانت تریدینگ ویو

خرید از چین

خرید از چین

تجهیزات کافی شاپ

محصولات فوراور

خرید سرور اچ پی ماهان شبکه

دوربین سیمکارتی چرخشی

همکاری آی نو و گزینه دو

کاشت ابرو طبیعی و‌ سریع

الک آزمایشگاهی

الک آزمایشگاهی

خرید سرور مجازی

قیمت بالابر هیدرولیکی

قیمت بالابر هیدرولیکی

قیمت بالابر هیدرولیکی

لوله و اتصالات آذین

قرص گلوریا

نمایندگی دوو در کرج

خرید نهال سیب

وکیل ایرانی در استانبول

وکیل ایرانی در استانبول

وکیل ایرانی در استانبول

رفع تاری و تشخیص پلاک

پرگابالین

 






آمار وبسایت

 تعداد کل بازدیدها : 1835659088




هواشناسی

نرخ طلا سکه و  ارز

قیمت خودرو

فال حافظ

تعبیر خواب

فال انبیاء

متن قرآن



اضافه به علاقمنديها ارسال اين مطلب به دوستان آرشيو تمام مطالب
archive  refresh

يونيكد چيست؟


واضح آرشیو وب فارسی:سایت ریسک: Saeed_TnT12-01-2005, 09:18 PMيونيكد چيست؟ مقدمه: از چند سال پيش در كشورمان، استفاده از كامپيوتر با سرعت سرسام‌آوری جای خود را در تمامی عرصه‌ها باز كرد و سيل كامپيوترهای شخصی و تجهيزات جانبی آنها به سوی كشور سرازير شد. اما بايستی اعتراف كرد كه با وجود اين كه سرعت سوق به سوی تكنولوژی ديجيتال در ايران روند خوبی را طی نموده، اما در زمينه ارائه اطلاعات و پردازش آن به زبان فارسی تشتتی در اين ميان ايجاد گرديد. يكی از عوامل موثر در اين ناهماهنگی، نبود الگويی واحد برای ذخيره و پردازش و نمايش اطلاعات بر روی رسانه‌های جديد اطلاع‌رسانی همچون كامپيوتر در سطح ملی است. نرم‌افزارهای متفاوت، با فرمت‌های مختلف، كدهای فارسی گوناگون و ... در حال استفاده‌اند و روزانه ميزان قابل توجهی از اطلاعات را در خود جای می‌دهند. اگر از آن دسته از مراكزی كه به دليل عدم آگاهی كافی اطلاعات را به صورت ناقص جمع‌آوری و وارد می‌كنند (كه حدود 80 درصد جامعه مورد نظر را تشكيل می‌دهند) بگذريم به تفرق، اختلاف و اعمال سليقه‌های مختلف در ساير مراكز خواهيم رسيد كه برای نمونه به اختلاف در مورد كدنويسه‌های به كار رفته برای حروف فارسی روی كامپيوتر می‌توان اشاره كرد. نتيجه ادامه روند جاری در مورد مراكزی كه به هر حال مشغول سرمايه‌گذاری در بخش ورود، پردازش و نمايش اطلاعات هستند مسئله به نوع ديگری خود را نشان خواهد داد. اين گونه مراكز تا زمانی كه پای خود را از محدوده مركز خود فراتر نگذاشته‌اند مشكلی نخواهند داشت، ولی به محض آنكه بخواهند با مراكز اطلاعاتی و تحقيقاتی ديگر ارتباط برقرار كرده يا به مبادله اطلاعات با اين مركز بپردازند متوجه خواهند شد كه سال‌ها سرمايه‌های خود را بر بادداده‌اند. همين مشكل در سطح ملی برای ايجاد يك مركز اطلاعات ملی رخ خواهد نمود. زمانی اين مشكل ملی بيشتر نمود پيدا می‌كند كه بحث شبكه جهانی اينترنت نيز به ميان آيد. اينترنت به عنوان كليدی برای ارتباط با ديگر مراكز اطلاعاتی - به علت در دسترس بودن آسان و همچنين حجم عظيم اطلاعات موجود در آن- يكی از مهم‌ترين موضوعاتی خواهد بود كه به علت عدم وجود يك سيستم جهانی برای ذخيره، بازيابی، پردازش و نمايش اطلاعات و به طور كلی مبادله اطلاعات كه جنبه‌های ملی نيز داشته باشد، دارای نقاط ضعفی است كه ما را از بهره‌برداری مناسب در جهت منافعمان باز می‌دارد. راه حل چيست؟ از زمانی كه اولين گزارش «زبان فارسی و كامپيوتر» در سال 1356 در دانشكده رياضی و كامپيوتر دانشگاه صنعتی شريف ارائه شد، تا امروز كه شبكه اينترنت چهره ديگری به اطلاع‌رسانی داده است، مدت زيادی می‌گذرد. امروزه ديگر محدوديت‌های سخت‌افزاری يا نرم‌افزاری نمی‌تواند مانع پياده‌سازی يك سيستم ذخيره‌سازی، نمايش، و تبادل اطلاعات چندزبانه گردد. امروزه مؤسسات بزرگ استانداردسازی چون ايزو ( ISO ) و W3 Consortium نيز، در استانداردهايشان مشكلات و مسائل مربوط به جهانی‌سازی را در نظر می‌گيرند تا امر تبادل اطلاعات چند زبانه را تسهيل نمايند. اما به نظر می‌رسد كه به دليل عدم حضور ايرانيان و فارسی‌زبان‌ها در اين روند، زبان فارسی قدری غريب مانده و كمتر به آن توجه شده است. به عنوان مثال، هنوز در بين صدها مجموعه‌نويسه( Character Set ) ثبت شده در اينترنت توسط يانا (Internet Assigned Number Authority)، تنها يك مجموعه‌نويسه ثبت شده متعلق به زبان فارسی است كه آن هم كد پيج اختصاصی شركت آيبيام است. حتی در مورد استاندارد كلی تبادل اطلاعات نيز قالبی كه مورد توافق همه باشد وجود ندارد. سه قالب موجود، ايران سيستم، استاندارد 2900 و استاندارد 3342 ، هر يك ايراداتی دارند كه سبب شده است شركت‌ها و مؤسسات داخلی به جدول‌های خاص خود روی آورند تا بتوانند نيازهای خود را تا حدی رفع سازند. اخيراً راه‌حل‌هايی در هر يك از مسائل خاص مربوط به تبادل اطلاعات برای بين‌المللی‌سازی در نظر گرفته شده است كه با وجود اين كه اين موارد كامل‌تر از جداولی است كه در ايران برای حل مشكلات تبادل اطلاعات زبان فارسی ايجاد گرديده، ولی به خاطر عدم وجود مراجع موثق در مورد خط و زبان فارسی برای استانداردگذاران، مسائل خاص اين زبان يا در نظر گرفته نشده و يا به شكل ناقص منظور شده است. خوشبختانه بسياری از اين استانداردها امكان گسترش بعدی را در نظر گرفته‌اند كه روند تصحيح را تسهيل می‌كند. يونی‌كد چيست؟ از جمله استانداردهای بين‌المللی كه كامل‌تر از بقيه استانداردهای موجود به رفع نيازهای مربوط به تبادل اطلاعات چندزبانه پرداخته‌است، می‌توان به استاندارد يونی‌كد اشاره كرد. اين استاندارد، تقريباً توسط تمامی شركت‌های بين‌المللی كامپيوتری، مانند آيبيام، مايكروسافت، و سان، و نيز موسسات ملی استاندارد در كشورهای مختلف جهان برای تبادل اطلاعات چندزبانه مورد توافق قرار گرفته است و سرعت رشد بسيار زيادی نيز در ميان كاربران دارد. همين‌طور، در حال حاضر كليه استانداردهای جديدی كه برای شبكه اينترنت طراحی می‌شوند، اين دو استاندارد را به‌عنوان كدپيج پيش‌فرض می‌پذيرند كه استاندارد XML و زبان جاوا از آن جمله‌اند. به زبان ساده می‌توان گفت كه يونی‌كد روشی برای تبديل متون به رشته‌های عددی قابل ذخيره در كامپيوتر است. روش‌های گوناگونی برای اين كار وجود دارند، ولی مزيت يونی‌كد نسبت به آنها، اين است كه يك روش كامل جهانی است؛ به اين معنی كه حروف همه زبان‌های دنيا و تمامی علائم مورد استفاده همه مردم جهان در آن آمده‌اند و همچنين در همه‌جا قابل نمايش است و نياز به امكانات خاصی ندارد. البته يونی‌كد هنوز جوان است ولی امروزه بسياری نرم‌افزارهای رايج در جهان (از جمله همه مرورگرهای جديد اينترنت) آن را پشتيبانی می‌كنند. از مهم‌ترين مزايايی كه يونی‌كد برای زبان فارسی دارد (مثل بسياری زبان‌های ديگر) می‌توان موارد زير را نام برد: 1. در نسخه استاندارد هر نرم‌افزاری كه از اين استاندارد پشتيبانی كند، می‌توان فارسی نوشت يا متون فارسی را خواند. بدين ترتيب ديگر نيازی به تأمين نسخه‌های خاص فارسی يا عربی نيست. 2. برای خواندن متون فارسی كه توسط شركت خاصی نوشته شده‌اند، نيازی به داشتن فونت خاص آن شركت نداريم و هر متن فارسی كه با استاندارد يونی‌كد، كدگذاری شده باشد، با هر فونت يونی‌كدی قابل مشاهده است. 3. امكان استفاده هم‌زمان از زبان‌های فارسی و انگليسی را تأمين می‌كند. 4. بدون استفاده از فونت‌های خاص امكان استفاده از علائم خاص را فراهم می‌كند. به بيان ديگر، «استاندارد يونی‌كد» استاندارد جهانی كدگذاری كاركترهاست كه برای پردازش كامپيوتری متون به كار می‌رود. اين استاندارد همان كاراكترها و كدهای استاندارد ISO/IEC 10646 را داراست و كاملا با آن سازگار است. پس در واقع هر پياده‌سازی سازگار با يونی‌كد، با ISO/IEC 10646 نيز سازگار است. يونی‌كد امكان كدگذاری همه كاراكترهای مورد استفاده در نوشتن زبان‌های دنيا را فراهم آورده‌است. اين استاندارد از كدگذاری 16بيتی استفاده می‌كند كه برای بيش از65000 نويسه (كاراكتر) جا فراهم می‌كند. اگر چه 65000 نويسه برای كدگذاری اكثر نويسه‌هايی كه در زبان‌های مهم دنيا استفاده می‌شود كافی است، با اين حال يونی‌كد شيوه‌گسترشی به‌نام UTF-16 فراهم‌كرده‌است كه امكان اضافه‌كردن حدود يك ميليون نويسه ديگر را نيز می‌دهد. اين دامنه برای كليه نويسه‌های عالم، از جمله پوشش كامل همه خط‌های باستانی (همچون خط ميخی) نيز كافی است. يونی‌كد برای كليه نويسه‌های مورد استفاده در زبان‌های عمده دنيا كد تعيين‌كرده‌است. به‌علت گسترده‌بودن فضای تخصيص نويسه، اين استاندارد بسياری از نمادهای لازم برای حروف‌چينی را نيز در بر گرفته‌است. از خط‌های مورد پشتيبانی اين استاندارد می‌توان به لاتين (دربرگيرنده اكثر زبان‌های اروپايی)، سيريليك(روسی، صربی)، يونانی، عربی (شامل عربی، فارسی، اردو، كردی)، عبری، هندی، ارمنی، آسوری، چينی، كاتاكانا و هيراگانا(ژاپنی)، و هانگول (كره‌ای) اشاره‌كرد. به‌علاوه، تعداد زيادی نماد رياضی و فنی علائم نقطه‌گذاری، پيكان، و علامت‌های متفرقه‌در اين استاندارد وجود دارد. اين استاندارد برای علامت‌های ‌تركيب‌شونده‌ يا اعراب‌ها نيز كدهايی در نظر گرفته‌است كه‌از جمله آنها علامت‌هايی چون «˜» (مد)هستند كه در تركيبب حروف پايه، حروف تغييرلحن يافته‌ای چون «ñ» را می‌سازند. به طور كلی، بعضی از مشخصات يونی‌كد به شرح زير است: نويسه‌های شانزده‌بيتی يكی‌سازی (اختصاص يك كد به نويسه‌های مشترك در چند زبان مختلف) نويسه، نه شكل (يك «ع»، و نه چهارتا: «ﻋ»، «ﻌ»، «ﻊ»، «ﻉ») بار معنايی (حرف‌بودن، مقدار عددی، ...) در استاندارد يونی‌كد، نويسه‌های فارسی در بلوك مربوط به‌خط‌ عربی‌ قرار دارند. اين بلوك‌برای دربرگرفتن نويسه‌های زبان‌هايی كه‌از خط عربی‌استفاده‌می‌كنند، مثل فارسی، اردو، پشتو، سندی، و كردی گسترش يافته است. اين بلوك نشانه‌های قرآنی از قبيل نشانه‌های سجده و پايان آيه، و علائم وقف را نيز در بردارد. در يونی‌كد با وجود يكی‌سازی كدهای حروف مشترك، برای حروف فارسی كه بار معنايی يا نمايشی متفاوت با حروف عربی دارند، نويسه‌های جداگانه درنظر گرفته‌شده‌است. يعنی كليه حروف خاص فارسی (پ، چ، ژ، گ) و نيز «ك» و «ی» فارسی كه‌با حرف مشابه‌در عربی‌تفاوت نمايشی دارند، مكان‌جداگانه‌ای به‌خود اختصاص داده‌اند. كليه اعراب‌های متداول حضور دارند و ميان شكل‌فارسی/اردو و عربی ارقام نيز به‌علت شكل و رفتار متفاوت، تفاوت‌هايی منظور گشته‌است. از طرف ديگر، علائم نقطه‌گذاری چون نقطه و فاصله كه‌شكلی كسانی‌در خط‌های لاتين و عربی دارند، كد يكسان‌ دارند. علائمی‌چون پرانتز نيز، بسته به جهت متن، آينه‌ای می‌شوند، به طور مثال، نويسه 0028 نماينده «پرانتز باز» است، و نه«پرانتز سمت‌چپ». يونی‌كد اتصال‌مجازی و فاصله مجازی را نيز تحت‌نام‌های «اتصال با عرض‌صفر» و «بی‌اتصالی با عرض‌صفر» به‌رسميت می‌شناسد. بدين ترتيب ملاحظه می‌شود كه برای حل مشكلات موجود، و نيز رفتن به سوی يك استاندارد مقبول و همه‌جانبه، استاندارد يونی‌كد، روشی مناسب به نظر می‌رسد. در شماره‌های آتی ماهنامه نيز به اين موضوع از جنبه‌های ديگر خواهيم پرداخت. اصطلاحات: نويسه: در مقابل character. كوچك‌ترين واحد متن. مثلاً يك حرف لاتين، يك اعراب فارسی، يكی علامت نقطه‌گذاری، يك نشانه بريل، يا يك نماد رياضی شكل: در مقابل glyph. كوچك‌ترين واحد نمايش متن. برای بعضی نويسه‌ها مثل حروف فارسی و هندی ممكن است چند شكل موجود باشد. مثلاً « ﺑ » و « ﻊ » از اشكال‌نمايشی محسوب می‌شوند مجموعه‌نويسه: در مقابلcharacter set. مجموعه‌ای از نويسه‌ها كه‌به‌هر نويسه عددی اختصاص‌می‌دهد كه نماينده آن نويسه محسوب می‌شود و در تبادل اطلاعات مورد استفاده‌قرار می‌گيرد مجموعه كد: در مقابل codepage. سيستمی كه به‌هر نويسه دنباله مشخصی‌از بايت‌ها را متناظر می‌كند. مجموعه‌نويسه‌ها می‌توانند به‌شكل يا چند مجموعه‌ كد قابل استفاده‌باشند. منبع : aliproductions shahrdartoope13-01-2005, 03:22 AMسلام سعی تی ان تی قربون دستت خیلی حال کردم.. فقط یه سوال نمی دونی چه جوری میشه یونیکد رو تبدیل کرد بعد در فایل تکست ذخیره کرد؟ اگه همین جوری کپی کنی بعد از ذخیره همه کلمات به صورت علامت سوال در میان می تونی کمکم کنی شهر دار Saeed_TnT13-01-2005, 10:03 AMبه نظر من اگه از Amir_p30 بپرسي بهتره :wink: :!: :!: :!: shahrdartoope15-01-2005, 06:19 AMپس امیر جان بدادم برس شهردار mkoleiny16-01-2005, 01:03 PMاصلا نميخواد كپي كني.از اول با notepad باز كن و از همون جا هم تكست save كن shahrdartoope17-01-2005, 06:40 AMخوب اگه فونتشو نداشته باشی چی؟ در این صورت فقط با یونیکد میشه دید شهردار mkoleiny17-01-2005, 12:27 PMنه نميخواد Sina17-01-2005, 05:54 PMدوستان ببينيد يونيكد يه روش ذخيره سازي هست و براي مشاهده اون نياز به هيچ فونتي نيست! :) shahrdartoope19-01-2005, 02:12 AMسینا جان شما منظورمو متوجه نشدی من نیاز خیلی شدیدی دارم که پسوند doc رو به txt تبدیل کنم ولی با کپی کردن این کار انجام نمیشه ؟؟ شهردار Sina19-01-2005, 05:42 PMويندوز شما چيه ؟ با كپي كردن بايد بشه .. يعني توي نت پد فارسي مينويسه بعد در هنگام ذخيره يه سوال هم ميكنه كه بايد جواب مثبا بدين MaSoOd21-01-2005, 04:15 AMممنون از مقالت سعيد جان اینم لینکش : !!!! برای مشاهده محتوا ، لطفا ثبت نام کنید / وارد شوید !!!! shahrdartoope22-01-2005, 02:23 AMسینا جان ویندوز من ایکس پی روسیه از من سوال میکنه که اگه ای فایل ذخیره بشه ممکنه بعضی اطلاعات از بین بره آیا مطمئن هستید" اگه بزنم اره وقتی دوباره بازش می کنم همه کلمات فارسی به صورت علامت سواله اگه هم بزنم نه ذخیره نمیکنه حالا نظر شما جیه؟؟؟ pedramonline24-01-2005, 01:58 AMاي ول خيلي وقته دنبال تعريف ميگشتم گيرم نميومد دستت درد نكنه خدا عمر بت بده Amir_P3024-01-2005, 09:36 PMشما زبان فارسي رو كامل روي ويندوزت نصب كرده ايي؟ Sina25-01-2005, 06:12 PMمن همين كار رو ميكنم و مشكلي پيش نمياد البته با اكس پي انگليسي كه فارسي هم روش نصب هست shahrdartoope01-02-2005, 03:45 AMبله امير جان ولي فايده اي نداره Amir_P3001-02-2005, 06:12 PMآقا اون جايي كه زبان فارسي رو نصب مي كني يه زبانه داره به نام ادونس اونو چك كن كه فارسي باشه سایت ما را در گوگل محبوب کنید با کلیک روی دکمه ای که در سمت چپ این منو با عنوان +1 قرار داده شده شما به این سایت مهر تأیید میزنید و به دوستانتان در صفحه جستجوی گوگل دیدن این سایت را پیشنهاد میکنید که این امر خود باعث افزایش رتبه سایت در گوگل میشود




این صفحه را در گوگل محبوب کنید

[ارسال شده از: سایت ریسک]
[مشاهده در: www.ri3k.eu]
[تعداد بازديد از اين مطلب: 597]

bt

اضافه شدن مطلب/حذف مطلب




-


گوناگون

پربازدیدترینها
طراحی وب>


صفحه اول | تمام مطالب | RSS | ارتباط با ما
1390© تمامی حقوق این سایت متعلق به سایت واضح می باشد.
این سایت در ستاد ساماندهی وزارت فرهنگ و ارشاد اسلامی ثبت شده است و پیرو قوانین جمهوری اسلامی ایران می باشد. لطفا در صورت برخورد با مطالب و صفحات خلاف قوانین در سایت آن را به ما اطلاع دهید
پایگاه خبری واضح کاری از شرکت طراحی سایت اینتن