تور لحظه آخری
امروز : چهارشنبه ، 12 اردیبهشت 1403    احادیث و روایات:  امام علی (ع):نادانى ريشه همه بديهاست.
سرگرمی سبک زندگی سینما و تلویزیون فرهنگ و هنر پزشکی و سلامت اجتماع و خانواده تصویری دین و اندیشه ورزش اقتصادی سیاسی حوادث علم و فناوری سایتهای دانلود گوناگون شرکت ها

تبلیغات

بلومبارد

تبلیغات متنی

تریدینگ ویو

خرید اکانت اسپاتیفای

کاشت ابرو

لمینت دندان

ونداد کولر

لیست قیمت گوشی شیائومی

صرافی ارکی چنج

صرافی rkchange

دانلود سریال سووشون

دانلود فیلم

ناب مووی

تعمیر گیربکس اتوماتیک

دیزل ژنراتور موتور سازان

سرور اختصاصی ایران

سایت ایمالز

تور دبی

سایبان ماشین

جملات زیبا

دزدگیر منزل

ماربل شیت

تشریفات روناک

آموزش آرایشگری رایگان

طراحی سایت تهران سایت

آموزشگاه زبان

اجاره سند در شیراز

ترازوی آزمایشگاهی

رنگ استخری

فروش اقساطی کوییک

راهبند تبریز

ترازوی آزمایشگاهی

قطعات لیفتراک

وکیل تبریز

خرید اجاق گاز رومیزی

آموزش ارز دیجیتال در تهران

شاپیفای چیست

فروش اقساطی ایران خودرو

واردات از چین

قیمت نردبان تاشو

وکیل کرج

قیمت فنس

armanekasbokar

armanetejarat

صندوق تضمین

پراپ تریدینگ معتبر ایرانی

نهال گردو

صنعت نواز

پیچ و مهره

خرید اکانت اسپاتیفای

صنعت نواز

لوله پلی اتیلن

کرم ضد آفتاب لاکچری کوین SPF50

دانلود آهنگ

طراحی کاتالوگ فوری

واردات از چین

اجاره کولر

دفتر شکرگزاری

تسکین فوری درد بواسیر

دانلود کتاب صوتی

تعمیرات مک بوک

قیمت فرش

خرید سی پی ارزان

خرید تجهیزات دندانپزشکی اقساطی

خانه انزلی

تجهیزات ایمنی

رنگ استخری

 






آمار وبسایت

 تعداد کل بازدیدها : 1799204548




هواشناسی

نرخ طلا سکه و  ارز

قیمت خودرو

فال حافظ

تعبیر خواب

فال انبیاء

متن قرآن



اضافه به علاقمنديها ارسال اين مطلب به دوستان آرشيو تمام مطالب
archive  refresh

[سوال] توضیح در مورد کارکتر های ساختاری یک فایل -


واضح آرشیو وب فارسی:سایت ریسک: [سوال] توضیح در مورد کارکتر های ساختاری یک فایل ashkan_mmb 27 ارديبهشت 1389, 18:15سلام یه توضیح در مورد کارکتر ها در نوشته ها و فایلها میخوام که تا چند کارکتر مختلف میشه استفاده کرد و یه سری کارکتر چینی و ژاپنی و علائم وجود دارن و من از قدیم الایام یادمه که میگفتن کارکتر ها از 8 صفر و یک تشکیل شدن و 256 نوع مختلف بیشتر ندارن ولی امروز یه سری کارکتر هایی رو دیدم که با نات پد همم نمیشد اونهارو سیو کرد یه سری سوال داشتم 1.حجم این کارکتر ها با کارکتر های معمولی فرق میکنه یا نه؟ یعنی کارکتر  حجمش با کارکتر J برابره؟ 2.اگر برابره با چه نرم افزاری میشه اونهارو داخل یک فایل نوشت 3.فایلهای معمولی مثل .rar از همه کارکتر ها استفاده میکنن و یا از کارکتر های خاصی؟ the_king 28 ارديبهشت 1389, 08:58سلام یه توضیح در مورد کارکتر ها در نوشته ها و فایلها میخوام که تا چند کارکتر مختلف میشه استفاده کرد و یه سری کارکتر چینی و ژاپنی و علائم وجود دارن و من از قدیم الایام یادمه که میگفتن کارکتر ها از 8 صفر و یک تشکیل شدن و 256 نوع مختلف بیشتر ندارن ولی امروز یه سری کارکتر هایی رو دیدم که با نات پد همم نمیشد اونهارو سیو کرد یه سری سوال داشتم کاراکتر هایی که از قدیم الایام 8 بیتی بودند مربوط به استاندارد هایی مثل ASCII هستند. هنوز هم در مواردی مثل فایل های txt قدیمی از این مجموعه کاراکتر های یک بایتی استفاده میشه، ولی همانطور که خودتون اشاره کردید، حداکثر 256 حالت متفاوت رو نشون می دهند که با سیستم عامل های چند زبانه امروزی چندان جور در نمیاد. 1.حجم این کارکتر ها با کارکتر های معمولی فرق میکنه یا نه؟ یعنی کارکتر  حجمش با کارکتر J برابره؟ اگه فقط در مورد استاندارد های مرسوم UTF-8 و UTF-16 صحبت کنیم، برای سوال اولتون دو جواب وجود داره. در استاندارد UTF-8 طول کاراکتر ها متغیره، یعنی یا 8 بیتی است یا 16 بیتی (دو تا 8 بیتی). به این مفهوم که اگه کاراکتر مورد نظر جزو 128 کاراکتر ASCII آمریکایی (US) بود، مثل کاراکتر های قدیمی ASCII یک کد بین 0 الی 127 خواهند داشت، اما اگه کاراکتر جزو اون 128 کاراکتر آمریکایی نبود (مثل کاراکتر های عربی و هندی و ...)، کد کاراکتر از بین یک مجموعه 65 هزار کاراکتری Unicode انتخاب میشه که 16 بیت (دو بایت) جا می گیره. مثلا کد کاراکتر Copyright یعنی کاراکتر © با دو بایت 0 و 169 بطور متوالی مشخص می شود، و نه فقط یک بایت تنها. در استاندارد UTF-16 همه کاراکتر ها 16 بیتی هستند و هر کدوم دو بایت جا می گیرند. چه جزو کاراکتر های آمریکایی باشند و چه نباشند. مثلا کاراکتر A که در ASCII با کد 65 نشان داده می شود در UTF-16 با دو بایت 0 و 65 مشخص می گردد که بصورت متوالی نوشته می شوند. 2.اگر برابره با چه نرم افزاری میشه اونهارو داخل یک فایل نوشت انتخاب فونت مناسب شرط اوله، چون تمامی فونت ها تمامی کاراکتر های Unicode را به درستی نشان نمی دهند. در فونت های استاندارد ویندوز، فونت هایی مثل Arial و Tahoma به نسبت مجموعه کامل تری دارند. شرط دوم، استفاده کردن از سیستم کاراکتر های Unicode است. موقع Save As کردن فایل های متنی در notepad می توانید تنظیم Encoding را روی Unicode قرار دهید. شرط سوم، استفاده کردن از یک نمایش دهنده مناسب است که استاندارد کاراکتر های Unicode را پشتیبانی کند. به عنوان مثال Microsoft Word و Internet Explorer آنرا پشتیبانی می کنند، اما مثلا MMB نمی کند. 3.فایلهای معمولی مثل .rar از همه کارکتر ها استفاده میکنن و یا از کارکتر های خاصی؟ فرمت فایل rar از Unicode پشتیبانی می کند. مفهوم آن این است که از اسم فایل هایی که rar آنها را فشرده می کند می تواند ترکیبی از زبان های چینی، فارسی، عربی و ... باشد. محتویات فایل بحثی جداست، چون فشرده ساز ها کاری به UTF-8 یا UTF-16 بودن محتویات فایل ندارند، در هر صورت آنرا فشرده می کنند. محدودیت فقط در نمایش متن آنها است. مثلا MMB از Unicode پشتیبانی نمی کند و نمی توانید متن Unicode را بدون یک پلاگین مناسب در MMB به درستی نمایش دهید. ashkan_mmb 28 ارديبهشت 1389, 10:36خوب تقریباً حرفاتون رو متوجه شدم اما یه سوال برام مونده که سورس این فایل ها هم همین شکل رو دارن و یا سورسشون با نمایشی که توی نات پد با فونت منتخب به ما نشون داده میشن فرق دارن یعنی مثلاً ӈ در یونی کد از دو عدد 23 و 12 تشکیل شده حالا اگر ما اون رو به صورت ان اف اس آی باز کنیم به ما چنین چیزی رو نشون میده : ↨♀ خوب حالا اگر همین رو بنویسیم و سیو کنیم و با فرمول یونی کد بازش کنیم به ما ӈ رو نشون میده یا نه و در آخر هم یه سوال دیگه داشتم ما وقتی یک فایل رو با فرمول یونی کد سیو میکنیم و دوباره با نات پد بازش میکنیم بازم خودش متوجه میشه که از یونی کد استفاده شده آیا توی سورس فایلها چیزهایی هست که نات پد نشون نمیده؟ یعنی مثلاً توی یک فایل نوشته شده 0101010010101001 خوب نات پد میتونه این رو به صورت دوتا کارکتر 8 بیتی نشون بده و هم میتونه به صورت 1 کارکتر 16 بیتی ولی خوب وقتی دوتا 8 بیتی سیو میکنیم وقتی که باز میشه همون دوتا 8 بیتی رو نشون میده و با همین ترتیب بیت ها هم وقتی به صورت 16 بیتی سیو میکنیم در موقع باز کردن همون 16 بیتی رو نشون میده و اشتباه نمیکنه که شاید این بیت ها دو تا کارکتر 8 بیتی رو منظور کنن یعنی اطلاعات اینکه این فایل به صورت 8 بیتی سیو شده یا نه داخل فایل قرار میگیره؟ اگه اینطوره باید نرم افزاری باشه که بشه باهاش به ساده ترین سورس فایل دست پیدا کرد لطفاً در این موارد اگه زحمتی نیست یک توضیح بدید the_king 29 ارديبهشت 1389, 08:49خوب تقریباً حرفاتون رو متوجه شدم اما یه سوال برام مونده که سورس این فایل ها هم همین شکل رو دارن و یا سورسشون با نمایشی که توی نات پد با فونت منتخب به ما نشون داده میشن فرق دارن یعنی مثلاً ӈ در یونی کد از دو عدد 23 و 12 تشکیل شده حالا اگر ما اون رو به صورت ان اف اس آی باز کنیم به ما چنین چیزی رو نشون میده : ↨♀ خوب حالا اگر همین رو بنویسیم و سیو کنیم و با فرمول یونی کد بازش کنیم به ما ӈ رو نشون میده یا نه و در آخر هم یه سوال دیگه داشتم ما وقتی یک فایل رو با فرمول یونی کد سیو میکنیم و دوباره با نات پد بازش میکنیم بازم خودش متوجه میشه که از یونی کد استفاده شده آیا توی سورس فایلها چیزهایی هست که نات پد نشون نمیده؟ یعنی مثلاً توی یک فایل نوشته شده 0101010010101001 خوب نات پد میتونه این رو به صورت دوتا کارکتر 8 بیتی نشون بده و هم میتونه به صورت 1 کارکتر 16 بیتی ولی خوب وقتی دوتا 8 بیتی سیو میکنیم وقتی که باز میشه همون دوتا 8 بیتی رو نشون میده و با همین ترتیب بیت ها هم وقتی به صورت 16 بیتی سیو میکنیم در موقع باز کردن همون 16 بیتی رو نشون میده و اشتباه نمیکنه که شاید این بیت ها دو تا کارکتر 8 بیتی رو منظور کنن یعنی اطلاعات اینکه این فایل به صورت 8 بیتی سیو شده یا نه داخل فایل قرار میگیره؟ اگه اینطوره باید نرم افزاری باشه که بشه باهاش به ساده ترین سورس فایل دست پیدا کرد لطفاً در این موارد اگه زحمتی نیست یک توضیح بدید طبق استاندارد Unicode برای اینکه ویرایشگر هایی مثل Notepad بتوانند فایل های متنی ASCII را از Unicode تشخیص دهند، دو بایت به ابتدای فایل های Unicode اضافه میشه، به ترتیب با کد های 255 و 254. هر ویرایشگر متنی که این دو بایت رو در ابتدای فایل متنی ببینه، اونها رو نادیده می گیره و بقیه محتویات فایل رو بصورت Unicode تفسیر می کنه. به همین دلیله که فرضا اگه داخل فایل متنی فقط چهار کاراکتر ABCD رو با Encoding یونیکد ذخیره کنید، 10 بایت جای می گیره، نه 8 بایت. از اونجایی که تمامی کد ها کاراکتر معادل قابل نمایشی ندارند، یک ویرایشگر متنی برای ایجاد کردن مستقیم کد کاراکتر ها مناسب نیست. برای اینکه بتوانید یک کاراکتر را بصورت مستقیم درج کنید، بایستی از ابزار Character Map استفاده کنید که جزو مجموعه Accessories - System Tools منوی Start ویندوز است. همچنین ویرایشگر های Hex Editor می توانند برای درج کردن مستقیم کد کاراکتر ها بکار روند، مثلا WinHex سایت ما را در گوگل محبوب کنید با کلیک روی دکمه ای که در سمت چپ این منو با عنوان +1 قرار داده شده شما به این سایت مهر تأیید میزنید و به دوستانتان در صفحه جستجوی گوگل دیدن این سایت را پیشنهاد میکنید که این امر خود باعث افزایش رتبه سایت در گوگل میشود




این صفحه را در گوگل محبوب کنید

[ارسال شده از: سایت ریسک]
[مشاهده در: www.ri3k.eu]
[تعداد بازديد از اين مطلب: 540]

bt

اضافه شدن مطلب/حذف مطلب







-


گوناگون

پربازدیدترینها
طراحی وب>


صفحه اول | تمام مطالب | RSS | ارتباط با ما
1390© تمامی حقوق این سایت متعلق به سایت واضح می باشد.
این سایت در ستاد ساماندهی وزارت فرهنگ و ارشاد اسلامی ثبت شده است و پیرو قوانین جمهوری اسلامی ایران می باشد. لطفا در صورت برخورد با مطالب و صفحات خلاف قوانین در سایت آن را به ما اطلاع دهید
پایگاه خبری واضح کاری از شرکت طراحی سایت اینتن