05/03 1394

چرا کارکترهای فارسی بیشتر از انگلیسی فضا اشغال میکنند

0 1 1 1 1 1 1 1 1 1 1

Unicode

حتما در بسیاری مواقع دیده اید که به هنگام تایپ حروف فارسی مقدار فضای اشغال شده بسیار بیشتر از حروف انگلیسی میباشد. شاید برای بسیاری این سوال پیش آمده باشد که علت این اشغال شدن فضا توسط حروف فارسی چیست؟ بیشتر کاربران این امر را در هنگام ارسال پیغام کوتاه در گوشی های همراه با آن روبرو شده اند.

در ادامه مطلب علت اشغال فضای بیشتر کارکترهای فارسی را توضیح خواهیم داد.

حروف انگلیسی بر اساس الگوی کدگذاری به نام ASCII طراحی شده‌اند. ASCI مخفف American Standard Code for Information Interchange است و اولین بار در سال 1967 در ایالات متحده آمریکا مورد استفاده قرار گرفت. در اسکی هر کارکتر انگلیسی یک بایت فضا اشغال می‌کند. کارکترهای انگلیسی بخشی از کارکترهای لاتین به شمار می‌روند که اسکی به خوبی از آن‌ها پشتیبانی می‌کند. در زبان انگلیسی 26 حرف وجود دارد که فارغ از اینکه بزرگ هستند یا کوچک، فضای یکسانی از حافظه را اشغال می‌کنند.

در دهه 1960 و زمانی که کامپیوترها از حافظه ذخیره‌سازی بسیار محدودی بهره می‌بردند، استاندارد ASCII خلق شد تا کارکترها به روش استانداردی در حافظه تمام کامپیوترهای عرضه شده در آمریکا، ذخیره شوند. در آن زمان تصمیم گرفته شد تا با تکنیک خاصی هر کارکتر در 8 بیت معادل یک بایت ذخیره شوند. در واقع هر کارکتر انگلیسی 7 بیت فضا اشغال می‌کند و بیت هشتم برای چک‌کردن زوج یا فرد بودن عدد است.

با راه یافتن کامپیوتر به کشورهای مختلف جهان و نیاز به وارد‌نمودن زبان‌های مختلف دنیا که هر کدام کارکترهای خاص خود را دارند، استانداردهای کدگذاری مختلفی تعریف شد که از جهات گوناگون با ASCII متفاوت بودند. معروف‌ترین این استانداردها که امروزه بسیار مورد استفاده قرار می‌گیرد و پشتیبانی بسیار خوبی نیز از زبان فارسی دارد، Unicode است. در یونیکد، تمام کارکترهای زبان‌های مختلف دنیا در قالب یک مجموعه کارکتر ذخیره شده‌اند. معروف‌ترین روش در کدگذاری یونیوکد، UTF-8 است که امروزه بیشتر از باقی استانداردها مورد توجه قرار گرفته است. این استاندارد به شکلی طراحی شده است که از استانداردهای دیگر از جمله ASCII پشتیبانی کند. در UTF-8 هر کارکتر 2 بایت یا بیشتر فضا اشغال می‌کند.

پس از آنجایی که حروف انگلیسی براساس استاندارد ASCII ذخیره می‌شوند یک بایت فضا اشغال می‌کنند و حروف فارسی نیز که عموما براساس استاندارد UTF-8 ذخیره می‌شوند 2 بایت یا بیشتر فضا اشغال می‌کنند.

با توجه به این توضیحات اگر در حال ارسال پیامک انگلیسی باشید 160 بایت یا 160 کارکتر انگلیسی در اختیار خواهید داشت و این در حالی است که این محدودیت برای پیامک‌های فارسی به کمتر از نصف کاهش می‌یابد.

برچسب ها یونیکد چیست, میزان اشغال فضای کارکتر های غیر انگلیسی, چرا کارکتر های فارسی بیشتر فضا میگیرند