UNICODE

Writing Kurdish in today's electronic medium is a great challenge. Koya University has initiated couple of project to help our academic community and all Kurdish users to experience a smooth writing in any electronic medium at any time.

Problem

Computer users produce electronic data for communication, archive and analyses. Most communication, archive and analyses tools are working with UNICODE systems which enables practical links between various independent platforms. Kurdish in general follows a non standard writing system in different sector of Kurdistan. Computer users in Kurdistan Region are mostly using Arabic based writing system (Ali System) which caries a great level of complexity of its own. This is apparent clearly in inconsistent data shared between users as well as shared archives.

Fundamentally, computers just deal with numbers. They store letters and other characters by assigning a number for each one. Before Unicode was invented, there were hundreds of different encoding systems for assigning these numbers. No single encoding could contain enough characters: for example, the European Union alone requires several different encodings to cover all its languages. Even for a single language like English no single encoding was adequate for all the letters, punctuation, and technical symbols in common use.

These encoding systems also conflict with one another. That is, two encodings can use the same number for two different characters, or use different numbers for the same character. Any given computer (especially servers) needs to support many different encodings; yet whenever data is passed between different encodings or platforms, that data always runs the risk of corruption.

This shows that writing practices in Kurdish has become vulnerable from various aspects and a solution needed to make vast amount of data produced useful for archiving and knowledge transfer. The answer in in one single unified system that all electronic medium interpreter in the same way, namely the UNICODE.

The UNICODE Tools

In 1996, a surrogate character mechanism was implemented in Unicode 2.0, that increased the Unicode to over a million code points, which allowed for the encoding of many historic scripts (e.g., Egyptian Hieroglyphs) and thousands of rarely used or obsolete characters that had not been anticipated as needing encoding.

Unicode is an industry standard character set encoding developed and maintained by The Unicode® Consortium. The Unicode character set has the capacity to support over one million characters, and is being developed with an aim to have a single character set that supports all characters from all scripts, as well as many symbols, that are in common use around the world today or in the past. Currently, the Standard supports over 96,000 characters representing a large number of scripts. The benefits of a single, universal character set and the practical considerations for implementation that have gone into the design of Unicode have made it a success, and it is well on the way to becoming a dominant and ubiquitous standard.

The emergence of the Unicode Standard, and the availability of tools supporting it, are among the most significant recent global software technology trends. Unicode is setting up binary codes for text or script characters. Officially called the Unicode Worldwide Character Standard, it is a system for "the interchange, processing, and display of the written texts of the diverse languages of the modern world." It also supports many classical and historical texts in a number of languages. (please read more on UNICODE)

The Koya University has initiated couple of project to help our academic community and all Kurdish users to experience a smooth writing in any electronic medium at any time.

Ali Font System

The Ali System was a non UNICODE writing system that was introduced for writing in Arabic in mid 1990s. The system was adopted to write in Persian, Urdu and later on Kurdistan (Arabic based alphabet). As the computer literacy become a public domain this writing system become a main tools for writing and produce electronic materials. Ali system keyboard layout for Kurdish is based on Arabic writing system. This layout has become the ultimate way of using keyboard among computer users in Kurdish Region, in particular among those with limited English Language skills.

Using Ali font system has been abandon in Kurdistan Region now and a rapid transition started in 2011. This was backed and supported with a ministerial order in Dec 2014, (Please click to see)

نوسین به‌زمانی کوردی له‌ناوه‌ندێکی ئه‌لیکتڕۆنیدا کارێکی سه‌خته‌. زانکۆی کۆیه‌ چه‌ند پڕۆژه‌یه‌کی ده‌ست پێکردووه‌ بۆ یارمه‌تیدانی کۆمه‌ڵگه‌ی ئه‌کادیمیمان و هه‌موو به‌کارهێنه‌رانی کورد بۆ ئه‌وه‌ی بتوانن کاری نوسین به‌زمانی کوردی له‌هه‌ر ناوه‌ندێکی ئه‌لیکتڕۆنیدا و له‌هه‌ر کاتێکدا بێت ئه‌نجام بده‌ن.


كێشه‌

به‌كارهێنه‌رانی كۆمپیوته‌ر زانیاری ئه‌لكترۆنی به‌رهه‌م ده‌هێنن بۆ په‌یوه‌ندیكردن و به‌ ئارشیف كردن و شیكردنه‌وه‌. زۆربه‌ی ئامرازه‌كانی په‌یوه‌ندیكردن و به‌ ئارشیف كردن و شیكردنه‌وه به‌ سیستمی یونیكۆد كارده‌كه‌ن كه‌ لینكی پراكتیكی له‌ نێوان سیستمه‌ یاخود به‌رنامه سه‌ربه‌خۆ‌ جیاوازه‌كانی كۆمپیونه‌ر كارا ده‌كات. زمانی كوردی به‌ شێوه‌یه‌كی گشتی په‌یڕه‌وی سیستمێكی ناستانده‌رد ده‌كات له‌ به‌شه‌ جیاوازه‌كانی كوردستاندا. به‌كارهێنه‌رانی كۆمپیوته‌ر له‌ هه‌رێمی كوردستاندا زیاتر سیتمی نووسینی دامه‌زراو له‌ سه‌ر زمانی عه‌ره‌بی به‌كارده‌هێنن ( سیسته‌می Ali ) كه‌ ئه‌ویش خۆی له‌ خۆیدا ئاڵۆزیه‌كی زۆری تێدایه‌. ئه‌مه‌ش به‌ شێوه‌یه‌كی ئاشكرا له‌و زانیاری و ئارشیفه‌ له‌ گه‌ڵ یه‌ك نه‌سازاوانه‌دا كه‌ له‌ نێوان به‌كارهێنه‌رانه‌وه‌ ئاڵوگۆڕ ده‌كرێ دیا‌رده‌كه‌وێ.


به‌ شێوه‌یه‌كی سه‌ره‌كی، كۆمپیوته‌ر ته‌نها مامه‌ڵه‌ له‌گه‌ڵ ژماره‌ ده‌كات. پیت و نیشاته‌كانی تر كۆگا (خه‌زن) ده‌كات به‌ شێوه‌یه‌ك كه‌ بۆ هه‌ر یه‌كێكیان ژماره‌یه‌ك داده‌نێت. پێش ئه‌وه‌ی یونیكۆد بێته‌ كایه‌وه‌، سه‌ده‌ها سیستمی به‌كۆدكردنی جیاواز هه‌بوون بۆ دانانی ئه‌و ژمارانه‌. هیچ سیستمێكی به‌كۆدكردن به‌ته‌واوی هه‌موو پیته‌كانی له‌ خۆ نه‌ده‌گرت ؛ بۆ تموونه‌، یه‌كێتی ئه‌وروپا به‌ته‌نها پێویستی به‌چه‌ند جۆره‌ سیستمێكی ‌ به‌كۆدكردن ده‌بێت بۆ ئه‌وه‌ی بتوانێ پێداویستی هه‌موو زمانه‌كان دابین بكات. هه‌تاوه‌كو بۆ تاكه‌ زمانێكی وه‌كو زمانی ئنگلیزیش، یه‌ك سیستمی به‌كۆدكردن ناتوانێ هه‌موو پیته‌كان و خاڵبه‌ندی و نیشانه‌ ته‌كنیكیه‌كانی كه‌ به‌ شێوه‌یه‌كی ئاسایی به‌كارده‌هێنرێن له‌ خۆ بگریت.


سیستمه‌كانی به‌كۆدكردن هه‌روه‌ها له‌ گه‌ڵ یه‌كتریشدا ناسازێن، واتا ده‌كرێ دوو سیستمی‌ به‌كۆدكردن هه‌مان ژماره‌ بۆ دوو پیتی جباواز به‌كاربهێنن، یان ژماره‌ی جیاواز بۆ هه‌مان پیت به‌كاربهێنن. هه‌ر كۆمپیوته‌رێك وه‌ربگرین( به‌ تایبه‌تیش سێرڤه‌ره‌كان) پێویسته‌ كه‌ ڕێگا به‌ چه‌ند سیستمێكی به‌كۆدكردنی جیاواز بدات. له‌گه‌ڵ ئه‌مه‌شدا، هه‌ركاتێك زانیاری له‌نێوان سیستمه‌ جیاوازه‌كانی به‌كۆدكردن ده‌گوازرێته‌وه‌، ئه‌و زانیاریه‌ مه‌ترسی تێكچون یان شێوانی لێ ده‌كرێت.


ئه‌مه‌ نیشانی ئه‌دات که‌ نوسین به‌زمانی کوردی له‌زۆربه‌ی بواره‌ جیاوازه‌کاندا توانایه‌کی ئه‌وتۆی نیه‌، بۆیه‌ جاره‌سه‌رێک پێویست بوو بۆ به‌رهه‌مهێنانی ڕێژه‌یه‌کی زۆر له‌ زانیاری که‌ سودی هه‌بێت له‌ به‌ئه‌رشیف کردن و گواستنه‌وه‌ی زانستدا. چاره‌سه‌ر بۆ ئه‌م کێشه‌یه‌ ‌بوونی سیسته‌مێکی یه‌کخراوه‌ به‌شیوه‌یه‌ک که‌ هه‌موو ناوه‌نده‌ ئه‌لیکتڕۆنیه‌کان له‌گه‌ڵ یه‌کتر بگونجێن، ئه‌م سیسته‌مه‌ش ناسراوه‌ به‌ سیسته‌می یونیکۆد.


ئامرازه‌كاتی یونیكۆد


له‌ساڵی 1996دا میکانیزمێکی پیتی جێگره‌وه‌ له‌ یونیکۆددا جێبه‌جێکرا، که‌بوه‌ هۆی زیاد کردنی کۆده‌کانی یونیکۆد بۆ سه‌رو میلیۆنێک، ئه‌مه‌ش ‌ئاسانکاری کرد بۆ به‌کۆدکردنی چه‌ندین سیسته‌می نوسینی مێژوویی، بۆ نمونه‌ ( نوسینی بزماری میسڕیه‌ کۆنه‌کان) وه‌ له‌گه‌ڵ هه‌زاران پیتی زۆر که‌م به‌کارهاتوو یاخود به‌سه‌رچوو که‌ باوه‌ڕ وابووه‌ پێویستیان به‌ به‌کۆدکردن نیه‌.


یونیكۆد كۆمه‌ڵه‌ پیت وھیمایه‌كی ستانده‌ردی به‌كۆدكردنه‌ كه‌ له‌لایه‌ن ( (The Unicode@ Consortiumداهێنراوه‌ ئاگاداری ده‌كرێت. ئه‌م كۆمه‌ڵه‌ پیت و هێمایانه‌ی یونیكۆد توانای له‌خۆگرتنی زیاتر له‌ ملیۆنێك هێما و پیتی هه‌یه‌ و ‌مه‌به‌ستیش له‌ داهێنانی ئه‌م سیستمه‌ی یونیكۆد هێنانه‌ كایه‌وه‌ی كۆمه‌ڵه‌ پیت و هێمایه‌كه‌ كه‌ بتوانێ خۆی له‌گه‌ڵ هه‌موو سیستمه‌كانی نووسیندا بگونجێنێ. جكه‌ له‌مه‌ش، ‌ ژماره‌یه‌كی زۆر له‌ و هێمایانه‌ی كه‌ به‌شێوه‌یه‌كی ئاسایی له‌ جیهاندا به‌كارده‌هێنرێن له‌ خۆ ده‌گرێت. له‌ ئێستادا سیستمه‌ ستانده‌رده‌كه‌ی یونیكۆد زیاتر له‌ 96000 پیت له‌خۆ ده‌گرێت كه‌ له‌ زۆربه‌ی سیستمه‌كانی نووسیندا به‌كارده‌هێنرێن. به‌ هۆی سوود و به‌كارهێنانه‌ پراكتیكیه‌كه‌ی ئه‌م كۆمه‌ڵه‌ پیت و هێما جیهانیه‌، یونیكۆد سه‌ركه‌وتنێكی زۆری به‌ده‌ست هێناوه‌ و بۆته‌ سیستمێكی باو و به‌ربڵاو.


سه‌رهه‌ڵدانی سیستمی یونیكۆد و بوونی ئامرازی یارمه‌تیده‌ر بؤ ‌به‌كارهێنانی یه‌كێكه‌ له‌ ئاراسته‌ هه‌ره‌ گرنگه‌ باوه‌كانی ته‌كنه‌لۆژیای سوفت وێری جیهانی له‌م سه‌رده‌مه‌دا‌. یونیكۆد كۆدی دوو ژماره‌یی بۆ پیته‌كانی نووسین داده‌نێت. له‌به‌رئه‌وه‌ی سیستمی یونیكۆد به‌ فه‌رمی ناسراوه‌ به‌ ستانده‌ردی پیته‌ جبهانیه‌كانی یونیكۆد. ئه‌م سیستمه‌ بۆ ئاڵوگۆڕكردن و چاره‌سه‌ركردن وخستنه‌ڕووی ده‌قه‌ نووسراوه‌كان به‌ زمانه‌ جیاوازه‌كان له‌ جیهانی ئه‌م سه‌رده‌مه‌دا به‌كارده‌هێنرێت و هه‌روه‌ها بۆ نووسینی زۆر له‌ ده‌قه‌ كلاسیكی و مێژووییه‌كانیش به‌ هه‌ندێك له‌ زمانه‌كان‌ ده‌ست ئه‌دات

زانكۆی كۆیه‌ چه‌ند پڕۆژه‌یه‌كی ده‌ست پێكردووه‌ به‌ مه‌به‌ستی یارمه‌تیدانی كۆمه‌ڵگای ئه‌كادیمی و هه‌موو به‌كارهێنه‌ره‌ كورده‌كان بۆ ئه‌وه‌ی نووسیینێكی بێ گرفت ئه‌نجام بده‌ن به‌ هه‌ر جۆره‌ سیستمێكی ئه‌لكترۆنی بێت و له‌ هه‌ر شوێنێك بێت.


سیسته‌می فۆنتی Ali


سیسته‌می فۆنتی Ali سیسته‌مێکی نوسینی نایونیکۆدی بوو که‌ له‌ناوه‌ڕاستی ساڵانی نه‌وه‌ده‌کاندا بۆ نوسین به‌زمانی عه‌ره‌بی هێنرایه‌ کایه‌وه‌. دواتر سیسته‌مه‌که‌ به‌شێوه‌یه‌ک گونجێندرا که‌ بتوانرێ بۆ نوسینی فارسی، ئۆردۆ دواتریش کوردی (له‌سه‌ر ئه‌لف و بێی عه‌ره‌بی) به‌کاربهێنرێت. له‌گه‌ڵ گه‌شه‌سه‌ندنی زانستی کۆمپیوته‌ر و گرتنه‌ خۆی ته‌واوی بواره‌کانی ژیان، ئه‌م سیسته‌می نوسینه‌ بوو به‌ ئامرازی سه‌ره‌کی نوسین و به‌رهه‌مهێنانی بابه‌ته‌ ئه‌لیکتڕۆنیه‌کان. نه‌خشه‌ی ته‌خته‌کلیلی سیسته‌می Ali له‌سه‌ر بنچینه‌ی سیسته‌می نوسینی عه‌ره‌بی دامه‌زراوه‌. ئه‌م نه‌خشه‌یه‌ بوو به‌ ڕێگای بنچینه‌یی به‌کارهێنانی ته‌خته‌کلیل له‌ناو به‌کارهێنه‌رانی کۆمپیوته‌ر له‌هه‌رێمی کوردستاندا، به‌تایبه‌ت له‌ناو ئه‌و که‌سانه‌ی که‌ شاره‌زاییه‌کی که‌ممیان له‌زمانی ئینگلیزیدا هه‌یه‌.


ئێستا له‌کوردستاندا سیسته‌می فۆنتی Ali کاری پێناکرێت و له‌ 2011 ه‌وه‌ گۆڕانکاری خیرا به‌م ئاڕاسته‌یه‌دا ده‌ستی پیکرد. ئه‌مه‌ش پاڵپشت به‌فه‌رمانێکی وه‌زاری که له‌ کانونی یه‌که‌می 2014 دا ده‌رچوو.