עברית באינטרנט

אחת מהבעיות הקשות של רשת האינטרנט העולמית היא - היותה כלל עולמית. גולשים רבים הם בני לאומים שונים ששפתם שונה, הגופנים בהם הם משתמשים שונים משפה לשפה, ולעיתים אף כיוון הכתיבה, כמו בשפות השמיות – עברית וערבית הפוך למקובל בעולם.

גופנים

הקונסורציום הבינלאומי לתקינה וקביעת מוסכמות באינטרנט (W3C), המליץ על עבודה לפי כמה תקנים המגדירים את אופי קידוד האותיות, העברתם ברשת ואת תצורת הגופנים עצמם. בין התקנים המפורסמים ניתן למצוא:

תקן ISO-8859-1 – (מוכר כ- Latin-1), תומך ברוב השפות המערב אירופאיות.

תקן ISO-8859-5 - תומך בגופנים קריליים.

תקן ISO-8859-8 - מוכר כ- Hebrew (ISO Visual)  ותומך בגופנים עבריים.

חלק מובנה מהתקן, הוא הגופן עצמו. הגופנים ממשפחת Webhe, Globe, הן שנים מבין הגופנים המוכרים יותר התומכים בתקן לגופנים עבריים. משמעות העבודה תחת הגדרות תקן זה, היא שיש להתקין במחשב את אחד הגופנים הנדרשים.

כיוון כתיבה

הכתיבה בעברית יוצרת בעיה ייחודית. הפיכת הטקסט לביטים לצורך העברה בתקשורת אוניברסאלית, מתבצע באופן המכונה ויזואלי – הסמן עובר על הטקסט בכיוון אחיד (ובמקרה זה, משמאל לימין) בלי תלות בשפה או בהקשר המילולי, מה שגורם לכך שהאותיות מתורגמות החל מהאות השמאלית וגמור באות הימנית. וכך, המילה תקשורת, מועברת ברשת משמאל לימין ומוצגת על המסך כ- תרושקת.

בניית אתרים תחת התקן הויזואלי, מחייבת על כן, כתיבת טקסט המקור של האתר בכתב הפוך!

יתרונות השיטה הויזואלית

לעבודה בקידוד ויזואלי (Visual Encoding) יש כמה יתרונות:

 ·          אין מגבלה של תוכנת הפעלה הכוללת תמיכה בעברית. הורדת הפונטים הייחודיים לתקן ישירות מהאינטרנט, מאפשרת צפיה בכל האתרים הכתובים בקידוד זה, בכל מחשב בעולם.

 ·          הצגת האתר מנותקת מבעיות של פיסוק וחלוקה למשפטים כמו בשיטה הלוגית, (ראה בהמשך).

חסרונות השיטה הויזואלית

 ·          מחייבת כתיבה עם גופן מסוג אחד בלבד.

 ·          השיטה מחייבת כתיבת האתר באופן הפוך.

 ·          שבירת שורה באופן לא הגיוני, כאשר המילה הראשונה (האחרונה מבחינת כיוון התקשורת!) שבשורה, יורדת לשורה תחתונה ונשארת בה בודדה. טקסט יכול להיראות כך (הצבע מראה את מיקומה הנכון של המילה):

פיסקה זו כתובה באופן שוטף והגיוני. כל מילה באה בתורה לאחר קודמתה, והטקסט שוטף, וקולע. בתא הבא ניתן לראות את אותה פיסקה, לו נכתבה באופן ויזואלי.

טקסט מקור

זו כתובה באופן שוטף והגיוני. כל מילה באה בתורה

פיסקה

קודמתה, והטקסט שוטף, וקולע. בתא הבא ניתן

לאחר

את אותה פיסקה, לו נכתבה באופן ויזואלי.

לראות

טקסט מוצג בתקינה ויזואלית

כדי להתגבר על הבעיה, יש להוסיף את התג <NOBR> בראש כל פיסקה.

קידוד לוגי

השיטה הלוגית היא שיטה בא נע הסמן על פני הטקסט תוך התחשבות בשפה ובהקשרה. לדוגמא, כאשר מעבירים את הסמן באמצעות החצים שבמקלדת, על פני טקסט במעבד תמלילים, יהפוך הסמן את כיוונו לפי סוג האותיות עליהם הוא עובר. הוא ינוע מימין לשמאל מעל טקסט עברי, ויהפוך את הכיוון מעל ספרות או גופנים לועזיים. תנועה זו נקראת תנועה לוגית.

אם נחליף את תקן העבודה מתקן ויזואלי לתקן לוגי (תקן windows-1255), נוכל לכתוב את האתר בכתב ישר (ולא הפוך כמו בויזואלי), והדפדפן ידע להציגו נכון על המסך.

שיטת הקידוד הלוגי, גם אינה מגדירה את סוג הגופן, וניתן להשתמש בה בכל הגופנים הרגילים המותקנים במחשב. לשיטה זו יתרונות רבים ולצידם גם חסרונות.

יתרונות השיטה הלוגית

 ·          ניתן להשתמש בכל סוגי הגופנים.

 ·          אין צורך להפוך את כיוון הכתיבה – מה שמאפשר לגולש להעתיק מאמרים שלמים מהאתר אל מעבד התמלילים ללא בעיות היפוך טקסט.

חסרונות השיטה הלוגית

 ·          מחייבת המצאות הגופנים במחשב של הגולש ותוכנת הפעלה התומכת בעברית. זוהי מגבלה למי שמעוניין שאתרו יקרא בחו"ל, או לגולשים תחת דפדפן נטסקייפ.

 ·          הדפדפן מבלבל בין סימנים אוניברסאליים של עברית ולועזית (פסיק, נקודה, גרשיים וכו'). התוצאה היא, שמבנה המשפט עלול להתבלבל והתוצאה בלתי קריאה.

שיטת מיקרוסופט לתמיכה בעברית.

שיטת מיקרוסופט נשענת על השיטה הלוגית (ואותו תקן) תוך מתן פתרון לבעית הפיסוק ואף מעבר לכך, התאמת הדף כולו לאוריינטציה של "ימין לשמאל".

מיקרוסופט הוסיפה תכונה חשובה ל HTML. תכונת DIR (קיצור למילה Direction – כיוון). תכונת Dir מגדירה את תחילת האזור המוגדר "ימין לשמאל" באמצעות הערך RTL – "Right To Left", או בכיוון בהפוך באמצעות הערך LTR – "Left To Right", ומכילה בתוכו את כל האלמנטים, כולל סימני הפיסוק. לתכונה זו כח רב:

התג <font dir=rtl> - פותח אזור בו כיוון הטקסט הוא מימין לשמאל.

התג <P dir=rtl> - מגדיר פיסקה מיושרת לימין, שהטקסט בה הוא בכיוון ימין לשמאל. ניתן כמובן להוסיף לתג גם תכונת Align ליישור אחר.

התג <Div dir=rtl> - מגדיר קטע שלם המיושר לימין, ואשר הטקסט שבו הוא בכיוון ימין לשמאל.

התג <Table dir=rtl> - מגדיר את הטבלה כטבלה עברית. התג TD הראשון הוא התא הימני!!.

התג <Body dir=rtl> - מגדיר את הדף כולו כדף עברי שבו כל האלמנטים מיוחסים לימין.

כך ניתן להוסיף תכונה זו גם לרשימות מוסדרות או לא ועוד.

חסרונות שיטת Windows

 ·          הצורך בתכנה או דפדפן התומכים בעברית.

 ·          אי הידיעה, אם הגופנים בהם השתמש בונה האתר, קיימים אצל הגולש, ואם לאו, איך יראה האתר במחשב כזה.

הגדרת הקידוד בעת הטענת הדף

דפדפנים חדישים יודעים לזהות לעיתים את סוג הקידוד ללא כל קושי. דף עברי שנכתב בקידוד מיקרוסופט (כולל פקודות Dir) יוצג כהלכה גם אם הדפדפן מוצב על קידוד Visual. ובכל זאת, יש צורך לציין את הקידוד בטרם יִטַּעֵן הדף, על מנת שהדפדפן יתאים עצמו לקידוד המתאים. הודעה זו מבוצעת באמצעות פקודת תג Meta (לחץ/י כדי לעבור לפרק בנושא פקודות Meta). להלן פקודה לקידוד של עברית ויזואלית:

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ISO-8859-8">

הפקודה לקידוד עברית לוגית (או מיקרוסופט) היא:

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1255”>