Wikipedia:Flerspråksstöd (Sydasien)
Sydasiatiska skriftsystem används i vissa av Wikipedias artiklar för att återge bland annat namn på personer och platser samt citat på inhemska språk. De sydasiatiska skriftsystemen innefattar ett flertal olika skriftsystem som används i Indien, Sri Lanka, Bangladesh, Nepal och Bhutan varav merparten härstammar från den uråldriga brāhmī-skriften. De karaktäriseras av sina många komplexa ligaturer och diakriter.
Wikipedia använder teckenkodningen Unicode som har stöd för ett stort antal skriftsystem. För att kunna läsa och redigera text skriven med dessa skriftsystem behöver din dator ha stöd för Unicode och komplex textlayout samt ha lämpliga typsnitt installerade. Detta kan saknas i äldre operativsystem.
Befintligt stöd för komplex textlayout
redigeraModerna versioner av operativsystem som Microsoft Windows, OS X och Linux har redan välutvecklat stöd för komplex textlayout. För att ett skriftsystem ska kunna visas korrekt krävs det att det finns en uppsättning instruktioner som omvandlar Unicode-tecknen till glyfer och positioner. Åsikterna går dock isär om var dessa instruktioner ska lagras. I OpenType Layout, utvecklat av Microsoft och Adobe, är instruktionerna en del av själva standarden och finns inbakade i mjukvaran. I Apple Advanced Typography (AAT), tillgängligt på OS X, och SIL Graphite, tillgängligt för Windows och Linux, lagras instruktionerna istället i typsnitten.
OpenType är den mest etablerade standarden och också lättare att utveckla typsnitt för än de övriga. Den är samtidigt mindre flexibel då det inte finns något enkelt sätt att själv lägga till stöd för nya skriftsystem. Detta drabbar främst historiska och mer ovanliga skriftsystem som används av olika minoriteter. En lösning är att använda sig av mjukvara med stöd för Graphite. OS X stödjer OpenType sedan version 10.5 (Leopard) samtidigt som AAT gör det möjligt att stödja mer ovanliga skriftsystem.
Vissa datorprogram som exempelvis webbläsare använder andra layoutmotorer än de som tillhandahålls som standard av operativsystemet. Om du använder en textredigerare eller ordbehandlare för att skriva artikeltext, var då medveten om att dessa kan rendera texten annorlunda än webbläsaren.
Kontrollera befintligt stöd
redigeraMed följande tabell kan du jämföra en korrekt rendering av respektive skriftsystem med hur din dator renderar det.
Skriftsystem | Exempel | Språk | Land (delstat) | |
---|---|---|---|---|
Korrekt rendering | Din dator | |||
Bengalisk/assamesisk | ক + ি → কি | bengali, assamesiska, meitei | Bangladesh, Indien (Västbengalen, Assam, Tripura) | |
Devanagari | क + ि → कि | hindi, nepali m.fl. | Indien, Nepal | |
Gujarati | ક + િ → કિ | gujarati, kutchi | Indien (Gujarat) | |
Gurmukhi | ਕ + ਿ → ਕਿ | punjabi | Indien (Punjab) | |
Kannada (kanaresisk) | ಕ + ಿ → ಕಿ | kannada/kanaresiska | Indien (Karnataka) | |
Malayalam | ക + െ → കെ | malayalam | Indien (Kerala) | |
Oriya | କ + େ → କେ | oriya | Indien (Odisha) | |
Sinhala (singalesisk) | ඵ + ේ → ඵේ | sinhala/singalesiska | Sri Lanka | |
Tamilsk | க + ே → கே | tamil | Indien (Tamil Nadu), Sri Lanka | |
Telugu | య + ీ → యీ | telugu | Indien (Andhra Pradesh, Telangana) | |
Tibetansk | ར + ྐ + ྱ → རྐྱ | dzongkha, ladakhi, tibetanska | Bhutan, Tibet |
Även om ett skriftsystem visas korrekt så kan det fortfarande krävas ytterligare mjukvara för att kunna redigera den.
Unicode-typsnitt
redigeraTypsnitt med stöd för ett stort antal skriftsystem
redigeraTypsnitt | Licens | Beskrivning |
---|---|---|
Arial Unicode MS | Proprietär | Leveras med Windows och OS X och har stöd för de vanligaste sydasiatiska skriftsystemen. |
Everson Mono | Proprietär | Typsnitt med fast teckenbredd. |
GNU FreeFont | GPL | En sammanställning av ett antal olika typsnitt som släppts under fri mjukvarulicens. Målet är att stödja alla tecken i UCS. |
MPH 2B Damase | Okänd | Stödjer flera ovanliga skriftsystem, däribland buginesisk skrift, hanunó'o, kharoshthi, limbu, syloti nagri och tai le. På grund av fel och brister i typsnittet kommer inte alla tecken att visas korrekt. |
Noto | Apache | Typsnittsfamilj som tas fram på uppdrag av Google. Målet är att täcka samtliga skriftsystem som ingår i Unicode samt att de olika skriftsystemen ska kunna kombineras på ett tilltalande sätt. |
Quivira | Okänd | Stödjer ett stort antal skriftsystem. Målet är att stödja en betydande del av Unicode, dock ej CJK-logogram. Kan distribueras fritt men får ej modifieras. |
Arial Unicode (v 1.01) | Everson Mono (v 7.0.0) | Gnu Free Sans | GNU Free Serif | MPH 2B Damase (v 2) | Noto (2015-06-16) | |
---|---|---|---|---|---|---|
Bengalisk | √ | – | √ | √ | – | √ |
Brahmi | – | – | – | – | – | √ |
Devanagari | √ | – | √ | √ | – | √ |
Gujarati | √ | – | √ | – | – | √ |
Gurmukhi | √ | – | √ | √ | – | √ |
Kaithi | – | – | – | – | – | √ |
Kannada | √ | – | – | – | – | √ |
Kharosthi | – | – | – | – | √ | √ |
Lepcha | – | – | – | – | – | √ |
Limbu | – | – | – | – | √ | √ |
Malayalam | √ | – | – | √ | – | √ |
Mitei mayek | – | – | – | – | – | √ |
Ol chiki | – | – | – | – | – | √ |
Oriya | √ | – | – | – | – | √ |
Saurashtra | – | – | – | – | – | √ |
Sinhala | – | – | – | √ | – | √ |
Syloti nagri | – | – | – | – | √ | √ |
Tamilsk | √ | – | √ | √ | – | √ |
Tāna | – | √ | – | √ | √ | √ |
Telugu | √ | – | – | – | – | √ |
Tibetansk | √ | – | – | – | – | √ |
Typsnitt för enstaka skriftsystem
redigeraBrahmi
redigeraBrahmi (brāhmī) är ett historiskt skriftsystem som finns belagd från 300-talet f.v.t. och tros bygga på den arameiska skriften. Det användes för att skriva sakiska, tokhariska och prakrit. Med tiden spred den sig och ett stort antal lokala varianter uppstod. Det mest använda använda av dessa idag är devanagari.
- Noto Sans Brahmi (direktlänk)
Kaithi
redigeraKaithi (kaithī) användes förr i stor utsträckning i norra Indien men ersattes med tiden av andra skriftsystem.
- Noto Sans Kaithi (direktlänk)
Kharosthi
redigeraKharosthi (kharoṣṭhī) är ett historiskt skriftsystem som uppstod i nuvarande Afghanistan och Pakistan på 300-talet f.v.t. och skrevs från höger till vänster. Det användes för att skriva gandahari och sanskrit.
- MPH 2B Damase
- Noto Sans Kharoshthi (direktlänk)
Lepcha
redigeraLepcha används för att skriva språket med samma namn som talas i Nepal, Bhutan och de indiska delstaterna Sikkim och Västbengalen.
- Noto Sans Lepcha (direktlänk)
Limbu
redigeraLimbu används för att skriva språket med samma namn som talas i Nepal, Bhutan och de indiska delstaterna Sikkim och Västbengalen.
- MPH 2B Damase
- Noto Sans Limbu (direktlänk)
Mitei mayek
redigeraMitei mayek (även meetei mayek och meitei mayek) används för att skriva meitei, ett av de officiella språken i den Indiska delstaten Manipur.
- Eeyek Unicode – GPL-licens
- Noto Sans Meetei Mayek (direktlänk)
Korrekt rendering | Din dator |
---|---|
ꯃꯩꯇꯩ ꯃꯌꯦꯛ |
Ol chiki
redigeraOl chiki uppfanns 1925 för att skriva språket santali som talas i Indien, Bangladesh och Nepal. Det kallas därför även för santalialfabetet.
- Noto Sans Ol Chiki (direktlänk)
Korrekt rendering | Din dator |
---|---|
ᱜᱤᱫᱽᱨᱚᱹ |
Saurashtra
redigeraSaurashtra (saurāṣṭra) utvecklades i slutet av 1800-talet för att skriva språket med samma namn som talas i södra Indien. Det är dock få som behärskar skriftsystemet.
- Noto Sans Saurashtra (direktlänk)
- Pagul – GPL-licens.
Syloti nagri
redigeraSyloti nagri (silôṭi nagôri) används för att skriva språket syloti som talas i Indien och Bangladesh. Skriften är dock närmast utdöd och numera skrivs språket med bengalisk skrift.
- MPH 2B Damase
- Noto Syloti Nagri (direktlänk)
Tāna
redigeraTāna (också taana eller thaana) används för att skriva språket divehi som talas på Maldiverna.
- Noto Sans Thaana (direktlänk)
Korrekt rendering | Din dator |
---|---|
ތާނަ އަލިފުބާގެ ތަރުތީބު |
Windows XP
redigeraWindows Vista och Windows 7
redigeraWindows 8
redigeraMac OS X
redigeraInbyggt stöd:
- Mac OS X 10.3 och tidigare hade stöd för devanagari, gujarati och gurmukhi
- Mac OS X 10.4 lade till stöd för tamilsk skrift
- Mac OS X 10.5 lade till stöd för tibetansk skrift
- Mac OS X 10.7 lade till stöd för kannada, telugu, bengalisk/assamesisk skrift, malayalam, sinhala och oriya.
Visa sydasiatiska skriftsystem
redigeraDe flesta moderna program kommer redan att visa de vanligaste sydasiatiska skriftsystemen korrekt. Webbläsare som Safari, Chrome och Firefox kompletterar med sina egna textrenderare och klarar generellt av betydligt fler skriftsystem än de flesta andra program.
XenoType Technologies säljer ett antal AAT-kompatibla typsnitt och tillhörande tangentbordslayouter för mer ovanliga skriftsystem. Hemsidan har dock inte uppdaterats sedan 2010.
Skriva sydasiatiska skriftsystem
redigeraFör att lägga till fler tangentbordslayouter, öppna Systeminställningar, välj Tangentbord och fliken Inmatningskällor. De olika layouterna ligger ordnade efter språk men det går också att använda sökrutan för att söka på skriftsystemets namn. Devanagari hittas exempelvis under Hindi (och Nepalesiska). Kryssa i alternativet Visa inmatningsmeny i menyraden för att lätt kunna skifta mellan dem. Från denna meny kommer du även åt Tangentbordsvisning som visar ett virtuellt tangent med den aktuella layouten samt Teckenvisare som listar samtliga tillgängliga tecken för respektive skriftsystem. Den finns också tillgänglig under Redigera-menyn, här med namnet Emoji och symboler (tidigare Specialtecken). Genom att dubbelklicka på ett tecken i Teckenvisaren så skrivs det in i det aktiva fönstret.
Programmet Ukelele kan användas för att skapa egna tangentbordslayouter.
LipikaIME är en inmatningskälla som möjliggör fonetisk inmatning med latinska bokstäver av nio av de vanligaste indiska skriftsystemen. Flera olika transkriptionsstandarder stöds. Den kan även användas för att skriva de diakrit-försedda latinska bokstäver som används vid transkription av många sydasiatiska språk (exempelvis ā, ḍ, ṅ).
Linux
redigeraDebian-baserade distributioner
redigeraMetapaketet fonts-indic installerar typsnitt för följande skriftsystem: bengalisk/assamesisk, devanagari, gujarati, gurmukhi, kannada, malayalam, oriya, saurashtra, tamilsk och telugu.
apt-get install fonts-indic
Andra typsnittspaket:
- fonts-dzongkha – typsnitt för tibetansk skrift
- fonts-eeyek – typsnitt för mitei mayek
- fonts-noto – Googles typsnittsfamilj Noto
- ttf-freefont – typsnittsfamiljen GNU FreeFont
- ttf-lklug-sinhala – typsnitt för sinhala
Mjukvara:
- gucharmap – GNOME Character Map, Unicode-teckentabell med möjlighet att söka efter tecken baserat på namn eller kodpunkt. Kan även användas för att mata in text.
- florence – Florence Virtual Keyboard, virtuellt tangentbord som visar den aktuella tangentbordslayouten. Observera att programmet använder sig av det valda systemtypsnittet – om detta saknar ett visst tecken kommer det inte att visas på tangentbordet.
FreeBSD
redigeraPaketet fonts-indic installerar typsnitt för följande skriftsystem: bengalisk/assamesisk, devanagari, gujarati, gurmukhi, kannada, malayalam, oriya, tamilsk och telugu.
cd /usr/ports/x11-fonts/fonts-indic && make install clean
eller
pkg install fonts-indic
Andra typsnittspaket:
- freefont-ttf – GNU FreeFont
- kaputa – typsnitt för sinhala
- noto – Googles typsnittsfamilj Noto
Externa länkar
redigera- Alan Wood’s Unicode Resources – Information om att använda Unicode på internet. Testsidor för Unicode 6.3.0 och länkar till olika typsnitt. (engelska)
- Unicode Font Guide For Free/Libre Open Source Operating Systems – Listar typsnitt för en stor mängd olika skriftsystem med fokus på sådana som släppts under fri/öppen mjukvarulicens. (engelska)
- Wazu Japan's Gallery of Unicode Fonts – Galleri med över 1 200 typsnitt sorterade efter skriftsystem. Har inte uppdaterats sedan 2012. (engelska)
|