+Unicode sampler
+‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Test support of various text encoded with Unicode up to version 8.0 (2015).
-UTF-8 encoded sample plain-text file
-‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Based on file by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
+Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
-Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
+Code:
+ <html><pre><span class=""><!-- HTM --></span>
-The ASCII compatible UTF-8 encoding used in this plain-text file
-is defined in Unicode, ISO 10646-1, and RFC 2279.
+ Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
+ perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
-Using Unicode/UTF-8, you can write in emails and source code things such as
+ ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
Mathematics and sciences:
⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm ⎩⎣⎝i=1 ⎠⎦⎭
-English panphone (traditional, IPA, Braille):
+Compact font overview:
+
+ ╔═══════════════════════════════════════════════════════════════╗
+ ║ _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏṆÞß ΑΒΓΔΩὮ АБВГДЯ ԱႠא $€ ║
+ ║ @abcdefghijklmnopqrstuvwxyz åāčếəṇþſ αβγδωὦ абвгдя աაا ¥£ ║
+ ║ [-0123456789] !¿?#%‰&©/*•† (.:;,…) {'"|“’”} +×=≠½²∈∞ ↗┌╁╖░☺ � ║
+ ╚═══════════════════════════════════════════════════════════════╝
+
+English panphone (traditional, IPA, Shavian, Braille):
Just as the French queen looked for it, she heard that symphony again.
A beige hue on the waters of the loch impressed all, including young Arthur.
ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
- ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠑⠝⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
+ 𐑡𐑳𐑕𐑑 𐑨𐑟 𐑞 𐑓𐑮𐑧𐑯𐑗 𐑒𐑢𐑰𐑯 𐑤𐑫𐑒𐑑 𐑓 𐑦𐑑, 𐑖𐑰 𐑣𐑻𐑛 𐑞𐑨𐑑 𐑕𐑦𐑥𐑓𐑩𐑯𐑰 𐑩𐑜𐑧𐑯.
+ 𐑩 𐑚𐑱𐑠 𐑣𐑿 𐑪𐑯 𐑞 𐑢𐑶𐑑𐑼𐑟 𐑝 𐑞 𐑤𐑪𐑒 𐑦𐑥𐑐𐑮𐑧𐑕𐑑 𐑷𐑤, 𐑦𐑙𐑒𐑤𐑵𐑛𐑦𐑙 𐑘𐑳𐑙 ·𐑸𐑔𐑻.
+
+ ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
-APL:
+Ænglisc:
+
+ ᚻᛖ᛫ᚳᚹᚫᚦ᛫ᚦᚫᛏ᛫ᚻᛖ᛫ᛒᚢᛞᛖ᛫ᚩᚾ᛫ᚦᚫᛗ᛫ᛚᚪᚾᛞᛖ᛫ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ᛫ᚹᛁᚦ᛫ᚦᚪ᛫ᚹᛖᛥᚫ᛬
+ Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
+ He said that he lived in the northern land near the Western Sea.
- ((V⍳V)=⍳⍴V)/V←,V ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
- ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
+Proper typography:
+
+ • ‘single’ and “double” quotes
+
+ • Curly apostrophes: “We’ve been here”
+
+ • Latin-1 apostrophe and accents: '´`
+
+ • ‚deutsche‘ „Anführungszeichen“
+
+ • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …
+
+ • ASCII safety test: 1lI|, 0OD, 8B
+ ╭─────────╮
+ • the euro symbol: │ 14.95 € │
+ ╰─────────╯
+
+Precomposed and combining diacritics:
+
+ Četri psihi faķīri vēlu vakarā zāģēja guļbūvei durvis, fonā šņācot mežam.
+ Četri psihi fak̦īri vēlu vakarā zāg̓ēja gul̦būvei durvis, fonā šn̦ācot mežam.
+
+ STARGΛ̊TE, a = v̇ = r̈, a⃑ ⊥ b⃑
+
+Pangrams:
+
+ cz: Příliš žluťoučký kůň úpěl ďábelské ódy.
+ eo: Ĉeĥa ĉiuliteraĵo ŝajne kontraŭĉapeliĝis. (ϗ eĥoŝanĝº ĉiĵaŭde)
+ fr: Le cœur déçu mais l'âme plutôt naïve, Louÿs rêva de crapaüter en
+ canoë au delà des îles, près du mälström où brûlent les novæ.
+ hu: Új, „Exvőd = fél pár” című show közügy Quitóban.
+ ig: Nne, nna, wepụ he’l’ụjọ dum n’ime ọzụzụ ụmụ, vufesi obi nye Chukwu,
+ ṅụrịanụ, gbakọọnụ kpaa, kwee ya ka o guzoshie ike; ọ ghaghị ito,
+ nwapụta ezi agwa.
+ ir: Ċuaiġ bé ṁórṡáċ le dlúṫspád fíorḟinn trí hata mo ḋea-ṗorcáin ḃig, ⁊ꞃl.
+ is: Sævör grét áðan því úlpan var ónýt.
+ lv: Glāžšķūņa rūķīši dzērumā čiepj Baha koncertflīģeļu vākus.
+ nl: Wijf lokt u cq 'r pa dmv 'n zg sexy bh. (af: én ʼn kwêvoëltjie)
+ pl: Pchnąć w tę łódź jeża lub ośm skrzyń fig. (Zażółć gęślą jaźń)
+ ro: Muzicologă în bej vând whisky și tequila, preț fix.
+ se: Vuol Ruoŧa geđggiid leat máŋga luosa ja čuovžža.
+ sk: Starý kôň na hŕbe kníh žuje tíško povädnuté ruže,
+ na stĺpe sa ďateľ učí kvákať novú ódu o živote.
+ tr: PİJAMALİ HASTA, yağız şoföre çabucak güvendi.
+ vt: Do bạch kim rất quý, sẽ để lắp vô xương.
+ yo: Ìwò̩fà ń yò̩ séji tó gbojúmó̩, ó hàn pákànpò̩ gan-an nis̩é̩ rè̩ bó dò̩la.
-Nicer typography in plain text files:
-
- ╔══════════════════════════════════════════╗
- ║ ║
- ║ • ‘single’ and “double” quotes ║
- ║ ║
- ║ • Curly apostrophes: “We’ve been here” ║
- ║ ║
- ║ • Latin-1 apostrophe and accents: '´` ║
- ║ ║
- ║ • ‚deutsche‘ „Anführungszeichen“ ║
- ║ ║
- ║ • †, ‡, ‰, •, 3–4, —, −5/+5, ™, … ║
- ║ ║
- ║ • ASCII safety test: 1lI|, 0OD, 8B ║
- ║ ╭─────────╮ ║
- ║ • the euro symbol: │ 14.95 € │ ║
- ║ ╰─────────╯ ║
- ╚══════════════════════════════════════════╝
-
-Combining characters:
-
- STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
+German ligatures:
+
+ Im finſteren Jagdſchloß am offenen Felsquellwaſſer patzte der affig‐flatterhafte
+ kauzig‐höfliche Bäcker über ſeinem verſifften kniffligen C‐Xylophon.
Greek (Polytonic):
применению Unicode в различных операционных системах и программных
приложениях, шрифтах, верстке и многоязычных компьютерных системах.
+Sakha (Yakut) Declaration of Rights:
+
+ Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
+ Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
+ бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
+
+Kazakh equivalents:
+
+ Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
+ дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
+ бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
+
+ بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
+ دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
+ ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
+
Hebrew:
כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
እግርህን በፍራሽህ ልክ ዘርጋ።
-Ænglisc:
-
- ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
-
- Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
- He said that he lived in the northern land near the Western Sea.
-
Tibetan Declaration of Rights:
༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
+Korean 훈민정음:
+
+ Modern korean hangeul:
+ 나라말이 중국과 달라, 문자끼리 서로 맞지 아니할세.
+ 이런 전차(이유)로 어린(어리석은) 백성이 이르고자 할 바 있어도
+ 마침내 제 뜻을 실히 펴지 못할 놈이 하니라(많으니라).
+ 내 이를 위하여 어여삐 여겨 새로 28 자를 만드노니
+ 모든 사람으로 하여금 쉬이 익혀 날로 씀에 편안케 하고자 할 따름이니라.
+
+ Original Chinese hanja:
+ 國之語音 異乎中國 與文字不相流通 故愚民 有所欲言 而終不得伸其情者 多矣
+ 予 為此憫然 新制二十八字 欲使人人易習 便於日用矣(耳)。
+
Japanese Iroha いろは:
kanji 漢字 hirag. ひらがな katak. カタカナ 半角 カタカナ man'yōg. 万葉仮名
閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
-Compact font selection example text:
-
- ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
- abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
- –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
- ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
-
-Greetings in various languages:
-
- Hello world, Καλημέρα κόσμε, コンニチハ
-
Box drawing alignment tests: █
▉
╔══╦══╗ ┌──┬──┐ ╭──┬──╮ ╭──┬──╮ ┏━━┳━━┓ ┎┒┏┑ ╷ ╻ ┏┯┓ ┌┰┐ ▊ ╱╲╱╲╳╳╳