random c code sample
[unicode-sampler.git] / unicode.txt
index 4363f27bd5ccf7c73a313316183de86554a60355..cf94db3f0b948f4674a9b557c900ae7b35418b85 100644 (file)
@@ -1,15 +1,21 @@
+Unicode sampler
+‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Test support of various text encoded with Unicode up to version 8.0 (2015).
 
 
-UTF-8 encoded sample plain-text file
-‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
+Based on file by Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/>
+Updated by Mischa Poslawsky <http://shiar.nl/> 2015-08-19
 
 
-Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
+Code:
 
 
+  <html><pre><span class=""><!-- H&#x54;M --></span>
 
 
-The ASCII compatible UTF-8 encoding used in this plain-text file
-is defined in Unicode, ISO 10646-1, and RFC 2279.
+  Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" }
 
 
+  while ((c = *l++) != '\0') { m->stat[2] = IO | (~OK & X_8); }
 
 
-Using Unicode/UTF-8, you can write in emails and source code things such as
+  perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge'
+
+  ↑1 ⍵∨.∧3 4=+/,¯1 0 1∘.⊖¯1 0 1⌽¨⊂⍵ ⍝ game of life
 
 Mathematics and sciences:
 
 
 Mathematics and sciences:
 
@@ -21,44 +27,81 @@ Mathematics and sciences:
                                             ⎪⎢⎜ ∞     ⎟⎥⎪
   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
                                             ⎪⎢⎜ ∞     ⎟⎥⎪
   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
-  2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
+  2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 µm     ⎩⎣⎝i=1    ⎠⎦⎭
+
+  ⒶⒷⒸ 𝐀𝐁𝐂 𝐴𝐵𝐶 𝑨𝑩𝑪 𝒜ℬ𝒞 𝓐𝓑𝓒 𝔄𝔅ℭ 𝔸𝔹ℂ 𝕬𝕭𝕮 𝖠𝖡𝖢 𝗔𝗕𝗖 𝘈𝘉𝘊 𝘼𝘽𝘾 𝙰𝙱𝙲 🅰🅱🆎
+
+Compact font overview:
+
+  ╔═══════════════════════════════════════════════════════════════╗
+  ║ _ABCDEFGHIJKLMNOPQRSTUVWXYZ ÅĀČẾƏṆÞß ΑΒΓΔΩὮ АБВГДЯ ԱႠא $€     ║
+  ║ @abcdefghijklmnopqrstuvwxyz åāčếəṇþſ αβγδωὦ абвгдя աაا ¥£     ║
+  ║ [-0123456789] !¿?#%‰&©/*•† (.:;,…) {'"|“’”} +×=≠½²∈∞ ↗┌╁╖░☺ � ║
+  ╚═══════════════════════════════════════════════════════════════╝
+
+English panphone (traditional, IPA, Shavian, Braille):
+
+  Just as the French queen looked for it, she heard that symphony again.
+  A beige hue on the waters of the loch impressed all, including young Arthur.
+
+  ʤʌst æz ðə fɹɛnʧ kʍin lʊkt fɔɹ ɪ̈t | ʃi ɦɝd ðat ˈsɪɱfəni əˈɟɛɪ̯n
+  ə beʒ çʉ ɒn ðə ˈwɔtɚz əv ðə lɒχ ɪmˈpɹɛst ʔɔːɫ | ɪŋˈkludɨŋ jʌŋ ˈɑɹθɚ
+
+  𐑡𐑳𐑕𐑑 𐑨𐑟 𐑞 𐑓𐑮𐑧𐑯𐑗 𐑒𐑢𐑰𐑯 𐑤𐑫𐑒𐑑 𐑓 𐑦𐑑, 𐑖𐑰 𐑣𐑻𐑛 𐑞𐑨𐑑 𐑕𐑦𐑥𐑓𐑩𐑯𐑰 𐑩𐑜𐑧𐑯.
+  𐑩 𐑚𐑱𐑠 𐑣𐑿 𐑪𐑯 𐑞 𐑢𐑶𐑑𐑼𐑟 𐑝 𐑞 𐑤𐑪𐑒 𐑦𐑥𐑐𐑮𐑧𐑕𐑑 𐑷𐑤, 𐑦𐑙𐑒𐑤𐑵𐑛𐑦𐑙 𐑘𐑳𐑙 ·𐑸𐑔𐑻.
+
+  ⠠⠚⠀⠵⠀⠮⠀⠠⠋⠗⠢⠡⠀⠟⠥⠑⠢⠀⠇⠕⠕⠅⠫⠀⠿⠀⠭⠂⠀⠩⠑⠀⠓⠑⠜⠙⠀⠞⠀⠎⠽⠍⠏⠓⠕⠝⠽⠀⠁⠛⠲
+  ⠠⠁⠀⠃⠑⠊⠛⠑⠀⠓⠥⠑⠀⠕⠝⠀⠮⠀⠺⠁⠞⠻⠎⠀⠷⠀⠮⠀⠇⠕⠡⠀⠊⠍⠏⠗⠑⠎⠎⠫⠀⠁⠇⠇⠂⠀⠔⠉⠇⠥⠙⠬⠀⠐⠽⠀⠠⠜⠹⠥⠗⠲
+
+Ænglisc:
 
 
-Linguistics and dictionaries:
+  ᚻᛖ᛫ᚳᚹᚫᚦ᛫ᚦᚫᛏ᛫ᚻᛖ᛫ᛒᚢᛞᛖ᛫ᚩᚾ᛫ᚦᚫᛗ᛫ᛚᚪᚾᛞᛖ᛫ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ᛫ᚹᛁᚦ᛫ᚦᚪ᛫ᚹᛖᛥᚫ᛬
+  Hē cƿæð þæt hē būde on þǣm lande norðƿeardum ƿið þā Ƿestſǣ.
+  He said that he lived in the northern land near the Western Sea.
 
 
-  ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn
-  Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ]
+Proper typography:
 
 
-APL:
+  • Lookalikes: 1lI|, 0OD, 8B, 2Z, 5S$
+  • “It’s ‘quoted’”, „deutsche ‚Gänsefüßchen‘“, « guillemets ‹comme ci› »
+  • u + ¨ + ´ = ǘ, o + ~ + ¯ = ȭ, e + ^ + ` = ề
+  • ‰, •, 3–4, —, −5/+5, ™, €1, …
+  • ⒈ ♙e4 ♟e5 ⒉ f4 e×f4 ⒊ ♗c4 ♛h4† ⒋ ♔f1 b5⁈ ⒌ ♗×b5 ♞f6 ⒍ ♘f3 ♛h6 … 2⒊ ♗e7‡
 
 
-  ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
+Precomposed and combining diacritics:
 
 
-Nicer typography in plain text files:
+  Četri psihi faķīri vēlu vakarā zāģēja guļbūvei durvis, fonā šņācot mežam.
+  Četri psihi fak̦īri vēlu vakarā zāg̓ēja gul̦būvei durvis, fonā šn̦ācot mežam.
 
 
-  ╔══════════════════════════════════════════╗
-  ║                                          ║
-  ║   • ‘single’ and “double” quotes         ║
-  ║                                          ║
-  ║   • Curly apostrophes: “We’ve been here” ║
-  ║                                          ║
-  ║   • Latin-1 apostrophe and accents: '´`  ║
-  ║                                          ║
-  ║   • ‚deutsche‘ „Anführungszeichen“       ║
-  ║                                          ║
-  ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
-  ║                                          ║
-  ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
-  ║                      ╭─────────╮         ║
-  ║   • the euro symbol: │ 14.95 € │         ║
-  ║                      ╰─────────╯         ║
-  ╚══════════════════════════════════════════╝
+  STARGɅ̊TE, a = v̇ = r̈, a⃑ ⊥ b⃑
 
 
-Combining characters:
+Pangrams:
 
 
-  STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
+  cz: Příliš žluťoučký kůň úpěl ďábelské ódy.
+  eo: Ĉeĥa ĉiuliteraĵo ŝajne kontraŭĉapeliĝis.  (ϗ eĥoŝanĝº ĉiĵaŭde)
+  fr: Le cœur déçu mais l'âme plutôt naïve, Louÿs rêva de crapaüter en
+      canoë au delà des îles, près du mälström où brûlent les novæ.
+  hu: Új, „Exvőd = fél pár” című show közügy Quitóban.
+  ig: Ṅụrịanụ, gbakọọnụ kpaa, kwee ya k’o-guzoshie ike; ọ ghaghị ito.
+  ir: Ċuaiġ bé ṁórṡáċ le dlúṫspád fíorḟinn trí hata mo ḋea-ṗorcáin ḃig, ⁊ꞃl.
+  is: Sævör grét áðan því úlpan var ónýt.
+  lv: Glāžšķūņa rūķīši dzērumā čiepj Baha koncertflīģeļu vākus.
+  naq: ǂKam ǃũi-aob gye ǁẽib di gūna ǃhomi ǃna gye ǃũi hã i.
+  nl: Wijf lokt u cq 'r pa dmv 'n zg sexy bh. (af: én ʼn kwêvoëltjie)
+  pl: Pchnąć w tę łódź jeża lub ośm skrzyń fig. (Zażółć gęślą jaźń)
+  ro: Muzicologă în bej vând whisky și tequila, preț fix.
+  se: Vuol Ruoŧa geđggiid leat máŋga luosa ja čuovžža.
+  sk: Starý kôň na hŕbe kníh žuje tíško povädnuté ruže,
+      na stĺpe sa ďateľ učí kvákať novú ódu o živote.
+  tr: PİJAMALİ HASTA, yağız şoföre çabucak güvendi.
+  vt: Do bạch kim rất quý, sẽ để lắp vô xương.
+  yo: Ìwò̩fà ń yò̩ séji tó gbojúmó̩, ó hàn pákànpò̩ gan-an nis̩é̩ rè̩ bó dò̩la.
 
 
-Greek (in Polytonic):
+German ligatures:
 
 
-  The Greek anthem:
+  Im finſteren Jagdſchloß am offenen Felsquellwaſſer patzte der affig‐flatterhafte
+  kauzig‐höfliche Bäcker über ſeinem verſifften kniffligen C‐Xylophon.
+
+Greek (Polytonic):
 
   Σὲ γνωρίζω ἀπὸ τὴν κόψη
   τοῦ σπαθιοῦ τὴν τρομερή,
 
   Σὲ γνωρίζω ἀπὸ τὴν κόψη
   τοῦ σπαθιοῦ τὴν τρομερή,
@@ -70,8 +113,6 @@ Greek (in Polytonic):
   καὶ σὰν πρῶτα ἀνδρειωμένη
   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
 
   καὶ σὰν πρῶτα ἀνδρειωμένη
   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
 
-  From a speech of Demosthenes in the 4th century BC:
-
   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
@@ -88,25 +129,18 @@ Greek (in Polytonic):
   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
-
-  Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
+                                  Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
 
 Georgian:
 
 
 Georgian:
 
-  From a Unicode conference invitation:
+  ვეფხისტყაოსანი (Veṗxis Ṭq̇aosani) შოთა რუსთაველი (დაახ. 1165)
 
 
-  გთხოვთ ახლავე გაიაროთ რეგისტრაცია Unicode-ის მეათე საერთაშორისო
-  კონფერენციაზე დასასწრებად, რომელიც გაიმართება 10-12 მარტს,
-  ქ. მაინცში, გერმანიაში. კონფერენცია შეჰკრებს ერთად მსოფლიოს
-  ექსპერტებს ისეთ დარგებში როგორიცაა ინტერნეტი და Unicode-ი,
-  ინტერნაციონალიზაცია და ლოკალიზაცია, Unicode-ის გამოყენება
-  ოპერაციულ სისტემებსა, და გამოყენებით პროგრამებში, შრიფტებში,
-  ტექსტების დამუშავებასა და მრავალენოვან კომპიუტერულ სისტემებში.
+  ღმერთსი შემვედრე, ნუთუ კვლა დამხსნას სოფლისა შრომასა, ცეცხლს, წყალსა და
+  მიწასა, ჰაერთა თანა მრომასა; მომცნეს ფრთენი და აღვფრინდე, მივჰხვდე მას
+  ჩემსა ნდომასა, დღისით და ღამით ვჰხედვიდე მზისა ელვათა კრთომაასა.
 
 Russian:
 
 
 Russian:
 
-  From a Unicode conference invitation:
-
   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
   Конференция соберет широкий круг экспертов по  вопросам глобального
   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
   Конференция соберет широкий круг экспертов по  вопросам глобального
@@ -114,12 +148,39 @@ Russian:
   применению Unicode в различных операционных системах и программных
   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
 
   применению Unicode в различных операционных системах и программных
   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
 
-Thai (UCS Level 2):
+Sakha (Yakut) Declaration of Rights:
 
 
-  Excerpt from a poetry on The Romance of The Three Kingdoms (a Chinese
-  classic 'San Gua'):
+  Дьон барыта бэйэ суолтатыгар уонна быраабыгар тэҥ буолан төрүүллэр.
+  Кинилэр бары өркөн өйдөөх, суобастаах буолан төрүүллэр, уонна бэйэ
+  бэйэлэригэр тылга кииринигэс быһыылара доҕордоһуу тыыннаах буолуохтаах.
+
+Kazakh equivalents:
+
+  Барлық адамдар тумысынан азат және қадір-қасиеті мен кұқықтары тең болып
+  дүниеге келеді. Адамдарға ақыл-парасат, ар-ождан берілген, сондықтан олар
+  бір-бірімен туыстық, бауырмалдық қарым-қатынас жасаулары тиіс.
+
+  بارلىق ادامدار تۋمىسىنان ازات جانە قادىر-قاسيەتى مەن كۇقىقتارى تەڭ بولىپ
+  دۇنيەگە كەلەدى. ادامدارعا اقىل-پاراسات, ار-وجدان بەرىلگەن, سوندىقتان ولار
+  ءبىر-بىرىمەن تۋىستىق, باۋىرمالدىق قارىم-قاتىناس جاساۋلارى ءتيىس.
+
+Hebrew:
+
+  כאשר העולם רוצה לדבר, הוא מדבר ב־Unicode. הירשמו כעת לכנס Unicode
+  הבינלאומי העשירי, שייערך בין התאריכים 12־10 במרץ 1997, בְּמָיְינְץ שבגרמניה.
+
+Hindi:
+
+  हालाँकि सूर के जीवन के बारे में कई जनश्रुतियाँ प्रचलित
+  हैं, पर इन में कितनी सच्चाई है यह कहना कठिन है।
+  कहा जाता है उनका जन्म सन् १४७८
+  में दिल्ली के पास एक ग़रीब ब्राह्मीण परिवार में हुआ।
+  जनश्रुति के अनुसार सूरदास जन्म से ही अंधे थे। आजकल थी
+  अंधे आदमी अक्सर 'सूरदास' कहलाते हैं। कई लोगों ने उन्हें गुरु के
+  रूप में अपनाया और उनकी पूजा करना शुरु कर दिया ।
+
+Thai (UCS Level 2):
 
 
-  [----------------------------|------------------------]
     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
@@ -128,14 +189,27 @@ Thai (UCS Level 2):
   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
+  [----------------------------|------------------------]
+   (second column should align ⬏)
 
 
-  (The above is a two-column text. If combining characters are handled
-  correctly, the lines of the second column should be aligned with the
-  | character above.)
+Tamil poetry of Subramaniya Bharathiyar: சுப்ரமணிய பாரதியார் (1882-1921):
 
 
-Ethiopian:
+  யாமறிந்த மொழிகளிலே தமிழ்மொழி போல் இனிதாவது எங்கும் காணோம்,
+  பாமரராய் விலங்குகளாய், உலகனைத்தும் இகழ்ச்சிசொலப் பான்மை கெட்டு,
+  நாமமது தமிழரெனக் கொண்டு இங்கு வாழ்ந்திடுதல் நன்றோ? சொல்லீர்!
+  தேமதுரத் தமிழோசை உலகமெலாம் பரவும்வகை செய்தல் வேண்டும்.
+
+Kannada poetry by Kuvempu — ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು
+
+  ಬಾ ಇಲ್ಲಿ ಸಂಭವಿಸು ಇಂದೆನ್ನ ಹೃದಯದಲಿ
+  ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ
+
+  ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗೀ...
+  ಮಣ್ಣಾಗಿ ಮರವಾಗಿ ಮಿಗವಾಗಿ ಕಗವಾಗಿ
+  ಭವ ಭವದಿ ಭತಿಸಿಹೇ ಭವತಿ ದೂರ
+  ನಿತ್ಯವೂ ಅವತರಿಪ ಸತ್ಯಾವತಾರ || ಬಾ ಇಲ್ಲಿ ||
 
 
-  Proverbs in the Amharic language:
+Ethiopian:
 
   ሰማይ አይታረስ ንጉሥ አይከሰስ።
   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
 
   ሰማይ አይታረስ ንጉሥ አይከሰስ።
   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
@@ -156,57 +230,91 @@ Ethiopian:
   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
   እግርህን በፍራሽህ ልክ ዘርጋ።
 
   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
   እግርህን በፍራሽህ ልክ ዘርጋ።
 
-Runes:
+Tibetan Declaration of Rights:
+
+  ༄༅༎ ཡོངས་ཁྱབ་གསལ་བསྒྲགས་འགྲོ་བ་མིའི་ཐོབ་ཐང༌། ཕྱི་ལོ་༡༩༤༨ ལོའི་ཟླ་༡༢་ཚེས་༡༠ཉིན།
+  འགྲོ་བ་མིའི་རིགས་རྒྱུད་ཡོངས་ལ་སྐྱེས་ཙམ་ཉིད་ནས་ཆེ་མཐོངས་དང༌། ཐོབ་ཐངགི་རང་དབང་འདྲ་མཉམ་དུ་ཡོད་ལ།
+  ཁོང་ཚོར་རང་བྱུང་གི་བློ་རྩལ་དང་བསམ་ཚུལ་བཟང་པོ་འདོན་པའི་འོས་བབས་ཀྱང་ཡོད།
+  དེ་བཞིན་ཕན་ཚུན་གཅིག་གིས་གཅིག་ལ་བུ་སྤུན་གྱི་འདུ་ཤེས་འཛིན་པའི་བྱ་སྤྱོད་ཀྱང་ལག་ལེན་བསྟར་དགོས་པ་ཡིན༎
+
+Korean pangram:
+
+  “웬 초콜릿? 제가 원했던 건 뻥튀기 쬐끔과 의류예요.” “얘야, 왜 또 불평?”
+  “웬 초콜릿? 제가 원했던 건 뻥튀기 쬐끔과 의류예요.” “얘야, 왜 또 불평?”
+  “ᅰᄂ 초코리ᄉ? 제가 ᅯᄂ해ᄊ더ᄂ 거ᄂ 뻐ᄋ튀기 쬐끄ᄆ과 ᅴ류ᅨᅭ.” “ᅤᅣ, ᅫ 또 부ᄅ펴ᄋ?”
+  “ㅞㄴ ㅊㅗㅋㅗㄹㅣㅅ? ㅈㅔㄱㅏ ㅝㄴㅎㅐㅆㄷㅓㄴ ㄱㅓㄴ ㅃㅓㅇㅌㅟㄱㅣ
+   ㅉㅚㄲㅡㅁㄱㅘ ㅢㄹㅠㅖㅛ.” “ㅒㅑ, ㅙ ㄸㅗ ㅂㅜㄹㅍㅕㅇ?”
+
+Korean 훈민정음:
+
+  Modern korean hangeul:
+  나라말이 중국과 달라, 문자끼리 서로 맞지 아니할세.
+  이런 전차(이유)로 어린(어리석은) 백성이 이르고자 할 바 있어도
+  마침내 제 뜻을 실히 펴지 못할 놈이 하니라(많으니라).
+  내 이를 위하여 어여삐 여겨 새로 28 자를 만드노니
+  모든 사람으로 하여금 쉬이 익혀 날로 씀에 편안케 하고자 할 따름이니라.
+
+  Original Korean hangeul (separate jamo):
+  나랏말ᄊᆞ미 中듀ᇰ國귁에 달아 文문字ᄍᆞᆼ와로 서르 ᄉᆞᄆᆞᆺ디 아니ᄒᆞᆯᄊᆡ
+  이런 젼ᄎᆞ로 어린 百ᄇᆡᆨ姓셔ᇰ이 니르고져 호ᇙ배 이셔도
+  ᄆᆞᄎᆞᆷ내 제 ᄠᅳ들 시러 펴디 몯ᄒᆞᇙ 노미 하니라
+  내 이ᄅᆞᆯ 爲윙ᄒᆞ야 어엿비 너겨 새로 스믈여듧 字ᄍᆞᆼᄅᆞᆯ ᄆᆡᇰᄀᆞ노니
+  사ᄅᆞᆷ마다 ᄒᆡᅇᅧ 수ᄫᅵ 니겨 날로 ᄡᅮ메 便뼌安ᅙᅡᆫ킈 ᄒᆞ고져 ᄒᆞᇙ ᄯᆞᄅᆞ미니라
+
+  Last line in mixed hanja/hangeul:
+  欲·욕使:ᄉᆞᆼ人ᅀᅵᆫ人ᅀᅵᆫ·ᄋᆞ·로 易·잉習·씹·ᄒᆞ·야 便뼌於ᅙᅥᆼ日·ᅀᅵᇙ用·요ᇰ耳:ᅀᅵᆼ니·라
+
+  Original Chinese hanja:
+  國之語音 異乎中國 與文字不相流通 故愚民 有所欲言 而終不得伸其情者 多矣
+  予 為此憫然 新制二十八字 欲使人人易習 便於日用矣(耳)。
+
+Japanese Iroha いろは:
 
 
-  ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
+  kanji 漢字   hirag. ひらがな  katak. カタカナ  半角 カタカナ  man'yōg. 万葉仮名
 
 
-  (Old English, which transcribed into Latin reads 'He cwaeth that he
-  bude thaem lande northweardum with tha Westsae.' and means 'He said
-  that he lived in the northern land near the Western Sea.')
+  色は匂へど   いろはにほへと   イロハニホヘド   イロハニホヘド   以呂波耳本部止
+  散りぬるを   ちりぬるを     チリヌルヲ     チリヌルヲ      千利奴流乎
+  我が世誰ぞ   わかよたれそ    ワガヨタレソ    ワガヨタレソ    和加餘多連曽
+  常ならん    つねならむ     ツネナラム     ツネナラム      津祢那良牟
+  有為の奥山   うゐのおくやま   ウヰノオクヤマ   ウウィノオクヤマ   有為能於久耶万
+  今日越えて   けふこえて     ケフコエテ     ケフコエテ      計不己衣天
+  浅き夢見じ   あさきゆめみし   アサキユメミジ   アサキユメミジ   阿佐伎喩女美之
+  酔ひもせず   ゑひもせす     ヱヒモセズン    ウェヒモセズン   恵比毛勢須
 
 
-Braille:
+Chinese:
 
 
-  ⡌⠁⠧⠑ ⠼⠁⠒  ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌
+  Most common characters:
 
 
-  ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞
-  ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎
-  ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂
-  ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙
-  ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑
-  ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲
+  的一是不了在人有我他这个们中来上大为和国地到以说时
+  要就出会可也你对生能而子那得于着下自之年过发后作里
 
 
-  ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
+  Transliteration test:
 
 
-  ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹
-  ⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞
-  ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕
-  ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹
-  ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎
-  ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎
-  ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳
-  ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞
-  ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
+  女 (ㄋㄩˇ nǚ /ny˨˩˦/) • 律 (ㄌㄩˋ lǜ /ly˥˩/) • 驢/驴 (ㄌㄩˊ lǘ /ly˧˥/)
 
 
-  (The first couple of paragraphs of "A Christmas Carol" by Dickens)
+  Extension blocks:
 
 
-Compact font selection example text:
+  A㡛㬐㖧䵍 B𣚣𤶅𪘆𦞕 C𪢨𪪖𫔺𫜴 D𫝀𫞂𫝻𫠝 E𫠫𬚚𬳕𬺡
 
 
-  ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
-  abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
-  –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
-  ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
+  Qiān zì wén 千字文 by Xing Si Zhou:
 
 
-Greetings in various languages:
+  天地玄黃宇宙洪荒 日月盈昃辰宿列張 寒來暑往秋收冬藏
+  閏餘成歲律召調陽 雲騰致雨露結為霜 金生麗水玉出崑崗
+  劍號巨闕珠稱夜光 果珍李柰菜重芥薑 海鹹河淡鱗潛羽翔
 
 
-  Hello world, Καλημέρα κόσμε, コンニチハ
+Box drawing alignment tests:
 
 
-Box drawing alignment tests:                                          █
-                                                                      ▉
-  ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
-  ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
-  ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
-  ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
-  ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
-  ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
-  ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
-                                               ▝▀▘▙▄▟
+  ┌┬───╥┐  ╒══╤══╕  ┏━━┳━━┓  ┎┒┏┑ ╻╷  ┌╌╌┄┄┈┒  ▏   ▁▂▃▄▅▆▇█▓▓▒▒░░
+  ├┼───╫┤  │╓─┴─╖│  ┃┌─╂─┐┃  ┗╃╄┙╺╇╈╸ ╎▛▀▀▀▜┋  ▎  ⎺⎻─⎼⎽
+  ││╔╦╗║│  │║╭─╮║│  ┃│╲╿╱│┃  ┍╅╆┓╶╁╀╴ ╎▌▗▄▖▐┇  ▍   ▁  ↔  ▁
+  ││╠╬╣║│  ├╢│ │╟┤  ┣┿╾╳╼┿┫  ┕┛┖┚ ╹╵  ┆▌▐ ▌▐┇  ▌   ▕←⎯⎯⎯→▏
+  ││╚╩╝║│  │║╰─╯║│  ┃│╱╽╲│┃  ┏┯┓ ┌┰┐  ┆▌▝▀▘▐╏  ▋   ▔↖ ↑ ↗▔
+  ╞╪═══╬╡  │╙─┬─╜│  ┃└─╂─┘┃  ┠┼┨ ┝╋┥  ┊▙▄▄▄▟╏  ▊   ⇐  ⏐↕ ⇒
+  └┴───╨┘  ╘══╧══╛  ┗━━┻━━┛  ┗┷┛ └┸┘  ┕┉┅┅╍╍┛  ▉    ↙ ↓ ↘     ▗▄▖▄▖
+                                               █            ▐▄▞▀▐▚▗▘
+                     ▄█▄ █▄      ▄                          ▗▛▛▀▀▀▛▙
+   ▄█▀█▓ ▄▓▀▀█▀ ▀▀▀█▓▀▀ ▀▀   ▄█▀█▓▀▀▀▀▀▓▄▀██▀▀   (\__/)      ▞▌▛▀▌▌▜
+  ██  ██ ▀██▄▄ ▄█  ▀ ░▒ ░▒  ██  ██ ▄█▄ █▀ ██     (=’.’=)    ▐▜▌▌▘▌▛▙
+  █▓▄▀██  ▄ ▀█▌▓█    ▒▓ ▒▓  █▓▄▀██ ▓█ ▀▄  █▓    ☆(”)_(”)☆   ▐▐▌▀▀▘█▖
+  █▒  █▓ ██▄▓▀ ▀█▄▄█▄▓█ ▓█  █▒  █▓ ▒█  ▓█▄ ▒                ▗ ▀▛▜▜▀▘
+      ▀▒           ▀  ▀ █▀      ▀▒  █  █▀  ░  ヽ༼。◕ ∀ ◕。༽ノ  ▝ ▗▞▖▗▘▗