X-Git-Url: http://git.shiar.net/unicode-sampler.git/blobdiff_plain/1d1aec7d6dd1364c019ee777cf4ed9c5efee502e..00ecb9ac4e51715afa88326ca06fafb4e6282609:/unicode.txt?ds=inline
diff --git a/unicode.txt b/unicode.txt
index 186a3fa..9c0822f 100644
--- a/unicode.txt
+++ b/unicode.txt
@@ -1,15 +1,19 @@
+Unicode sampler
+â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾
+Test support of various text encoded with Unicode up to version 8.0 (2015).
-UTF-8 encoded sample plain-text file
-â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾â¾
+Based on text by Markus Kuhn
-The ASCII compatible UTF-8 encoding used in this plain-text file -is defined in Unicode, ISO 10646-1, and RFC 2279. + Hash[ :nbsp => 0O2_40 ].each {|name, cp| puts "#{name} is '#{cp.chr}'" } + perl -pe's/\w/$^=~$&>chop($^=$&.$^)?"@-":$&/ge' -Using Unicode/UTF-8, you can write in emails and source code things such as + â1 âµâ¨.â§3 4=+/,¯1 0 1â.â¯1 0 1â½Â¨ââµ â game of life Mathematics and sciences: @@ -23,14 +27,22 @@ Mathematics and sciences: âªâ¢â â³aâ±-bâ±ââ¥âª 2Hâ + Oâ â 2HâO, R = 4.7 kΩ, â 200 mm â©â£âi=1 â â¦â -Linguistics and dictionaries: +Compact font overview: - ði ıntÉËnæÊÉnÉl fÉËnÉtık ÉsoÊsiËeıÊn - Y [ËÊpsilÉn], Yen [jÉn], Yoga [ËjoËgÉ] + ABCDEFGHIJKLMNOPQRSTUVWXYZ à ÄÄẾÆá¹Ãà ÎÎÎÎΩὮ ÐÐÐÐÐЯ Ô±á × $⬠+ abcdefghijklmnopqrstuvwxyz Ã¥ÄÄếÉá¹Ã¾Å¿ αβγδÏὦ Ð°Ð±Ð²Ð³Ð´Ñ Õ¡áا ¥£ + -0123456789_ !¿?@#%/â°&©â *⢠(.:;â¦) '"|âââ +Ã=â ½²ââ âââââ⺠� -APL: +English panphone (traditional, IPA, Braille): - ((Vâ³V)=â³â´V)/Vâ,V â·ââ³ââ´ââââ¾âââ + Just as the French queen looked for it, she heard that symphony again. + A beige hue on the waters of the loch impressed all, including young Arthur. + + ʤÊst æz Ã°É fɹÉnʧ kÊin lÊkt fÉɹ ɪÌt | Êi ɦÉd ðat ËsɪɱfÉni ÉËÉÉɪ̯n + É beÊ Ã§Ê Én Ã°É ËwÉtÉz Év Ã°É lÉÏ ÉªmËpɹÉst ÊÉËÉ« | ɪÅËkludɨŠjÊÅ ËÉÉ¹Î¸É + + â â â â µâ â ®â â â â ⠢⠡â â â ¥â â ¢â â â â â â «â â ¿â â â â â ©â â â â â â â â â â â ½â â â â â â ½â â â â ² + â â â â â â â â â â â ¥â â â â â â ®â â ºâ â â »â â â ·â â ®â â â â ¡â â â â â â â â â «â â â â â â â â â â ¥â â ¬â â â ½â â â ⠹⠥â â ² Nicer typography in plain text files: @@ -56,6 +68,29 @@ Combining characters: STARGÎÌTE SG-1, a = vÌ = rÌ, aâ ⥠bâ +Pangrams: + + cz: PÅÃliÅ¡ žluÅ¥ouÄký kůŠúpÄl Äábelské ódy. + eo: ÄeÄ¥a Äiuliteraĵo Åajne kontraÅÄapeliÄis. (Ï eÄ¥oÅanĺ ÄiĵaÅde) + fr: Le cÅur déçu mais l'âme plutôt naïve, Louÿs rêva de crapaüter en + canoë au delà des îles, près du mälström où brûlent les novæ. + hu: Ãj, âExvÅd = fél párâ cÃmű show közügy Quitóban. + ig: Nne, nna, wepụ heâlâụjá» dum nâime á»zụzụ ụmụ, vufesi obi nye Chukwu, + Ṡụrá»anụ, gbaká»á»nụ kpaa, kwee ya ka o guzoshie ike; á» ghaghá» ito, + nwapụta ezi agwa. + ir: ÄuaiÄ¡ bé á¹Ã³rá¹¡Ã¡Ä le dlúṫspád fÃorá¸inn trà hata mo á¸ea-á¹orcáin á¸ig. + is: Sævör grét áðan þvà úlpan var ónýt. + lv: GlÄžšķūÅa rÅ«Ä·Ä«Å¡i dzÄrumÄ Äiepj Baha koncertflÄ«Ä£eļu vÄkus. + nl: Wijf lokt u cq 'r pa dmv Å zg sexy bh. + pl: PchnÄ Ä w tÄ Åódź jeża lub oÅm skrzyÅ fig. (ZażóÅÄ gÄÅlÄ jaźÅ) + ro: MuzicologÄ Ã®n bej vând whisky Èi tequila, preÈ fix. + se: Vuol Ruoŧa geÄggiid leat máÅga luosa ja Äuovžža. + sk: Starý kôŠna hÅbe knÃh žuje tÃÅ¡ko povädnuté ruže, + na stĺpe sa Äateľ uÄà kvákaÅ¥ novú ódu o živote. + tr: PÄ°JAMALÄ° HASTA, yaÄız Åoföre çabucak güvendi. + vt: Do bạch kim rất quý, sẽ Äá» lắp vô xÆ°Æ¡ng. + yo: Ãwò̩fà Šyò̩ séji tó gbojúmó̩, ó hà n pákà npò̩ gan-an nis̩é̩ rè̩ bó dò̩la. + Greek (Polytonic): Σὲ γνÏÏá½·Î¶Ï á¼Ïὸ Ïὴν κόÏη @@ -88,13 +123,11 @@ Greek (Polytonic): Georgian: - ááá®ááá áá®áááá ááááá áá á áááá¡á¢á ááªáá Unicode-áá¡ ááááá á¡ááá ááá¨áá áá¡á - áááá¤áá áááªáááá ááá¡áá¡á¬á áááá, á ááááá᪠áááááá áááá 10-12 ááá á¢á¡, - á¥. áááááªá¨á, ááá áááááá¨á. áááá¤áá áááªáá á¨áá°áá ááá¡ áá ááá áá¡áá¤áááá¡ - áá¥á¡ááá á¢ááá¡ áá¡áá ááá áááá¨á á áááá ááªáá ááá¢áá ááá¢á áá Unicode-á, - ááá¢áá áááªáááááááááªáá áá áááááááááªáá, Unicode-áá¡ ááááá§ááááá - áááá ááªáá£á á¡áá¡á¢ááááá¡á, áá ááááá§áááááá áá ááá ááááá¨á, á¨á áá¤á¢ááá¨á, - á¢áá¥á¡á¢áááá¡ áááá£á¨áááááá¡á áá áá áááááááááá áááááá£á¢áá á£á á¡áá¡á¢ááááá¨á. + ááá¤á®áá¡á¢á§ááá¡ááá (Veá¹xis ṬqÌaosani) á¨ááá á á£á¡áááááá (áááá®. 1165) + + á¦ááá áá¡á á¨áááááá á, áá£áᣠáááá áááá®á¡ááá¡ á¡áá¤ááá¡á á¨á áááá¡á, áªááªá®áá¡, á¬á§ááá¡á áá + ááá¬áá¡á, á°ááá áá áááá áá áááá¡á; ááááªááá¡ á¤á áááá áá áá¦áá¤á áááá, áááá°á®ááá ááá¡ + á©ááá¡á áááááá¡á, áá¦áá¡áá áá á¦áááá áá°á®áááááá áááá¡á áááááá áá áááááá¡á. Russian: @@ -105,6 +138,22 @@ Russian: пÑÐ¸Ð¼ÐµÐ½ÐµÐ½Ð¸Ñ Unicode в ÑазлиÑнÑÑ Ð¾Ð¿ÐµÑаÑионнÑÑ ÑиÑÑÐµÐ¼Ð°Ñ Ð¸ пÑогÑаммнÑÑ Ð¿ÑиложениÑÑ , ÑÑиÑÑÐ°Ñ , веÑÑÑке и многоÑзÑÑнÑÑ ÐºÐ¾Ð¼Ð¿ÑÑÑеÑнÑÑ ÑиÑÑÐµÐ¼Ð°Ñ . +Sakha (Yakut) Declaration of Rights: + + ÐÑон баÑÑÑа бÑÐ¹Ñ ÑÑолÑаÑÑÐ³Ð°Ñ Ñонна бÑÑаабÑÐ³Ð°Ñ ÑÑÒ¥ бÑолан ÑÓ©ÑүүллÑÑ. + ÐинилÑÑ Ð±Ð°ÑÑ Ó©Ñкөн Ó©Ð¹Ð´Ó©Ó©Ñ , ÑÑобаÑÑÐ°Ð°Ñ Ð±Ñолан ÑÓ©ÑүүллÑÑ, Ñонна бÑÐ¹Ñ + бÑйÑлÑÑигÑÑ ÑÑлга кииÑинигÑÑ Ð±ÑÒ»ÑÑлаÑа доÒоÑдоһÑÑ ÑÑÑÐ½Ð½Ð°Ð°Ñ Ð±ÑолÑÐ¾Ñ ÑÐ°Ð°Ñ . + +Kazakh equivalents: + + ÐаÑлÑÒ Ð°Ð´Ð°Ð¼Ð´Ð°Ñ ÑÑмÑÑÑнан Ð°Ð·Ð°Ñ Ð¶Óне ÒадÑÑ-ÒаÑиеÑÑ Ð¼ÐµÐ½ кұÒÑÒÑаÑÑ Ñең болÑп + дүниеге келедÑ. ÐдамдаÑÒа аÒÑл-паÑаÑаÑ, аÑ-ождан беÑÑлген, ÑондÑÒÑан Ð¾Ð»Ð°Ñ + бÑÑ-бÑÑÑмен ÑÑÑÑÑÑÒ, баÑÑÑмалдÑÒ ÒаÑÑм-ÒаÑÑÐ½Ð°Ñ Ð¶Ð°ÑаÑлаÑÑ ÑиÑÑ. + + بارÙÙ٠ادا٠دار تÛÙ ÙسÙÙا٠ازات جاÙÛ ÙادÙر-ÙاسÙÛت٠٠ÛÙ ÙÛÙÙÙتار٠تÛÚ Ø¨ÙÙÙÙ¾ + دÛÙÙÛÚ¯Û ÙÛÙÛدÙ. ادا٠دارعا اÙÙÙ-پاراسات, ار-Ùجدا٠بÛرÙÙÚ¯ÛÙ, سÙÙدÙÙتا٠ÙÙار + ءبÙر-بÙرÙÙ Û٠تÛÙستÙÙ, باÛÙر٠اÙدÙÙ ÙارÙÙ -ÙاتÙÙاس جاساÛÙار٠ءتÙÙس. + Hebrew: ××שר ××¢××× ×¨××¦× ×××ר, ××× ×××ר ×Ö¾Unicode. ××רש×× ×עת ××× ×¡ Unicode @@ -133,6 +182,23 @@ Thai (UCS Level 2): [----------------------------|------------------------] (second column should align â¬) +Tamil poetry of Subramaniya Bharathiyar: à®à¯à®ªà¯à®°à®®à®£à®¿à®¯ பாரதியார௠(1882-1921): + + யாமறிநà¯à®¤ à®®à¯à®´à®¿à®à®³à®¿à®²à¯ தமிழà¯à®®à¯à®´à®¿ பà¯à®²à¯ à®à®©à®¿à®¤à®¾à®µà®¤à¯ à®à®à¯à®à¯à®®à¯ à®à®¾à®£à¯à®®à¯, + பாமரராய௠விலà®à¯à®à¯à®à®³à®¾à®¯à¯, à®à®²à®à®©à¯à®¤à¯à®¤à¯à®®à¯ à®à®à®´à¯à®à¯à®à®¿à®à¯à®²à®ªà¯ பானà¯à®®à¯ à®à¯à®à¯à®à¯, + நாமமத௠தமிழரà¯à®©à®à¯ à®à¯à®£à¯à®à¯ à®à®à¯à®à¯ வாழà¯à®¨à¯à®¤à®¿à®à¯à®¤à®²à¯ நனà¯à®±à¯? à®à¯à®²à¯à®²à¯à®°à¯! + தà¯à®®à®¤à¯à®°à®¤à¯ தமிழà¯à®à¯ à®à®²à®à®®à¯à®²à®¾à®®à¯ பரவà¯à®®à¯à®µà®à¯ à®à¯à®¯à¯à®¤à®²à¯ வà¯à®£à¯à®à¯à®®à¯. + +Kannada poetry by Kuvempu â ಬಾ à²à²²à³à²²à²¿ ಸà²à²à²µà²¿à²¸à³ + + ಬಾ à²à²²à³à²²à²¿ ಸà²à²à²µà²¿à²¸à³ à²à²à²¦à³à²¨à³à²¨ ಹà³à²¦à²¯à²¦à²²à²¿ + ನಿತà³à²¯à²µà³ ಠವತರಿಪ ಸತà³à²¯à²¾à²µà²¤à²¾à²° + + ಮಣà³à²£à²¾à²à²¿ ಮರವಾà²à²¿ ಮಿà²à²µà²¾à²à²¿ à²à²à²µà²¾à²à³... + ಮಣà³à²£à²¾à²à²¿ ಮರವಾà²à²¿ ಮಿà²à²µà²¾à²à²¿ à²à²à²µà²¾à²à²¿ + à²à²µ à²à²µà²¦à²¿ à²à²¤à²¿à²¸à²¿à²¹à³ à²à²µà²¤à²¿ ದà³à²° + ನಿತà³à²¯à²µà³ ಠವತರಿಪ ಸತà³à²¯à²¾à²µà²¤à²¾à²° || ಬಾ à²à²²à³à²²à²¿ || + Ethiopian: á°áá á áá³á¨áµ ááᥠá áá¨á°áµá¢ @@ -161,39 +227,46 @@ Ethiopian: HÄ cƿæð þæt hÄ bÅ«de on þǣm lande norðƿeardum Æ¿ið Ã¾Ä Ç·eï¬Å¿Ç£. He said that he lived in the northern land near the Western Sea. -Braille: +Tibetan Declaration of Rights: + + à¼à¼ ༠ཡོà½à½¦à¼à½à¾±à½à¼à½à½¦à½£à¼à½à½¦à¾à¾²à½à½¦à¼à½ à½à¾²à½¼à¼à½à¼à½à½²à½ ིà¼à½à½¼à½à¼à½à½à¼à¼ à½à¾±à½²à¼à½£à½¼à¼à¼¡à¼©à¼¤à¼¨ ལོའིà¼à½à¾³à¼à¼¡à¼¢à¼à½à½ºà½¦à¼à¼¡à¼ à½à½²à½à¼ + འà½à¾²à½¼à¼à½à¼à½à½²à½ ིà¼à½¢à½²à½à½¦à¼à½¢à¾à¾±à½´à½à¼à½¡à½¼à½à½¦à¼à½£à¼à½¦à¾à¾±à½ºà½¦à¼à½à½à¼à½à½²à½à¼à½à½¦à¼à½à½ºà¼à½à½à½¼à½à½¦à¼à½à½à¼à¼ à½à½¼à½à¼à½à½à½à½²à¼à½¢à½à¼à½à½à½à¼à½ à½à¾²à¼à½à½à½à¼à½à½´à¼à½¡à½¼à½à¼à½£à¼ + à½à½¼à½à¼à½à½¼à½¢à¼à½¢à½à¼à½à¾±à½´à½à¼à½à½²à¼à½à¾³à½¼à¼à½¢à¾©à½£à¼à½à½à¼à½à½¦à½à¼à½à½´à½£à¼à½à½à½à¼à½à½¼à¼à½ à½à½¼à½à¼à½à½ ིà¼à½ ོསà¼à½à½à½¦à¼à½à¾±à½à¼à½¡à½¼à½à¼ + à½à½ºà¼à½à½à½²à½à¼à½à½à¼à½à½´à½à¼à½à½ ིà½à¼à½à½²à½¦à¼à½à½ ིà½à¼à½£à¼à½à½´à¼à½¦à¾¤à½´à½à¼à½à¾±à½²à¼à½ à½à½´à¼à½¤à½ºà½¦à¼à½ à½à½²à½à¼à½à½ ིà¼à½à¾±à¼à½¦à¾¤à¾±à½¼à½à¼à½à¾±à½à¼à½£à½à¼à½£à½ºà½à¼à½à½¦à¾à½¢à¼à½à½à½¼à½¦à¼à½à¼à½¡à½²à½à¼ + +Japanese Iroha ããã¯: + + kanji æ¼¢å hirag. ã²ãã㪠katak. ã«ã¿ã«ã åè§ ï½¶ï¾ï½¶ï¾ man'yÅg. ä¸èä»®å + + è²ã¯åã¸ã© ããã¯ã«ã»ã¸ã¨ ã¤ãããããã ï½²ï¾ï¾ï¾ï¾ï¾ï¾ï¾ 以åæ³¢è³æ¬é¨æ¢ + æ£ãã¬ãã ã¡ãã¬ãã ããªãã«ã² ï¾ï¾ï¾ï¾ï½¦ åå©å¥´æµä¹ + æãä¸èª°ã ããããããã ã¯ã«ã¨ã¿ã¬ã½ã ï¾ï½¶ï¾ï¾ï¾ï½¿ åå é¤å¤é£æ½ + 常ãªãã ã¤ããªãã ãããã©ã ï¾ï¾ï¾ ï¾ï¾ 津祢é£è¯ç + æçºã®å¥¥å±± ããã®ãããã¾ ã¦ã°ããªã¯ã¤ã ウウィï¾ï½µï½¸ï¾ï¾ æçºè½æ¼ä¹ è¶ä¸ + ä»æ¥è¶ã㦠ããµãã㦠ã±ãã³ã¨ã ï½¹ï¾ï½ºï½´ï¾ è¨ä¸å·±è¡£å¤© + æµ ã夢è¦ã ãããããã¿ã ã¢ãµãã¦ã¡ã㷠アサキï¾ï¾ï¾ï½¼ é¿ä½ä¼å©å¥³ç¾ä¹ + é ã²ããã ãã²ããã ã±ãã¢ã»ã¹ã³ ウェï¾ï¾ï½¾ï½½ï¾ æµæ¯æ¯å¢é + +Chinese: - â¡â â §â â ¼â â â¡â â â ⠹⠰â â¡£â â + Most common characters: - â¡â â â â ¹ â ºâ â â â â â â â â â â â â â ºâ ⠹⠲ ⡹⠻â â â â â â â ³â â - â ±â â â ⠧⠻ â â â ³â â ¹â â â ² ⡹â â â â â â â » â â â â â â â ¥â â â â â ºâ â - â â â â â « â â ¹ â ¹â â â â »â â ¹â â â â â ¹â â â â »â â â ¹â â ¥â â â »â â â â »â - â â â â ¹â â ¡â â â â â ³â â ⠻⠲ â¡â â â â â â â â â â â « â â â ² â¡â â - â¡â â â â â â â °â â â â â â ºâ â â â â â â ¥â â â â °â¡¡â â â â â â â â â â ⠹⠹â â â â - â ¡â â â â â â â ¥â â â â â â â â â â â ² + çä¸æ¯ä¸äºå¨äººææä»è¿ä¸ªä»¬ä¸æ¥ä¸å¤§ä¸ºåå½å°å°ä»¥è¯´æ¶ + è¦å°±åºä¼å¯ä¹ä½ 对çè½èåé£å¾äºçä¸èªä¹å¹´è¿ååä½é - â¡â â â¡â â â â ¹ â ºâ â â â â â â â â â â â â â â â ¤â â â â â ² + Transliteration test: - â¡â â â â¡ â â â â °â â â â â â â â â â ¹ â ¹â â â¡ â â â ªâ â â â â ¹ - â ªâ â â â ªâ â «â â â â ±â â ⠹⠻â â â â â â â â â ¥â â â â ¹ â â â â â â â ³â - â â â â â â ¤â â â â â ² â¡ â â â £â â â â §â â â â ² â â â â â «â â â ¹â â â â â â â - â â â â â â â â â â â â ¤â â â â â â â ¹â â â â â â â â â â â â â â â â â â â â â â ⠻⠹ - â â ¹â â â â â â â ² â¡â ¥â â ¹â â ºâ â â â â â â â ³â â â â â â â â â - â â â â ¹â â â â â â â â â â â â â ¹ â ¥â â â â â ⠪⠫ â â â â â - â ©â â â â â â â â â â ¥â â â â â â â â ¹â â¡â ³â â â ⠹⠰â â â â â â â â â ² ⡹⠳ - â ºâ â â ⠹⠻â â â â â â â »â â â â â â â â â â â â â â â â â â â â â â â â â â ¹â â ¹â â - â¡â â â â ¹ â ºâ â â â â â â â â â â â â â â â ¤â â â â â ² + 女 (ãã©Ë nÇ /ny˨˩˦/) â¢ å¾ (ãã©Ë lÇ /ly˥˩/) ⢠驢/é©´ (ãã©Ë lÇ /ly˧˥/) -Compact font selection example text: + Extension blocks: - ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789 - abcdefghijklmnopqrstuvwxyz £©µÃÃÃÃÃéöÿ - âââââââ â¢â¦â°â¢ÅŠŸž⬠ÎÎÎÎÎ©Î±Î²Î³Î´Ï ÐÐÐÐÐабвгд - âââââ§âªâ¡â âââ¨â»â£ ââ¼ââââºâºâ ï¬ï¿½ââá¼ á¸Ó¥áºÉËâ×Ô±á + Aã¡ã¬ã§äµ Bð££ð¤¶ ðªð¦ C𪢨ðªªð«ºð«´ Dð«ð«ð«»ð« Eð« «ð¬ð¬³ð¬º¡ -Greetings in various languages: + QiÄn zì wén ååæ by Xing Si Zhou: - Hello world, ÎαλημέÏα κόÏμε, ã³ã³ããã + 天å°çé»å®å®æ´ªè æ¥æçæ辰宿åå¼µ å¯ä¾æå¾ç§æ¶å¬è + éé¤ææ²å¾å¬èª¿é½ é²é¨°è´é¨é²çµçºé éçéºæ°´çåºå´å´ + åèå·¨éç 稱å¤å æçææ°èéè¥è 海鹹河淡é±æ½ç¾½ç¿ Box drawing alignment tests: â â