d3969557ecf6a16104ff44d4fb6f0addad15d2e6
[unifont.git] / font / hexsrc / README
1 The Unicode Basic Multilingual Plane consists of 2^16 = 65,536 code points.
2 Of this number, 2,048 are the Surrogate Pairs, from U+D800..U+DFFF.  This
3 leaves 65,536 - 2,048 = 63,488 code points.
4
5 ==> The total number of lines in the files below should be 63,488 <==
6
7    hangul-syllables.hex
8    nonprinting.hex
9    pua.hex
10    spaces.hex
11    unassigned.hex
12    unifont-base.hex
13    wqy.hex
14
15 The number of lines can be conveniently determined in this directory with
16
17    wc -l *.hex
18
19 The last line will be a grand total, and this should equal 63,488.  Here
20 is the current output of "wc -l *.hex" with the Unifont 6.3 glyph files:
21
22      11172 hangul-syllables.hex
23         98 nonprinting.hex
24       6400 pua.hex
25         16 spaces.hex
26       2325 unassigned.hex
27      15651 unifont-base.hex
28      27826 wqy.hex
29      63488 total
30
31 If there are any duplicates, most likely these will be from new glyphs
32 being added to unifont-base.hex that were not removed from unassigned.hex.
33 A simple comparison using unidup will show this:
34
35    sort *.hex | unidup
36
37 If there are duplicate code points, unidup will print them.
38
39 Note that nonprinting.hex, pua.hex, and unassigned.hex might not be
40 included in the final generated unifont.hex file.  If desired, they
41 can all be added by modifying the make file one level above this
42 directory (modify the UNIFILES definition in ../Makefile) or with
43 the call to "make" in the top-level directory with a command such as:
44
45      make UNASSIGNED="hexsrc/unassigned.hex" PUA="hexsrc/pua.hex"
46
47
48 Paul Hardy, 2013