map: import 10x10 dutch numbers mnemonic

[sheet.git] / tools / mkcharinfo
diff --git a/tools/mkcharinfo b/tools/mkcharinfo

index 66f3a0022d94058a525bce55cb90c476e13826b7..6d08f9e868004b87b649e150f943eea04f51590b 100755 (executable)
--- a/tools/mkcharinfo
+++ b/tools/mkcharinfo
@@ -1,28 +1,27 @@
  #!/usr/bin/env perl
-use 5.010;
-use strict;
+use 5.014;
  use warnings;
  use utf8;
  no if $] >= 5.018, warnings => 'experimental::smartmatch';
  
-use open OUT => ':utf8', ':std';
+use open OUT => ':encoding(utf-8)', ':std';
  use Data::Dump 'pp';
  
-our $VERSION = '1.01';
+our $VERSION = '1.02';
  
  my %info = (
         # prepare presentational string for some control(lish) entries
         "\xAD"     => {string => '-'},
         "\x{200E}" => {string => '→'},
         "\x{200F}" => {string => '←'},
-       "\x{200B}" => {string => '␣'},
+       "\x{200B}" => {string => '␣'}, # nbsp: ~ in TeX
         "\x{200C}" => {string => '|'}, # ISO-9995-7-081 lookalike (alt: ∣ ⊺ ⟙)
         "\x{200D}" => {string => '⁀'}, # join (alt: ∤ |ͯ ⨝)
  );
  $info{chr $_} //= {} for 32 .. 126;
  
  eval {
-       my $tables = do 'unicode-table.inc.pl' or die $@ || $!;
+       my $tables = do './unicode-table.inc.pl' or die $@ || $!;
         for (values %$tables) {
                 for (values %$_) {
                         for (@$_) {
@@ -47,9 +46,9 @@ eval {
  } or warn "Failed importing html entities: $@";
  
  my %diinc = (
-       'data/digraphs-rfc.inc.pl' => 'u-di',
-       'data/digraphs-shiar.inc.pl' => 'u-prop ex',
-       'data/digraphs-vim.inc.pl' => 'u-prop',
+       './data/digraphs-rfc.inc.pl' => 'u-di',
+       './data/digraphs-shiar.inc.pl' => 'u-prop',
+       './data/digraphs-vim.inc.pl' => 'u-vim',
  );
  for (sort keys %diinc) {
         -e $_ or next;
@@ -65,13 +64,13 @@ for (sort keys %diinc) {
  
  eval {
         # read introducing unicode versions for known characters
-       my $agemap = do 'unicode-age.inc.pl' or die $@ || $!;
+       my $agemap = do './data/unicode-age.inc.pl' or die $@ || $!;
         for my $chr (keys %info) {
                 my $version = $agemap->{ord $chr} or next;
                 $info{$chr}->{class}->{'u-v'.$version}++
         }
         1;
-} or warn "Failed including unicode version data $@";
+} or warn "Failed including unicode version data: $@";
  
  for my $chr (keys %info) {
         my $cp = ord $chr;
@@ -84,9 +83,9 @@ for my $chr (keys %info) {
  
         $info->{$_} = $info{$chr}->{$_} for keys %{ $info{$chr} };
  
-       # official digraphs either lose vim flag or gain experimental
-       delete $info->{class}->{'u-prop'} or $info->{class}->{ex}++
-               if $info->{class}->{'u-di'};
+       # ignore vim flag in addition to rfc support, replace otherwise
+       $info->{class}->{'u-di'} or $info->{class}->{'u-prop'}++
+               if delete $info->{class}->{'u-vim'};
  
         # categorise by unicode types and writing script
         $info->{class}->{$_}++ for $info->{category};