binmode results from the CPAN

App-coldigits
view release on metacpan or search on metacpan
#!/usr/bin/perl 
use 5.014 ; use warnings ; 
use Time::HiRes qw [ gettimeofday tv_interval ] ;
my ${ dt_start } = [ gettimeofday ] ; 
use Encode qw[ decode_utf8 encode_utf8 ] ; 
use Getopt::Std ; getopts '=0:BM:R:e:i:u:v:y:' , \my %o  ; 
use Term::ANSIColor qw[ color :constants ] ; $Term::ANSIColor::AUTORESET = 1 ;
use FindBin qw[ $Script ] ; 
use autodie qw [ open ] ;
use List::Util qw[ min max ] ; 
use Scalar::Util qw [ dualvar ]  ; 

* d3 = exists $o{','} && $o{','} eq 0 ? sub{$_[0]} : sub { $_[0] =~ s/(?<=\d)(?=(\d\d\d)+($|\D))/,/gr } ;
my $time0 = time ; 
my $help = 0  ; # ã‚ªãƒ³ãƒ©ã‚¤ãƒ³ãƒ˜ãƒ«ãƒ—ã®æ–‡é¢ã®è¡¨ç¤ºã‚’ã—ãŸã‹å¦ã‹ã€‚
my $readLines  ; # èªã¿å–ã£ãŸè¡Œæ•°
my $sec = $o{'@'} // 15 ; # ä½•ç§’ãŠãã«ã‚¢ãƒ©ãƒ¼ãƒ ã‚’ç™ºç”Ÿã•ã›ã‚‹ã‹
$o{y} //= "2.." if $o{M} ; 
our @y_ranges ; 
& y_init () ; 

$SIG{INT} = sub { exit } ;
$SIG{ALRM} = sub { 
  my $n = $.  =~ s/(?<=\d)(?=(\d\d\d)+($|\D))/,/gr ; # 3æ¡ã”ã¨ã«åŒºåˆ‡ã‚‹ã€‚
  say STDERR GREEN "$n lines read ($Script). " , scalar localtime ; 
  alarm $sec 
} ; 
alarm $sec ;

* R0proc = exists $o{R} && $o{R} eq 0 ? sub {} : sub { s/\r$// } ; 
* decode = ($o{u}//'') ne 0 ? * decode_utf8 : sub ( $ ) { $_[0] } ; 
$o{0} //= '-' ; # è¡Œåˆ—çŠ¶ã®å‡ºåŠ›ã§ å€¤ãŒ 0 ã®å ´åˆã«å‡ºåŠ›ã™ã‚‹æ–‡å—
my $isep = $o{i} // "\t" ;  # å…¥åŠ›ã®åŒºåˆ‡ã‚Šæ–‡å—
$o{e} = decode ( $o{e} ) if exists $o{e} ;
* len = ! exists $o{e} ? sub ( $ ) { length $_[0]  } : sub ($) { my @c = $_[0] =~ m/$o{e}/g ; scalar @c } ;

my $neoM = ! exists $o{M} ; 
my $noB = ! $o{B} ; 
my @cn =  & colnames if $o{'='} ;  # Column Names ã®é æ–‡å—
my @Cij  ; # $Cij[åˆ—ç•ª]{æ¡æ•°} ã«ã‚ˆã‚Šã€0å§‹ã¾ã‚Šä½•ç•ªã®åˆ—ã«ã€ä½•æ¡ã®ã‚‚ã®ãŒã€ä½•ä»¶ã‚ã£ãŸã‹ã‚’ç¤ºã™ã€‚
my %Cj  ; # $Cj{ æ¡æ•°} > 0 ã«ã‚ˆã‚Šã€ãã®æ¡æ•°ã®ã‚‚ã®ãŒå˜åœ¨ã—ãŸã“ã¨ã‚’ç¤ºã™ã€‚digit length ã®ã¤ã‚‚ã‚Šã€‚
my @Cj  ; # å‡ºåŠ›ã®æ™‚ã«ä½¿ã†ã€‚ sort { $a <=> $b } keys %Cj ;
my @E1  ; # $E1[$i] = [å…¥åŠ›$iåˆ—ç›®(å‡ºåŠ›$iè¡Œç›®)ã®æœ€ã‚‚å³ã®jã®å€¤(ä½ç½®) , å…¥åŠ›ã§ã®å‡ºç¾å€¤ , ãã®ä½ç½®ã¨å‡ºç¾å€¤ã®é »åº¦ ] ã€‚
my @E2  ; # [ä½ç½®, å‡ºç¾å€¤, é »åº¦]  ; $E2[$j] ã§ $E1[$j] ã«æº–ã˜ã‚‹ã‚‚ã®ã«ãªã‚‹ã€‚ å½¢å¼ã¯åŒæ§˜ã€‚
my @out ; # å‡ºåŠ›æ™‚ã«ã€å„è¡Œã§ä½•ã‚’ã‚¿ãƒ–åŒºåˆ‡ã‚Šã§è¡¨ç¤ºã™ã‚‹ã‹ã‚’æ ¼ç´ã™ã‚‹ã€‚

binmode STDOUT, "utf8" if ($o{u}//'') ne 0 ; 
 
## -- -
M : # ã‚ªãƒ—ã‚·ãƒ§ãƒ³ -M ãŒæŒ‡å®šã•ã‚ŒãŸæ™‚ã€‚
while( <> ) { 
  chomp ; & R0proc ; 
  my @F = split /$isep/o , decode( $_ ) , -1 ; 
  for ( 0 .. $#F ) {
    my %jd = do { my %z ; $z{$_}++ for split //, $F[$_], 0 ;   map{ $_,$z{$_} }   grep { &y_filter($z{$_}) } keys %z } if exists $o{M} ; 
    for my $j (  $neoM ? do { my $j = len ( $F[$_] ) ; & y_filter ( $j ) ? ($j) : () } : keys %jd )  {
      $neoM ? $Cij [ $_ ] { $j } ++ : do { $Cij [ $_ ] { $jd {$j} } { $j } ++ ; $j = $jd{$j} } ; # $Cij[å…¥åŠ›åˆ—ç•ª]{æ–‡å—åˆ—é•·} ã‹ $Cij[å…¥åŠ›åˆ—ç•ª]{å‡ºç¾é »åº¦}{å‡ºç¾æ–‡å—}
      $Cj { $j } ++  ; # $Cj { å‡ºç¾é »åº¦ } ã‚’ã‚«ã‚¦ãƒ³ãƒˆã€‚
      $E1[$_] = [ $j , $F[$_] , 0 ] if ( $E1[$_]->[0] // "-Inf" ) < $j ;  # # [(ä»•åˆ†ã‘)ä½ç½®(åã®æ–‡å—åˆ—), å‡ºç¾å€¤, é »åº¦]  ; ã“ã“ã§ã® $_ ã¯åˆ—ç•ªå·ã§ã‚ã‚‹ã€‚
      $E1[$_]->[2] ++ if $E1[$_]->[0] == $j && $E1[$_]->[1] eq $F[$_] ; 
      $E2[$_] = [ $j , $F[$_] , 0 ] if ( $E2[$_]->[0] // "-Inf" ) < $j && $F[$_] ne $E1[$_]->[1] ; # && $E1[$_]->[0] == $j ;  
      $E2[$_]->[2] ++ if exists $E2[$_]->[1] && $E2[$_]->[1] eq $F[$_] ;     
    }
  }
} 
& output () ; 
exit 0 ; 

# å‡ºåŠ›;
sub cseq ( $$$ ) {  # å‡ºåŠ›ã®å„ã‚»ãƒ«ã«ãŠã„ã¦ã€å‡ºç¾ã—ãŸæ–‡å—ã®å…¨ã¦ã‚’ã€ã„ã„å…·åˆã«ã¾ã¨ã‚ã‚‹ã€‚
  my $lc = $_[0] ; # limit char 
  my $i = $_[1] ;  # å‡ºåŠ›ã®å„è¡Œ(å…¥åŠ›ã®å„åˆ—)ã«å¯¾å¿œ
  my $j = $_[2] ;  # å‡ºåŠ›ã®å„åˆ—(é›†è¨ˆã—ãŸæ™‚ã®ä»•åˆ†ã‘å…ˆ)ã«å¯¾å¿œ
  #my @Z = sort keys %{ $Cij[$i]{$Cj[$j]} } ; #  æ–‡å—åˆ— $Cij[$i]{$x}ã§å…¥åŠ›$iç•ªç›®ã®åˆ—ã«ã€æ–‡å—$xã‚’æŒã¤ã‚»ãƒ«ã®ã€å‡ºç¾ä»¶æ•°ã‚’ç¤ºã™ã€‚$Cj[$j]ã§ã€ãã®å‡ºç¾ä»¶æ•°ã®ã€é »åº¦æ•°ã‚’è¡¨ã™ã€‚
  my @Z = sort keys %{  $Cij [$i] { $_[2] }  } ; #  æ–‡å—åˆ— $Cij[$i]{$x}ã§å…¥åŠ›$iç•ªç›®ã®åˆ—ã«ã€æ–‡å—$xã‚’æŒã¤ã‚»ãƒ«ã®ã€å‡ºç¾ä»¶æ•°ã‚’ç¤ºã™ã€‚$Cj[$j]ã§ã€ãã®å‡ºç¾ä»¶æ•°ã®ã€é »åº¦æ•°ã‚’è¡¨ã™ã€‚
  #return @Z > $lc ? do{ $Z[1] //= '' ; $Z[-1] //= '' ; "$Z[0]$Z[1]..$Z[-2]$Z[-1]" . FAINT "(".@Z.")" }  : @Z ? join ('', @Z). FAINT "(".@Z.")" : FAINT $o{0} ;
  return @Z > $lc ? do{ $_ //= '' for 1,2,-3,-2  ; "$Z[0]$Z[1]$Z[2]..$Z[-3]$Z[-2]$Z[-1]" . FAINT "(".@Z.")" }  : @Z ? join ('', @Z). FAINT "(".@Z.")" : FAINT $o{0} ;
}

sub output () { 
  my $lc = exists $o{M} ? defined $o{M} ? $o{M} : 15 : undef ; # -Mã‚ªãƒ—ã‚·ãƒ§ãƒ³ã«å¯„ã‚Šã€å‡ºåŠ›ã®å„ã‚»ãƒ«ã«ã€ä½•æ–‡å—ã‚’è¶…ãˆãŸã‚‰ã€çœç•¥è¨˜æ³•ã«ã™ã‚‹ã‹ã«ã¤ã„ã¦ã€‚ Limit Char ã®é æ–‡å—
  @Cj = sort { $a <=> $b } keys %Cj ;
  say join "\t" , map { UNDERLINE $_ } YELLOW ('col') , ( $noB ? @Cj:qw[min max]) , ($o{v}//'') eq 0 ? () : map { GREEN "eg.$_". FAINT "(freq)" } 1..2 ;  
  for my $i ( 0 .. $#Cij ) {
    @out = () ; 
    push @out , YELLOW $cn [ $i ] // YELLOW $i + 1 ; # å…¥åŠ›ã®åˆ—å
    if ( $noB ) { 
      #push @out , $neoM  ?  $Cij[ $i ] { $Cj[$_] } // FAINT $o{0}  :  & cseq ( $lc, $i, $_ ) for  0 .. $#Cj  ; # Cij ã§é›†è¨ˆã—ãŸä¸èº«ã‚’å‡ºåŠ›ã™ã‚‹ã€‚
      push @out , $neoM  ?  $Cij[ $i ] { $Cj[$_] } // FAINT $o{0}  :  & cseq ( $lc, $i, $Cj [$_] ) for  0 .. $#Cj  ; # Cij ã§é›†è¨ˆã—ãŸä¸èº«ã‚’å‡ºåŠ›ã™ã‚‹ã€‚
    } else { 
      my ($m1,$m2) = do { my @t = keys %{$Cij[$i] } ; ( min(@t) , max(@t) ) } ; 
      next if ! defined $m1 ; # continue ç¯€ã« é£›ã¶ã€‚
      my ($v1,$v2) = map { $neoM ? "$Cij[$i]{$_}": cseq( $lc, $i , $_ ) } $m1 , $m2  ;  # <-- - 
      push @out , $m1!=$m2  ?  "$m1\[$v1\]"  :  "$m1\[$v1\]=" , UNDERLINE BOLD($m2)."[$v2]" ; 
    }
    if ( not 0 eq ($o{v}//'') ) {  # å…¥åŠ›ã§ä¸Žãˆã‚‰ã‚ŒãŸå‡ºç¾å€¤ã®å…·ä½“ä¾‹ã‚’ä¸Žãˆã‚‹ã€‚
      push @out , GREEN $E1[$i]->[1] . '' . FAINT "($E1[$i]->[2])" if exists $E1[$i]->[2] ;
      push @out , GREEN $E2[$i]->[1] . '' . FAINT "($E2[$i]->[2])" if exists $E2[$i]->[2] ;
    } 
  } continue {
    say join "\t" , @out ; 
  }
}

=for comment 
# å‡ºåŠ›(-M); 
  push @out , do { my @t = sort keys %{ $Cij[$i]{$Cj[$_]} } ; @t > $m ? "$t[0]..$t[-1](".@t.")" : join '', @t }  for 0 .. $#Cj ;
( run in 1.124 second using v1.01-cache-2.11-cpan-9581c071862 )