binmode results from the CPAN

App-chartimes
view release on metacpan or search on metacpan
#!/usr/bin/perl 
use 5.014 ; use warnings ; 
use Time::HiRes qw [ gettimeofday tv_interval ] ;
my ${ dt_start } = [ gettimeofday ] ; 
use Encode qw[ decode_utf8 encode_utf8 ] ; 
use Getopt::Std ; getopts '=@:0:2:q:v:y:R' , \my %o  ; 
use Term::ANSIColor qw[ color :constants ] ; $Term::ANSIColor::AUTORESET = 1 ;
use FindBin qw[ $Script ] ; 
use autodie qw [ open ] ;
use List::Util qw[ max ] ; 
use Scalar::Util qw [ dualvar ]  ; 

* d3 = exists $o{','} && $o{','} eq 0 ? sub{$_[0]} : sub { $_[0] =~ s/(?<=\d)(?=(\d\d\d)+($|\D))/,/gr } ;
my $time0 = time ; 
my $help = 0  ; # ã‚ªãƒ³ãƒ©ã‚¤ãƒ³ãƒ˜ãƒ«ãƒ—ã®æ–‡é¢ã®è¡¨ç¤ºã‚’ã—ãŸã‹å¦ã‹ã€‚
my $readLines = 0 ; # èªã¿å–ã£ãŸè¡Œæ•°
my $diffChars = 0 ; # å‡ºåŠ›ã®è¡Œæ•°
my $sec = $o{'@'} // 15 ; # ä½•ç§’ãŠãã«ã‚¢ãƒ©ãƒ¼ãƒ ã‚’ç™ºç”Ÿã•ã›ã‚‹ã‹

$o{0} //= '-' ; # è¡Œåˆ—çŠ¶ã®å‡ºåŠ›ã§ å€¤ãŒ 0 ã®å ´åˆã«å‡ºåŠ›ã™ã‚‹æ–‡å—
$o{q} //= "'" ; # æ–‡å—ã‚’å›²ã‚€æ–‡å—
$o{y} //= 1   ; # ã“ã®æ•°ã‚ˆã‚Šå°‘ãªã„é »åº¦ã—ã‹ã©ã®è¡Œã§ã‚‚å‡ºåŠ›ã—ãªã‹ã£ãŸå ´åˆã¯ã€å‡ºåŠ›ã—ãªã„ã€‚
my $optV0 = ($o{v}//'') eq '0' ? 1 : 0 ;

$SIG{INT} = sub { exit } ;
$SIG{ALRM} = sub { 
  my $n = $.  =~ s/(?<=\d)(?=(\d\d\d)+($|\D))/,/gr ; # 3æ¡ã”ã¨ã«åŒºåˆ‡ã‚‹ã€‚
  say STDERR GREEN "$n lines read ($Script). " , scalar localtime ; 
  alarm $sec 
} ; 
alarm $sec ;

binmode STDOUT, ":utf8" ;
my %f2 ; # $f2{ $char } [ $times ] ã¯ã€å„æ–‡å— charã‚’ä¸åº¦timeså€‹æŒã¤æ–‡å—ãŒã€ä½•è¡Œã«å‡ºç¾ã—ãŸã‹ã‚’æ ¼ç´ã€‚
my %fs ; # $f2{$c}[$t] ã® æ•°$t ã§ç¾ã‚ŒãŸå€¤ã‚’è¨˜éŒ²ã€‚
my %fm1 ; # $fm1{$c} ã§ $c ã®å‡ºç¾ã®æœ€å¤§å€¤ã‚’è¨˜éŒ²ã€‚dualvar ã§ã‚ã‚‹ã€‚ã™ãªã‚ã¡ã€ãã®æ™‚ã®æœ€å¤§å€¤ã®æ™‚ã®ã€è¡Œæ–‡å—åˆ—ã‚‚æ ¼ç´ã€‚
my %fm2 ; # %fm1 ã¨ã‚ˆãä¼¼ã¦ã„ã‚‹ãŒã€æœ€å¾Œã®ä¾‹ã‚’å–ã‚Šå‡ºã™ã€‚ dualvar ã§ã‚ã‚‹ã“ã¨ã¯åŒã˜ã€‚
my ( %fm1c , %fm2c ) ; # ãã®å¯¾å¿œã™ã‚‹æ–‡å—åˆ—ã®å‡ºç¾å›žæ•°ã‚’æ ¼ç´ã™ã‚‹ã€‚

my $head = <> if $o{'='} ;
chomp $head if defined $head ;
$SIG{INT} = sub { & output ; exit } ;

# é›†è¨ˆ
while ( <> ) {
  $readLines ++ ;
  chomp ; 
  $_ = decode_utf8 $_ ;
  my @F = split // , $_ , 0 ; # æ–‡å—å˜ä½ã§ã°ã‚‰ã°ã‚‰ã«ã™ã‚‹ã€‚0 ã§ãªãã¦-1ã«ã™ã‚‹ã¨ã€é…åˆ—ã®æœ€å¾ŒãŒç©ºæ–‡å—åˆ—ã«ãªã‚‹ã€‚
  #say join "+" , @F ; 
  my %f1 ; #  $f1{ $char } ã§ãã®è¡Œã«ãã®æ–‡å—ãŒä½•å›žå‡ºç¾ã—ãŸã‹ã‚’æ ¼ç´ã€‚
  if ( ! $o{R} ) { $f1 { $_ } ++ for @F } # å˜ç´”ã«é›†è¨ˆ
  else { 
    my %t ; # $t{$c}ã¯ $cãŒé€£ç¶šã§æœ€é•·ä½•æ–‡å—ç¶šã„ãŸã‹ã‚’æ ¼ç´ã™ã‚‹ã‚ˆã†ã«ã™ã‚‹ã€‚
    my $z = '' ; # ç›´å‰ã®æ–‡å—
    my $d = 1 ; # é•·ã•
    push @F , '' ; # è»½ã„ãƒˆãƒªãƒƒã‚¯
    for ( @F ) { 
      if ( $_ eq $z ) {
        $d ++ ; #print $d ; 
      } else 
      {
        $t {$z} = $d ; #print $d if $d > 1 ; 
        $d = 1 ; # ãƒªã‚»ãƒƒãƒˆ
        $f1 { $z } = $t{ $z } if ( $f1 { $z } // 0 ) < $t { $z } ;
      }
      $z = $_ ;
    }
    delete $f1{''} ; 
    #for ( keys %t )
  }
  $f2 { $_ } [ $f1{$_} ] ++ for keys %f1 ;
  $fs { $_ } = 1 for values %f1 ; 

  for my $c ( keys %f1 ) { 
    do{ $fm1c{$c} = 0 ; $fm1{$c} = dualvar $f1{$c},$_ } if ($fm1{$c}//0) <  $f1 { $c } ; 
    $fm1c { $c } ++ if $_ eq $fm1{$c} ; # dualvar ã®æ–‡å—åˆ—ã®æ–¹ã®æ¯”è¼ƒã«ãªã£ã¦ã„ã‚‹
    do{ $fm2c{$c} = 0 if defined $fm2{$c} && $fm2{$c} ne $_ ; $fm2{$c} = dualvar $f1{$c},$_ } if ($fm2{$c}//0) <= $f1 { $c } && $fm1{$c} ne $_ ;
    $fm2c { $c } ++ if defined $fm2{$c} && $_ eq $fm2{$c} ; # dualvar ã®æ–‡å—åˆ—ã®æ–¹ã®æ¯”è¼ƒã«ãªã£ã¦ã„ã‚‹    
  }
}

& output () ;
exit ; 

# å‡ºåŠ›

sub output () { 
  #say STDERR $o{y} ; exit ;
  my @fsE = sort { $a <=> $b } keys %fs ; # E ã¯ Entire ã®é æ–‡å—ã®ã¤ã‚‚ã‚Šã€‚æ•°å€¤ã®é›†åˆã¨ãªã‚‹ã€‚
  my @chars = grep { scalar @{$f2{$_}} > $o{y} } sort keys %f2 ; 
  $diffChars = @chars  ; 
  say UNDERLINE join "\t" , 'char', @fsE , $optV0 ? () : 'examples' . FAINT '(count)' ;
( run in 0.775 second using v1.01-cache-2.11-cpan-9581c071862 )