looks results from the CPAN

App-colsummary

view release on metacpan or search on metacpan

#!/usr/bin/perl

#  colsummary : TSVã¾ãŸã¯CSVãƒ•ã‚¡ã‚¤ãƒ«ã®å„åˆ—ã®å€¤ã®æ§˜åã‚’è¡¨ç¤ºã™ã‚‹ã€‚ã¨ã¦ã‚‚ä¾¿åˆ©ã€‚
#   2015/05/11 - 2016/07/05 , 2018-03-28 . Shimono Toshiyuki 
#   2019/10/24, 2021/06/08, 2021/06/11 ã•ã‚‰ã«å¤§å¹…ã«æ›¸ãæ›¿ãˆ 

use 5.014 ; 
use strict ; 
use warnings ; # also confirmed on 5.011 5.014 5.018  
use autodie qw [ open ] ; 
use Encode qw[ decode_utf8 encode_utf8 ] ; 
use FindBin qw [ $Script ] ; 
use Getopt::Std ; getopts 'R:c:g:i:jm:r:su:v:z=!@:#:0:2:' => \my %o ;
use List::Util qw/max min maxstr minstr/ ; 
use POSIX qw/strtod/ ; # # å¹³å‡å€¤ã®è¨ˆç®—ã«ç”¨ã„ã‚‹ str to double.
use Scalar::Util qw/looks_like_number/;
use Term::ANSIColor qw/:constants color/ ; $Term::ANSIColor::AUTORESET = 1 ; 
use Time::HiRes qw [ gettimeofday tv_interval ] ; my ${ dt_start } = [ gettimeofday ] ; 

my $sdt = sprintf '%04d-%02d-%02d %02d:%02d:%02d', do{my @t= @{[localtime]}[5,4,3,2,1,0]; $t[0]+=1900; $t[1]++; @t } ; 
eval "use PerlIO::gzip;1" or die "PerlIO::gzip cannot be loaded, so -z does not work. ($Script, $sdt)\n" if $o{z} ; 

sub AlignOut ( @ ) ; # å‡ºåŠ› ; eachFileã§ã‚‚Colstatã§ã‚‚ä½¿ã†ã€‚
sub ColStat ( $$ ) ; # $colvals->[åˆ—ç•ª] ã¨ åˆ—åã‚’ æ¸¡ã™ã€‚ãã—ã¦ã€ãã®ä¸èº«ãŒè¡¨ç¤ºã•ã‚Œã‚‹ã€‚; eachFileã§ã‚‚Colstatã§ã‚‚ä½¿ã†ã€‚
sub d3 ($) { $_[0] =~ s/(?<=\d)(?=(\d\d\d)+($|\D))/,/gr } ; # æ•°ã‚’3æ¡åŒºåˆ‡ã‚Šã«å¤‰æ›ã™ã‚‹ã€‚
sub eachFile ( $ ) ; 
  # ä»¥ä¸‹3å€‹ã¯eachFileã‹ã‚‰å‘¼ã°ã‚Œã‚‹ã€‚
  sub colnames( $ ) ; # -=ã®æ™‚ã«å…ˆé è¡Œã®æƒ…å ±ã‚’å–ã‚Šå‡ºã™
  sub filePinfo ; # ãƒ•ã‚¡ã‚¤ãƒ«æ¯Žã®2æ¬¡æƒ…å ±(ä¸€è¡Œã‚µãƒžãƒª)
  sub ColFreq ( $$ ) ; # ç¬¬ï¼‘å¤‰æ•°ã¯ãƒ•ã‚¡ã‚¤ãƒ«ãƒãƒ³ãƒ‰ãƒ« ç¬¬ï¼’å¤‰æ•°ã¯å‚ç…§ ;  å„åˆ—ã®å€¤ã®åˆ†å¸ƒã‚’å–ã‚Šå‡ºã™

## å…¨ä½“ã§ä½¿ã†å¤‰æ•°
my $optu0 = exists $o{u} && $o{u} eq 0 ; 
* decode = * decode_utf8 ; 
* decode = sub ( $ ) { $_[0] } if $optu0 ; 
#* decode = (! $optu0) ? * decode_utf8 : sub ($){ $_[0] } ; #* encode = $o{u} ? * encode_utf8 : sub ($){ $_[0] } ; 
my $optR0 = defined $o{R} && $o{R} eq 0 ;
* R0proc = $optR0 ? sub {} : sub { s/\r$// } ;  # -R0 ãŒæŒ‡å®šã•ã‚ŒãŸæ™‚ã®å‡¦ç†
binmode *STDOUT , ':utf8' unless $optu0 ; # ã“ã‚Œã ã‘å…¨ä½“ã§ä½¿ã†å¤‰æ•°ã¨ã¯è¨€ã„ãŒãŸã„ã‹ã‚‚ã—ã‚Œãªã„ãŒã€ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã®å‡¦ç†ã¯ã“ã®ç¯€ã®å‰åŠã«ã‚ã‚‹ã®ã§ã€‚
$| = 1 if $o{'!'} ;
$o{g} //= 6 ; # if ( ! defined $o{g} ) ; # å–ã‚Šå‡ºã™æ•°
$o{r} //= "~" ; # ç¯„å›²ã‚’è¡¨ã™è¨˜å·(å‡ºåŠ›ã§ä½¿ã†)
$o{c} //= '|'  ; # ç¯„å›²ã‚’ç¤ºã™è¡¨ç¤ºã‚’è¤‡æ•°ç¹‹ã’ã‚‹è¨˜å·(å‡ºåŠ›ã§ä½¿ã†)
$o{'#'} = decode ( $o{'#'} ) if defined $o{'#'} ; # é™¤å¤–ã™ã‚‹æ£è¦è¡¨ç¾
push @ARGV , '-' unless @ARGV ; # æ¨™æº–å…¥åŠ›ã®è¿½åŠ 
my $isep = $o{i} // "\t" ;  # å…¥åŠ›ã®åŒºåˆ‡ã‚Šæ–‡å— $o{','} = do { $o{','} //= "\t" ; eval qq[qq[$o{','}]] } ;
my $sec = $o{'@'} // 15 ; # ä½•ç§’ã”ã¨ã«ãƒ¬ãƒãƒ¼ãƒˆã‚’è¡¨ç¤ºã•ã›ã‚‹ã‹
my $nc = 0 ; # è¨ˆæ•°å¯¾è±¡ã¨ã—ãªã‹ã£ãŸã‚»ãƒ«ã®æ•°ã‚’ã‚«ã‚¦ãƒ³ãƒˆã€‚
my $rl ; # å„ãƒ•ã‚¡ã‚¤ãƒ«ã®èªã‚“ã è¡Œæ•°ã‚’æ ¼ç´ã€‚
my %fOut = (
j => [map{UNDERLINE decode($_)}map{eval"\"$_\""}qw[åˆ—ç•ª ç•°ãªã‚‹å€¤ æ•°å€¤åŒ–å¹³å‡ åˆ—å å€¤ã®ç¯„å›² æœ€é »å€¤ é »åº¦(é‡è¤‡)], q[], 'æ¡æ•°'],
e =>  [ map {UNDERLINE $_ } qw[ cpos diff ave. name range frequent frequency(multi) ] , "",  "digits" ] ) ; 

my $col = undef ; # 0ã‚ªãƒªã‚¸ãƒ³ã®ã‚«ãƒ©ãƒ ç•ªå· ## sub ColFreq å†…ã§ä½¿ã†ã€‚
* negcell = defined $o{'#'} ? sub { if (m/$o{'#'}/ ) { $col ++ ; $nc ++ ; goto EACH_CELL } }  : sub {} ; # o{'0'} ã‚’ã‚„ã‚ãŸ


## ã‚·ã‚°ãƒŠãƒ«ã«å¯¾ã™ã‚‹è¨å®š
my ${ INT1 } = sub {
  &{ $SIG{ALRM} } ;
  print STDERR BRIGHT_RED 
   'Do you want to get the halfway result? Then type Ctrl + C again within 2 seconds. '. "\n" .
   'Really want to Quit? Then press Ctrl + "\" or Ctrl + Yen-Mark. (Ctrl+Z may be what you want.) ' . RESET "\n" ;
  $SIG{INT} = sub { select *STDERR ; & ColStat ; select *STDOUT ; return } ; 
  sleep 2 ; 
  return ;
} ;
$SIG{ INT } = ${ INT1 } ;
$SIG{ ALRM } = sub { say STDERR GREEN + (d3 $rl) . " lines read. " , scalar localtime ; alarm $sec } ; 
alarm $sec ; 

eachFile $_ for @ARGV ;
exit 0 ;

## 1å€‹ãšã¤ãƒ•ã‚¡ã‚¤ãƒ«ã‚’èªã¿å–ã‚‹ã€‚
sub eachFile ( $ ) {

colsummary view on Meta::CPAN

  my @kcct =  sort {$b <=> $a} keys %cct ;
  my @kcct1 = splice @kcct , 0,  min(  $o{g} ,$#kcct+1 ) ; # <- tricky! 
  my @kcct2 = splice @kcct , - min(  $o{g} ,$#kcct+1 ) ; # <- tricky! 
  push @out , join $o{c}, minmaxstr \@vals ; # å‡ºç¾å€¤ã®ç¯„å›²
  push @out , join $o{c}, @skeys ; # æœ€é »å€¤ã„ãã¤ã‹
  push @out , join $o{c}, MultSpec \@kcct1, \%cct ; # é »åº¦ã®é«˜ã„æ–¹
  push @out , (@kcct2? @kcct? $o{r} : $o{c} : '' ) . (join $o{c} , MultSpec \@kcct2, \%cct)  ; # é »åº¦ã®ä½Žã„æ–¹
  push @out , $digitRg ; # æ¡æ•°ç¯„å›²
  AlignOut @out; # <-- å…ƒã®å…¥åŠ›ã®1åˆ—ã®æƒ…å ±ãŒã€å‡ºåŠ›1è¡Œã«ç›¸å½“ã™ã‚‹ã€‚
  return ;
}

## å‡ºåŠ›
sub AlignOut ( @ ) { 
  my @p = @_ ; 
  my @P ; 
  push @P , $p[0] ;  ## (1) åˆ—ç•ªå·ã®è¡¨ç¤º1ã‹ã‚‰
  push @P , GREEN BOLD $p[1] ; ## (2) ä½•é€šã‚Šã®å€¤ãŒå‡ºç¾ã—ãŸã‹ã‚’è¡¨ç¤º 
  push @P , BRIGHT_BLUE $p[2] if ($o{m}//'') ne 0 ; ## (3) å¹³å‡å€¤ã®è¡¨ç¤º (åŠ ç®—ã¨æ¸›ç®—ã®é–¢ä¿‚ã‚’æŠŠæ¡ã™ã‚‹ç›®çš„ãŒã‚ã‚‹ã®ã§ã€å€¤ãŒç„¡ã„ã¨ã“ã‚ã¯0ã¨è¦‹ãªã™)
  push @P , BRIGHT_YELLOW $p[3] if $o{'='} ;## (4) åˆ—ã®åå‰(åˆ—å)ã‚’è¡¨ç¤º
  push @P , BOLD BRIGHT_WHITE $p[4] ; ## (5) å€¤ã®æœ€å¤§ã¨æœ€å°ã‚’å–ã‚Šå‡ºã™ã€‚
  push @P , $p[5] ;## (6)  å…·ä½“çš„ãªå€¤ã®è¡¨ç¤º (å‡ºç¾åº¦æ•°ã®å¤šã„é †ã« $o{g} å€‹ ) 
  push @P , BRIGHT_GREEN $p[6] . GREEN $p[7] ;## ## (7) æœ€é »åº¦æ•°ã®åˆ†å¸ƒ## (7) ä¸ç‚¹(ãªã‹ã¦ã‚“)ã®å‡¦ç† (7) ãƒ†ãƒ¼ãƒ«åº¦æ•°ã®åˆ†å¸ƒ
  push @P , BRIGHT_BLUE $p[8] ;  ## (8) å€¤ã®æ–‡å—åˆ—é•·ã®ç¯„å›²ã®è¡¨ç¤º
  say join "\t" , @P ;
}

# å¹³å‡å€¤ã‚’è¨ˆç®—ã™ã‚‹å‡¦ç†ã‚’ã™ã‚‹ã€‚
sub aveft ( $$ ) {
  my ($rHash,$rKeys) = @_ ;
  my ($tval, $freq, $asum, $afreq ) ; 
  for( @{$rKeys} ) { 
    ( my $num = $_ ) =~ s/(\d),/$1/g ; #s/,//g ; # 3æ¡åŒºåˆ‡ã‚Šã«ç¾ã‚Œã‚‹åŒºåˆ‡ã‚Šã‚³ãƒ³ãƒžã‚’æ¶ˆåŽ»ã™ã‚‹
    $tval = POSIX::strtod ( $num ) ; # å¹³å‡å€¤ã®è¨ˆç®—ã«ç”¨ã„ã‚‹
    $freq = $rHash->{ $_ }  ; 
    $asum += $tval * $freq ; 
    $afreq += $freq ; 
  }
  return sprintf '%5.3f',$asum/$afreq;  
}

# åº¦æ•°(é »å‡ºä¸Šä½ã®å€‹æ•°åŠã³ãƒ†ãƒ¼ãƒ«ã®æ§˜å) ã«ã¤ã„ã¦è¡¨ç¤ºæ–‡å—åˆ—ã‚’æº–å‚™ã™ã‚‹(..ã®å‰å¾Œã§2å›žå‘¼ã³å‡ºã•ã‚Œã‚‹)
sub  MultSpec ( $$ ) {
  my ( $p_kc , $p_ccount )  =  @_;
  my @ostr ;
  my $c=0 ; 
  while ( my $t  = shift @$p_kc )  { 
    $c++ ; 
    push @ostr , $t if ( $p_ccount->{$t} == 1 ) ; 
    push @ostr , $t.'('.$p_ccount->{$t} .')' if ( $p_ccount->{$t} >= 2 ) ;  # æ‹¬å¼§å†…ã«å¤šé‡åº¦
    last if ( $c >= $o{g} ) ;
  } 
  return @ostr ;
} ;

# é…åˆ—å‚ç…§ã‹ã‚‰ã€æœ€å°å€¤æœ€å¤§å€¤ã‚’å–ã‚Šå‡ºã™ 
sub minmaxstr ( $ ) {
  * uniq = sub (@) {my %hh ;map { $hh{$_}++ != 0 ? () : $_ } @_ } ; 
  sub part ( &@ ) ; 
  sub RangeStr ( $$ ) ;
  my @gps = part {/^0*$/ ? 0 : looks_like_number $_ ? 1 : 2}  @{ $_[0] } ; 
  my @ostr ; 
  push @ostr, join $o{r}, sort  & uniq ( @{$gps[0]} ) if $gps[0] ;  # ç©ºæ–‡å—åˆ—ãŒã‚ã‚‹ã¨ãã®å‡¦ç†  
  push @ostr, RangeStr( min(@{$gps[1]}), max(@{$gps[1]}) ) if $gps[1] ;  # æ•°ã«è¦‹ãˆã‚‹å€¤ãŒã‚ã‚‹ã¨ãã®å‡¦ç† 
  push @ostr, RangeStr( minstr(@{$gps[2]}), maxstr(@{$gps[2]}) ) if $gps[2] ; # æ•°ã«è¦‹ãˆãªã„å€¤ãŒã‚ã‚‹ã¨ãã®å‡¦ç† 
  return @ostr; 
} ; 
sub part ( &@ ) { my ($cd, @l) = @_ ; my @p ; push @{ $p[ $cd->($_) ] } , $_ for @l ; @p } ;  # ã“ã®é–¢æ•°ã¯ List::MoreUtils 
sub RangeStr ( $$ ) { $_[0] eq $_[1] ? "$_[0]" : "$_[0]$o{r}$_[1]" } # 2å€‹ã®æ•°oræ–‡å—åˆ—ã‹ã‚‰ 1..2ã®ã‚ˆã†ãªæ–‡å—åˆ—ã‚’ç”Ÿæˆ


## ãƒ˜ãƒ«ãƒ—ã®æ‰±ã„
sub VERSION_MESSAGE {}
sub HELP_MESSAGE {
  use FindBin qw[ $Script ] ; 
  $ARGV[1] //= '' ;
  open my $FH , '<' , $0 ;
  while(<$FH>){
    s/\$0/$Script/g ;
    print $_ if s/^=head1// .. s/^=cut// and $ARGV[1] =~ /^o(p(t(i(o(ns?)?)?)?)?)?$/i ? m/^\s+\-/ : 1;
  }
  close $FH ;
  exit 0 ;
}
=encoding utf8

=head1 $0 

 ãƒ‡ãƒ¼ã‚¿ãƒ•ã‚¡ã‚¤ãƒ«(TSVå½¢å¼ã€ä¸€è¡Œç›®ã¯ãƒ˜ãƒƒãƒ€)ã«ã¤ã„ã¦ã€å„åˆ—ã®æœ‰ç”¨ãªæƒ…å ±ã‚’å‡ºåŠ›ã™ã‚‹ã€‚

 å‡ºåŠ›é …ç›®:
   1. åˆ—ç•ªå· ; ç™½
   2. ç•°ãªã‚Šæ•°(å„åˆ—ã«ç•°ãªã‚‹å€¤ãŒä½•å€‹å‡ºç¾ã—ãŸã‹) ; æ˜Žã‚‹ã„ç·‘
   3. å¹³å‡å€¤ ( -m ã§å¹³å‡å€¤ã®å‡ºåŠ›ã¯æŠ‘åˆ¶å¯èƒ½) ; é’
   4. åˆ—å (ãƒ˜ãƒƒãƒ€ã‹ã‚‰å–ã‚Šå‡ºã™) ; é»„è‰²
   5. å€¤ã®ç¯„å›² ; æ˜Žã‚‹ã„ç™½
   6. å€¤ã®é »å‡ºãƒ©ãƒ³ã‚ãƒ³ã‚° ; æš—ã„ç™½
   7. é »å‡ºä¸Šä½ã¨ä¸‹ä½ã«ã¤ã„ã¦ã®å‡ºç¾å›žæ•° ; æ˜Žã‚‹ã„ç·‘
   8. å€¤ã®æ–‡å—åˆ—é•·ã®ç¯„å›² ; é’

 [ã‚ªãƒ—ã‚·ãƒ§ãƒ³] :

   (å…¥åŠ›ã‚ªãƒ—ã‚·ãƒ§ãƒ³)
  -=     ; å…¥åŠ›ã®æœ€åˆã®è¡ŒãŒåˆ—åã®ä¸¦ã³ã¨ä»®å®šã€‚ã“ã®æŒ‡å®šã‚’ã—ãªã„å ´åˆã¯åˆ—åã¯é€£ç•ªã«ãªã‚‹ã€‚
  -i STR : åŒºåˆ‡ã‚Šæ–‡å—ã‚’ã‚¿ãƒ–æ–‡å—ã§ã¯ãªãã¦ã€ str  ã«å¤‰æ›´ã€‚
  -v N   ; å„ã‚»ãƒ«ã®å€¤ã®é•·ã•ã‚’æŒ‡å®šæ–‡å—æ•°ã«åˆ¶é™ã™ã‚‹ã€‚(åˆ—åã«ã¯é©ç”¨ã•ã‚Œãªã„ã€‚)
  -s     ; å„ã‚»ãƒ«ã®æœ«å°¾ã®ç©ºç™½ã‚’é™¤åŽ»ã€‚-u0ã¨ã—ãªã„é™ã‚ŠåŠè§’ç©ºç™½ã ã‘ã§ç„¡ãã¦å…¨è§’ç©ºç™½ã‚‚é™¤åŽ»ã€‚
  -u 0   ; utf-8 ã¨ã—ã¦å‡¦ç†ã™ã‚‹é€šå¸¸ã®å‡¦ç†ã‚’ã›ãšã€ãƒã‚¤ãƒˆå˜ä½ã®å‡¦ç†ã¨ãªã‚‹ã€‚
  -z     ; å…¥åŠ›ã¯ gzip åœ§ç¸®ã•ã‚Œã¦ã„ã‚‹ã“ã¨ã‚’ä»®å®šã€‚
  -\# REGEX ; é™¤å¤–ã™ã‚‹å€¤ã®æ£è¦è¡¨ç¾ã®æŒ‡å®šã€‚ '^éƒ¨åˆ†æ£è¦è¡¨ç¾$' ã®ã‚ˆã†ãªæŒ‡å®šã®ä»•æ–¹ã‚’ã‚ˆãä½¿ã†ã“ã¨ã«ãªã‚‹ã ã‚ã†ã€‚ 
  -@ N : N ç§’ã”ã¨ã«ï¼Œä½•è¡Œã‚’èªã‚“ã ã‹ã‚’å ±å‘Šã™ã‚‹ã€‚ Report how many have read every N seconds.  

  -R 0   ; æ”¹è¡ŒåŒºåˆ‡ã‚ŠãŒ\r\nã§ã‚ã£ã¦ã‚‚ä½•ã‚‚ã‚ªãƒ—ã‚·ãƒ§ãƒ³æŒ‡å®šã›ãšã«å¯¾å‡¦ã—ã¦ã„ã‚‹ãŒã€ä¸å…·åˆãŒã‚ã‚Œã°ä½¿ã†ã€‚

   (å‡ºåŠ›ã‚ªãƒ–ã‚·ãƒ§ãƒ³)
  -0 0 : å‡ºåŠ›ã®å¤‰æ•°ã®åå‰ã®ä¸¦ã³ã‚’å‡ºåŠ›ã—ãªã„ã€‚   
  -g N ;  å…·ä½“çš„ãªå€¤ã‚’ä½•å€‹è¡¨ç¤ºã•ã›ã‚‹ã‹æŒ‡å®šã™ã‚‹ã€‚æœªæŒ‡å®šãªã‚‰6ã€‚
  -j : å‡ºåŠ›ã®å„åˆ—ã®åå‰ã‚’æ—¥æœ¬èªžã§å‡ºåŠ›ã™ã‚‹ã€‚
  -m 0 ; å¹³å‡å€¤ã‚’è¡¨ç¤ºã—ãªã„ã€‚(å¹³å‡å€¤ã¯ strtod ã‚’ä½¿ã£ã¦ã„ã‚‹ã€‚) 
  -r str : ç¯„å›²ã‚’è¡¨ã™è¨˜å·(æœªæŒ‡å®šãªã‚‰"~"ã®1æ–‡å—)ã€‚-r ".." ãªã©ã¨æŒ‡å®šã™ã‚‹ã€‚(rã¯Rangeã®ã¤ã‚‚ã‚Šã€‚)
  -c str : ç¯„å›²ã‚’ç¤ºã™è¡¨ç¤ºã‚’è¤‡æ•°ã‚’æŸãã‚‹ã¨ãã«ä½¿ã†è¨˜å·ã€‚æœªæŒ‡å®šãªã‚‰"|"ã€‚-c ','ãªã©ã¨ã™ã‚‹ã€‚

( run in 2.013 seconds using v1.01-cache-2.11-cpan-6aa56a78535 )