guess results from the CPAN

guess

App-Greple

view release on metacpan or search on metacpan

	greple -pi -e 'cyclic redundancy c\w+' rfc*
	greple -o --joinby=' ' -ie 'cyclic redundancy c\w+' rfc*

### find Kanji and not CJKUnifiedIdeographs / æ¼¢å—ã ã‘ã© CJKUnifiedIdeographs ã˜ã‚ƒãªã„æ–‡å—ã‚’æŽ¢ã™

	greple --inside='\p{Han}+' '[^\s\p{InCJKUnifiedIdeographs}]'
	
	# This works, but quite slow.  Not recommended.
	# å‹•ãã‘ã©ãƒãƒ§ãƒ¼é…ã„ã‹ã‚‰ã“ã‚“ãªã“ã¨ã—ã¡ã‚ƒé§„ç›®ã‚ˆã€‚

### guess data encoding / æ–‡å—ã‚³ãƒ¼ãƒ‰ã‚’è‡ªå‹•åˆ¤å®šã™ã‚‹

	greple --icode=guess

### specify data encoding / æ–‡å—ã‚³ãƒ¼ãƒ‰ã‚’æŒ‡å®šã™ã‚‹

	greple --icode=euc-jp
	greple --icode=shif-jis

### specify guessing code set / è‡ªå‹•åˆ¤å®šã™ã‚‹ã‚³ãƒ¼ãƒ‰ã‚’æŒ‡å®šã™ã‚‹

	greple --icode=utf8,euc-jp,shift-jis,7bit-jis

### add to guessing code set / è‡ªå‹•åˆ¤å®šã™ã‚‹ã‚³ãƒ¼ãƒ‰ã‚’è¿½åŠ ã™ã‚‹

	greple --icode=+euc-kr

---
## Filter / ãƒ•ã‚£ãƒ«ã‚¿ãƒ¼

### expand tabs before seach / ã‚¿ãƒ–ã‚’å±•é–‹ã—ã¦ã‹ã‚‰æ¤œç´¢ã™ã‚‹

	greple -n --if=expand

README.md view on Meta::CPAN

    This match does not occur when option `--strict` is given, either.

## CHARACTER CODE

- **--icode**=_code_

    Target file is assumed to be encoded in utf8 by default.  Use this
    option to set specific encoding.  When handling Japanese text, you may
    choose from 7bit-jis (jis), euc-jp or shiftjis (sjis).  Multiple code
    can be supplied using multiple option or combined code names with
    space or comma, then file encoding is guessed from those code sets.
    Use encoding name `guess` for automatic recognition from default code
    list which is euc-jp and 7bit-jis.  Following commands are all
    equivalent.

        greple --icode=guess ...
        greple --icode=euc-jp,7bit-jis ...
        greple --icode=euc-jp --icode=7bit-jis ...

    Default code set are always included suspect code list.  If you have
    just one code adding to suspect list, put + mark before the code name.
    Next example does automatic code detection from euc-kr, ascii, utf8
    and UTF-16/32.

        greple --icode=+euc-kr ...

script/greple view on Meta::CPAN

}

## setup file encoding
if (@opt_icode) {
    @opt_icode = map { split /[,\s]+/ } @opt_icode;
    if (grep { s/^\+// } @opt_icode) {
	unshift @opt_icode, @default_icode_list;
    }
    @opt_icode = uniq @opt_icode;
    if (@opt_icode > 1) {
	@opt_icode = grep { !/(?:auto|guess)$/i } @opt_icode;
	Encode::Guess->set_suspects(@opt_icode);
	$file_code = 'Guess';
    }
    elsif ($opt_icode[0] =~ /^(?:guess|auto)$/i) {
	Encode::Guess->set_suspects(@default_icode_list);
	$file_code = 'Guess';
    } else {
	$file_code = $opt_icode[0];
    }
}
else {
    $file_code = $default_icode;
}

script/greple view on Meta::CPAN



=over 7

=item B<--icode>=I<code>

Target file is assumed to be encoded in utf8 by default.  Use this
option to set specific encoding.  When handling Japanese text, you may
choose from 7bit-jis (jis), euc-jp or shiftjis (sjis).  Multiple code
can be supplied using multiple option or combined code names with
space or comma, then file encoding is guessed from those code sets.
Use encoding name C<guess> for automatic recognition from default code
list which is euc-jp and 7bit-jis.  Following commands are all
equivalent.

    greple --icode=guess ...
    greple --icode=euc-jp,7bit-jis ...
    greple --icode=euc-jp --icode=7bit-jis ...

Default code set are always included suspect code list.  If you have
just one code adding to suspect list, put + mark before the code name.
Next example does automatic code detection from euc-kr, ascii, utf8
and UTF-16/32.

    greple --icode=+euc-kr ...

t/15_encoding.t view on Meta::CPAN

use open IO => ':utf8';

use lib '.';
use t::Util;

$ENV{NO_COLOR} = 1;

like(run(q(--icode euc-jp ã„ã‚ã¯ t/SAMPLE_euc-jp.txt))->stdout,
     qr/ã„ã‚ã¯/, "euc-jp");

like(run(q(--icode guess ã„ã‚ã¯ t/SAMPLE_euc-jp.txt))->stdout,
     qr/ã„ã‚ã¯/, "guess euc");

like(run(q(--icode shift-jis ã„ã‚ã¯ t/SAMPLE_sjis.txt))->stdout,
     qr/ã„ã‚ã¯/, "shift-jis");

like(run(q(--icode +shift-jis ã„ã‚ã¯ t/SAMPLE_sjis.txt))->stdout,
     qr/ã„ã‚ã¯/, "guess shift-jis");

done_testing;

( run in 0.381 second using v1.01-cache-2.11-cpan-74e6d1fb12f )