split m results from the CPAN

split m
Unicode-LineBreak
view release on metacpan or search on metacpan
lib/POD2/JA/Unicode/LineBreak.pod view on Meta::CPAN
    "eol" |ä»»æ„åˆ†å‰²             |åˆ†å‰²ä½ç½®ã®å‰ã®ç©ºç™½æ–‡å—
    "eop" |å¼·åˆ¶åˆ†å‰²             |æ”¹è¡Œã¨ãã®å‰ã®ç©ºç™½æ–‡å—
    "eot" |ãƒ†ã‚ã‚¹ãƒˆçµ‚ç«¯         |ãƒ†ã‚ã‚¹ãƒˆçµ‚ç«¯ã®ç©ºç™½æ–‡å— (ã¨æ”¹è¡Œ)
    -----------------------------------------------------------------

ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯ã€ãƒ†ã‚ã‚¹ãƒˆã®æ–ç‰‡ã‚’ä¿®æ£ã—ã¦è¿”ã•ãªã‘ã‚Œã°ãªã‚‰ãªã„ã€‚ãªã«ã‚‚ä¿®æ£ã—ãªã‹ã£ãŸã“ã¨ã‚’ç¤ºã™ã«ã¯ã€C<undef> ã‚’è¿”ã›ã°ã‚ˆã„ã€‚
ãªãŠã€C<"sot">ã€C<"sop">ã€C<"sol"> ã®æ–‡è„ˆã§ã®ä¿®æ£ã¯ãã®å¾Œã®åˆ†å‰²ä½ç½®ã®æ±ºå®šã«å½±éŸ¿ã™ã‚‹ãŒã€ã»ã‹ã®æ–‡è„ˆã§ã®ä¿®æ£ã¯å½±éŸ¿ã—ãªã„ã€‚

B<æ³¨æ„>:
æ–‡å—åˆ—ã®å¼•æ•°ã¯å®Ÿéš›ã«ã¯æ›¸è¨˜ç´ ã‚¯ãƒ©ã‚¹ã‚¿åˆ—ã§ã‚ã‚‹ã€‚
L<Unicode::GCString~[ja]> å‚ç…§ã€‚

ãŸã¨ãˆã°æ¬¡ã®ã‚³ãƒ¼ãƒ‰ã¯ã€è¡Œæœ«ã®ç©ºç™½ã‚’å–ã‚Šé™¤ã„ã¦è¡ŒæŠ˜ã‚Šã‚’ã™ã‚‹ã€‚

    sub fmt {
        if ($_[1] =~ /^eo/) {
            return "\n";
      	}
        return undef;
    }
    my $lb = Unicode::LineBreak->new(Format => \&fmt);
    $output = $lb->break($text);

=head2 ãƒ¦ãƒ¼ã‚¶å®šç¾©ã®è¡Œåˆ†å‰²å‹•ä½œ

ä»»æ„åˆ†å‰²ã«ã‚ˆã£ã¦ç”Ÿã˜ã‚‹è¡ŒãŒ CharMaxã€ColMaxã€ColMin ã®ã„ãšã‚Œã‹ã®åˆ¶é™ã‚’è¶…ãˆã‚‹ã¨è¦‹è¾¼ã¾ã‚Œã‚‹ã¨ãã¯ã€å¼•ãç¶šãæ–‡å—åˆ—ã«å¯¾ã—ã¦B<ç·Šæ€¥åˆ†å‰²>ã‚’å®Ÿè¡Œã§ãã‚‹ã€‚
L</Urgent> ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã«ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¸ã®å‚ç…§ã‚’æŒ‡å®šã™ã‚‹å ´åˆã€ãã®ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯ 2 ã¤ã®å¼•æ•°ã‚’å–ã‚‰ãªã‘ã‚Œã°ãªã‚‰ãªã„ã€‚

    @åˆ†å‰²å¾Œ = &ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³(SELF, STR);

SELF ã¯ Unicode::LineBreak ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã€STR ã¯åˆ†å‰²ã™ã¹ã Unicode æ–‡å—åˆ—ã€‚

ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯ã€æ–‡å—åˆ— STR ã‚’åˆ†å‰²ã—ãŸçµæžœã®é…åˆ—ã‚’è¿”ã•ãªã‘ã‚Œã°ãªã‚‰ãªã„ã€‚

B<æ³¨æ„>:
æ–‡å—åˆ—ã®å¼•æ•°ã¯å®Ÿéš›ã«ã¯æ›¸è¨˜ç´ ã‚¯ãƒ©ã‚¹ã‚¿åˆ—ã§ã‚ã‚‹ã€‚
L<Unicode::GCString~[ja]> å‚ç…§ã€‚

ãŸã¨ãˆã°æ¬¡ã®ã‚³ãƒ¼ãƒ‰ã¯ã€è‹¥å¹²ã®åŒ–å¦ç‰©è³ª (ãƒãƒãƒ³ã®ã‚ˆã†ãª) ã®åç§°ã«ãƒã‚¤ãƒ•ãƒ³ã‚’æŒ¿å…¥ã—ã€è¡ŒæŠ˜ã‚Šã§ãã‚‹ã‚ˆã†ã«ã™ã‚‹ã€‚

    sub hyphenize {
	return map {$_ =~ s/yl$/yl-/; $_} split /(\w+?yl(?=\w))/, $_[1];
    }
    my $lb = Unicode::LineBreak->new(Urgent => \&hyphenize);
    $output = $lb->break("Methionylthreonylthreonylglutaminylarginyl...");

L</Prep> ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã« [REGEX, SUBREF] ã®é…åˆ—å‚ç…§ã‚’æŒ‡å®šã™ã‚‹å ´åˆã€ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯ 2 ã¤ã®å¼•æ•°ã‚’å–ã‚‰ãªã‘ã‚Œã°ãªã‚‰ãªã„ã€‚

    @åˆ†å‰²å¾Œ = &ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³(SELF, STR);

SELF ã¯ Unicode::LineBreak ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã€STR ã¯ REGEX ã«ãƒžãƒƒãƒã™ã‚‹åˆ†å‰²ã™ã¹ã Unicode æ–‡å—åˆ—ã€‚

ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯ã€æ–‡å—åˆ— STR ã‚’åˆ†å‰²ã—ãŸçµæžœã®é…åˆ—ã‚’è¿”ã•ãªã‘ã‚Œã°ãªã‚‰ãªã„ã€‚

ãŸã¨ãˆã°æ¬¡ã®ã‚³ãƒ¼ãƒ‰ã¯ã€HTTP URL ã‚’ [CMOS] ã®è¦å‰‡ã‚’ç”¨ã„ã¦åˆ†å‰²ã™ã‚‹ã€‚

    my $url = qr{http://[\x21-\x7E]+}i;
    sub breakurl {
        my $self = shift;
        my $str = shift;
        return split m{(?<=[/]) (?=[^/]) |
                       (?<=[^-.]) (?=[-~.,_?\#%=&]) |
        	       (?<=[=&]) (?=.)}x, $str;
    }
    my $lb = Unicode::LineBreak->new(Prep => [$url, \&breakurl]);
    $output = $lb->break($string);

=head3 çŠ¶æ…‹ã®ä¿å˜

Unicode::LineBreak ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã¯ãƒãƒƒã‚·ãƒ¥å‚ç…§ã¨ã—ã¦ãµã‚‹ã¾ã†ã€‚
ä»»æ„ã®è¦ç´ ã‚’ã€ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã®å˜åœ¨æœŸé–“ä¸ä¿å˜ã§ãã‚‹ã€‚

ãŸã¨ãˆã°æ¬¡ã®ã‚³ãƒ¼ãƒ‰ã¯ã€æ®µè½ã‚’ç©ºè¡Œã§åˆ†ã‘ã‚‹ã€‚

    sub paraformat {
        my $self = shift;
        my $action = shift;
        my $str = shift;
        
        if ($action eq 'sot' or $action eq 'sop') {
            $self->{'line'} = '';
        } elsif ($action eq '') {
            $self->{'line'} = $str;
        } elsif ($action eq 'eol') {
            return "\n";
        } elsif ($action eq 'eop') {
            if (length $self->{'line'}) {
                return "\n\n";
            } else {
                return "\n";
            }
        } elsif ($action eq 'eot') {
            return "\n";
        }
        return undef;
    }
    my $lb = Unicode::LineBreak->new(Format => \&paraformat);
    $output = $lb->break($string);

=head2 æ–‡å—åˆ—é•·ã®ç®—å‡º

L</Sizing> ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã«ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¸ã®å‚ç…§ã‚’æŒ‡å®šã™ã‚‹å ´åˆã€ãã®ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯ 5 ã¤ã®å¼•æ•°ã‚’å–ã‚‰ãªã‘ã‚Œã°ãªã‚‰ãªã„ã€‚

    $æ¡æ•° = &ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³(SELF, LEN, PRE, SPC, STR);

SELF ã¯ Unicode::LineBreak ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã€LEN ã¯å…ˆè¡Œã™ã‚‹æ–‡å—åˆ—ã®é•·ã•ã€PRE ã¯å…ˆè¡Œã™ã‚‹ Unicode æ–‡å—åˆ—ã€SPC ã¯è¿½åŠ ã•ã‚Œã‚‹ç©ºç™½æ–‡å—ã€STR ã¯å‡¦ç†ã™ã‚‹ Unicode æ–‡å—åˆ—ã€‚

ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯ C<PRE.SPC.STR> ã®æ¡æ•°ã‚’ç®—å‡ºã—ã¦è¿”ã•ãªã‘ã‚Œã°ãªã‚‰ãªã„ã€‚
æ¡æ•°ã¯æ•´æ•°ã§ãªãã¦ã‚‚ã‚ˆã„ã€‚æ¡æ•°ã®å˜ä½ã¯éšæ„ã«é¸ã¹ã‚‹ãŒã€L</ColMin> ã‚ªãƒ—ã‚·ãƒ§ãƒ³ãŠã‚ˆã³ L</ColMax> ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã®ãã‚Œã¨ä¸€è‡´ã•ã›ãªã‘ã‚Œã°ãªã‚‰ãªã„ã€‚

B<æ³¨æ„>:
æ–‡å—åˆ—ã®å¼•æ•°ã¯å®Ÿéš›ã«ã¯æ›¸è¨˜ç´ ã‚¯ãƒ©ã‚¹ã‚¿åˆ—ã§ã‚ã‚‹ã€‚
L<Unicode::GCString~[ja]> å‚ç…§ã€‚

ãŸã¨ãˆã°æ¬¡ã®ã‚³ãƒ¼ãƒ‰ã¯ã€è¡Œã« 8 æ¡ã”ã¨ã®ã‚¿ãƒ–ã‚¹ãƒˆãƒƒãƒ—ãŒã‚ã‚‹ã‚‚ã®ã¨ã—ã¦å‡¦ç†ã™ã‚‹ã€‚

    sub tabbedsizing {
        my ($self, $cols, $pre, $spc, $str) = @_;
     
        my $spcstr = $spc.$str;
        while ($spcstr->lbc == LB_SP) {
( run in 0.699 second using v1.01-cache-2.11-cpan-71847e10f99 )