sub update results from the CPAN

Markdown-Pod
ë‹¤ìŒì€ `manaba.yml` ì„¤ì • íŒŒì¼ì—ì„œ ê´€ë¦¬í•˜ëŠ” `webtoon` í•ëª©ì˜ ë‚´ìš© ì¤‘ ì¼ë¶€ìž…ë‹ˆë‹¤.

    #!yaml
    webtoon:
      dieter:
        name: ë‹¤ì´ì–´í„°
        site: daum
        code: 10362
        image: http://i1.cartoon.daumcdn.net/svc/image/U03/cartoon/U620854C4D5B251707
      noblesse:
        name: ë…¸ë¸”ë ˆìŠ¤
        site: naver
        code: 25455
        image: http://imgcomic.naver.com/webtoon/25455/thumbnail/title_thumbnail_20100614120245_t125x101.jpg
      kudu:
        name: êµ¬ë‘
        site: nate
        code: 31337
        image: http://crayondata.cyworld.com/upload/series/31337_m.gif

ì´ì œ ë‹¤ìŒê³¼ ë„¤ì´ë²„, ë„¤ì´íŠ¸ ì›¹íˆ°ì´ë¼ë©´ ì–¼ë§ˆë“ ì§€ ê´€ë¦¬í•˜ê³ (ë³´ê³ ?)
ì‹¶ì€ ë§Œí¼ ì„¤ì •íŒŒì¼ì— ì¶”ê°€í•˜ë©´ ë©ë‹ˆë‹¤.
ê°ê°ì˜ ë§Œí™”ëŠ” ìžì‹ ë§Œì˜ ê³ ìœ  ID í•˜ë¶€ì— `name`, `site`, `code`, `image` í•ëª©ì„ ê°€ì§‘ë‹ˆë‹¤.
`site`ì™€ `code` ë¶€ë¶„ì€ ì •í™•í•˜ê²Œ ê¸°ìž…í•´ì•¼ì§€ë§Œ Manabaê°€ ì œëŒ€ë¡œ
ì²˜ë¦¬ë¥¼ í•´ì¤„ ìˆ˜ ìžˆìŠµë‹ˆë‹¤.  `name`ê³¼ `image`ëŠ” í™”ë©´ì— ë³´ì´ê¸° ìœ„í•œ
ë¶€ë¶„ìœ¼ë¡œ ìž˜ëª» ìž…ë ¥í•œë‹¤ê³  í•´ë„ ì‹¤í–‰ì— ë¬¸ì œëŠ” ì—†ì§€ë§Œ ì›¹íˆ° ì´ë¦„ì´
ì œëŒ€ë¡œ ë³´ì´ì§€ ì•ŠëŠ”ë‹¤ë˜ê°€ ë˜ëŠ” ì›¹íˆ° ëŒ€í‘œ ì´ë¯¸ì§€ê°€ ì œëŒ€ë¡œ ë³´ì´ì§€ ì•ŠëŠ”
ë¬¸ì œê°€ ìžˆì„ ìˆ˜ ìžˆìŠµë‹ˆë‹¤.
ì„¤ì •íŒŒì¼ ìžì²´ê°€ ê°„ê²°í•œ ë§Œí¼ íŠ¹ë³„í•œ ì„¤ëª…ì´ ë” í•„ìš”í•  ê²ƒ ê°™ì§€ëŠ” ì•ŠìŠµë‹ˆë‹¤.

ìž‘ì„±í•œ `manaba.yml` ì„¤ì • íŒŒì¼ì„ ì½ì–´ ë“¤ì´ë ¤ë©´
[CPANì˜ YAML::Tiny ëª¨ë“ˆ][cpan-yaml-tiny]ì„ ì‚¬ìš©í•©ë‹ˆë‹¤.

    #!perl
    sub load_manaba {
        my $yaml = YAML::Tiny->read( config->{manaba} );
        $CONFIG  = $yaml->[0];
    }


ë§ˆêµ¬ ê¸ì–´ì˜¤ê¸°!
---------------

ì›¹ íŽ˜ì´ì§€ì˜ ì •ë³´ë¥¼ ê¸ì–´ì˜¬ ìˆ˜ ìžˆëŠ” ë¼ì´ë¸ŒëŸ¬ë¦¬ë‚˜ Perl ëª¨ë“ˆì€ ë¬´ì²™ ë§ŽìŠµë‹ˆë‹¤.
í•˜ì§€ë§Œ ì›¹ í¬íƒˆì˜ ê²½ìš° ë””ìžì¸ê³¼ HTML êµ¬ì¡°ê°€ ìˆ˜ì‹œë¡œ ë³€í•˜ê¸° ë•Œë¬¸ì—
ê°€ëŠ¥í•˜ë©´ ì†ì‰½ê²Œ ì›í•˜ëŠ” HTML ìš”ì†Œì˜ ê°’ì„ ì¶”ì¶œí•  ìˆ˜ ìžˆëŠ” ë°©ë²•ì„ ì‚¬ìš©í•˜ëŠ” ê²ƒì´ ìœ ë¦¬í•©ë‹ˆë‹¤.
[CPANì˜ Web::Scraper ëª¨ë“ˆ][cpan-web-scraper]ì„ ì´ìš©í•˜ë©´ CSS ì…€ë ‰í„° ë°©ì‹ì´ë‚˜
XPath ë°©ì‹ì„ ì´ìš©í•´ì„œ HTML íŠ¹ì • ìš”ì†Œë¥¼ ì‰½ê²Œ ì°¾ì„ ìˆ˜ ìžˆìŠµë‹ˆë‹¤.
ì •ê·œ í‘œí˜„ì‹ì„ ì´ìš©í•˜ëŠ” ê²ƒë³´ë‹¤ëŠ” ìƒëŒ€ì ìœ¼ë¡œ ë§Žì´ ëŠë¦¬ì§€ë§Œ
ì‚¬ì´íŠ¸ì˜ ë³€í™”ì— ë”°ë¼ ë°œë¹ ë¥´ê²Œ ëŒ€ì‘í•  ìˆ˜ ìžˆë‹¤ëŠ” ê²ƒì´ ë§¤ë ¥ìž…ë‹ˆë‹¤.
ë˜í•œ ì›¹ì„ ê¸ì–´ì˜¬ ë•Œ ì¼ë¶€ëŸ¬ í•´ë‹¹ ì‚¬ì´íŠ¸ì— ê³¼ë¶€í•˜ë¥¼ ì£¼ì§€ ì•Šê¸° ìœ„í•´
ì§€ì—° ì‹œê°„ì„ ì£¼ê¸°ë„(`sleep $time`) í•˜ëŠ”ë° `Web::Scraper`ì˜ ì†ë„ ìžì²´ê°€
ëŠë¦¬ê¸° ë•Œë¬¸ì— ì•„ë¬´ëž˜ë„ ê¸ëŠ” ìž…ìž¥ì—ì„œëŠ” ì•½ê°„ì˜ ì§€ì—°ì´ ë°œìƒí•˜ë¯€ë¡œ
ì¡°ê¸ˆ ì•ˆì‹¬ë˜ëŠ” ë©´ë„ ìžˆìŠµë‹ˆë‹¤.

ê°ê°ì˜ í¬íƒˆ ì‚¬ì´íŠ¸ ë³„ë¡œ `Web::Scraper` ëª¨ë“ˆì„ ì´ìš©í•´ì„œ íŽ˜ì´ì§€ë¥¼ ê¸ì€ í›„
íšŒì°¨ ê´€ë ¨ ì •ë³´ë¥¼ ì¶”ì¶œí•˜ë„ë¡ í•©ë‹ˆë‹¤.
ë„¤ì´íŠ¸ ì›¹íˆ°ì— ëŒ€í•´ ì²˜ë¦¬í•˜ëŠ” ì½”ë“œëŠ” ë‹¤ìŒê³¼ ê°™ìŠµë‹ˆë‹¤.

    #!perl
    sub update_nate_link {
        my ( $id, @links ) = @_;
        ...
        my @chapters = sort {
            my $page_no_a = 0;
            my $page_no_b = 0;
    
            $page_no_a = $1 if $a =~ m/^(\d+)$/;
            $page_no_b = $1 if $b =~ m/^(\d+)$/;

            $page_no_a <=> $page_no_b;
        } map {
            m{viewer/(\d+)$};
        } @links;
        ...
    }

ë„¤ì´ë²„ ì›¹íˆ°ê³¼  ë‹¤ìŒ ì›¹íˆ°ë„ ê¸°ë³¸ì ì¸ í˜•ì‹ì€ ë¹„ìŠ·í•˜ì§€ë§Œ,
`map`ì„ ì´ìš©í•´ì„œ ë§í¬ ì£¼ì†Œì—ì„œ íšŒì°¨ ì •ë³´ë¥¼ ê¸ì–´ì˜¤ëŠ”
ì •ê·œí‘œí˜„ì‹ ë¶€ë¶„ë§Œ ì¡°ê¸ˆì”© ë‹¤ë¦…ë‹ˆë‹¤.



Let's Dance!
-------------

ì›í•˜ëŠ” ì›¹íˆ°ì˜ ì²« ì£¼ì†Œë„, ìµœì‹  ì£¼ì†Œë„ ì•Œì•˜ê³ 
ì´ì œ ë‚¨ì€ ê²ƒì€ í™”ë©´ì— ë¿Œë ¤ì£¼ê¸°ë§Œ í•˜ë©´ ë©ë‹ˆë‹¤.
ì•„ë¬´ëž˜ë„ ê°„ë‹¨í•˜ê²Œ ë§Œë“¤ ë•ŒëŠ” ì›¹ ì–´í”Œë¦¬ì¼€ì´ì…˜ìœ¼ë¡œ ë§Œë“œëŠ” ê²ƒì´
UIë¥¼ ìˆ˜ì •í•œë‹¤ê±°ë‚˜ Perlê³¼ ì—°ë™í•˜ê¸°ë„ ì¢‹ì€ ê²ƒ ê°™ìŠµë‹ˆë‹¤.
ê·¸ë ‡ë‹¤ë©´ Perlì˜ ë§ˆì´í¬ë¡œ ì›¹ í”„ë ˆìž„ì›Œí¬ì¸
[Dancer][dancer-home]ë¥¼ ì‚¬ìš©í•´ì„œ UI êµ¬í˜„ì„ ë§ˆë¬´ë¦¬í•˜ì£ .

ì»¨íŠ¸ë¡¤ëŸ¬ëŠ” ë‹¨ ë‘ ê°œë§Œ ë§Œë“¤ê² ìŠµë‹ˆë‹¤.
ê¸°ë³¸ íŽ˜ì´ì§€ë¥¼ ì˜ë¯¸í•˜ëŠ” `/`, ì¦‰ ì¸ë±ìŠ¤ìš© ì»¨íŠ¸ë¡¤ëŸ¬ í•˜ë‚˜ì™€
ê°•ì œë¡œ ì‚¬ìš©ìžê°€ ë“±ë¡í•œ ì›¹íˆ°ì˜ ì •ë³´ë¥¼ ê°±ì‹ (`Web::Scraper`ë¥¼ ì´ìš©í•´ì„œ)í•˜ëŠ”
`update` ì»¨íŠ¸ë¡¤ëŸ¬ë¥¼ ìƒì„±í•©ë‹ˆë‹¤.

- /
- /update/:id?

`/` ì»¨íŠ¸ë¡¤ëŸ¬ëŠ” ë·° ë‹¨ì— ë„˜ê²¨ì£¼ê¸° ìœ„í•œ ë°ì´í„°ë¥¼ ìƒì„±í•˜ê¸° ìœ„í•œ ì²˜ë¦¬ë¥¼ ìˆ˜í–‰í•©ë‹ˆë‹¤.

    #!perl
    get '/' => sub {
        my $webtoon = $CONFIG->{webtoon};
    
        my @items = map {
            my $item = $webtoon->{$_};
    
            $item->{id}    = $_;
            $item->{first} = q{} unless $item->{first};
            $item->{last}  = q{} unless $item->{last};
    
            $item;
        } sort keys %$webtoon;
    
        my $ptr = 0;
        my @rows;
        while ( $items[$ptr] ) {
            my @cols;
            for my $i ( 0 .. 9 ) {
                last unless $items[$ptr];
                push @cols, $items[$ptr];
                ++$ptr;
            }
            push @rows, \@cols;
        }
    
        template 'index' => {
            rows => \@rows,
        };
    };

`update` ì»¨íŠ¸ë¡¤ëŸ¬ëŠ” `id`ë¥¼ ë°›ì•„ì„œ íŠ¹ì • íšŒì°¨ë§Œ ê°±ì‹ í•  ìˆ˜ë„ ìžˆê³ 
`id`ë¥¼ ë„˜ê²¨ì£¼ì§€ ì•ŠëŠ” ê²½ìš° ëª¨ë“  ì›¹íˆ°ì˜ íšŒì°¨ ì •ë³´ë¥¼ ê°±ì‹ í•©ë‹ˆë‹¤.

    #!perl
    get '/update/:id?' => sub {
        my $id = param('id');
    
        if ($id) {
            update($id);
        }
        else {
            update_all();
        }
    
        redirect '/';
    };

ì›¹íˆ°ì˜ ì •ë³´ë¥¼ ê¸ì–´ì˜¤ëŠ” í•¨ìˆ˜ëŠ” `update_all()`ê³¼ `update()` í•¨ìˆ˜ìž…ë‹ˆë‹¤.
`update_all()` í•¨ìˆ˜ëŠ” ë‚´ë¶€ì ìœ¼ë¡œ `update()` í•¨ìˆ˜ë¥¼ í˜¸ì¶œí•˜ë¯€ë¡œ
`update()` í•¨ìˆ˜ë¥¼ ê°„ëžµí•˜ê²Œ ì‚´íŽ´ë³´ì£ .

    #!perl
    sub update {
        my $id = shift;
    
        return unless $id;
    
        my $webtoon = $CONFIG->{webtoon};
        return unless $webtoon;
    
        my $site_name = $webtoon->{$id}{site};
        return unless $site_name;
    
        my $scraper = $SCRAPERS->{ $site_name };
        return unless $scraper;
    
        my $site = $CONFIG->{site};
        return unless $site;
    
        my $start_url = sprintf(
            $site->{ $site_name }{ 'start_url' },
            $webtoon->{$id}{ 'code' },
        );
    
        my $items = $scraper->scrape( URI->new( $start_url ) )->{items};
        my @links = map { $_->{link} } @$items;
    
        given ( $site_name ) {
            update_daum_link($id, @links)  when 'daum';
            update_naver_link($id, @links) when 'naver';
            update_nate_link($id, @links)  when 'nate';
        }
    }

`update()` í•¨ìˆ˜ëŠ” ë‹¤ì‹œ ê°ê°ì˜ ì‚¬ì´íŠ¸ ë³„ë¡œ ì›¹íˆ°ì„ ì²˜ë¦¬í•˜ê¸° ìœ„í•œ í•¨ìˆ˜ë¡œ ì´ë™í•©ë‹ˆë‹¤.
ê°ê°ì˜ í•¨ìˆ˜ì—ì„œëŠ” ì•žì—ì„œ ë³´ì•˜ë˜ `Web::Scraper` ëª¨ë“ˆì„ ì´ìš©í•´ì„œ
ì›í•˜ëŠ” ì›¹íˆ° íšŒì°¨ ì •ë³´ë¥¼ ì¶”ì¶œí•©ë‹ˆë‹¤.

`Web::Scraper`ë¥¼ ì‚¬ìš©í•˜ê¸° ë•Œë¬¸ì— ì ì ˆí•˜ê²Œ ì§€ì—° ì‹œê°„ì„ ì£¼ì§€ ì•Šìœ¼ë©´
í¬íƒˆ ì‚¬ì´íŠ¸ë¡œë¶€í„° ì‚¬ìš©í•˜ëŠ” ì•„ì´í”¼ê°€ ë¸”ë¡ ë‹¹í•  ìˆ˜ ìžˆìœ¼ë¯€ë¡œ ì£¼ì˜í•˜ë„ë¡ í•©ë‹ˆë‹¤.
í•„ìš”í•˜ë‹¤ë©´ `update_all()` ë˜ëŠ” `update()` í•¨ìˆ˜ì—
`sleep $time` ì²˜ëŸ¼ ì§€ì—° ì‹œê°„ì„ ì ì ˆí•˜ê²Œ ì£¼ë„ë¡ í•©ë‹ˆë‹¤.

í˜„ìž¬ êµ¬í˜„ìƒ Manabaê°€ ìµœì´ˆì— Dancer ì›¹ ì–´í”Œë¦¬ì¼€ì´ì…˜ìœ¼ë¡œ ì‹¤í–‰ë  ë•Œ
ëª¨ë“  ì›¹íˆ°ì˜ ì •ë³´ë¥¼ ê¸ì–´ì˜µë‹ˆë‹¤.
ì›¹íˆ°ì˜ ì–‘ì´ ë§Žìœ¼ë©´ ë§Žì„ìˆ˜ë¡ ì •ë³´ë¥¼ ê¸ì–´ì˜¤ëŠ”ë° ë“œëŠ” ë¹„ìš©ì´ ì»¤ì§€ë¯€ë¡œ
íŽ˜ì´ì§€ê°€ ê°±ì‹  ë ë•Œë§ˆë‹¤ ì •ë³´ë¥¼ ê°±ì‹ í•˜ê¸° ë³´ë‹¤ëŠ” ê°ê°ì˜ ì›¹íˆ° ë³„ë¡œ
ê°±ì‹ í•  ìˆ˜ ìžˆë„ë¡ `/update` ì»¨íŠ¸ë¡¤ëŸ¬ì—ì„œ `id`ë¥¼ ì¸ìžë¡œ ë°›ê³  ìžˆìŒì„ ìœ ì˜í•´ì£¼ì„¸ìš”.


ë„¤ì´ë²„ëŠ” ê´´ë¡œì›Œ...
-------------------

ê±°ì˜ ë‹¤ ìž‘ì—…ì´ ëë‚˜ê°ˆ ë¬´ë µ ë„¤ì´ë²„ì˜ ì›¹íˆ° ëŒ€í‘œ ì´ë¯¸ì§€ê°€ ë³´ì´ì§€ ì•Šê¸° ì‹œìž‘í–ˆìŠµë‹ˆë‹¤.
(ì´ëŸ°! ì•„ê¹Œê¹Œì§€ë§Œ í•´ë„ ìž˜ ë³´ì˜€ëŠ”ë°!!)
ì—¬ëŸ¬ë²ˆì˜ ê²€ìƒ‰ ë° í…ŒìŠ¤íŠ¸ ê²°ê³¼ ë„¤ì´ë²„ê°€ ì •ì±…ì ìœ¼ë¡œ ì™¸ë¶€ ì£¼ì†Œì—ì„œ
ìžì‹ ì˜ ì´ë¯¸ì§€ë¥¼ ì—´ëžŒí•˜ëŠ” ê²ƒì„ ë§‰ì•„ ë†“ì•˜ë‹¤ëŠ” ì‹¬ì¦ì„ êµ³ížˆê²Œ ë©ë‹ˆë‹¤.
ì•„ë§ˆë„ íŠ¸ëž˜í”½ì˜ íì¦ì„ ë§‰ê¸° ìœ„í•œ ë°©ì•ˆìœ¼ë¡œ ìƒê°ë˜ëŠ”ë°
êµë‚´ 1ìœ„ ëŒ€í˜• í¬íƒˆìž„ì„ ê°ì•ˆí• ë•Œ ìƒê°ë³´ë‹¤ *ìª¼ì§œ..* ... í•œ ê²ƒ ê°™ìŠµë‹ˆë‹¤.
IP ë¸”ëŸ ë‹¹í•˜ì§€ ì•Šì€ ê²ƒì´ ë‹¤í–‰ì´êµ°ìš”...;;;

ê·¸ëž˜ì„œ í”„ë¡œê·¸ëž¨ ìƒì—ì„œ ì´ë¯¸ì§€ë¥¼ ë°”ë¡œ ë³´ì—¬ì£¼ëŠ” ê²ƒì´ ì•„ë‹ˆë¼
ë‹¤ìš´ë¡œë“œ ë°›ì•„ì„œ ë¡œì»¬ í•˜ë“œ ë””ìŠ¤í¬ì— ì €ìž¥í•´ì„œ ë³´ì—¬ì£¼ê¸°ë¡œ ì •ì±…ì„ ì„ íšŒí•©ë‹ˆë‹¤.
( run in 3.222 seconds using v1.01-cache-2.11-cpan-d8267643d1d )