bind results from the CPAN

bind
App-Anchr
view release on metacpan or search on metacpan
- [ç‰ˆæœ¬](#ç‰ˆæœ¬)
- [ä¾èµ–](#ä¾èµ–)
- [å®‰è£…](#å®‰è£…)
- [æ ·ä¾‹æ•°æ®](#æ ·ä¾‹æ•°æ®)
    - [Rhodobacter sphaeroides (çƒå½¢çº¢ç»†èŒ)](#rhodobacter-sphaeroides-çƒå½¢çº¢ç»†èŒ)
        - [Illumina PE, Short Jump and Sanger (1x or 4x)](#illumina-pe-short-jump-and-sanger-1x-or-4x)
        - [Rhodobacter sphaeroides with `anchr superreads`](#rhodobacter-sphaeroides-with-anchr-superreads)
        - [ç»“æžœæ¯”è¾ƒ](#ç»“æžœæ¯”è¾ƒ)
- [SuperReads 3.1.3](#superreads-313)
- [Super-reads and anchors](#super-reads-and-anchors)
    - [E. coli sampling](#e-coli-sampling)
        - [E. coli: link anchors](#e-coli-link-anchors)


# ç‰¹ç‚¹

De novo åŸºå› ç»„åºåˆ—çš„æ‹¼æŽ¥æœ‰ä»¥ä¸‹å‡ ç§ä¸»æµçš„ç–ç•¥:

1. Overlapâ€“layoutâ€“consensus (OLC) assembly

    * ä¸»è¦ç”¨äºŽé•¿ reads, åœ¨ Sanger æµ‹åºæ—¶ä»£å°±åŸºæœ¬å‘å±•å®Œå¤‡, ä¸‰ä»£æ—¶ä»£åˆé‡æ–°å‘å±•
    * ä»£è¡¨: Celera Assembler, PCAP, Canu

2. de Bruijn graph (å¾·å¸ƒé²å› å›¾)

    * äºŒä»£æµ‹åºçš„ä¸»æµ
    * ä»£è¡¨: Velvet, SOAPdenovo, Allpaths-LG

3. String graph

    * Myers æå‡ºçš„ OLC çš„æ‰©å±•, ä¸»è¦æ˜¯ layout éƒ¨åˆ†çš„ç®—æ³•æœ‰æ‰€ä¸åŒ. SGA ä½¿ç”¨ FM-index/Burrows-Wheeler transform
      æ¥æ‰¾ overlaps, è¾ƒä¸ºèŠ‚çœå†…å˜
    * ä»£è¡¨: SGA

MaSuRCA æå‡ºäº†ä¸€ç§æ–°çš„ç–ç•¥, Super-reads. ä¸»è¦æ€æƒ³æ˜¯å°†å¤šä¸ªçŸ reads æŒ‰ 1 bp (å®žé™…ä¸Šæ˜¯ unique K-mer) å»¶ä¼¸,
åˆå¹¶å¾—åˆ°æ•°é‡å°‘å¾—å¤šçš„é•¿ reads. åœ¨å•å€ä½“åŸºå› ç»„çš„æƒ…å†µä¸‹, æ— è®ºè¦†ç›–åº¦æ˜¯å¤šå°‘ (50x, 100x), æœ€ç»ˆçš„ super-reads
è¦†ç›–åº¦éƒ½è¶‹å‘äºŽ 2x. é«˜æ‚åˆåŸºå› ç»„åˆ™è¶‹å‘äºŽ 4x.

åˆå¹¶åŽçš„ super-reads çš„ N50 çº¦ä¸º 2-4 kbp.

# ç‰ˆæœ¬

version 3.1.3.

homebrew-science é‡Œçš„ç‰ˆæœ¬æ˜¯ 2.3.2b, 3.1.3 çš„
[PR](https://github.com/Homebrew/homebrew-science/pull/3802) ä¹Ÿæœ‰äº†, ä½†æ²¡åˆå¹¶.

ä¹æœˆ UMD çš„ ftp ä¸Šæœ‰äº† 3.2.1 ç‰ˆ, å¤šäº† CA8, MUMmer å’Œ PacBio ä¸‰ä¸ªç›®å½•, è¿˜æœ«è¯¦ç»†ç ”ç©¶.

http://ccb.jhu.edu/software.shtml

> New modules coming soon include methods to create hybrid assemblies using both Illumina and PacBio
> data.

# ä¾èµ–

å¤–éƒ¨

* gcc-4: macOS ä¸‹çš„ clang æ— æ³•ç¼–è¯‘
* m4: å®è¯è¨€, ç”± `autoreconf -fi` ç”Ÿæˆ, æ˜¯ `GNU autotools` çš„ä¸€éƒ¨åˆ†, ä¸ç”¨ç®¡
* swig: for Perl binding of jellyfish

è‡ªå¸¦

* Celera Assembler
* [jellyfish](https://github.com/gmarcais/Jellyfish): k-mer counting
* prepare: æ— æ–‡æ¡£, çœ‹èµ·æ¥æ˜¯é¢„å¤„ç†æ•°æ®ç”¨çš„.
* [Quorum](https://github.com/gmarcais/Quorum): Error correction for Illumina reads.
* samtools
* SOAPdenovo2
* SuperReads: masurca çš„ä¸»ç¨‹åº. è¿™ä¸ªæ˜¯æˆ‘ä»¬æ‰€éœ€è¦çš„, åˆå¹¶ reads çš„åŠŸèƒ½å°±åœ¨è¿™é‡Œ. æºç çº¦äº”ä¸‡è¡Œ.
* ufasta: UMD çš„æ“ä½œ fasta çš„å·¥å…·, æœªåœ¨å…¶å®ƒåœ°æ–¹å‘çŽ°ç›¸å…³ä¿¡æ¯. é‡Œé¢çš„ tests å†™å¾—ä¸é”™, å€¼å¾—å€Ÿé‰´.

# å®‰è£…

```bash
echo "==> MaSuRCA"
cd /prepare/resource/
wget -N ftp://ftp.genome.umd.edu/pub/MaSuRCA/MaSuRCA-3.1.3.tar.gz

if [ -d $HOME/share/MaSuRCA ]; then
    rm -fr $HOME/share/MaSuRCA
fi

cd $HOME/share/
tar xvfz /prepare/resource/MaSuRCA-3.1.3.tar.gz

mv MaSuRCA-* MaSuRCA
cd MaSuRCA
sh install.sh
```

ç¼–è¯‘å®ŒæˆåŽ, ä¼šç”Ÿæˆ `bin` ç›®å½•, é‡Œé¢æ˜¯å¯æ‰§è¡Œæ–‡ä»¶, `tree bin`.

```text
bin
â”œâ”€â”€ add_missing_mates.pl
â”œâ”€â”€ addSurrogatesToFrgCtgFile
â”œâ”€â”€ addSurrogatesToFrgctg.perl
â”œâ”€â”€ bloom_query
â”œâ”€â”€ closeGapsInScaffFastaFile.perl
â”œâ”€â”€ closeGapsLocally.perl
â”œâ”€â”€ closeGaps.oneDirectory.fromMinKmerLen.perl
â”œâ”€â”€ closeGaps.oneDirectory.perl
â”œâ”€â”€ closeGaps.perl
â”œâ”€â”€ close_gaps.sh
â”œâ”€â”€ collectReadSequencesForLocalGapClosing
â”œâ”€â”€ compute_sr_cov.pl
â”œâ”€â”€ compute_sr_cov.revisedForGCContig.pl
â”œâ”€â”€ create_end_pairs.perl
â”œâ”€â”€ create_end_pairs.pl
â”œâ”€â”€ createFastaSuperReadSequences
â”œâ”€â”€ createKUnitigMaxOverlaps
â”œâ”€â”€ create_k_unitigs_large_k
â”œâ”€â”€ create_k_unitigs_large_k2
â”œâ”€â”€ create_sr_frg
â”œâ”€â”€ create_sr_frg.pl
â”œâ”€â”€ createSuperReadSequenceAndPlacementFileFromCombined.perl
â”œâ”€â”€ createSuperReadsForDirectory.perl
â”œâ”€â”€ eliminateBadSuperReadsUsingList
â”œâ”€â”€ error_corrected2frg
( run in 1.159 second using v1.01-cache-2.11-cpan-2398b32b56e )