GenOO
view release on metacpan or search on metacpan
lib/GenOO/GeneCollection/Factory/GTF.pm view on Meta::CPAN
# POD documentation - main docs before the code
=head1 NAME
GenOO::GeneCollection::Factory::GTF - Factory to create GeneCollection from a GTF file
=head1 SYNOPSIS
Creates GenOO::GeneCollection containing genes from a GTF file
Preferably use it through the generic GenOO::GeneCollection::Factory
my $factory = GenOO::GeneCollection::Factory->new('GTF',{
file => 'sample.gtf'
});
=head1 DESCRIPTION
# An instance of this class is a concrete factory for the creation of a
# L<GenOO::GeneCollection> containing genes from a GTF file. It offers the
# method "read_collection" (as the consumed role requires) which returns
# the actual L<GenOO::GeneCollection> object in the form of
# L<GenOO::RegionCollection::Type::DoubleHashArray>. The latter is the
# implementation
# of the L<GenOO::RegionCollection> class based on the complex data
# structure L<GenOO::Data::Structure::DoubleHashArray>.
=head1 EXAMPLES
# Create a concrete factory
my $factory_implementation = GenOO::GeneCollection::Factory->new('GTF',{
file => 'sample.gtf'
});
# Return the actual GenOO::GeneCollection object
my $collection = $factory_implementation->read_collection;
print ref($collection) # GenOO::GeneCollection::Type::DoubleHashArray
=cut
# Let the code begin...
package GenOO::GeneCollection::Factory::GTF;
$GenOO::GeneCollection::Factory::GTF::VERSION = '1.5.2';
#######################################################################
####################### Load External modules #####################
#######################################################################
use Modern::Perl;
use autodie;
use Moose;
use namespace::autoclean;
#######################################################################
####################### Load GenOO modules #####################
#######################################################################
use GenOO::RegionCollection::Factory;
use GenOO::Transcript;
use GenOO::Gene;
use GenOO::Data::File::GFF;
#######################################################################
####################### Interface attributes ######################
#######################################################################
has 'file' => (
isa => 'Maybe[Str]',
is => 'ro'
);
#######################################################################
########################## Consumed Roles #########################
#######################################################################
with 'GenOO::RegionCollection::Factory::Requires';
#######################################################################
######################## Interface Methods ########################
#######################################################################
sub read_collection {
my ($self) = @_;
my $genes = $self->_read_gtf($self->file);
return GenOO::RegionCollection::Factory->create('RegionArray', {
array => $genes
})->read_collection;
}
#######################################################################
######################### Private methods ##########################
#######################################################################
sub _read_gtf {
my ($self, $file)=@_;
my %transcripts;
my %transcript_splice_starts;
my %transcript_splice_stops;
my %genes;
my $gff = GenOO::Data::File::GFF->new(file => $file);
while (my $record = $gff->next_record){
next unless (($record->feature eq 'exon') or ($record->feature eq 'start_codon') or ($record->feature eq 'stop_codon'));
my $tid = $record->attribute('transcript_id')
or die "transcript_id attribute must be defined\n";
my $gid = $record->attribute('gene_id')
( run in 0.619 second using v1.01-cache-2.11-cpan-d8267643d1d )