Web::Scraper wird verwendet um Informationen aus Webseiten zu auszulesen.
Es leidet dabei nicht unter kleinen veränderungen der Webseite, wie HTML::Parser oder eingene Regex-Suchfilter. Die zu suchenden Elemente können dabei per CSS oder XPath-Syntax angegeben werden.
#!/usr/bin/perl -w
use strict;
use v5.10;
use Web::Scraper;
use URI;
my $uri = URI->new('http://www.zdf.de/ZDFmediathek?flash=off');
my $p = scraper {
process 'a' , 'links[]' => scraper {
process 'a' , 'title' => 'TEXT'; process 'a' , 'url' => '@href';
};
};
my $result = $p->scrape($uri);
say $$_{title} for @{ $result->{links} };
- http://reneeb-perlblog.blogspot.com/2007/09/webscraper-ein-echt-ntzliches-modul.html
- http://search.cpan.org/~miyagawa/Web-Scraper-0.31/
- http://www.corion.net/talks/web-scraper/web-scraper-talk.html
- http://www.slideshare.net/miyagawa/webscraper-for-sfpm-lt
- http://de.wikipedia.org/wiki/XPath
Jetzt kommentieren