November 2009 Archive

Web::Scraper wird verwendet um Informationen aus Webseiten zu auszulesen.
Es leidet dabei nicht unter kleinen veränderungen der Webseite, wie HTML::Parser oder eingene Regex-Suchfilter. Die zu suchenden Elemente können dabei per CSS oder XPath-Syntax angegeben werden.

#!/usr/bin/perl -w
use strict;
use v5.10;
use Web::Scraper;
use URI;

my $uri = URI->new('http://www.zdf.de/ZDFmediathek?flash=off');

my $p = scraper {
 process 'a' , 'links[]' => scraper {
 process 'a' , 'title' => 'TEXT'; process 'a' , 'url' => '@href';
  };
};
my $result = $p->scrape($uri);
say $$_{title} for @{ $result->{links} };



  • http://reneeb-perlblog.blogspot.com/2007/09/webscraper-ein-echt-ntzliches-modul.html
  • http://search.cpan.org/~miyagawa/Web-Scraper-0.31/
  • http://www.corion.net/talks/web-scraper/web-scraper-talk.html
  • http://www.slideshare.net/miyagawa/webscraper-for-sfpm-lt
  • http://de.wikipedia.org/wiki/XPath

Perl.org neugestaltet

| | Kommentare (0) | TrackBacks (0)
nach perldoc.org wurde nun auch perl.org neugestaltet.
Ich gratulieren. Die neue Seite ist endlich vorzeigbar.

Hier die neue und aktuelle Seite:
perlorg-neu.pngZum Vergleich die alte Seite. Stand 2008:
perlorg-alt.png


Wozu ein Wiki? (QuickTip)

| | Kommentare (0) | TrackBacks (0)
Wikis sind sehr nüztliche und auch mächtige Hilfsmittel.
Für die Meisten ( vor allem nicht Techniker ) sind es aber immer noch abstrakte Objekte.
Klar hat man davon gehört, kann sich aber nicht vorstellen für was man es
benutzen sollte. Es gibt real existierende Wikis in Unternehmen. Häufig werden diese in gutem Willen installiert, und verstauben danach auf den Servern.
Sie scheitern am Unwillen der Benutzer. Wie bei allen Technologien müssen die Benutzer erst von Ihrem Nutzen überzeugt werden.


December 2010

So Mo Di Mi Do Fr Sa
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

Über dieses Archiv

Diese Seite enthält alle Einträge von $mad[4]->milk() von neu nach alt.

October 2009 ist das vorherige Archiv.

December 2009 ist das nächste Archiv.

Aktuelle Einträge finden Sie auf der Startseite, alle Einträge in den Archiven.