Projekt, ein Crawler zu schreiben, das zu einer gegebenen BeckOK-Titelseite das gesamte Buch in eine PDF speichert.
Go to file
2020-10-10 20:00:22 +02:00
crawler.js Ich glaub ich krieg die Authentifizierung nicht hin 2020-10-10 20:00:22 +02:00
package.json update metadata 2020-10-10 16:06:05 +02:00
README.md README updated 2020-10-10 14:53:03 +02:00

BeckOK

Der Beck'sche OnlineKommentar ist nur mit Account nutzbar und zeigt den Kommentar nur Paragraphen- oder gar randnummerweise an. Das wollen wir ändern: BeckOK soll einmal aus dem Link zur Titelseite eines Gesetzbuchs ein PDF mit dem gesamten Buch machen.

Systemvorraussetzungen

node.js und npm.

Run with node crawler.js <START_URL>. Wird START_URL nicht angegeben, wird die Titelseite des Grundgesetzes verwendet.

Stand

Das Skript blättert alle aufeinanderfolgend frei zugänglichen Seiten ab der angegebenen durch, ohne sie abzuspeichern.

Todos

  • Abspeichern, obviously
  • evtl. Authentifizierung?