Etikettarkiv: webscraping

SF Bio, negativ marknadsföring och sökspindeljuridik

Kanske är det för att jag själv sysslat mycket med screenscraping och omstöpande av innehåll från andra webbplatser som jag tycker att SF Bio:s agerande enligt nedanstående är rent fantastiskt korkat — ännu mer så när det kommer från den … Läs mer

Publicerat i law | Etiketter , , , , | 4 kommentar

Cachning och throttling för webspindlar i python

Om du inte ägnar dig åt att programmera webspindlar i Python är dagens post förmodligen inte av så stort intresse. Men: Jag har ägnat långfredagen åt att bland annat putsa på några utökningar till urllib2. För länge sedan skrev jag … Läs mer

Publicerat i programming | Etiketter , , | Lämna en kommentar

PM om juridiska aspekter på robots.txt

Här är den tidigare omnämda PM:en om juridiska aspekter på robots.txt (i PDF-format), som jag skrev efter att ha diskuterat frågeställningarna med mina kollegor på IRI.

Publicerat i law | Etiketter , , | 1 kommentar

Juridiska vs tekniska lösningar på problem

Idag blev jag uppringd av en person från domstolsverket, som hade sett lagen.nu. Personen i fråga var dock kritisk till att jag länkar direkt till rättsfallen på deras site; genom mina länkar hade nämligen Google hittat till rättsfallen och indexerat … Läs mer

Publicerat i lagen.nu, law | Etiketter , , , , | 2 kommentar

Har du olovligen berett dig tillgång till en upptagning för automatiserad databehandling idag?

Bruce Schneier länkar till en mycket intressant artikel om vad begreppet ”Unauthorized access” betyder i datorsammanhang, i ett rättsligt perspektiv, utgående från amerikansk rättspraxis och -doktrin. Artikelförfattaren, Orin S. Kerr, kommer fram till att begrepp som ”access” och ”authorized” används … Läs mer

Publicerat i law | Etiketter , , | Lämna en kommentar

The legality of screenscraping

Niklas Lundblad directs me to a couple of interesting propositions about pending laws regarding computer crime (one of them actually uses the phrase ”crimes in cyberspace” — very 1995′ish retro). Both Ds 2005:5 and Ds 2005:6 are intended to be … Läs mer

Publicerat i law, programming | Etiketter , , | 5 kommentar

Part 3: Understanding what was fetched

(Earlier posts in this series: here and here) There are a lot of ways to extract data from a HTML file. You can do simple string searching (by the way, why is the python documentation for basic string objects hidden … Läs mer

Publicerat i programming | Etiketter , , , | Lämna en kommentar

Part 2: Fetching stuff from the web

(A continuation of the series started in this post) Now, the first thing that needs to be done is to actually get the text of the laws from the web. Before that can be done, a list of available laws … Läs mer

Publicerat i programming | Etiketter , , , | Lämna en kommentar