Lagen, nu med kommentatorsspår

Det har redan omnämnts på lagen.nu, i mitt twitterflöde och på Moonhouse, men självklart ska jag även här meddela sommarens stora begivenhet i rättsinformationsvärlden: Nu förklarar vi lagen, med wikiteknik! Jag och ca tio-femton andra jurister kommer ägna oss åt att kommentera och förklara Sveriges viktigaste lagar – systematik, begrepp, tolkningar och allt annat som är svårt att se när man bara läser lagtexten. Det hela blir förstås fritt innehåll under CC-BY-SA-2.5-se.

Är du jurist(student) och tycker det här verkar vara ett lovvärt initiativ att ägna sig åt under regnperioden, skicka iväg en intresseanmälan senast på fredag! Kolla in hur vi tänker oss gå tillväga på deltagarportalen, följ aktiviteten på mailinglistan och gå med i fanklubben på facebook! Inledande workshop i Stockholm i början av juli, sedan distribuerat arbete under sommaren och hösten. Viss ersättning utgår.

Det hela sker med stöd av IIS, som genom Internetfonden finansierar det hela. Stort tack till dem! Registrera en .se-domän, så de kan fortsätta med sådant här stöd.

Diverse skriverier

Lite tyst här på sistone — jag jobbar mer eller mindre frenetiskt på
andra saker just nu, bland annat på den
allra sista kursen jag ska gå
på juristprogrammet. Känns lite
märkligt.

Men jag har skrivit saker på annat håll. Först upp, två krönikor i
TechWorld, en om problemen med
teknikneutral lagstiftning
(där jag i stort utgår från vad Rasmus
Fleisher sa för två år sedan
), och en annan om lagstiftaren
som systemarkitekt
(som i princip bygger på ett tema Nicklas
Lundblad
presenterade för tre år sedan). Medelmåttor lånar, genier
stjäl. Detta är mina sista krönikor för Techworld, vilket är synd, för
jag gillade verkligen att ha deadlines, läsarkrets och inkomst. Om du
vill att jag ska skriva åt just dig och kan erbjuda dessa tre
faktorer, hör av dig.

Jag har tidigare
nämnt
att jag höll på med en text om lagen.nu till Lov &
Data
– nu är tidningen ute, och här
kan du läsa artikeln
. Om du inte redan prenumererar på Lov & Data
rekommenderas ett medlemsskap i ADBJ, då en prenumeration ingår, samt
tillträde till en massa intressanta
seminarier
i Stockholmsområdet.

För lite
längre sedan
skrev jag och Christine Kirchberger
ett paper till en workshop vid Jurix 2008. Det kanske
kommer publiceras officiellt i någon form någon gång, men tills dess
finns vårt paper ”Inbound links – picking the low hanging fruit from
the semantic web” tillgängligt här. Bör vara intressant för både
teoretiskt lagda jurister och semantic web-intressenter.

Avslutningsvis har jag även blivit skriven om: Juridicums
nyhetsbrev
gjorde en liten intervju angående lagen.nu. Superkul!

Seminarium om framtidens rättsinformationstjänster

På torsdag åker jag till Oslo (med tåg – det är ju den senaste retrotrenden) för att på fredag vara med på ett halvdagsseminarium om framtidens rättsinformationstjänster. Jag ska prata om lagen.nu nu och i framtiden och sitter som bäst och planerar mer i detalj vad jag ska prata om. Det blir lite teknik från den här presentationen, lite dåtid/nutid/framtid från den här, lite visionerande från den här och en massa nytt.

Seminariet har styrts upp av Kirill Miazine, som har skrivit en mycket intressant uppsats om rättskällor och hyperstrukturer, samt en hel del annat om rättsinformationsmodellering. Deltar gör även Ole Christian Rynning, som skrivit en likaledes läsvärd uppsats om wikis, semantic web och rättsinformation.

Samtidigt håller jag på med en artikel på ungefär samma tema till Lov & Data (deadline idag…), en beskrivning av verksamheten till en ”affärsplan” inför bildandet av en ideell förening eller stiftelse, samt två bidragsansökningar. Nu händer det grejer!

Mediawiki som datalager

lagen.nu använder jag ingen
relationsdatabas. Alla dokument ligger i varsin statisk fil, och den
samling av metadata som behövs för att jag ska kunna exempelvis skapa
index över alla dokument ligger i en gigantisk .n3-fil som jag går
igenom med RDFLib. Anledningen är
förstås min djupt
kända misstro
mot konceptet databasserver i allmänhet och
relationsdatabaser i synnerhet. Jag tycker filsystemet är underskattat
som databas. Det finns alltid där, är snabbt, går att debugga och
manipulera med välbekanta verktyg (ls, find,
grep, xargs, tar, rsync), har ett
begripligt rättighetssystem integrerat med operativsystemet, osv.

Till nästa stora iteration av lagen.nu-koden kommer jag ändå att
börja använda någon sorts server för datalagring. Men det blir
förmodligen inte en traditionell relationsdatabas med
SQL-gränssnitt. Min datamodell är inte särskilt relationell. Med tanke
på hur djupt jag integrerat RDF i systemet blir det förmodligen en
kombination av en triplestore tillsammans med någon form av dokumentdatabas.
För det tidigare blir det förmodligen Sesame, för det senare har jag
tittat nyfiket på CouchDB.

Men i kommentarerna till ett tidigare
inlägg
om en mediaövervakningsbot föreslog Peter Krantz att använda Mediawiki som
datalagring. Jag började kolla på hur man kan automatisera hämtning
och lagring av data från en Mediawikiserver, och det visar sig att det
finns en mycket kompetent pythonmodul, mwclient, för
ändamålet (det finns även ett annat ramverk, pywikipedia,
men det gav inte alls ett lika bra första intryck). Så här enkelt är
det att skapa och ändra en sida:

    import mwclient
    
    site = mwclient.Site('www.example.org','/path/to/mediawiki/')
    site.login('myuser','secret')
    page = site.Pages['Testpage']
    page.save("Hello world", summary="initial version")
    page.save("Goodbye world", summary="updated version")
    print "Page has %d revisions" % len(page.revisions())

Allt det som mediawiki ger — revisionshantering med diffar,
användarhantering, admin- och slutanvändargränssnitt, spamkontroller,
roll- och rättighetssystem, och utökningsmöjligheter
— får man på köpet. Det är kanske inget man vill använda för att
hantera jättemånga updateringar i sekunden, men om man kan se till att
exv cachea de anrop som bara hämtar data kan man nog få det snabbt
nog.

Tillbaka till de levandes skara

Långa perioder av tystnad här på bloggen brukar bero på arbetsbelastning, så även denna gång. Den senaste tiden har jag haft tre stora arbetsuppgifter och det har slumpat sig så att de samtliga tog slut idag;

  • Jag har tentat processrätt. Det skulle jag egentligen ha gjort för snart två år sedan, men bättre sent än aldrig.
  • Jag har, tillsammans med två kursare, författat en uppsats i IT-rätt (tema: spelar det någon juridisk roll i vilket land en server står?)
  • Och slutligen har jag varit seminarielärare på tre seminarier  rättsinformatikkursen

Alla tre har varit roliga utmaningar, men seminarielärandet har nog varit det som jag varit mest nervös inför. Det är en sak att som student delta i ett seminarium, även om man kan ämnet riktigt bra kan man ändå luta sig tillbaka när man inte har ordet. Som seminarielärare måste man ha koll på allt – själva seminarieämnet, vad studenterna säger, vad man själv har att säga, se till att alla får chansen att tala, uppmuntra debatt, styra upp när det spårar ur, se till att alla områden gås igenom, och inte minst ha nån sorts svar på alla frågor som kan tänkas uppstå under diskussionerna. Lyckligtvis har jag haft bra studenter – pålästa, intresserade och förstående vad gäller att seminarieläraren kanske inte har alla svar.

Nu ska jag opponera på en annan IT-rättsuppsats, skriva en krönika till techworld, en artikel om lagen.nu till lov&data, samt åka till Norge för att prata om samma ämne. Lugnt och skönt. Förhoppningsvis hinner jag skriva lite kod också.

Rättsinformation 2.0

När jag gick igenom några gamla datahögar hittade jag följande, som var det underlag till det femminutersanförande jag höll vid en paneldebattjuridicums jubileumsseminarier förra året. Även med ett år på nacken tycker jag texten är rätt bra. Frågeställningen inför seminariet var ”Rättsinformation för alla?”, och min idé var ”Rättsinformation av alla!”

Nånting händer med webben

Om man räknar med 1993 som födelseåret för det vi idag känner som webben har denna plattform för informationsspridning har precis blivit tonåring. Och som tonåringar brukar håller den på att finna sin egen identitet. De tidiga webåren präglades framförallt av försök att applicera pre-internet-modeller för information på den här nya plattformen.

Men webben är inte tidning. Webben är inte ett referensbibliotek. Den är inte radio, tv, biofilm, seminarium, debattforum eller något annat tidigare sätt att utbyta information. Och det som hänt framförallt de senaste tre till fyra åren åren är att webben har mognat och hittat web-native sätt att hantera information. Man kan inte surfa på samma web två gånger – det har man aldrig kunnat göra, men webben idag är helt annorlunda än webben 2002.

Vi har bloggen, som är ett mycket mer ”web-native” sätt att publicera på än tradionella nyhetssiter. Vi har wikis. Vi har RSS. Vi har API:er, tagging, trackbacks, CAPTHAS. Vi har en medvetenhet om värdet av standarder och accessibillity. Vi har user generated content. Vi har, för att sammanfatta det med en term, ”Web 2.0”.

Det finns några poster childs för web 2.0. Några känner ni säkert till.

  • Flickr, som låter alla med en digitalkamera utbyta upplevelser med vänner (och främlingar)
  • Del.icio.us, som låter dig dela med dig av dina favoritlänkar
  • Blogger, som låter alla som har något att säga starta en blog
  • Youtube, som ger alla som har något att visa sina ten minutes of fame
  • Wikipedia, som låter oss alla samla all mänsklig kunskap
  • Digg, som låter läsarna bli redaktörer

Om det finns en sak som binder ihop alla dessa tjänster, så är det att de uppmuntrar användarna att delta. Man behöver förstås inte — det är mångdubbelt fler som tittar på youtube-videos än som laddar upp egna — men det finns alltid möjligheten, för den som vill, att delta, när han eller hon är redo. En annan sak är att tjänsterna konkurrerar med funktionalitet, inte information. Information är, i web 2.0-världen, som syre. Den är nödvändig för att något överhuvudtaget ska överleva, men det är nästan ingen som kan ta betalt för den längre. Åtminstone inte direkt.

Faktiskt är det så att alla framgångsrika tjänster eftersträvar att deras data ska återanvändas, omformas, remixas. Google maps har ett API genom vilket hundratals spännande ”mash-ups” skapats. Alla bloggplatformar exporterar sin information genom RSS, vilket möjliggör ett ekosystem av aggregatorer, läsare, sökmotorer, med mera. Flickr låter dig inte bara publicera dina bilder på deras site, utan exporterar glatt den till din blog, eller låter dig prenumera på ett RSS-flöde av dina vänners bilder. Youtube låter varenda video på siten vara embeddable på vilken blog som helst. All information på wikipedia får spridas fritt under GFDL-licensen, exempelvis skickas snapshots med på varje OLPC-dator

Vad betyder det här för rättsinformationen?

De senaste fem åren har något signifikant hänt med webben. Idéer om ett enriktat informationsflöde från producent till konsument är allvarligt ifrågasatta. Bloggar, wikis, videosharing, tagging, social networking, collaborative filters och andra Web 2.0-begrepp är olika exempel på att extremt stora mängder kunskap och kreativitet kan frigöras m den tekniska arkitekturen är rätt.

Jag driver lagen.nu, som är en webbtjänst med alla författningar i SFS, korsrefererat och sammankopplat med rättsfall. Tjänsten drivs på en nollbudget, och jag representerar därmed hobbyist- eller det ideella perspektivet.

Jag tror (eller är övertygad om, snarare) att vi måste släppa idén om att rättsinformationen ska komma från en producent, eventuellt via en förädlare, till en slutkonsument. Jag menar inte att vi ska dumpa in hela SFS i en wiki och låta vem som helst redigera författningarna (även om det nog vore ett spännande projekt), men att vi hela tiden när vi bygger system har följande tanke i bakhuvudet: ”Hur kan vi tillvarata allas kunskap?”

Det är naturligtvis viktigt att det ska gå att konsumera rättsinformation utan att betala dyra pengar. Det är också viktigt att det ska gå att förädla och återpublicera rättsinformation på samma villkor. Den centrala rättsinformationen produceras av det allmäna, som inte har ett ekonomiskt intresse i informationen som sådan.

Om man gör en grov uppdelning av rättsinformationen i data och metadata kan vi placera traditionella dokument i den första kategorin — författningar, rättsfallsreferat, föreskrifter. Produktion och spridning av den här informationen är viktig — särskilt måste den kunna spridas fritt, utan begränsningar på grund av upphovsrätt (Doktrin intar en särställning i att det är en primär rättskälla som inte produceras av det allmäna, och idag sällan kan spridas fritt) eller personuppgifter.

Men den stora rättsinformatiska utmaningen är metadatat — vilka nyckelord man kan sätta på ett rättsfall eller en paragraf, hur en författning hänger ihop med en EG-förordning, vilka texter som ingår i kursfordran, vem som skrivit om ett rättsfall i doktrinen, vilken rubrik eller ämnesområde en författning ska inordnas under. Viss metadata är antingen sann eller falsk — 42 § URL implementerar verkligen Art 6 220/98/EEG eller så gör den verkligen inte det, NJA 2004 s 25 åberopar verkligen URL § 42. Annan metadata kan man ha olika åsikter om – KKL kan betyda konsumentköplagen eller konkurslagen eller kanske körkortslagen. Viss metadata är allmängiltig – 24 § är ett uttryck för den ackusatoriska principen. Annan är specialiserad för en viss grupp – 24 § är tentarelevant. Viss metadata är rättsligt bindande. Viss metadata kommmer från förädlare, men är fortfarande obestridbar.

Idag finns det en föreställning om att sådan metadata, för att vara intressant eller öht säker att publicera, måste vara utformad av experter, faktakollad av experter, disseminerad under kontrollerade former och försedd med noggranna riktlinjer om hur den ska och till vad den får användas. Det finns en paralyserande rädsla för att information – främst metadata – av låg kvalité och i stor mängd kommer förleda mottagaren.

Web 2.0 har visat att den föreställningen är felaktig. Rättsinformation 2.0 kommer att handla om att uppmuntra produktionen av metadata, att lära sig leva med ofullkomling, inkomplett och kvalitetsosäkrad metadata, för att nå ett slutmål där det finns tillräckligt mycket metadata för att även folk utanför skrået kan begripa rättsinformation, och med tillräcklig stor redundans.

Det finns tusentals forum på webben där folk hjälper varandra med juridiska frågor utan att nån är skolad. Ofta slutar diskussionerna med att nån länkar till lagen.nu och säger ”titta här, såhär är det enligt lagen” — varpå en fortsättningsdiskussion tar vid om vad lagtexten betyder. Lagen.nu saknar metadata kring juridisk jargong och begreppsbildning, länkar till doktrin, framlyfta centrala rättsfall. Med mera metadata skulle den kunna ge forumdebattörerna bättre svar.

Ta några vanliga juridiska missuppfattningar — ”man får använda upp till fyra takter av en melodi”, ”god tro är avskaffat i svensk rätt”. Dessa orsakas av för lite data, inte för mycket.

Problem

  • Upphovsrätt
  • Persondataskydd
  • Utgivaransvar
  • Skadeståndsansvar

Ickeproblem

  • Datakvalité
  • Normklassificering

Nästa utvecklingscykel för lagen.nu

För ett tag sedan branchade jag svn-repot i en stable-branch, i vilken koden bakom dagens lagen.nu ligger. I trunk finns nu utvecklingsversionen, vilken syns utåt på ferenda.lagen.nu. Den stora grejen med nästa version kommer vara det som jag strävat efter i flera år, men som jag först nu har en stabil plattform för: Lagtextkommentarer som redigeras med wikiteknik.

Ett första exempel fins, i form av en kommenterad personuppgiftslag. Nästa steg är att skriva en kommentar till brottsbalken, eftersom det är den mest lästa lagtexten på lagen.nu. Genom det arbetet hoppas jag få lite insikter i vad som funkar och inte, både tekniskt och textmässigt. Sen börjar jobbet med att ragga skribenter på allvar, men vill du börja redan nu är det bara att börja genom att klicka på första bästa ”redigera”-länk på ferenda.lagen.nu.

Och om du är intresserad av utvecklingen, gå med på epostlistan!

Dagens uppLYSning om RDF

Ikväll klockan 18:15 håller jag en upplysning om informationsmodellering, RDF och annan semantic web-teknologi, mot bakgrund av hur jag använt dem i lagen.nu. Här är de slides jag tänkt använda, återigen i S5-format. Eftersom jag använder object-taggen för att länka in live-webbsidor funkar det kanske inte i alla webbläsare, men det verkar funka i min Firefox iallafall. Är du i Linköping ikväll, kom gärna förbi!