Dagens presentation

Idag höll jag som sagt en presentation av lagen.nu (och hela konceptet med idéella verksamheter) på Stiftelsen för rättsinformations konferens. Eftersom jag ville få till mina poänger på den begränsade tid jag hade tog jag med ett skrivet manus – det funkade bra i att jag inte missade något viktigt, men dåligt i att det blev svårt att improvisera när jag fick ont om tid. Jag kompenserade genom att prata jättefort. Och när jag ändå skrivit ner allt kan jag ju lägga upp det här på bloggen också. Det är ungefär en slide per stycke i det nedanstående.

Privata initiativ – Lagen.nu, Opengov.se, m.fl

1. Lagen.nu

Jag heter Staffan Malmgren, och jag är varken representant för den offentliga sektorn eller den kommersiella sektorn. Vi har under dagen fått redogörelse på hur hur dessa två sektorer ser på frågan om produktion och återanvändning av rättsinformationen, och det är lätt att se på frågorna ur det perspektivet, en dikotomi där aktörer antingen är statliga eller kommersiella. Men det finns en tredje typ av aktör som jag representerar.

Jag driver en webbplatsen lagen.nu, som innehåller alla författningar som finns i SFS och ca 10000 vägledande rättsfall. Vi är en liten spelare på rättsinformationsmarknaden, men vi har en del funktioner som är ganska unika inom svensk rättsinformation.

Lagtexterna presenteras sida vid sida med alla tillgängliga rättsfall som i domskälen hänvisar till motsvarande lagrum. Eftersom den inledande referattexten visas direkt får man en översikt över vilka frågor kring lagrummet som praxis kan tänkas besvara.

Man kan därfrån klicka sig vidare till varje enskilt rättsfall. Invid varje rättsfall listas senare rättsfall som hänvisar till detta. På detta vis får man en känsla för hur ett enskilt rättsfall relaterar till annan senare praxis.

Vid sidan av lagtexterna finns även en lista över hänvisande lagrum i andra delar av lagstiftningen. Särskilt när det gäller frågor kring regelkonflikter, speciallagstiftning och delegering av kompetens är sådana hänvisningar värdefulla.

För vissa lagar har paragraferna även blivit kommenterade. Kommentarerna innehåller bakgrund, exempel, begreppsbeskrivningar, hänvisningar som inte direkt framgår av lagtexten, summering av praxis och mycket mer. Begrepp som används är som regel länkade.

Varje använt begrepp har sedan en egen sida, där man samlar en beskrivning tillsammans med rättsfall som använder samma begrepp som sökord, eventuella legaldefinitioner, och annat. Det finns drygt 500 begrepp som är beskrivna, och ytterligare 4000 begrepp som förekommer som sökord eller legaldefinitioner i systemet.

De här lagkommentarerna och begreppsbeskrivningarna kan redigeras genom ett webbgränssnitt, med samma programvara som wikipedia använder för sina webbplatser. Sammanlagt har över 1200 paragrafer i närmare 20 lagar kommenterats, med en textmängd som motsvarar över 400 utskrivna sidor. Den här informationen har skrivits av fjorton personer under sommaren och hösten. Jag vill särskilt uppmana alla här att gå in och göra sin egen bedömning av språk, korrekthet och användarnytta.

Tjänsten riktar sig till den breda allmänheten och har 20000 unika besökare varje vecka. Tusentals bloggar och andra webbplatser länkar till lagen.nu för att i nätdiskussioner ha en bra och stabil källa för argument om vad lagen säger. Hundratusentals människor använder tjänsten för att själva ha en källa att gå till.

Tjänsten är öppen i alla dess betydelser. Den kostar inga pengar att använda, all källkoden som sköter det tekniska är fritt tillgänglig, och allt innehåll i form av lagkommentarer med mera är fria att använda under en Creative Commons-licens. Arbetet har huvudsakligen utförts på fritiden, och det finns inte någon ekonomi att tala om i verksamheten. Anledningen till att jag valt det här sättet att arbeta istället för att driva ett traditionellt företag är att jag tycker det är viktigt att rättsinformation är fritt tillgänglig och lätt att använda.

2. Den tredje sektorn

Lagen.nu är en representant för vad som ofta kallas ”den tredje sektorn” – organisationer och aktörer som varken tillhör den offentliga eller den kommersiella sektorn. Den tredje sektorn är inte specifik för rättsinformation eller juridik eller Sverige, utan finns på alla områden. ”Volontary sector”, ”non-profit sector”, ”civil sector” är synonymer som brukar användas på engelska.

Den tredje sektorn är en betydelsefull spelare på marknaden som i exv USA representerar den tredje sektorn ca 10 procent av bruttonationalprodukten (Christopher Eaton Gunn, ”Third-sector development: making up for the market”).

I storbritannien anses den tredje sektorn så samhällsekonomiskt viktig att det finns ett departement, ”Office of the third sector” inom deras motsvarighet till regeringskansliet, vars syfte är att understödja och hjälpa initiativ inom denna sektor.

På juridikens område har tredje sektorn-representanter framförallt fått en stor betydelse i common law-länder. Framförallt bör man uppmärksamma Legal information institute (LII) vid Cornell University, som sedan 1993 arbetat för att göra amerikansk rättsinformation tillgänglig på nätet.

Initiativet har fått många efterföljare i andra jurisdiktioner — I Storbritannien har vi British and Irish Legal information institute eller BAILII, i Australien AustLII. I Asien finns det en uppsjö av LII:s. I USA finns även AltLAW, public.resource.org och RECAP.

Ett regionalt intressant initiativ kommer från Oregon, där delstaten själv publicerade en ganska oläslig sörja med sin lokala lagstiftning. Man hävdade dessutom, i strid mot all amerikansk rättstradition, att dessa lagar var skyddade av upphovsrätt.

Efter att delstaten förlorade den striden så tog en juriststudent
tog informationen och gjorde om det till en webbplats som är behaglig att se på,
och som kopplar ihop paragrafer och officiella kommentarer. på ett
sätt som den officiella versionen inte gjort. Sajten har ett stort
antal funktioner som är ganska
innovativa
.

Ett bra svenskt exempel är opengov.se, där Peter Krantz har samlat information om myndighetsdatabaser i allmänhet och utredningar i synnerhet. Genom att ladda hem och analysera liggande komittedirektiv kan han visa vilka utredningar som pågår, när de ska vara klara, vilka EG-direktiv och svenska lagar som de arbetar med, och mycket mer. Man kan prenumerera på uppdateringar så att man exempelvis får en notifiering när en utredning får i uppdrag att se över en viss lagstiftning, eller få ett kalendarium över när olika utredningar lämnar betänkanden.

Oavsett om tredje sektorns initiativ är omfångsrika och välfinansierade (som LII:erna) eller projekt utan budget skapade av en enskild privatperson (som oregonlaws.org och opengov.se) så bidrar de med innovationer som inte återfinns i varken den offentliga eller den kommersiella sektorn. Där den offentliga sektorn är bunden till vad den måste, får och inte får producera, och den kommersiella sektorn är begränsad till att skapa tjänster/varor som kan säljas, kan den tredje sektorn fokusera på att skapa nytta med större friheter och utan att behöva paketera det i en säljbar form.

Som jurist vill man gärna tro att det vi sysslar med är att lösa mellanmänskliga konflikter, hjälper till att upprätthålla rättsstatsidealen, minskar risken och transaktionskostnaderna i affärslivet, och andra bra saker. Omvärldens tilltro på att vi klarar de här uppgifterna är inte så hög. I många sammanhang anses juridik något som i bästa fall kostar pengar och bör undvikas (”vi kopplar inte in juristerna på det här projektet”) och som i värsta fall korrumperar de rättsstatliga idealen genom att skapa en ogenomskinlig och auktoritär pseudovetenskap som förstärker orättvisor.

Det här är rätt allvarligt. Både för samhället och för oss i vår yrkesroll. Till stor del beror omvärdens problem med juridiken som disciplin att man inte förstår den. Det man inte förstår tror man gärna det värsta om.

Och som jag ser det är det juristens ansvar att se till att bli förstådd av samhället. Vi måste motivera vårt existensberättigande, och steg ett är att förklara hur rättssystemet egentligen fungerar.

Om juridiken är mer tillgänglig ökar förtroendet för den som konfliktlösande verktyg. Om människor själva är mer medvetna om sina skyldigheter och rättigheter kan de agera med större säkerhet och bli mer självständiga. På en fri marknad sänker det transaktionskostnader vilket ger större omsättning och därmed tillväxt, och ur ett mänskligt perspektiv ger det individen större makt och bättre nattsömn. Juridisk information kan inte bara vara en intern fråga för en yrkeskår. Därför behövs initiativ som lagen.nu inom den tredje sektorn.

3. Problem

Med detta har vi etablerat vad den tredje sektorn är och vilken dess unika nytta är. Ett utmärkande drag är att organisationer eller initiativ inom denna sektor är motvilligt till att, eller till och med oförmögen, att ingå avtal, särskilt betungande sådana. Verksamheten kanske inte ens bedrivs i form av en juridisk person, utan har mer karaktären av löst sammansatta nätverk. Särskilt på det nätpolitiska området är detta vanligt.

Detta får bäring på den tredje sektorns informationskonsumtion. Man har oftast inte en budget att betala med, utan är beroende av att informationen är fri att hämta. Man vill ofta behandla informationen för vidare spridning, så man är beroende av att informationen är fri att återpublicera. Man kan inte granska informationen ingående eftersom hanteringen sker automatiskt, utan är beroende av att exempelvis personuppgifter är anonymiserade på ett sådant sätt att PUL inte förhindrar en behandling.

Och framföralt är man är beroende av att informationen finns tillgängligt i format som går att behandla automatiskt. PDF-formatet, som många myndigheter föredrar att använda eftersom det möjliggör att den elektroniska informationen ser likadan ut som den tryckta, är särskilt uselt på detta. Att konvertera en PDF-fil till strukturerad information är, som någon programmerare har sagt, som att konvertera hamburgare till kor.

Hur ser situationen ut för den svenska rättsinformationen? Vi har ju en svensk rättsinformationsförordning som anger vad det allmänna är skyldigt att tillgängliggöra, och den förordningen fyller tio år i år. I traditionell rättkällelära brukar man prata om fyra olika rättskällor, och vi kan gå igenom dessa steg för steg.

3.1. Författningar

Det vill säga bindande generella föreskrifter utfärdade av ett organ med kompetens att göra så. Vi kan göra en grov uppdelning mellan författningar som utfärdas av regering och riksdag, som publiceras i SFS, och alla andra föreskrifter som utfärdas av enskilda myndigheter. Generellt är SFS förstås den mest intressanta, men inom vissa områden har myndighetsföreskrifterna stor betydelse.

3.1.1 SFS

Vad gäller författningar så är den enda officiella och kunggjorda formen av dessa den tryckta versionen. Så man kan lätt ledas att tror att denna version är viktig, och det är den kanske ur någon sorts auktoritetsperspektiv, men i praktiken är den här versionen oanvändbar. Detta beror på den tekniska lösning kring hur denna version utformats. Till en början ger man ut en grundförfattning och allt är väl. När denna ska ändras i någon del så kungörs en ändringsförfattning där endast de ändrade paragraferna tagits med, eventuellt tillsammans med andra instruktioner om hur man ska klippa och klistra i grundförfattningen.

Ta upphovsrättslagen som exempel. Sedan grundförfattningen gavs för snart femtio år sedan har det getts ut 39 ändringsförfattningar. Ska man använda sig av författningarna så som de kunggörs för att avgöra en upphovsrättslig fråga måste man själv använda alla dessa 40 dokument och pussla ihop dess betydelse. Det gör ju ingen vettig människa. Det är lovvärt att det på området lagts ett förslag om officiell elektronisk kunggörelse av författningar, men eftersom dessa inte rör konsoliderade författningar är de praktiskt betydelselösa för mig. Det är inget jag kan använda.

Istället förlitar man sig på sådana versioner av författningarna med ändringar som andra har pusslat ihop, s.k. konsoliderade versioner. Det här är ett arbete som görs av flera oberoende aktörer. Regeringskansliet gör en konsolidering som publiceras i regeringskansliets rättsdatabaser, i den databas som kallas SFST, och denna version återanvänds av flera aktörer, bland annat lagen.nu.

Denna databas är ganska bra. Den är heltäckande och innehåller faktiskt alla nu gällande författningar som ingår i SFS, ända tilbaks till handelsbalken, i konsoliderad form. Men den har ett par stora brister. Den första bristen är att materialet är ostrukturerat. Det framgår inte vad som är ett kapitel, vad som är en rubrik, vad som är inledningen på en paragraf, och vad hänvisningarna pekar på. Som ett exempel, betrakta jordabalken 2:1, den som inleds med ”Till en fastighet hör”. Hur många stycken finns i den paragrafen? En noggrann läsare kan se att det är två stycken, men en slarvig läsare eller en oförbedd dator ser fem skilda stycken. Hur vet vi överhuvudtaget att vi har 2 kap. 1 § framför oss? Ska man hantera den gigantiska textmängden som SFS omfattar måste man göra det med någon form av automatik, och om informationen inte är strukturerat uppmärkt kommer denna automatik göra fel här och var.

Den andra bristen är att mycket material saknas. Framförallt bilagor med tunga tabeller verkar plockas bort, men mycket material som inte går att representera i plain text tas också bort, exv formler, illustrationer, kartor m.m. I SFS 1999:917 ser vi ett exempel på hur en förordning om konsumentkrediter ser ut i den tryckta SFS.

Men det mesta saknas för motsvarande författning i SFST, så jag vet inte riktigt vem som någon nytta av den senare versionen. Samma situation gäller för författningar som har symboler, exempelvis vägmärkesförordnigen, eller bilder, exempelvis lagen om trängselskatt, som innehåller en karta över betalstationerna.

Den tredje bristen är att historiken saknas. Detta står, såvitt jag kan se, i direkt strid med rättsinformationsförordningen (3 § 2 st) som har varit gällande i tio år. Den hantering av historik som förekommer är att en upphävd författning sparas i sin sista lydelse, samt att under övergångsperioder så förekommer gammal och ny text sida vid sida. Bägge dessa halvhjärtade försök ställer till med mer problem än de löser.

Utöver detta finns ett par mindre brister – konsolideringsarbetet introducerar ibland fel, men det är mänskligt. Felen är ofta av typen felaktig hänvisning, särstavning, förlupen blankrad, eller oklar upphävningshänvisning som vi såg med byggningabalken. När jag stöter på sådana fel brukar jag tillverka en patchfil, dvs en instruktion för systemet att exv på en viss rad byta ut texten ”Upphävd genom förordning ?” till ”Upphävd genom lag (1984:1110)”. Med ojämna mellanrum rapporterar jag även dessa fel till ansvarig person på regeringskansliet, som brukar fixa dem efter några veckor.

En annan brist är att det inte finns något sätt att med enkel automatik hämta hela innehållet i databasen, särskilt att kolla vad som ändrats. Istället måste man kolla ”Har det publicerats någon SFS med nummer 2009:1058? Ok, har det publicerats någon SFS med nummer 2009:1059”, och så vidare. Utan att gå in på detaljer kan jag säga att de sammanlagt 250 rader kod för att hantera detta har vuxit fram mycket långsamt och med mycket trial and error.

3.1.2 Föreskrifter

Vad det gäller andra författningar, dvs myndigheters föreskrifter, är situationen mycket mycket sämre. På lagrummet.se finns en mycket bra lista över vilka författningssamlingar som finns, men eftersom varje myndighet har uppfunnit var sitt hjul för att publicera sina föreskrifter är det i praktiken ogörligt att med automatik hämta och hantera dessa föreskrifter. Att myndigheterna i allmänhet väljer att publicera informationen i PDF gör att det är än svårare att återanvända informationen.

En tredje typ av bindande generella föreskrifter återfinner vi i EG-rätten. De grundläggande fördragen (primärrrätten) tillsammans med direktiv och EG-förordningar (sekundärrätten) är indirekt eller direkt tillämpbara av svenska domstolar. EG-rättens dokument nämns överhuvudtaget inte i rättsinformationsförordningen.

EG-rättens samlas i databasen EURLex. Att hämta hem information från denna webbplats med automatik är krångligt, men möjligt. Dock finns informationen i ett färdigstrukturerat format tillgängligt från publikationskontorets FTP-server. Detta är betydligt bättre för den som vill återanvända materialet. Men för att få utnyttja detta krävs ingående av avtal, vilket kostar 10 000 euro per år för en enda språkversion. Inga undantag för den tredje sektorn.

3.2. Rättsfall och myndighetspraxis

3.2.1 Domstolsverket

Domstolsverket gör tillgängligt ett stort antal rättsfall genom en FTP-server. Den kan man få tillgång till om man tar kontakt med verket och förklarar vad man vill göra med materialet. Samma information publiceras även via domstolsverkets webbplats, men går pga tekniska spärrar inte att ladda ner med automatik.

Materialet publiceras på FTP-servern i form av ZIP-filer som innehåller worddokument, normalt sett en ny zipfil varje vecka. Ett rättsfall ska normalt sett inte ändras, men då det ändå ibland behövs (när något blivit fel i hur det ursprungligen publicerats) görs detta genom att ett ny version av rättsfallet läggs in i veckans zipfil.

De saknar även textformattering som återfinns i de tryckta versioner. Detta är särskilt problematiskt vad gäller citat, infogade utlåtanden, dissenting opinions och annat som i de tryckta versionerna vanligtvis anges som text i mindre stil med ett indrag. Eftersom sådan text i worddokumentent visuellt är likadan som övrig text är det svårare att navigera i texten.

Information om sidnummeruppdelning saknas även, vilket kan vara problematiskt när hänvisningar på formen ”NJA 1982 s. 422 på sidan 425” förekommer. Worddokumenten saknar explicit maskinläsbar metadata för att exv ange dess identifirare (”NJA 1984 s. 422”, ”RÅ 1998:42”), datum, målnummer, hänvisade lagrum, hänvisade rättsfall, med mera.

Materialet går dessutom inte tillbaka så långt. HD-fall finns till 1981, hovrätterna, regeringsrätten och arbetsdomstolen till 1993, och andra specialdomstolar har ännu kortare arkiv. Eftersom det regelmässigt hänvisas till äldre rättsfall än så är detta ett problem – det går helt enkelt inte att ta reda på vad gällande rätt är med bara publika elektroniska källor. För referat från högsta domstolen används samma referat som publiceras i Nytt Juridiskt Arkiv. Upphovsrätten till detta material ägs sedan 1981 av staten, men för tidigare utgåvor ägs upphovsrätten av ett privat företag. För äldre domar från hovrätterna, regeringsrätten, arbetsdomstolen m.m. är det mer obegripligt att materialet inte gjorts tillgängligt digitalt.

De underliggande domsluten omfattas inte av upphovsrätt (jfr URL 9 §), men sammanställningen som ett referat innebär är upphovsrättsligt skyddat. Tydligen finns högsta domstolens äldre domar arkiverade på Riksarkivet. De är inte digitaliserade, men man får om man vill komma på besök och exv fotografera av materialet.

3.2.2 Myndighetspraxis

Inom många områden finns relevant praxis främst att finna i myndigheter och nämnders beslutspraxis. För dessa är situationen ungefär som för myndigheternas författningssamlingar, dvs mycket brokigt.

3.3. Förarbeten

Förarbeten finns delvis tillgänglga från regeringen, delvis från riksdagen, med ett visst överlapp. För gamla propositioner har riksdagen gjort ett jättejobb, men gamla SOU/Ds:ar saknas. Det saknas även koppling mellan dokument, framförallt mellan propositioner till de bakomliggande utredningsbetänkandena. Och vad gäller remissvar och lagrådsremisser är täckningen än mer fragmenterad.

3.4. Doktrin

Doktrin, dvs den rättsvetenskapliga information som skrivs i form av avhandingar, artiklar i akademiska tidskrifter med mera är rent upphovsrättsmässigt svårt. Det är inte upprättade allmänna handlingar, och staten har inte upphovsrätten. Eftersom doktrin regelmässigt citeras av domstolar, framförallt som grund för att ett visst rättsligt resonemang är allmänt accepterat, är ett rättsinformationssystem som saknar detta inte komplett, men det står inte i rättssystemets makt att direkt åtgärda detta. Istället bör framförallt universitet, inklusive forskare, samt icke vinstdrivande organ verka för att göra sitt material tillgängligt under fria licenser. Andra vetenskapliga discipliner har i ökad grad annamat principer om Open Access, dvs villkor som möjliggör fri åkomst och spridning, och funnit dessa vara ändamålsenliga. Särskilt när detta material tagits fram genom statligt stöd finns det en närmast moralisk skyldighet att göra detta fritt tillgängligt.

4 Lösningar

Nu har jag pratat om vilka problem den tredje sektorn har när det gäller återanvändning av rättsinformation. Temat på den här konferensen är ”Marknaden för återanvändning av rättsinformation”. Som jag hoppas har blivit tydligt är den tredje sektorn inte en marknad i det vanliga marknadsekonomiska hänseendet. Vi arbetar med fri tillgång till digital information, vilket gör att nationalekonomiska modeller om utbud och efterfrågan inte blir tillämpliga. Det kostar oss massor att ge access till den första användaren, men inget alls att ge access till användare två, tre och så vidare. Marginalkostnaden för varje ny användare är noll.

Med nationalekonomiska termer tillhandahåller vi en kollektiv vara som har egenskapen ickerivalitet – att en person konsumerar varan utesluter inte en annan person från att konsumera samma vara. Det klassiska exemplet på en kollektiv vara är en fyr – den har ett stort värde för samhället, särskilt för kustsamhällen, varan är ickerivaliserande (alla kan använda den samtidigt) och ickeexklusiv (det finns inget bra sätt att hindra ett fartyg från att använda den).

Enligt etablerad nationalekonomisk teori kommer en fri marknad inte att producera kollektiva varor på ett effektivt sätt, vilket leder till välfärdsförluster. Därmed inte sagt att kollektiva varor måste produceras av staten – aktörer på en fri marknad, inklusive representanter för den tredje sektorn eller privatpersoner, kan bilda associationer för att skapa en kollektiv vara, vilket kan kallas Peer production.

Det tydligaste exemplet på att peer production faktiskt sker är utvecklingen av operativsystemet Linux, där hundratals större och mindre företag bidrar till utvecklingen genom att avlöna utvecklare. Minst 70% av utvecklingen sker med sådant stöd. Företag som bidrar till detta inkluderar Red Hat, Novell, IBM, Intel, Oracle och Google, dvs företag som på andra marknader konkurrerar.

Varför uppstår ett samarbete just kring Linuxutveckling? Jo, de medverkande företagen drar på andra marknader nytta av att det existerar ett fritt och anpassningsbart operativsystem. Genom att bidra med resurser kan de vara med och styra utvecklingen, samtidigt som de inte behöver ta den fulla ekonomiska kostnaden. Se även Yochai Benkler, ”Coases penguin and the nature of the firm” som förklarar fenomenet med peer production genom ekonomisk teori.

För att ett öppet projekt ska funka måste värdet på projektet öka med antalet inblandade aktörer, och varje enskild aktör måste få ut mer värde än denne stoppar in. Linux, Wikipedia och webbläsaren Firefox är projekt som har lyckats med denna ekvation, och har följdaktligen blivit mycket framgångsrika. Lagen.nu är inte där än, men intresset och engagemanget växer.

4.1 Vad den offentliga sektorn bör göra

Jag har en önskelista till den offentliga sektorn. Det är kanske inte så mycket en önskelista som ett par grundläggande krav som man bör kunna ställa på en förvaltning på tjugohundratalet. Kraven är dock inte nya.

Lon Fuller använde i den rättsfilosofiska klassikern ”The Morality of Law” en berättelse om kung Rex, som gjorde åtta distinkta fel när det gällde att skapa rätt, vilket slutade med katastrof. Dessa fel kan omvänt ses som en sorts lägsta krav på varje anständigt rättssystem. Vad gäller vårt svenska system kan man vara lite orolig för det fjärde, sjunde och framförallt andra kravet – gör lagstiftaren verkligen sin plikt när det gäller att informera medborgarna om vilka regler de har att beakta?

Det finns många åsikter om vad den offentliga sektorn borde göra med sin information. För vissa är det viktigt att så mycket material som möjligt kan fås ut, för vissa är det viktigt att materialet är tillgängligt i standardiserade format. För min del är det viktigt att materialet är tillgängligt i en form som gör det möjligt att återanvända det. Inscannade PDF-filer är nästan helt meningslösa i det här avseendet. För att göra bra rättsinformationstjänster måste man nämligen förstå informationens struktur och metadata. Detta är vanskligt och ibland omöjligt att göra om man har ostrukturerade format att utgå ifrån. Ju dåligare kvalité grundmaterialet är, desto mer tid måste investeras i att tvätta materialet.

Men myndigheterna måste även ändra sin inställning. När tidningen Fokus försökte göra en heltäckande undersökning om hur myndigheterna hanterar offentlighetsprincipen i internetåldern blev resultatet nedslående. De hittade inte ett enda gott exempel på någon myndighet som proaktivt gjorde sin information tillgänglig på ett sätt så att det är lätt att använda och återanvända den. Faran kanske ligger i vår ärevördiga offentlighetsprincipen – den har så länge varit så långt före vad andra länder nått upp till att vi vilat på lagrarna och inte märkt att vi blivit omsprungna av övriga Europa.

Turerna kring EU:s direktiv om vidareutnyttjande av information från den offentliga sektorn, det så kallade PSI-direktivet, är belysande. Först hette det att offentlighetsprincipen uppfyllde direktivets alla krav. Efter en formell underrättelse från kommissionen om att så inte alls var fallet infördes PSI-förordningen, som sades uppfylla direktivets krav. Efter ytterligare en formell underrättelse som underkände denna implementation tilsattes en utredning som nu har lämnat sitt betänkande (Ds 2009:44), och kanske blir det en lag, som — tredje gången gillt — uppfyller kommissionens krav någon gång i mitten av nästa år. Speciellt med beaktande av förra veckans ministerförklaring vid eförvaltningskonferensen i Malmö så får vi hoppas på en attitydförändring i myndighetssverige.

Offentlighetsprincipen är fundamentalt reaktiv. En begäran, en prövning, ett utlämnande. Som inte ens behöver vara elektroniskt! Vi bör kunna ställa krav på myndigheter att de proaktivt arbetar för att göra den information som de skapar i sin förvaltning tillgänglig för så många som möjligt, på så enkla villkor som möjligt, i så bra format som möjligt. Allt annat är helt enkelt kapitalförstöring.

4.2 Vad den kommersiella sektorn bör göra

Låt mig nu vända mig till den kommersiella sektorn. Jag är inte så orolig för att min önskelista till den offentliga sektorn inte blir uppfylld. Trenden i Europa och världen gör det på sikt omöjligt att hålla fast vid en reaktiv, pappersbaserad modell för myndighetsinsyn. Digital myndighetsinformation kommer bli fritt tillgänglig. Den affärsmodell som bygger på exklusiv tillgång till sådant information är inte särskilt framtidssäker. På liknande sätt är den affärsmodell som bygger på att göra om arbete — det vill säga att tvätta informationen — som andra redan gjort inte särskilt hållbar – om inte annat så för att någon förr eller senare kommer publicera den tvättade informationen.

Lagen.nu publicerar idag tvättad information. Alla svenska rättsfall och författningar finns att ladda ner i ett strukturerat XML-format. Den som vill bygga en rättsinformationstjänst kan med grund i detta material göra en hyfsad förstaversion på några dagar. Under de förutsättningarna känns det fånigt att varje rättsinformationstjänst sitter och gör motsvarande arbete på sin egen kammare. Detta arbete är inte diffrentierande mellan tjänsterna, utan bara en resurstjuv. Vi väntar alla på att myndigheterna ska släppa informationen fritt i ett perfekt strukturerat format, men under en övergångsperiod kanske vi borde samarbeta kring detta strukturarbete? Om IBM, Novell och Oracle kan samarbeta kring Linux så borde vi rimligtvis kunna samarbeta kring grundinformation. Istället kan vi lägga ner mer resurser på funktioner och kringtjänster.

Myndigheterna är heller inte så pigga på att publicera information som inte är officiell, exempelvis alla lagförkortningar som är de facto-standardiserade. Viss information kommer den offentliga sektorn aldrig publicera, eftersom det innefattar juridiska bedömningar som det inte ligger i deras uppdrag att utföra. Exempelvis kan en kommersiell eller idell aktör kategorisera lagar i rättsområden, eller rättsområden i en hiearki. Det finns många tänkbara områden att samarbeta kring.

4.3 Slutord

För oavsett om vi identifierar oss som tillhörande den offentliga, den kommersiella eller den tredje sektorn så tillhör vi alla den juridiska sektorn. Vi sitter på information och kunskap som är grundläggande för nästan all samhällelig aktivitet. Det är inget vi har rätt att tjuvhålla på – den tillhör hela samhället, och vi har ansvar för att göra den så åtkomlig som möjligt.

Rättsinformationskonferens i Stockholm

Bloggen har varit lite försummad sedan lanseringen av nya lagen.nu-versionen. Det kan delvis ha att göra med att jag skriver så fruktansvärt mycket på en massa andra håll och kanter att bokstäverna inte riktigt räcker till den här bloggen.

En av de saker jag skriver på är det halvtimmesanförande jag ska hålla i nästa vecka på konferensen ”Marknaden för återanvändning av rättsinformation – vidareutnyttjande och offentlighetsuttag”, som ordnas av Stiftelsen för rättsinformation.

Det blir en kortfattad bakgrund till ”den tredje sektorn” – dvs sådana initiativ som inte tillhör varken den offentliga eller den kommersiella sektorn, hur arbetet inom denna funkar, vilka drivkrafter som finns, och vilka värden som kan skapas om den ges bra förutsättningar.

En väldigt viktig förutsättning, särskilt för internetbaserade initiativ, är tillgången på data. Lagen.nu skulle inte kunna existera alls om inte lagtexter och rättsfall fanns tillgängliga elektroniskt, men den skulle å andra sidan vara mycket bättre om jag inte var tvungen att lägga så mycket tid på att lista ut hur man hämtar och tvättar den rådata som finns tillgänglig.

Så sånt ska jag prata om – bakgrund, problem och lösningar. Kom och lyssna, det är gratis! Ni behöver bara anmäla er först – senast på fredag!

Lansering av nya lagen.nu (plz RT!)

Efter fyra månaders intensivt arbete är jag oerhört stolt att få meddela att den nya versionen av lagen.nu, med lagkommentarer, nu ligger ute på https://lagen.nu/. Jag håller på att fila på ett pressmeddelande som kommer gå ut i morgon förmiddag (utkast).

Vi hade en avslutande workshop för projektet igår, där vi framförallt diskuterade hur vi skulle kunna ta vidare projektet, där många bra idéer kom fram. Det allra viktigaste är att nå ut till fler människor, både de som kan ha nytta av tjänsten och de som kan bidra till att göra den bättre (det är förstås ett stort överlapp på dessa grupper).

Ni som följer den här bloggen har nog redan läst vad det är vi har försökt göra och hur det har gått.

Nu behöver vi nå ut till fler. Känner du några jurister? Berätta för dem att det finns ett projekt där de kan göra världen bättre och utveckla sig själva samtidigt. Känner du några journalister? Berätta för dem att det finns ett gäng entusiaster som jobbar på att göra lagboken begriplig. Känner du några människor? Berätta för dem att det finns ett ställe där de kan läsa sig till sån juridisk kunskap som normalt tar 4½ år att arbeta upp. Umgås du inte med folk? Skriv något på din blog / skicka ett tweet / ändra din facebookstatus. Och länka gärna till lagar och paragrafer om du diskuterar lag och rätt på nätet.

Lagkommenteringsprojektet: Skrivfasen avslutad

Det har varit ganska tyst på bloggen om lagkommenteringsprojektet (det
mesta har stått på mailinglistan). I förra veckan gick vi dock imål
med en viktig milstolpe, som är värd att uppmärksammas.

Under sommaren och hösten har vi som sagt ägnat oss åt att skriva
kommentarer/förklaringar till/av de viktigaste lagarna och juridiska
begreppen. Eller rättare sagt, mina begåvade projektmedlemmar har
skrivit och jag har projektlett efter bästa förmåga, samt skruvat på
tekniken.

Skrivperioden avslutad

Enligt projektplanen skulle projektet ha tre faser. Den första fasen
var teknikutveckling, då jag klistrade ihop en mediawikiinstallation
med en Sesame-server och använde det hela för att bygga en pipeline
från wikimarkup till RDF-triples till ihopvävda lagtextkommentarer.

Den andra fasen var skrivandet, och den löpte från första juli till
sista september, dvs förra onsdagen. Att få projektleda det arbetet
har varit något av det roligaste och mest utmanande jag gjort.

Den sista fasen utgörs av utvärderande och framtidsplaner, och löper
nu. Vi har lagt ner våra pennor/tangentbord och ska fundera över den
här proof-of-concept-kommentaren vi har skapat, framförallt om den har
blivit det vi ville att den skulle vara, dvs användbar. Vi ska också
försöka komma på hur vi kan ta den vidare.

Omedelbara intryck

Jag har ju följt de enskilda skribenternas arbete på nära håll. Min
första reflektion är att låta tretton personer skriva i genomsnitt
53,5 timmar vardera ger ett mycket bättre resultat än om jag hade
låtit en av dem skriva i 700 timmar.

Visst har varje individ en viss startsträcka innan man kommer igång,
och visst blir resultatet lite spretigt med varje skribents enskilda
stil, men tretton personer har sammanlagt så mycket mer kunskap och
idéer än vad en enskild person har.

Den andra reflektionen är att samtliga deltagare har på ganska kort
tid lärt sig arbetssättet och verktygen. Visst har det varit en del
frågor och problem (inte minst för att de fått jobba med en plattform
under utveckling, som kraschar då och då), men på det stora hela har
alla lyckats lära sig både grundläggande Mediawiki-hantering och de
ganska specifika reglerna vi har kring lagkommentering.

Kvantitet

I skrivande stund har det skrivits kommentarer till sjutton lagar,
beskrivningar av 523 juridiska begrepp, 144697 ord, 1091160 tecken
vilket, om man skulle skriva ut det, motsvarar ungefär 436 sidor. På
700 skrivtimmar motsvarar det en sida på 1 timme och 36 minuter. Nu
misstänker jag att en del deltagare ägnat betydligt fler än sina
rapporterade timmar åt skrivande, men det är ändå en riktigt bra takt,
rent kvantitetsmässigt.

Kvalitet

Men att vi skrivit mycket är ju inte så intressant om vi inte dessutom
har skrivit bra och rätt. För att utvärdera det håller just nu en
mottagargrupp bestående av icke-jurister att gå igenom
materialet genom att lösa en serie juridiska frågeställningar
med lagtexten och kommentarerna som enda hjälpmedel.

Vad gäller själva språket är det en konst att skriva kort,
lättfattligt och exakt. Många av skribenterna har sagt att det
varit svårt att komma ifrån det vanliga juridiska språkbruket som man
blir marinerad i under utbildningen. Om juristertvingas välja mellan
att skriva kort/enkelt och att skriva exakt så kommer de flesta välja
det senare. Så även i det här projektet, vilket jag tycker är helt
rätt – det hjälper inte hur enkel och kort informationen är, om den är
felaktig eller missvisande. Att skriva kortare och enklare utan att
något går förlorat är dock en färdighet man kan öva upp. Här har de
flesta skribenter blivit bättre med tiden.

lagrumshänvisningar

Vid sidan av skrivarbetet har jag även gjort lite teknikutveckling. En
sådan sak är inkommande lagrumshänvisningar, som jag skrivit om
tidigare. En viktig användbarhetsaspekt i hur dessa inkommande
hänvisningar visades fixades dock först igår – se nedanstående
skärmdump för en före/efter-jämförelse (klicka för större).

lagrum

Nästa steg

Novembers arbete går främst ut på att utvärdera vad vi gjort, dels
genom mottagargruppens utvärdering, dels genom en avslutande workshop
nu på lördag. Men vi ska också ta nästa steg för att ta det här
projektet vidare.

Ett urval av frågor som vi borde ha något svar på: Idag är projektet
ingen egen juridisk person, utan drivs av mig som privatperson. Det
kanske borde drivas i form av en idell förening, en stiftelse, eller
ett aktiebolag? Ska verksamheten vara nollbudget, icke vinstdrivande,
eller kommersiellt? Ska vi försöka få folk att skriva helt och hållet
på sin fritid, eller ska vi försöka få medel till lön för de som
skriver. Hur ska vi i så fall få in medel, och vad kan vi tänka oss
att gå med på för att få dem? Ska vi göra det enkelt för vem som helst
att bidra, eller ska vi ställa några krav på den som vill bli
skribent? Hur når vi dem som kan tänkas vilja skriva? Ska vi
kvalitetsgranska i förhand, efterhand eller inte alls? Vad är best
case scenario om vi tittar två år i framtiden? Hur bra måste
resultatet av vårt arbete vara för att det alls ska vara värt att
syssla med? Och vilka ingår i ”vi”?

Om du har åsikter om lagen.nu och ovanstående frågor får du gärna
delta på workshoppen, även om du inte skrivit i
lagkommenteringsprojektet. Hör av dig till mig i sådana fall. Om du är
icke-jurist som vill hjälpa till att utvärdera lagkommentarerna får du
också gärna höra av dig.

P1-reportage om lagkommenteringsprojektet

För ett tag sedan gjorde P1-morgon ett reportage om lagkommenteringsprojektet, som sändes igår (och kan lyssnas på i efterhand). I reportaget berättar två av deltagarna, Daniel och Tizian, om vad projektet går ut på och varför det är viktigt. Jag tycker det blev ett riktigt bra reportage och det känns otroligt coolt att höra andra än mig själv förklara vad det är vi försöker bygga. Det är inte längre bara mitt lilla hobbyprojekt utan vårt försök att göra juridiken begriplig. En förändring som är nödvändig för att lyckas med det målet.

Specialbehandla eller arbeta runt?

Jag upptäckte just ett fel i SFST, dvs den databasen som innehåller alla svenska lagtexter i konsoliderad form, och som ligger till grund för lagen.nu Inget unikt med det, det förekommer fel där då och då, vilket jag vanligtvis märker genom att någon kodsnutt går sönder eftersom den inte var skriven för att indatat skulle vara så trasigtmärkligt. Över tiden har jag utvecklat ett system för att hantera sådana här felaktigheter – jag skriver helt enkelt en patch, som appliceras först av allt innan resten av parsekoden kör.

Som ett exempel på ett typiskt fel, kolla 3 § PUL i SFST:

3 § I denna lag används följande beteckningar med nedan angiven
betydelse.


Beteckning                      Betydelse

Behandling (av person)          Varje åtgärd eller serie av
uppgifter)                      åtgärder som vidtas i fråga om
                                personuppgifter, vare sig det
                                sker på automatisk väg eller inte,
                                t.ex. insamling, registrering,
                                organisering, lagring, bearbetning
                                eller ändring, återvinning, inhämtande,
                                användning, utlämnande genom
                                översändande, spridning eller annat
                                tillhandahållande av
                                uppgifter, sammanställning eller
                                samkörning, blockering,
                                utplåning eller förstöring.

Dvs vänstercellen i tabellen har en högerparantes där det borde vara ett bindestreck.

Detta löses genom en patch i unified diff-format. Den appliceras, resten av parsningen tar vid, resultatet blir fint (och, nota bene, med en liten förklaring om att texten faktiskt har ändrats – transparens är viktigt).

(jo, jag har rapporterat det upstream också, och de som sköter SFST vet var de kan hitta mitt patcharkiv. Vissa fel har rättats med tiden, men inte alla).

Generellt försöker jag låta bli att lösa parsningsproblem med en patch – i en korpus så stor som SFST kan man nästan utgå från att alla tänkbara klasser av fel förekommer fler gånger. Om det är möjligt att lösa problemet generellt i själva parsningen, genom någon typ av workaround, är det att föredra framför att specialbehandla lagtext för lagtext. Ovanstående fel tror jag inte är möjligt att hantera generellt.

Men nu har jag hittat ett fel som är sådär på gränsen: I köplagens första paragraf, fjärde stycket finns texten ”Vid köp av byggnad som uppförts för stadigvarande bruk gäller […] vad som föreskrivs i 4 kap. 11, 12 och 18–19d §§ jordabalken”

Felet här är i slutet av meningen – den avslutas med en lista av hänvisningar, där den sista går till 4 kap. 19 d § jordabalken. När lagstiftaren ändrar en lag så vill denne ibland stoppa in nya paragrafer mellan exv 19 § och 20 § — dessa får då beteckningarna 19 a §, 19 b § osv.

(Sidnot: Amerikanska lagstiftare har i allmänhet löst det här på ett sätt som är mer tilltalande för gamla basicprogrammerare – kolla exempelvis Oregons reglering av forumregler i civilmål och notera att numreringen lämnar gott om utrymme att stoppa in nya bestämmelser mellan de befintliga, vilket också görs då och då).

Det svenska sättet att stoppa in nya paragrafer gör det krångligare att skriva en parser för lagtext — den måste klara av uttrycket ”3 §”, ”3 och 4 §§”, ”3 e §”, ”3 eller 4 §” och många många fler (glöm för allt i världen inte att ”10 § f” är något helt annat än ”10 f §”). Den EBNF-grammatik som används har vuxit fram organiskt över några år, och kan ge känsliga personer mardrömmar.

Av den anledningen blir jag lite kallsvettig varje gång jag ser ett nytt sätt att hänvisa till lagrum som systemet inte klarar av att parsea. Exemplet ovan — som kan förenklas till ”19d § jordabalken” — är ett sådant. Med den skillnaden att hänvisningen faktiskt är felaktig: paragrafen har nummer ”19 d”, inte ”19d”.

Så frågan är: Ska jag fixa det med specialbehandling, dvs skriva en patch, eller ska jag försöka arbeta runt problemet genom att ändra min EBNF-grammatik? En vägledning kan man få genom grep — vi kan helt enkelt kolla hur många andra förekomster av det här felaktiga sättet att hänvisa som vi hittar:

find data/sfs/intermediate -name "*.txt" | xargs  egrep '[0-9][a-z] §'
data/sfs/intermediate/1980/770.txt:5 § Vid tillämpning av 11a § tredje stycket kungörelsen (1972:412 ) om
data/sfs/intermediate/1990/931.txt:kap. 11, 12 och 18--19d §§ jordabalken. Om en tomträttsupplåtelse enligt
data/sfs/intermediate/1995/238.txt:-- 22--23, 25--26, 30 och 35--44a §§ kungörelsen (1969:380) om
data/sfs/intermediate/1995/238.txt:vapenfri tjänst skall 12--17a §§ kungörelsen (1966:414) med vissa
data/sfs/intermediate/1996/844.txt:d) Bestämmelserna om sanktioner i 31a-31e §§ lokalradiolagen
data/sfs/intermediate/1997/1157.txt:reglerna, jfr 72a § lagen nr 612 den 24 juni 1996 om social
data/sfs/intermediate/1998/488.txt:stycket finns i 2a §. I fråga om utfärdande av nytt
data/sfs/intermediate/1999/1229.txt:Vad som sägs i 2 kap. 3 §, 6 kap. 5, 10a och 16a §§, 17kap.

Ok, åtta fel är inte jättemånga, men jag får väga risken av att introducera nya fel genom en ändrad grammatik (vilken hålls nere av ett stort batteri med testfall) mot det tråkiga och tidskrävande arbetet att göra åtta patchfiler (samt den potentiella nyttan av att de appliceras upstream).

Mer om semweb-utveckling och nya features på lagen.nu

Nu har det varit obegripligt tyst här på bloggen ett bra tag, trots
att det hänt massor som är värt att berätta om. Eller så är det just
för att det hänt massor som det varit tyst på bloggen.

I vart fall så har sommaren ägnats åt lagen.nu-projektet, som nu går
in i sin tredje månad. Jag har delat min tid ungefär lika mellan
systemutveckling av själva teknikplattformen och projektledning av de
som skriver. Den senare delen av arbetet är förstås den mest
spännande, men den kan med fördel följas på
lagen.nu-utveckling-listan, som jag tycker du ska gå med på. Eller så
kan du bli ett fan av lagen.nu på facebook!

Men teknikutvecklingen har jag inte skrivit så mycket om varken här
eller där, så nu är det dags. Den ombyggnad som jag beskrev här, som
rör hur data från olika källor pusslas ihop med hjälp av SPARQL, har
driftssatts och funkar hyfsat bra. Jag har en del problem med Sesame,
där vissa saker tar omotiverat mycket tid, särskilt på
linuxplattformen, men det funkar iaf, sort of. Jag har också fått en
del tips på hur man kan undvika de långa kedjor av w
dct:isPartOf x . x dct:isPartOf y . y dct:isPartOf z
som
jag idag använder. Lösningen går ut på att tala om för Sesame att
dct:isPartOf är en TransitiveProperty och sedan be
Sesame använda inference — på det viset kan Sesame själv förstå att
w dct:isPartOf z. Exakt hur man faktiskt
gör det har jag dock inte läst mig till än.

Den nya versionen finns i betatest på ferenda.lagen.nu, och vana
lagen.nu-besökare kommer se ett antal förändringar redan i den
grafiska designen. Sidorna är uppbyggda med en smal högerkolumn som
oftast visar någon innehållsförteckning eller liknande, samt två lika
breda kolumner som visar själva dokumenttexten, samt metadata kring
dokumentet, exempelvis en kommentar till en paragraf, eller en lista
av rättsfall som hänvisar till paragrafen. Varje kategori av metadata
visas i en box som kan expanderas eller kollapsas. Det finns även en
ny kategori av rättsinformation vid sidan av ”Lagar” och ”Domar”,
nämligen ”Begrepp” (men säg inte till någon jurist att jag betraktar
begrepp som en rättskälla, då blir jag anklagad för att syssla med
begreppsjurisprudens).

Utöver denna nya formgivning finns även ett antal nya funktioner. Jag
tänkte gå igenom två av dem och visa hur den RDF/SPARQL-baserade
plattformen gjort det snabbare att lägga till dem. Att lägga till ny
funktionalitet på lagen.nu innebär att på ett eller annat sätt utvinna
data (dokument) och metadata (egenskaper hos dokument) om/från
rättskällor, för att sedan presentera och framförallt korskoppla denna
data/metadata.

”Lagrum som hänvisar hit”: Bredvid varje paragraf så finns det en box
(med rubriken ”Lagrumshänvisningar hit”) som innehåller en lista över
olika ställen i denna eller andra lagar som hänvisar till den aktuella
paragrafen. Minnesgoda bloggläsare känner igen detta från det
paper
jag och Christine Kirchberger skrev förra
vintern
. Det är också implementerat på ungefär samma sätt, med en
SPARQL-fråga vars svar vävs ihop med lagtexten genom XSLT. Den största
skillnaden är att jag vid sidgenereringen ställer ett antal olika
SPARQL-frågor (en för varje boxtyp, ungefär), väver ihop svaren till
en RDF/XML-fil, som sedan används från XSLT. Det finns lite kvar att
göra på den här funktionen, framförallt kryptiska beteckningar i stil
med ”SFS 2000:1225, P1S4” bytas ut mot kryptiska beteckningar i stil
med ”1 § 4 st lagen (2000:1225) om straff för smuggling”.

Den här funktionen kunde alltså realiseras med hjälp av metadata som
redan fanns, och det system för att väva ihop data och medatada som
också redan fanns. Den enda nyutvecklingen var en ny SPARQL-fråga och
en ny funktion i XSLT-stylesheetet.

”Legaldefinitioner”: I lagtext finns det ofta olika typer av
begreppsdefinitioner. Dessa definitioner förekommer vanligtvis i
samband med någon form av fasta uttrycksformer:

Tabellform, exv PUL 3 §:

I denna lag används följande beteckningar med nedan angiven
betydelse.

Beteckning Betydelse
Personuppgifter All slags information som direkt eller
indirekt kan hänföras till en fysisk person som är i livet.

Listform, exv LEK 1:7:

I lagen avses med

abonnent: den som har ingått avtal med en leverantör av allmänt tillgängliga elektroniska kommunikationstjänster om tillhandahållande av sådana tjänster,

Löpande form, exv PAL 2
§
:

Med produkter avses i denna lag lösa saker. En produkt som har infogats eller på annat sätt blivit en beståndsdel i någon annan lös egendom eller i fast egendom skall alltjämt anses i lagens mening utgöra en produkt för sig.

Parantesform, exv JB 4:19 a

Köparen får inte åberopa att fastigheten är felaktig enligt 11, 12 och 17–19 §§, om han inte lämnar säljaren meddelande om felet inom skälig tid efter det att han märkt eller borde ha märkt felet (reklamation).

Brottsrubriceringsform, exv BrB 17:4

Den som, utan att fall är för handen som förut i detta kapitel är
sagt, genom att sätta sig till motvärn eller eljest med våld söker
hindra någon i hans myndighetsutövning, dömes för våldsamt
motstånd
till böter eller fängelse i högst sex månader.

En definition av ett begrepp som finns i lagtext kallas vanligen
legaldefinition och har förstås en särskild tyngd jämfört med de
definitioner som vi vanliga dödliga kan åstadkomma. Därför är det
intressant att försöka känna igen legaldefinitionsmässigt. Hur man gör rent
textprocessingsmässigt för att göra det tänker jag inte gå in på här,
men den korta versionen är att det inbegriper ett stort antal, allt
hårigare, regexpar. Den långa versionen finns i den allt mer feldöpta
funktionen _construct_ids. Det är i vart fall inte särskilt svårt, utan jobbet ligger mest i att hitta de olika uttrycksformerna och skriva testfall. Poängen
är att efter vi kört våra regexpar så har vi ytterligare drygt tusen
RDF-triples på formen:

<http://rinfo.lagrummet.se/publ/sfs/1962:700#K17P4>
dct:subject "Våldsamt motstånd"@sv

Under den nya fliken ”Begrepp” har vi samlat begrepp från
3½ olika håll – de begrepp vi själva beskrivit i
lagkommenteringsprojektet, de begrepp som används som sökord i
rättsfall och de legaldefinitioner som vi utvunnit enligt ovan (samt
information om huruvida svenska Wikipedia har en sida om
begreppet).

För att skapa en sådan sida — exempelvis för begreppet ”Konsument”
hämtar vi all data från Sesame. Tre SPARQL-frågor, samma process för att slå ihop svaren
till en RDF/XML-fil, (nästan) samma process för att väva ihop ett
källdokument (som i detta fallet bara innehåller själva begreppet som
titel) med RDF-datan. Ny funktionalitet med ganska liten arbetsinsats.

(Även innehållsförteckningarna under flikarna ”Lagar”, ”Domar” och
”Begrepp” genereras nu på samma sätt — in med en stor RDF-graf, några
konfigurationsparametrar och ut kommer ett antal hundra sidor som
sammanlagt bildar ett index över all information av en viss typ som
finns i systemet).

Dumma grafexperiment 3 (nu lite smartare)

Närhelst jag försöker ordna upp saker och ting i kategorier dyker alltid Jorge Luis Borges fantastiska djurtaxonomi upp i bakhuvudet:

”Djur kan delas in i
a) djur som tillhör kejsaren,
b) balsamerade djur,
c) tama djur,
d) spädgrisar,
e) sirener,
f) fabeldjur,
g) hundar som springer fritt,
h) de som ingår i föreliggande klassifikation,
i) djur som uppför sig som galna,
j) oräkneliga djur,
k) djur målade med en mycket tunn kamelhårspensel,
l) etc,
m) djur som just haft sönder en kruka,
n) djur som på långt håll ser ut som flugor.”

(Borges påstår i sin text att listan härstammar från det kinesiska uppslagsverket Heavenly Emporium of Benevolent Knowledge, men det verkar mer sannolikt att han hittat på den själv. Ovanstående översättning är hämtad från det till synes fantastiskt tråkiga europaparlamentsbetänkandet 2002/2140(INI)).

Att försöka beskriva världen i hierarkiskt ordnade kategorier är egentligen inte möjligt. Kategorisering kan till och med vara skadligt om det begränsar vårt sätt att tänka, eller befäster ojämlikheter. Men ändå har vi en stark drift att ordna allt vi vet så att var informationsbit är på sin plats.

Inom juridiken ordnar man ofta upp kunskapen i rättsområden. Det finns två stora områden (civilrätt och offentlig rätt), som vart och ett har ett antal underområden. Det här hjälper oss att skapa en ändamålsenlig och samtidigt förutsägbar rättstillämpning. Det är helt olika principer som gäller för exempelvis bevisbördor eller lagtolkning inom avtal (civilrätt) jämfört med straffrätt (offentlig rätt). Men samtidigt finns det fall där verkligheten inte riktigt vill inordna sig i den enkla trädstrukturen — fastighetsrätt har både civilrättsliga och offentligrättsliga inslag, till exempel).

Inom lagkommenteringsprojektet så kategoriserar vi allt vi skriver i de olika rättsområdena. Ett visst begrepp kan tillhöra fler än en kategori — vårdslöshet är ett viktigt begrepp inom både straff- och skadeståndsrätt.

Även själva kategorierna kan kategoriseras – så skadeståndsrätten är en del av obligationsrätten, som är en del av förmögenhetsrätten, som är en del av civilrätten. Och vad får vi då? Jo, en stor härlig graf (klicka för större):

Kategorisering

Grafen skapas dynamiskt av MediaWiki-pluggen Graphical Category Browser, med GraphWiz i botten. Kolla in den senaste versionen direkt på wikin.

Det finns förstås mycket att säga om just den här kategoriseringen. Jag har utvecklat några tankar på mailinglistan. Om du har några kommentarer, skriv dem gärna där. Eller här nedanför.