Nya utmaningar

Igår tackade jag ja till en anställning på Domstolsverket som
projektledare för rättsinformationsprojektet,
det arbete som syftar till att göra vårt offentliga
rättsinformationssystem modernt (om ni följer twitter eller
mailinglistan
har ni redan sett detta). Jag börjar på halvtid den 18:e januari, och
på heltid den 22:a februari. Med anledning därav tänkte jag besvara
några frågor. Inte för att någon har ställt dessa än, men ändå.

Vad är det offentliga rättinformationssystemet?

Rättsinformationssystemet är statens system för att göra
rättsinformation — lagar, förarbeten, rättsfall med mera —
tillgängligt för allmänheten via nätet. Den här informationen produceras av en
rad olika myndigheter. Idag är varje myndighet ansvarig för att
publicera ”sin” information via sin egen webbplats. Det hela knyts
ihop genom länkportalen lagrummet.se som hänvisar till
varje myndighets respektive rättinformationssida.

Den här decentraliserade approachen har sina fördelar. Varje
myndighet har en stor frihet att utforma informationen på det sätt som
passar myndigheten bäst. Nackdelen är att varje myndighet utnyttjar
denna frihet till att uppfinna egna, och oftast ganska dåliga,
hjul. Den styrning som finns är i form av en författning – rättsinformationsförordningen
som inte ställer särskilt detaljerade krav på hur det ska
publiceras, bara att det ska publiceras.

Hur ser det ut idag?

Det som finns tillgängligt idag är… inte så bra. Själva portalen
lagrummet.se är snygg och pedagogisk, men den kan inte göra så mycket
så länge de olika myndigheterna tillhandahåller material i sådant
dåligt och framförallt spretigt skick.

Gränssnittet mellan lagrummet och de enskilda myndigheterna är idag i
princip en URL – myndigheten talar om addressen till huvudsidan för
deras rättsinformation, och lagrummet.se listar den. Eftersom varje
myndighet har uppfunnit sitt eget hjul för hur man exempelvis listar
vilka dokument som är tillgängliga, vilken metadata de har, vilka
format de publiceras i, hur informationens semantik uttrycks i de
formaten, hur nya och uppdaterade dokument kan upptäckas, och mycket
annat kan lagrummet.se inte göra så mycket med informationen.

Under de senaste åren har det pågått ett utvecklingsarbete på ett
system för att delvis centralisera hanteringen av
informationen. Projektledare har varit Peter Krantz, känd för sitt
outtröttliga engagemang för en modern och öppen e-förvaltning, nu senast genom
arbetet med opengov.se (Peter
slutar som projektledare eftersom han går
vidare
till e-delegationen).

Han och
Niklas Lindström, känd för
sitt outtröttliga engagemang för den semantiska webben, har
tagit fram en specifikation för och en implementation av ett system
som låter varje myndighet publicera sin rättsinformation på ett
konsekvent och standardiserat sätt med maskinläsbar metadata, så att
ett centralt system sedan kan hämta in informationen löpande.

Jag var med
på ett hörn
i det här projektet under förra och förrförra året och
hjälpte till med att ta fram en RDF-vokabulär, dvs en formaliserad
beskrivning över vilken data och metadata som finns i olika typer av
rättsinformation. Informationshanteringen
i lagen.nu
bygger på denna vokabulär.

Rättsinformationsprojektet har även arbetat tillsammans med en rad
myndigheter och hjälpt dem att börja levera information till systemet
enligt det specificerade gränssnittet. De första myndigheterna har
precis börjat med att leverera skarpt data. Det allra mesta arbetet
har redan gjorts, vilket är mycket tacksamt för mig som kommer in i
slutminuterna och får nöjet att vara med och sätta bollen i
mål. Framförallt har arbetet, systemet och tänket präglats av
principer om standardisering, semantik, enkelhet och öppenhet. Vilket
gör det till något av ett drömjobb för mig.

Vad händer med lagen.nu?

Jag har flaggat för att jag kommer driva lagen.nu vidare, och domstolsverket ser
inga problem med det. Lagen.nu är en krävande
rättsinformationsanvändare, och den erfarenheten kommer jag ta med mig
in i det här projektet. Men allt arbete på den tjänsten kommer ske på
fritiden, och sådan kan bli en knapp resurs, särskilt fram till den
22:a februari då jag ska vara klar med uppsatsarbetet.

Tanken framöver är att skapa en fristående juridisk person för
verksamheten och sedan jobba för att finansiera mer verksamhet kring
lagkommentarsskrivande och teknisk utveckling. Målet på sikt är att
skapa ett institut i stil med de legal information
institutes
som finns i många andra jurisdiktioner.

Lansering av nya lagen.nu (plz RT!)

Efter fyra månaders intensivt arbete är jag oerhört stolt att få meddela att den nya versionen av lagen.nu, med lagkommentarer, nu ligger ute på https://lagen.nu/. Jag håller på att fila på ett pressmeddelande som kommer gå ut i morgon förmiddag (utkast).

Vi hade en avslutande workshop för projektet igår, där vi framförallt diskuterade hur vi skulle kunna ta vidare projektet, där många bra idéer kom fram. Det allra viktigaste är att nå ut till fler människor, både de som kan ha nytta av tjänsten och de som kan bidra till att göra den bättre (det är förstås ett stort överlapp på dessa grupper).

Ni som följer den här bloggen har nog redan läst vad det är vi har försökt göra och hur det har gått.

Nu behöver vi nå ut till fler. Känner du några jurister? Berätta för dem att det finns ett projekt där de kan göra världen bättre och utveckla sig själva samtidigt. Känner du några journalister? Berätta för dem att det finns ett gäng entusiaster som jobbar på att göra lagboken begriplig. Känner du några människor? Berätta för dem att det finns ett ställe där de kan läsa sig till sån juridisk kunskap som normalt tar 4½ år att arbeta upp. Umgås du inte med folk? Skriv något på din blog / skicka ett tweet / ändra din facebookstatus. Och länka gärna till lagar och paragrafer om du diskuterar lag och rätt på nätet.

Lagkommenteringsprojektet: Skrivfasen avslutad

Det har varit ganska tyst på bloggen om lagkommenteringsprojektet (det
mesta har stått på mailinglistan). I förra veckan gick vi dock imål
med en viktig milstolpe, som är värd att uppmärksammas.

Under sommaren och hösten har vi som sagt ägnat oss åt att skriva
kommentarer/förklaringar till/av de viktigaste lagarna och juridiska
begreppen. Eller rättare sagt, mina begåvade projektmedlemmar har
skrivit och jag har projektlett efter bästa förmåga, samt skruvat på
tekniken.

Skrivperioden avslutad

Enligt projektplanen skulle projektet ha tre faser. Den första fasen
var teknikutveckling, då jag klistrade ihop en mediawikiinstallation
med en Sesame-server och använde det hela för att bygga en pipeline
från wikimarkup till RDF-triples till ihopvävda lagtextkommentarer.

Den andra fasen var skrivandet, och den löpte från första juli till
sista september, dvs förra onsdagen. Att få projektleda det arbetet
har varit något av det roligaste och mest utmanande jag gjort.

Den sista fasen utgörs av utvärderande och framtidsplaner, och löper
nu. Vi har lagt ner våra pennor/tangentbord och ska fundera över den
här proof-of-concept-kommentaren vi har skapat, framförallt om den har
blivit det vi ville att den skulle vara, dvs användbar. Vi ska också
försöka komma på hur vi kan ta den vidare.

Omedelbara intryck

Jag har ju följt de enskilda skribenternas arbete på nära håll. Min
första reflektion är att låta tretton personer skriva i genomsnitt
53,5 timmar vardera ger ett mycket bättre resultat än om jag hade
låtit en av dem skriva i 700 timmar.

Visst har varje individ en viss startsträcka innan man kommer igång,
och visst blir resultatet lite spretigt med varje skribents enskilda
stil, men tretton personer har sammanlagt så mycket mer kunskap och
idéer än vad en enskild person har.

Den andra reflektionen är att samtliga deltagare har på ganska kort
tid lärt sig arbetssättet och verktygen. Visst har det varit en del
frågor och problem (inte minst för att de fått jobba med en plattform
under utveckling, som kraschar då och då), men på det stora hela har
alla lyckats lära sig både grundläggande Mediawiki-hantering och de
ganska specifika reglerna vi har kring lagkommentering.

Kvantitet

I skrivande stund har det skrivits kommentarer till sjutton lagar,
beskrivningar av 523 juridiska begrepp, 144697 ord, 1091160 tecken
vilket, om man skulle skriva ut det, motsvarar ungefär 436 sidor. På
700 skrivtimmar motsvarar det en sida på 1 timme och 36 minuter. Nu
misstänker jag att en del deltagare ägnat betydligt fler än sina
rapporterade timmar åt skrivande, men det är ändå en riktigt bra takt,
rent kvantitetsmässigt.

Kvalitet

Men att vi skrivit mycket är ju inte så intressant om vi inte dessutom
har skrivit bra och rätt. För att utvärdera det håller just nu en
mottagargrupp bestående av icke-jurister att gå igenom
materialet genom att lösa en serie juridiska frågeställningar
med lagtexten och kommentarerna som enda hjälpmedel.

Vad gäller själva språket är det en konst att skriva kort,
lättfattligt och exakt. Många av skribenterna har sagt att det
varit svårt att komma ifrån det vanliga juridiska språkbruket som man
blir marinerad i under utbildningen. Om juristertvingas välja mellan
att skriva kort/enkelt och att skriva exakt så kommer de flesta välja
det senare. Så även i det här projektet, vilket jag tycker är helt
rätt – det hjälper inte hur enkel och kort informationen är, om den är
felaktig eller missvisande. Att skriva kortare och enklare utan att
något går förlorat är dock en färdighet man kan öva upp. Här har de
flesta skribenter blivit bättre med tiden.

lagrumshänvisningar

Vid sidan av skrivarbetet har jag även gjort lite teknikutveckling. En
sådan sak är inkommande lagrumshänvisningar, som jag skrivit om
tidigare. En viktig användbarhetsaspekt i hur dessa inkommande
hänvisningar visades fixades dock först igår – se nedanstående
skärmdump för en före/efter-jämförelse (klicka för större).

lagrum

Nästa steg

Novembers arbete går främst ut på att utvärdera vad vi gjort, dels
genom mottagargruppens utvärdering, dels genom en avslutande workshop
nu på lördag. Men vi ska också ta nästa steg för att ta det här
projektet vidare.

Ett urval av frågor som vi borde ha något svar på: Idag är projektet
ingen egen juridisk person, utan drivs av mig som privatperson. Det
kanske borde drivas i form av en idell förening, en stiftelse, eller
ett aktiebolag? Ska verksamheten vara nollbudget, icke vinstdrivande,
eller kommersiellt? Ska vi försöka få folk att skriva helt och hållet
på sin fritid, eller ska vi försöka få medel till lön för de som
skriver. Hur ska vi i så fall få in medel, och vad kan vi tänka oss
att gå med på för att få dem? Ska vi göra det enkelt för vem som helst
att bidra, eller ska vi ställa några krav på den som vill bli
skribent? Hur når vi dem som kan tänkas vilja skriva? Ska vi
kvalitetsgranska i förhand, efterhand eller inte alls? Vad är best
case scenario om vi tittar två år i framtiden? Hur bra måste
resultatet av vårt arbete vara för att det alls ska vara värt att
syssla med? Och vilka ingår i ”vi”?

Om du har åsikter om lagen.nu och ovanstående frågor får du gärna
delta på workshoppen, även om du inte skrivit i
lagkommenteringsprojektet. Hör av dig till mig i sådana fall. Om du är
icke-jurist som vill hjälpa till att utvärdera lagkommentarerna får du
också gärna höra av dig.

P1-reportage om lagkommenteringsprojektet

För ett tag sedan gjorde P1-morgon ett reportage om lagkommenteringsprojektet, som sändes igår (och kan lyssnas på i efterhand). I reportaget berättar två av deltagarna, Daniel och Tizian, om vad projektet går ut på och varför det är viktigt. Jag tycker det blev ett riktigt bra reportage och det känns otroligt coolt att höra andra än mig själv förklara vad det är vi försöker bygga. Det är inte längre bara mitt lilla hobbyprojekt utan vårt försök att göra juridiken begriplig. En förändring som är nödvändig för att lyckas med det målet.

Specialbehandla eller arbeta runt?

Jag upptäckte just ett fel i SFST, dvs den databasen som innehåller alla svenska lagtexter i konsoliderad form, och som ligger till grund för lagen.nu Inget unikt med det, det förekommer fel där då och då, vilket jag vanligtvis märker genom att någon kodsnutt går sönder eftersom den inte var skriven för att indatat skulle vara så trasigtmärkligt. Över tiden har jag utvecklat ett system för att hantera sådana här felaktigheter – jag skriver helt enkelt en patch, som appliceras först av allt innan resten av parsekoden kör.

Som ett exempel på ett typiskt fel, kolla 3 § PUL i SFST:

3 § I denna lag används följande beteckningar med nedan angiven
betydelse.


Beteckning           Betydelse

Behandling (av person)     Varje åtgärd eller serie av
uppgifter)           åtgärder som vidtas i fråga om
                personuppgifter, vare sig det
                sker på automatisk väg eller inte,
                t.ex. insamling, registrering,
                organisering, lagring, bearbetning
                eller ändring, återvinning, inhämtande,
                användning, utlämnande genom
                översändande, spridning eller annat
                tillhandahållande av
                uppgifter, sammanställning eller
                samkörning, blockering,
                utplåning eller förstöring.

Dvs vänstercellen i tabellen har en högerparantes där det borde vara ett bindestreck.

Detta löses genom en patch i unified diff-format. Den appliceras, resten av parsningen tar vid, resultatet blir fint (och, nota bene, med en liten förklaring om att texten faktiskt har ändrats – transparens är viktigt).

(jo, jag har rapporterat det upstream också, och de som sköter SFST vet var de kan hitta mitt patcharkiv. Vissa fel har rättats med tiden, men inte alla).

Generellt försöker jag låta bli att lösa parsningsproblem med en patch – i en korpus så stor som SFST kan man nästan utgå från att alla tänkbara klasser av fel förekommer fler gånger. Om det är möjligt att lösa problemet generellt i själva parsningen, genom någon typ av workaround, är det att föredra framför att specialbehandla lagtext för lagtext. Ovanstående fel tror jag inte är möjligt att hantera generellt.

Men nu har jag hittat ett fel som är sådär på gränsen: I köplagens första paragraf, fjärde stycket finns texten ”Vid köp av byggnad som uppförts för stadigvarande bruk gäller […] vad som föreskrivs i 4 kap. 11, 12 och 18–19d §§ jordabalken”

Felet här är i slutet av meningen – den avslutas med en lista av hänvisningar, där den sista går till 4 kap. 19 d § jordabalken. När lagstiftaren ändrar en lag så vill denne ibland stoppa in nya paragrafer mellan exv 19 § och 20 § — dessa får då beteckningarna 19 a §, 19 b § osv.

(Sidnot: Amerikanska lagstiftare har i allmänhet löst det här på ett sätt som är mer tilltalande för gamla basicprogrammerare – kolla exempelvis Oregons reglering av forumregler i civilmål och notera att numreringen lämnar gott om utrymme att stoppa in nya bestämmelser mellan de befintliga, vilket också görs då och då).

Det svenska sättet att stoppa in nya paragrafer gör det krångligare att skriva en parser för lagtext — den måste klara av uttrycket ”3 §”, ”3 och 4 §§”, ”3 e §”, ”3 eller 4 §” och många många fler (glöm för allt i världen inte att ”10 § f” är något helt annat än ”10 f §”). Den EBNF-grammatik som används har vuxit fram organiskt över några år, och kan ge känsliga personer mardrömmar.

Av den anledningen blir jag lite kallsvettig varje gång jag ser ett nytt sätt att hänvisa till lagrum som systemet inte klarar av att parsea. Exemplet ovan — som kan förenklas till ”19d § jordabalken” — är ett sådant. Med den skillnaden att hänvisningen faktiskt är felaktig: paragrafen har nummer ”19 d”, inte ”19d”.

Så frågan är: Ska jag fixa det med specialbehandling, dvs skriva en patch, eller ska jag försöka arbeta runt problemet genom att ändra min EBNF-grammatik? En vägledning kan man få genom grep — vi kan helt enkelt kolla hur många andra förekomster av det här felaktiga sättet att hänvisa som vi hittar:

find data/sfs/intermediate -name "*.txt" | xargs egrep '[0-9][a-z] §'
data/sfs/intermediate/1980/770.txt:5 § Vid tillämpning av 11a § tredje stycket kungörelsen (1972:412 ) om
data/sfs/intermediate/1990/931.txt:kap. 11, 12 och 18--19d §§ jordabalken. Om en tomträttsupplåtelse enligt
data/sfs/intermediate/1995/238.txt:-- 22--23, 25--26, 30 och 35--44a §§ kungörelsen (1969:380) om
data/sfs/intermediate/1995/238.txt:vapenfri tjänst skall 12--17a §§ kungörelsen (1966:414) med vissa
data/sfs/intermediate/1996/844.txt:d) Bestämmelserna om sanktioner i 31a-31e §§ lokalradiolagen
data/sfs/intermediate/1997/1157.txt:reglerna, jfr 72a § lagen nr 612 den 24 juni 1996 om social
data/sfs/intermediate/1998/488.txt:stycket finns i 2a §. I fråga om utfärdande av nytt
data/sfs/intermediate/1999/1229.txt:Vad som sägs i 2 kap. 3 §, 6 kap. 5, 10a och 16a §§, 17kap.

Ok, åtta fel är inte jättemånga, men jag får väga risken av att introducera nya fel genom en ändrad grammatik (vilken hålls nere av ett stort batteri med testfall) mot det tråkiga och tidskrävande arbetet att göra åtta patchfiler (samt den potentiella nyttan av att de appliceras upstream).

Mer om semweb-utveckling och nya features på lagen.nu

Nu har det varit obegripligt tyst här på bloggen ett bra tag, trots
att det hänt massor som är värt att berätta om. Eller så är det just
för att det hänt massor som det varit tyst på bloggen.

I vart fall så har sommaren ägnats åt lagen.nu-projektet, som nu går
in i sin tredje månad. Jag har delat min tid ungefär lika mellan
systemutveckling av själva teknikplattformen och projektledning av de
som skriver. Den senare delen av arbetet är förstås den mest
spännande, men den kan med fördel följas på
lagen.nu-utveckling-listan, som jag tycker du ska gå med på. Eller så
kan du bli ett fan av lagen.nu på facebook!

Men teknikutvecklingen har jag inte skrivit så mycket om varken här
eller där, så nu är det dags. Den ombyggnad som jag beskrev här, som
rör hur data från olika källor pusslas ihop med hjälp av SPARQL, har
driftssatts och funkar hyfsat bra. Jag har en del problem med Sesame,
där vissa saker tar omotiverat mycket tid, särskilt på
linuxplattformen, men det funkar iaf, sort of. Jag har också fått en
del tips på hur man kan undvika de långa kedjor av w
dct:isPartOf x . x dct:isPartOf y . y dct:isPartOf z
som
jag idag använder. Lösningen går ut på att tala om för Sesame att
dct:isPartOf är en TransitiveProperty och sedan be
Sesame använda inference — på det viset kan Sesame själv förstå att
w dct:isPartOf z. Exakt hur man faktiskt
gör det har jag dock inte läst mig till än.

Den nya versionen finns i betatest på ferenda.lagen.nu, och vana
lagen.nu-besökare kommer se ett antal förändringar redan i den
grafiska designen. Sidorna är uppbyggda med en smal högerkolumn som
oftast visar någon innehållsförteckning eller liknande, samt två lika
breda kolumner som visar själva dokumenttexten, samt metadata kring
dokumentet, exempelvis en kommentar till en paragraf, eller en lista
av rättsfall som hänvisar till paragrafen. Varje kategori av metadata
visas i en box som kan expanderas eller kollapsas. Det finns även en
ny kategori av rättsinformation vid sidan av ”Lagar” och ”Domar”,
nämligen ”Begrepp” (men säg inte till någon jurist att jag betraktar
begrepp som en rättskälla, då blir jag anklagad för att syssla med
begreppsjurisprudens).

Utöver denna nya formgivning finns även ett antal nya funktioner. Jag
tänkte gå igenom två av dem och visa hur den RDF/SPARQL-baserade
plattformen gjort det snabbare att lägga till dem. Att lägga till ny
funktionalitet på lagen.nu innebär att på ett eller annat sätt utvinna
data (dokument) och metadata (egenskaper hos dokument) om/från
rättskällor, för att sedan presentera och framförallt korskoppla denna
data/metadata.

”Lagrum som hänvisar hit”: Bredvid varje paragraf så finns det en box
(med rubriken ”Lagrumshänvisningar hit”) som innehåller en lista över
olika ställen i denna eller andra lagar som hänvisar till den aktuella
paragrafen. Minnesgoda bloggläsare känner igen detta från det
paper
jag och Christine Kirchberger skrev förra
vintern
. Det är också implementerat på ungefär samma sätt, med en
SPARQL-fråga vars svar vävs ihop med lagtexten genom XSLT. Den största
skillnaden är att jag vid sidgenereringen ställer ett antal olika
SPARQL-frågor (en för varje boxtyp, ungefär), väver ihop svaren till
en RDF/XML-fil, som sedan används från XSLT. Det finns lite kvar att
göra på den här funktionen, framförallt kryptiska beteckningar i stil
med ”SFS 2000:1225, P1S4” bytas ut mot kryptiska beteckningar i stil
med ”1 § 4 st lagen (2000:1225) om straff för smuggling”.

Den här funktionen kunde alltså realiseras med hjälp av metadata som
redan fanns, och det system för att väva ihop data och medatada som
också redan fanns. Den enda nyutvecklingen var en ny SPARQL-fråga och
en ny funktion i XSLT-stylesheetet.

”Legaldefinitioner”: I lagtext finns det ofta olika typer av
begreppsdefinitioner. Dessa definitioner förekommer vanligtvis i
samband med någon form av fasta uttrycksformer:

Tabellform, exv PUL 3 §:

I denna lag används följande beteckningar med nedan angiven
betydelse.

Beteckning Betydelse
Personuppgifter All slags information som direkt eller
indirekt kan hänföras till en fysisk person som är i livet.

Listform, exv LEK 1:7:

I lagen avses med

abonnent: den som har ingått avtal med en leverantör av allmänt tillgängliga elektroniska kommunikationstjänster om tillhandahållande av sådana tjänster,

Löpande form, exv PAL 2
§
:

Med produkter avses i denna lag lösa saker. En produkt som har infogats eller på annat sätt blivit en beståndsdel i någon annan lös egendom eller i fast egendom skall alltjämt anses i lagens mening utgöra en produkt för sig.

Parantesform, exv JB 4:19 a

Köparen får inte åberopa att fastigheten är felaktig enligt 11, 12 och 17–19 §§, om han inte lämnar säljaren meddelande om felet inom skälig tid efter det att han märkt eller borde ha märkt felet (reklamation).

Brottsrubriceringsform, exv BrB 17:4

Den som, utan att fall är för handen som förut i detta kapitel är
sagt, genom att sätta sig till motvärn eller eljest med våld söker
hindra någon i hans myndighetsutövning, dömes för våldsamt
motstånd
till böter eller fängelse i högst sex månader.

En definition av ett begrepp som finns i lagtext kallas vanligen
legaldefinition och har förstås en särskild tyngd jämfört med de
definitioner som vi vanliga dödliga kan åstadkomma. Därför är det
intressant att försöka känna igen legaldefinitionsmässigt. Hur man gör rent
textprocessingsmässigt för att göra det tänker jag inte gå in på här,
men den korta versionen är att det inbegriper ett stort antal, allt
hårigare, regexpar. Den långa versionen finns i den allt mer feldöpta
funktionen _construct_ids. Det är i vart fall inte särskilt svårt, utan jobbet ligger mest i att hitta de olika uttrycksformerna och skriva testfall. Poängen
är att efter vi kört våra regexpar så har vi ytterligare drygt tusen
RDF-triples på formen:

<http://rinfo.lagrummet.se/publ/sfs/1962:700#K17P4>
dct:subject "Våldsamt motstånd"@sv

Under den nya fliken ”Begrepp” har vi samlat begrepp från
3½ olika håll – de begrepp vi själva beskrivit i
lagkommenteringsprojektet, de begrepp som används som sökord i
rättsfall och de legaldefinitioner som vi utvunnit enligt ovan (samt
information om huruvida svenska Wikipedia har en sida om
begreppet).

För att skapa en sådan sida — exempelvis för begreppet ”Konsument”
hämtar vi all data från Sesame. Tre SPARQL-frågor, samma process för att slå ihop svaren
till en RDF/XML-fil, (nästan) samma process för att väva ihop ett
källdokument (som i detta fallet bara innehåller själva begreppet som
titel) med RDF-datan. Ny funktionalitet med ganska liten arbetsinsats.

(Även innehållsförteckningarna under flikarna ”Lagar”, ”Domar” och
”Begrepp” genereras nu på samma sätt — in med en stor RDF-graf, några
konfigurationsparametrar och ut kommer ett antal hundra sidor som
sammanlagt bildar ett index över all information av en viss typ som
finns i systemet).

Dumma grafexperiment 3 (nu lite smartare)

Närhelst jag försöker ordna upp saker och ting i kategorier dyker alltid Jorge Luis Borges fantastiska djurtaxonomi upp i bakhuvudet:

”Djur kan delas in i
a) djur som tillhör kejsaren,
b) balsamerade djur,
c) tama djur,
d) spädgrisar,
e) sirener,
f) fabeldjur,
g) hundar som springer fritt,
h) de som ingår i föreliggande klassifikation,
i) djur som uppför sig som galna,
j) oräkneliga djur,
k) djur målade med en mycket tunn kamelhårspensel,
l) etc,
m) djur som just haft sönder en kruka,
n) djur som på långt håll ser ut som flugor.”

(Borges påstår i sin text att listan härstammar från det kinesiska uppslagsverket Heavenly Emporium of Benevolent Knowledge, men det verkar mer sannolikt att han hittat på den själv. Ovanstående översättning är hämtad från det till synes fantastiskt tråkiga europaparlamentsbetänkandet 2002/2140(INI)).

Att försöka beskriva världen i hierarkiskt ordnade kategorier är egentligen inte möjligt. Kategorisering kan till och med vara skadligt om det begränsar vårt sätt att tänka, eller befäster ojämlikheter. Men ändå har vi en stark drift att ordna allt vi vet så att var informationsbit är på sin plats.

Inom juridiken ordnar man ofta upp kunskapen i rättsområden. Det finns två stora områden (civilrätt och offentlig rätt), som vart och ett har ett antal underområden. Det här hjälper oss att skapa en ändamålsenlig och samtidigt förutsägbar rättstillämpning. Det är helt olika principer som gäller för exempelvis bevisbördor eller lagtolkning inom avtal (civilrätt) jämfört med straffrätt (offentlig rätt). Men samtidigt finns det fall där verkligheten inte riktigt vill inordna sig i den enkla trädstrukturen — fastighetsrätt har både civilrättsliga och offentligrättsliga inslag, till exempel).

Inom lagkommenteringsprojektet så kategoriserar vi allt vi skriver i de olika rättsområdena. Ett visst begrepp kan tillhöra fler än en kategori — vårdslöshet är ett viktigt begrepp inom både straff- och skadeståndsrätt.

Även själva kategorierna kan kategoriseras – så skadeståndsrätten är en del av obligationsrätten, som är en del av förmögenhetsrätten, som är en del av civilrätten. Och vad får vi då? Jo, en stor härlig graf (klicka för större):

Kategorisering

Grafen skapas dynamiskt av MediaWiki-pluggen Graphical Category Browser, med GraphWiz i botten. Kolla in den senaste versionen direkt på wikin.

Det finns förstås mycket att säga om just den här kategoriseringen. Jag har utvecklat några tankar på mailinglistan. Om du har några kommentarer, skriv dem gärna där. Eller här nedanför.

Lagkommenteringsprojektet, första veckan

Nu har lagkommenteringsprojektet
varit igång en vecka. Vi kickade igång förra lördagen med en förmiddagsworkshop,
och efter det har alla jobbat på distans och kommunicerat framförallt
via vår mailinglista.

Ungefär hälften av deltagarna har kommit igång och börjat
skriva. Kommentarerna för Brottsbalken, Offentlighets- och
sekretesslagen
, Ärvdabalken, Avtalslagen och Rättegångsbalken växer
fram, paragraf för paragraf. Kolla Senaste ändringar för att få en
bild av aktiviteten.

Vi jobbar även med beskrivning av juridiska begrepp – juridiken är ett
område fullt av begrepp som är mer eller mindre obegripliga för den
oinvigde — du kanske känner till offentlighetsprincipen, men visste
du att det fanns två sådana principer med olika innebörd? Och vet du
vad en jurist menar när denne pratar om tradition?

När vi skriver själva lagkommentarerna försöker vi att använda de
begrepp som faktiskt används av jurister. Själva språket är ett
viktigt verktyg för den som vill förstå juridik. Av det följer att vi
måste förklara även viktiga begrepp, så att läsaren kan hänga med i en
diskussion om talerätt och partshabilitet. Och
eftersom vi gör det på nätet med wikiteknik så hyperlänkar vi förstås kors
och tvärs
.

Det är fortfarande många veckor kvar av projektet, och det mesta
återstår att skriva, men vad gäller en av de viktiga frågorna kring
pilotprojektet – kan man använda wikiteknik för att skriva sånt här
kommentarsmaterial överhuvudtaget? – ser det just nu mycket ljust ut.

Nästa steg är att ta reda på om de texter vi skapar faktiskt gör det
enklare för den intresserade allmänheten att ta reda på sina juridiska
rättigheter och skyldigheter. Det kommer vi utvärdera i slutet av
projektet under oktober månad. Är du en i den intresserade allmänheten
(dvs icke-jurist) och vill hjälpa till genom att svara på ett gäng
frågor? Hör av dig!