Dumma grafexperiment 4 (EU-rättsligt perspektiv)

Som jag skrev så kommer den juridiska relevansrankningsalgoritm jag jobbar på vara en enklare form av PageRank. Jag har en
RDF-databas med drygt 10 000 rättsfall med alla hänvisningar mellan rättsfall och även mellan rättsfall och lagstiftning. Det gör det möjligt att bland annat göra utsnitt ur datat med SPARQL, och på så sätt få fram exempelvis alla länkar mellan alla rättsfall där både det hänvisande och det hänvisade fallet även hänvisar till en viss EU-rättsakt. Från det kan man sen skapa en graphviz-fil för att få ett snyggt diagram. Minnesgoda läsare kommer ihåg att jag försökt rita diagram med graphviz förut, med varierande resultat. Låt oss se hur EU-rätten lämpar sig för sånt här!

Som rättsinformatiker finns det några direktiv som är av särskilt intresse. Dataskyddsdirektivet är ett sådant. Såhär ser rättspraxis ut för det:

(Alla diagram är klickbara och leder till en PDF-version. Scriptet som skapar graferna kan ”namnen” på några fall, de som jag har tyckt varit viktigast, och ritar ut dem med en annan färg).

Som synes är ”vårt” svenska fall om en konfirmandlärare som publicerade uppgifter om sina kollegor på föreningens webbplats med, och har en rätt framträdande position. Ju fler rättsfall som hänvisar till ett visst fall, desto större ruta. Vi kan också se att ett fall som inte alls har en så framträdande roll i svensk juristundervisning, Österreichicher Rundfunk, är ungefär lika ”viktigt”, baserat på antal hänvisningar.

Men rättspraxis för dataskyddsdirektivet är lite tunn. Hur ser en gammal goding som direktiv 69/335/EEG om indirekta skatter på kapitalanskaffning ut?

Äldre direktiv har i största allmänhet hunnit samla upp en större rättspraxis. Här ser man att Ponente Carni (61991J0071 AKA C-71/99 och C-178/91) har en framskjuten position. Nu kan jag för lite om EU-skatterätt för att avgöra om det är det allra viktigaste rättsfallet på det här området, men man kan notera (under ”Doctrine” i länken ovan) att det blivit föremål för analys i åtminstone nio artiklar.

Det mest hänvisade direktivet i domstolens historia är det sjätte mervärdesskattedirektivet, 388/77/EEG. Det finns 377 fall som berör det, och de har inbördes 1315 hänvisningar. Det ser ut såhär:

(Från och med här rekommenderar att man klickar sig igenom till PDF-versionen för att kunna se åtminstone något av vad som pågår.)

Här är det C-349/96 (Card Protection Plan Ltd) och C-62/93 (BP Soupergaz) som tycks vara viktigast. Är de det? Det vet jag inte innan jag gjort en djupdykning i litteraturen (eller hittat någon expert på sjätte mervärdesskattedirektivet).

Men direktiv i all ära, det är ju artiklarna i de grundläggande fördragen som har den riktigt stora samlingen praxis. I den testdata jag håller på att jobba fram har jag särskilt valt ut tio artiklar som är centrala. En klassiker är artikel 34 i EUF (mer känd som artikel 28 EG, men Lissabonfördraget numrerade om allt…), om förbud mot kvantitativa importförbud. Det finns 480 fall med inbördes 2982 hänvisningar som rör den artikeln (eller någon av dess tidigare inkarnationer. Såhär ser (ett utsnitt av det) ut:

När jag läste EG-rätt var det tre fall som särskilt togs upp som viktiga i undervisningen: Dassonville, Cassis de Dijon, och Keck. Glädjande nog är det dessa fall som får de överlägset största boxarna även i detta diagram.

Men så är det inte alltid. För artikel 267 EUF (aka artikel 234 EG) borde 6/64 (Costa v ENEL) och 283/81 (Cilfit) vara de absolut viktigaste fallen. Men i nedanstående (737 rättsfall, 5651 hänvisningar) är de inte alls framhävda.

Costa v ENEL har elva hänvisningar, och Cilfit tio –småpotatis i sammanhanget. Återstår att se vad det kan bero på. En tentativ teori är det som bibliometrister kallar obliteration by incorporation, dvs när en resurs blir så etablerad inom ett fält att den mer anses som en del av ämnets grundläggande kunskapsbas än något man borde hänvisa till. Eftersom Costa handlar om EG-rättens företräde framför nationell, och Cilfit etablerade Acte Clair-doktrinen, båda djupt etablerade principer inom EU-rätten, så kan det vara så att domstolen inte hänvisar till de fallen längre eftersom de har blivit allmänna rättsgrundsatser. Kanske.

Det där metodavsnittet

När jag inte jobbar med att projektleda rättsinformationsprojektet (ny bloggpost!) så skriver jag som sagt min examensuppsats på juristlinjen. Eftersom jag har en teknikbakgrund sätter det sin prägel både på ämnet och själva metoden. Det traditionella för juristuppsatser är att man jobbar enligt ”traditionell rättsdogmatisk metod”, dvs man undersöker någon viss juridisk fråga inifrån systemet, dvs man håller sig till de regler vilka källor man kan åberopa, etablerade tolkningsmetoder m.m., och man gör det i syfte att ta reda på vad gällande rätt är (inte vad den borde vara). Det är inget superbra namn med tanke på hur negativt uttrycket ”dogmatisk” i allmänhet har en innebörd av bakåtsträvande och ovetenskaplighet. För det mesta så präglas inte juridisk forskning av det.

Min uppsats handlar dock inte om gällande rätt i någon specifik fråga, utan mer allmänt om en aspekt av det juridiska arbetet. Den går ut på att formulera och testa en relevansrankningsfunktion för juridiska söksystem. För att göra det så innehåller första delen en undersökning om vad vi menar med ”relevans”, inom juridik, informationsvetenskap och andra områden, och fortsätter med en kort genomgång av modeller för informationssökning (boolska modeller, vektorrumsmodeller, sannolikhetsmodeller, länkanalys) och de antaganden om relevans som man gör inom dessa modeller. Här vet jag inte riktigt vilken metod, om någon, som jag använder. Jag sammanfattar det andra har skrivit för att ge en heltäckande bild av dessa olika forskningsområdens historiska utveckling och nuvarande state of the art. I de delar som rör det juridiska relevansbegreppet kanske man kan säga att jag tillämpar rättshistorisk metod.

I den andra delen så beskriver jag andra befintliga försök att bygga informationssöksystem som på ett eller annat sätt tillämpar juridiskt präglade resonemang för relevansrankning, för att sedan introducera mitt eget. Det bygger på länkanalys och är väl egentligen inte så magiskt (en sorts enkel pagerank som istället för länkar utnyttjar olika sorters hänvisningar i domslut), men det som gör den intressant är att den testas på en ganska stort och intressant korpus (alla rättsfall i EU-domstolens arkiv, ca 10 000 dokument), dels att jag evaluerar systemets effektivitet med en mer traditionell relevansrankning (BM25) som baseline och en specifik läroboks bedömningar om vilka fall som är mest relevant i olika sammanhang som gold standard. Jag tror att man kan betrakta den här delen som jurimetrisk metod. I övrigt är det väl en ganska Poppersk syn på metoden: Ställ upp en falsifierbar hypotes, och försök sen falsifiera den.

Den sortens metod är svår att tillämpa på traditionella rättsvetenskapliga arbeten. Och rent allmänt är det inte mycket i den här uppsatsen som påminner om det som mina kursare har gjort eller gör. Vilket får mig att undra om det överhuvudtaget är en juridiskt examensuppsats jag skriver.

Lyckligtvis finns det, särskilt inom de rättsinformatiska sammanhangen, en hel del artiklar, uppsatser, rapporter och avhandlingar som är lika spretiga gränsöverskridande i sin omfattning. Jag tror jag tänker låta mig inspireras av dem när jag författar mitt metodavsnitt.

Rättsinformationsvisioner från 1946

Det är mycket nu. Förutom att jag har börjat på mitt nya jobb där vi håller på att utveckla världens bästa offentliga rättsinformationssystem (läs gärna vår projektblogg!) så håller jag på att skriva på den examensuppsats som jag måste bli klar med så fort som möjligt. Och under arbetet med den senare stötte jag på följande text som på något vis anknyter till visionen om det perfekta rättsinformationssystemet:

Quote from 'Does the Law Need a Technological Revolution' by Louis O. Kelso

(18 Rocky Mntn. L. Rev. 378 (1945-1946) Does the Law Need a Technological Revolution; Kelso, Louis O.)

Visionen bygger förstås på Vannevar Bush:s As we may think från året innan, som jag har sett referenser till under de senaste femton åren. Förra veckan tog jag mig äntligen tid att läsa den — gör det du med!