Thesis: Appendicies and backmatter

The rest of the thesis consists of two appendicies (firstly describing the system prototype in detail, including how to run it yourself, secondly describing the ”gold standard” tests we’ve evaluated the system against) and the bibliography.

That is all, for this time! If you’ve read all chapters so far, I’d really appreciate your comments and suggestions for improvement.

Download appendicies and backmatter here.

Thesis chapter 6: Conclusion and future work

After having described relevance and information retrieval in general and legal context, as well as reviewing previous work in the field as well as designing and evaluating a better relevance ranking method, are we done? No, we’ve only just started! Here are some pointers on how this approach might be improved.

Download chapter 6 here.

Thesis chapter 5: A prototype of a legal relevance function

Finally, this is the heart and soul of this thesis (even if it’s only a few pages). A system designed for better legal relevance ranking is described and evaluated. Although primitive, being based only on simple known link analysis algorithms, it seems to perform really good compared to traditional ranking methods.

Download chapter 5 here.

Thesis chapter 3: Information retrieval

Relevance can be interpreted in many ways, from subjective to objective. Which interpretations are built into traditional information retrieval systems, and what properties does these manifestations of relevance have? The use of IR for legal information has a long history. How does legal information retrieval correspond to the legal method, and can we improve on this correspondance, by e.g. creating a relevance ranking function more in line with what is considered legally relevant?

Download chapter 3 here.

Thesis chapter 2: The concept of relevance

In order to define a better relevance ranking method, we need to delve deep into what relevance really is, and what aspects of it we can measure in an information retrieval system. We also examine what relevance means in a legal context, and how it is connected to other concepts such as authority and what clues to relevance we can find in legal information.

Download chapter 2 here.

Thesis chapter 1: Introduction

The first chapter sets the scene by describing the basis for information retrieval systems, legal information and how it is used, as well as the motivation for improving the former so that we can use the latter better. It also contains a description of the method used in the thesis, as well as the general structure of it.

Download chapter 1 here.

Towards a theory of jurisprudential relevance ranking

My graduate thesis, somewhat loftily titled ”Towards a theory of jurisprudential relevance ranking – Using link analysis on EU case law” has been submitted to and approved by my supervisor. It has taken far too long time since I first started working on it, but I’m very satisfied that it is finally finished. Except that it’s not really finished, since I hope to re-work and extend it with the aim of publishing it in some other form. Which is why I’m soliciting feedback on it.

Over the coming week, I’ll be publishing a chapter at a time. Each chapter will be available in PDF form and also inline in the form of images. This since that was the best conversion to a web-friendly format I could manage… (also note that the pagination differs slighly between the PDF and the web version).

If you are at all interested in legal informatics, information retrieval, jurisprudence or just what we really mean when we say that something is relevant, I hope you will find the time to read the chapters and maybe also give me your feedback below.

We’ll be kicking of with the front matter of the thesis. It does not contain anything substantial in itself, but it has a very neat Gephi-drawn cover and some interesting quotes. The table of contents should give you an idea of what it is about.

Download the front matter here.

”Om jag får grovt bröd, så är jag fullkomligen nöjd”

I morse läste jag Lina Karlssons inlägg med anledning av Sakine Madons inlägg om hur den ekonomiska situationen för studenter ser ut. Som student kanske jag borde ha någon åsikt om debatten, men då min situation inte är särskilt typisk så vet jag inte om min erfarenhet är särskilt relevant.

Men sen runt lunch läste jag inför dagens seminarium i idéhistoria och stötte på följande intressanta brevväxling mellan Gustaf Andersson, student i Lund, och dennes föräldrar:

Den 26 oktober 1828:

Mitt bröd är nu jämt slut, oaktat jag ej på minsta sätt slösat, ty jag äter aldrig frukost eller merafton, men mår ändå bra, ty vår middag är merendels god och alltid mer än tillräcklig. Om mina goda föräldrar på något sätt kunde få skickat hit något bröd, likaså gärna grovt som knäckebröd, så vode det mig ändeligen tjänligt, ty det kostar mig för mycket att köpa bröd för hela november och kanske en god del av december. Om jag får grovt bröd, så är jag fullkomligen nöjd.

Den 7 februari 1830:

När jag kom hit, såg det ej för gott ut i mitt rum. Fönstren voro betäckta av is och denna ökas dagligen ty alls ingen värme förslår i det förskräckligt kalla rummet. Väggarna äro även betäckta av ganska tjock is och jag måste varje afton flytta sängen mitt fram på golvet för att ej alldeles förfrysa. Men det värsta av allt är att kölden ej det minsta lärer vilja lämna rummet förrän sommarvärmen en gång tvingar den bort. Jag sparar ej på veden, ty hälsan är mig kärare än en liten penningbesparing. Jag var så lycklig att få ett tämligen gott lass för 2 Rd. 40 sk.

Den 20 februari 1831:

Min tid är helt och hållen upptagen av arbete. Kl. 4 om morgnarna stiger jag upp och då läser Ekborn och jag latin till kl. 8. Från 8 till 10 läser jag för Zetterljung, med vilken jag ännu icke ackorderat, från 10–12 giver jag undervisning i latin för traktör Thornströms son och en annan, varför jag har fri mat både morgnar och aftnar, från 1/2 1 em. till 2 läser jag för desse samme. Från 2–4 har jag för egen räkning 2 privata lektioner. Från 4–7 skriver jag stilar och repeterar. Från 7 till 9 om aftonen läser åter Ekborn och jag latin tillsammans. Jag betalar en karl, som väcker mig om morgnarna, 36 sk. om månaden

(Ur Svensk idéhistoria, del II av Tore Frängsmyr, s 65)

Ok, argument av typen ”man ska vara tacksam, för det var mycket värre förr” är inte så tunga. Men det är å andra sidan inte ironiskt återberättande heller.

Hur man skriver AB-tentor på juristprogrammet

För några veckor sedan skrev jag min näst sista tenta på juristlinjen,
i processrätt. Jag skulle egentligen skrivit den för två år sedan, men
det är en sån tenta som blivit släpande. I vanlig ordning konspirerade
verkligheten med andra åtaganden, så jag fick absurt lite tid på mig
för att tentaplugga. I princip satte jag igång på allvar den 1:a
januari, tentan var den 12:e, och under samma period hade jag ett
PM att bli klar med samt undervisning att hålla. Så jag fokuserade på
tentaförberedelser enligt den instuderingsmetod jag använt, och den fungerar skrämmande
bra.

Metoden är anpassad efter mina svagheter (rastlöshet, tveksam
arbetsmoral) och styrkor (lättja/otålighet/hybris
samt kategoriseringsmani), så den kanske inte funkar för dig. Metoden
går ut på att plocka isär den struktur som ämnet enligt den
kursansvarige har, och sätta ihop en ny struktur som passar dig
bättre
. Det låter kanske komplicerat men är hur enkelt som helst. Du
börjar med ett tomt ark (eller snarare en tom fil) och slutar med 20
sidor som sammanfattar ämnet på ett för dig begripligt sätt.

Först plockar jag ut en handfull fakta från nån del av kursen —
säg, rekvisiten för
häktning
. Jag plockar ut enskilda begrepp — ”minst 1 års fängelse
i straffskalan” (1 st), ”skäligen misstänkt”, (1 st), ”erkännande är
sannolika skäl för misstanke” (litteraturen), ”flight risk” (1 p),
”kollusionsfara” (2 p), ”recidivfara” (3 p), ”obligatorisk
häktningsgrund” (2 st), ”erkännande utesluter kollusionsfara” (litteraturen)
— och sätter ihop dem till en beskrivning som
är lätt för mig att följa, samt sorterar in den under en lämplig
rubrik:

Häktningsyrkande – vad måste vara uppfyllt?

  • Brottet ska ha 1 års fängelse i straffskalan
  • Personen ska vara på sannolika skäl misstänkt
    (”skäligen misstänkt” räcker inte)

    • Om någon erkänner ett brott är detta sannolika skäl att
      misstänka densamme för brottet (24:1, ”misstanken vid en
      objektiv bedömning framstår som berättigad”)
  • Och en särskild häktningsgrund enl punktlistan i 24:1 1 st) föreligger:
    • 1. Flight risk
    • 2. Kollusion – föreligger inte vid erkännande
    • 3. Recidiv
  • Eller om obligatorisk häktningsgrund (minst 2 år i
    fängelse, 24:1 2 st) föreligger

Sen plockar jag ut nästa handfull av fakta och upprepar tills jag gått
igenom det mesta materialet. Så långt inte särskilt märkligt, men det
finns ett par saker att tänka på.

Se till att formulera om materialet på ett sätt som passar ditt
tänkande
. Fastna inte i de uttryck och idiom som lagtext eller
kurslitteratur använder (i ovanstående har jag använt ”flight risk”
istället för ”risk för att han avviker eller på något annat sätt
undandrar sig lagföring eller straff”, dels för att det blir kortare,
dels för att det får mig att tänka på passionerade försvarsadvokater
som argumenterar för sin klient i amerikanska TV-serier).

Ta inte med allt som finns att veta om frågan (i
ovanstående har tar jag inte upp proportionalitetsprincipen (3 st),
spärren mot häktning (4 st) vid antagligt bötesstraff eller krav på
särskilda skäl om häktningen kan antas medföra men (24:4)). Du kommer komma tillbaka till frågan senare, genom någon annan handfull fakta längre fram.

Var så slumpmässig som möjligt när du betar av fakta. Börja inte på
lärobokens första sida eller med den första föreläsningen. Slå upp
boken nånstans mitten eller välj en föreläsningsslide på
måfå. Kursansvarige måste börja lära ut delarna i någon viss ordning,
läroboken likaså, men om du avviker från den tvingas du jobba själv med
att skapa struktur. Vilket är hela poängen med metoden.

Var inte rädd för att skriva fel. Är du inte säker på din
beskrivning, skriv ”(?)” efteråt. För eller senare kommer du tillbaks
till frågeställningen utifrån nya fakta, och då kanske du kan räta ut
ditt eget frågetecken då. Låt inte osäkerheten sakta ner ditt tempo
nu. I en typisk kurs finns det kanske 50 – 200 delfrågor av samma omfattning som häktningsgrunderna ovan, och du hinner inte lägga en halvdag på att reda ut alla frågetecken direkt.

Kategorisera och strukturera fakta allt eftersom. När du hållt på ett
tag kommer du upptäcka att den struktur som du börjat på inte kanske
passar – ett fråga borde kanske delas upp, en annan visar sig vara ett
specialfall av en mer generell fråga. Då är du på rätt väg. Flytta
runt textsnuttar, slå ihop och dela upp tills strukturen känns bra
igen
. Försök strukturera materialet på ett sånt sätt att det hjälper
dig att besvara frågeställningar, med checklistor och flödesscheman.

Bra ställen att hämta fakta från är svarsmallar till gamla
tentafrågor, föreläsningsslides och -anteckningar samt
seminarieuppgifter. Undvik dock i möjligaste mån att fastna i
kurslitteraturen
– har du inte läst den vid det här laget är det för
sent. Använd den som uppslagsverk, men försök inte läsa ingenom den
från början till slut.

Eller kortare uttryck: Jobba slarvigt, ofullständigt och
slumpmässigt
. Försök inte skapa den perfekta strukturen från
början, utan annama den ordning som verkar vettig efter ett tag, och
överge den när den inte längre verkar vettig.

När de grova dragen av din nya struktur börjar kanske du har en
5-15 huvudavdelningar, vart och en med ett antal underavdelningar. Då
kan det vara läge att försöka använda det för att besvara
tentafrågor. Använd inte lagbok, rättsfall eller kurslitteratur, utan
bara din egen text.
Täpp till luckorna i din struktur allt eftersom
frågeställningarna avslöjar dem.

Du är klar när du inte längre hittar fel i din övergripande
struktur, och börjar få svårt att hitta fakta som du inte redan
sorterat in
. Förmodligen kommer din struktur inte skilja sig så mycket
från den struktur som den kursansvarige eller läroboksförfattaren
använder. Men eftersom du byggt den från grunden förstår du bättre
varför den ser ut som den gör.

Såhär
ser det ut när jag börjar
. Klicka på ”nyare version” några gånger
för att få en bild av hur mer och mer fakta tillkommer och hur
strukturen (i innehållsförteckningen) kompletteras. Jag använder
alltså en wiki som mitt verktyg (som bland annat har fördelen att göra
hierarkin i strukturen tydlig), men du kanske föredrar något annat. Du
bör dock använda något som gör det enkelt att strukturera om
materialet
– den här metoden funkar inte med papper och
penna. Möjligtvis en stor anslagstavla och en massa postitlappar.

NB: Att skriva bra tentor är inte samma sak som att vara duktig i
ämnet. Jag kan ett fåtal rättsområden bra – statsrätt, it-rätt och
upphovsrätt – och inget av dem var jag särskilt bra på när jag skrev
tentorna. Enda anledningen att jag nu tycker att jag är bra på dem är
att jag jobbat vidare med dem efter att kursen avslutats, eftersom de
är roliga. Ovanstående metod gör dig bara bättre på att besvara
tentafrågor.
För djup förståelse av ett ämne krävs mer än den här rätt
ytliga formen av kunskapsstrukturering. Samtidigt tror jag inte man
kan bli riktigt bra på ett ämne om man inte har åtminstone ifrågasatt
dess etablerade struktur.