Modellmissmatch

Det borde inte vara så svårt att modellera lagtext efter ett
etablerat schema för textinformation, kan man tycka. Låt gå att HTML4
inte är världens mest sofistikerade modell, men den har rubriker,
stycken och listor – det har ju lagtext också. På den nivån borde
semantiken stämma överrens, eller?

Nej, naturligtvis inte, för då skulle jag ju inte sitta och skriva det
här. Ett exempel är att HTML4 (och därmed XHTML1) inte har någon
strukturmekanism som matchar de olika nivåerna som finns i lagtext
(avdelningar, kapitel, paragrafer) — det enda som finns är stycken
samt och den ganska intetsägande grupperingskonstruktionen <div>.

Ett annat är att i HTML-modellen är en lista (numrerad eller
onumrerad) något som befinner sig utanför ett stycke. Det är helt
enkelt inte tillåtet att ha en lista i ett stycke. Men enligt
modellen/kutymen som används i svensk lagtext så hör en lista till
närmast föregående stycke — ska man exempelvis hänvisa till den text
i upphovsrättslagen som lyder ”skönlitterär eller beskrivande
framställning i skrift eller tal” säger man ”1 § 1 st 1 p” (observera
att man inte säger ”1 kap. 1 § 1 st 1 p.” — kapitelhänvisningen
utelämnas när paragrafnumreringen räcker för att unikt identifiera en
given paragraf, vilket det gör i upphovsrättslagen)

XHTML2 löser de här problemen. Man kan ange att delar av texten
logiskt sett är delar av ett större sammanhang genom <section>-taggen
(som dessutom ger effekt på rubriker, så att man kan använda <h>-taggen
genomgående utan att behöva fippla med h1, h2, h3 osv.

Den tillåter även att en lista (numrerad eller onumrerad) är en
del av ett stycke
.

Men det finns fortfarande ytterligare minst ett förekommande mönster i
svensk lagtext som XHTML2 inte kan efterlikna, nämligen ovanan att
stoppa in nya element i en numrerad lista. Ta exempelvis Mervärdesskattelagen, 5 kap. 9
§
och den lista som finns där – nånstans under lagens levnad
bestämde lagstiftaren att stoppa något nytt mellan punkt 4 och 5 —
resultatet blev punkt 4 a. Visst känns det lite som att lagstiftaren
programmerat BASIC på 1980-talets hemdatorer? Man
får vara glad
att det inte finns någon juridisk RENUM.

Det här kan XHTML2 inte efterlikna, eftersom dess modell kräver att
alla element i en numrerad lista ska ha ett nummer som faktiskt
är ett nummer
och inte en friformsetikett.

För att överkomma den här modellimpedansmismatchen får jag helt enkelt
modellera numrerade listor i lagtexter som onumrerade listor, och låta
numreringen utgöra en del av varje punkts PCDATA-text (samt uttrycka
samma information som del av ett xml:id-attribut).

Samma mönster att stoppa in nya element förekommer för övrigt på andra
ställen i lagstiftningen, såsom paragraf- och kapitelnivå — se exv 11 a § och 2 a kap. i
upphovsrättslagen. Det här är dock inget egentligt problem för
XHTML2-modellering, eftersom det här inte finns något alternativ till
att låta dessa elements numrering uttryckas på annat sätt än som en
del av dess PCDATA. Det är bara det att just för listor så finns
potentialen att göra Rätt, men på grund av en restriktiv XHTML2-modell,
alternativt en slarvig lagstiftare, är det ändå inte möjligt.

Värst är det när nya stycken stoppas in — eftersom
dessa inte numreras explicit blir en hänvisning till ”4 § 3 st” trasig
när lagstiftaren bestämmer sig för att stoppa in ett nytt stycke
mellan första och andra stycket i den paragrafen.

Dagens föreläsning

Idag föreläste jag om ”Tekniken på internet” för studenterna i Experimentell immaterialrätt, där jag försökte förklara hur det egentligen funkar när datorer pratar med varandra och utbyter sådan information som ofta utgör upphovsrättsskyddade verk. Mycket snack om bittar och paket, lite mindre om paragrafer och rättsfall. Det var, ärligt talat, inte den bästa föreläsning jag hållt. Ofokuserat och för mycket inriktat på smådetaljer utan att sy ihop det till en helhet. Jag gillar inte att skriva ned vad jag tänker säga ord för ord, utan förlitar mig på väldigt grova stolpar, vilket funkar bra när jag har en bra dag. Vilket jag då inte hade idag. Mina ursäkter till eventuella bloggläsare som befann sig i publiken.

Det bästa med föreläsningen var mina powerpointslides. Jag ogillar, som de flesta, den typen av presentation där föreläsaren lägger up en slide med fyra huvudpunkter, några underpunkter och börjar läsa rakt upp och ner från dem. Istället försöker jag hitta illustrationer som får stå i bakgrunden till det jag säger. Vissa bilder har konkreta exempel som jag kan vifta åt, men vissa står helt för sig själv, så att åhörarna får dra sina egna kopplingar mellan det jag säger och det jag visar. Idag rationaliserade jag till och med bort de flesta rubriker. Känns helrätt, lite powerpointminimalism sådär. Om jag har en bra dag nästa gång kan det bli rent strålande.

Här är bilderna från presentationen. De är inte helt begripliga på egen hand, men det är lite av poängen.

UppLYSning om upphovsrätt, fildelning och tekniska skyddsåtgärder

Jag har fått förmånen att få delta i datorföreningen Lysators föredragsserie UppLYSning, med en remix på föredraget jag höll för några månader sedan — den här gången blir det mer fokus på det grundläggande juridiska ramverket, och även kanske lite fördjupning i de tekniska detaljerna kring skyddsåtgärder (till skillnad från sist har jag nästan två timmar på mig att svamla). Ämnet har ju blivit högaktuellt igen, i och med muslix64’s kringgående av AACS – Ed Felten och Alex Halderman fortsätter sin folkbildningsgärning med att förklara allt på ett initierat och begripligt sätt — obligatorisk läsning!

Tid och plats: 20 februari 18:15, Visionen, B-huset, Linköpings universitet. Öppet och gratis för alla! Mer information här.

Dagens affärsidé

Jag har funderat på sista tiden om hur den perfekta IT-miljön för en
praktiserande jurist borde se ut. Det synes mig som om det mesta
arbetet på det här området fokuserar på rättsinformationstjänster —
företrädelsevis webbtjänster, med mycket rättsinformation (lagar,
rättsfall, förarbeten…) och smarta sätt att hitta i
informationsmängden.

Men när man väl hittat information, vad gör man med den? På samma sätt
som en programmerares vanligaste deliverable är en kompilerad binär,
är en jurists vanligaste deliverable ett dokument av något slag — en
rättsutrednings-PM, ett domskäl, en doktorsavhandling… För att kunna
skapa dessa dokument konsumerar vi stora mängder rättsinformation. Men
kan kopplingen mellan rättsinformationstjänsten och
dokumentproduktionen bli bättre än ett ständigt alt-tabbande mellan
webläsarfönstret och Word?

Min idé är en ny kategori av program — låt oss kalla dem Integrated
Legal Lab Environment for Research (ILLER) som knyter ihop
informationssökandet och -producerandet. Min ide om hur en ILLER
skulle kunna se ut är grundat i min erfarenhet av olika IDE:er från
mina glada programmerardagar, parat med det lilla jag lärt mig om
rättsutredningar genom mina studier och jobbet på IRI.

Det finns tre aspekter på en rättsutredning:

  • Relevant information ska sökas fram
  • De källor man använder sig av ska redovisas
  • Själva skrivandet

En ILLER skulle ha ”rättsutredning” som grundkoncept. I en
rättsutredning finns ett eller flera deliverabledokument (säg, 2
Word-dokument och en powerpoint). Men framförallt finns en lång lista
på källor (Upphovsrättslagen, infosoc, sanktionsdirektivet, rättsfall,
artiklar, böcker…). En ILLER skulle ha sökfunktionalitet för att
hitta sådana källor, antingen i fulltext (lagtext, rättsfall, vissa
artiklar) eller åtminstone bibliografiinformation (monografier, andra
artiklar). Hur ett sådant gränssnitt ser ut är klassisk
rättsinfosökning — men en grundidé är att en ILLER kan konfigureras
att söka i olika databaser. På det viset kan man tänka sig att man får
tillgång till KarnovPlus kommenterade lagtext, eller NIRs
artikelarkiv, om man prenumererar på deras tjänster (och de har ett
sökgränssnitt som är kompatibelt med ILLERn). När en relevant källa är
hittad lägger man till den till utredningens källförteckning med ett
klick.

Självklart ska man kunna lägga upp en ny källa från scratch, och
koppla den till en URL eller ett dokument på hårddisken. Det är kanske
bäst att tänka på källförteckningen i en ILLER som en bokmärkeslista,
fast med all info som behövs för att skapa en bibliografiförteckning.

När man sen skriver själva PM:et eller vad det nu är frågan om
embeddas Word eller Powerpoint in i ILLERn. Denna har en massa magi
för att känna igen källreferenser (ffa lagtext och liknande) i löpande
text. Säg att man skriver ”Enligt 54 § URL så gäller […]” — när
markören är i närheten av den texten visas texten till 54 § URL i en
sidopanel. Genom magisk dokumentrelevansranking presenteras också
listor på andra dokument som kanske är relevanta men som inte är med i
källförteckningen.

För att hänvisa till en källa är det enkel drag&drop från
källförteckningen in i dokumentet. Källförteckningen i slutet av
dokumentet genereras naturligtvis automatiskt.

Fler saker kan tänkas. Men det viktiga är att koppla ihop skrivandet
med informationssökandet — automatisk referenshantering är en
uppenbar feature, men fler dyker upp ju mer jag tänker på det
hela. Integration med olika KM-system är en. Juridikanpassad
grammatik/språkkontroll är en annan. Autocomplete för referenser är en
tredje.

Jag tror det finns en stor marknad för ett sådant här verktyg — men
det hela hänger på hur bra rättsinformationstjänst som ligger i botten
för sökningarna. Två affärsidéer kan skönjas — antingen bygger man en
ILLER och lanserar den under eget namn, och träffar dealar med
rättsinformationsförädlningsföretagen (Infotorg, Thomson,
WoltersKluwer, Westlaw…) om att de ska erbjuda ett ILLER-kompatibelt
gränssnitt — eller så bygger man en anpassningsbar ILLER och säljer
den till rättsinfoföretagen, som brandar den och kopplar den tight
till sina egna databaser, och säljer den genom existerande kanaler.

Den första varianten är svårast men kan ge bäst utdelning (och även om
det bara går halvbra kan man nog bli uppköpt av någon
rättsinfoleverantör som vill få en edge för sina tjänster). För att nå marknader utanför Sverige måste naturligtvis kopplingar med nationella rättsinfortjänster göras. Den andra varianten är enklare, inte minst för
att man slipper arbetet med att arbeta upp egna kanaler för
försäljning och lokalisering.

Men det är inget jag kan göra den närmsta tiden. Ni som jobbar inom rättsinformations/verktygsbranschen – ta idén och spring! Ni får tre års försprång 🙂

Nätverksneutralitet

En debatt som förts med växande intensitet det senaste halvåret är den om nätverksneutralitet — enkelt uttryckt, ska infrastrukturleverantörer få prioritera eller diskriminera datatrafik från olika tjänsteleverantörer (eller olika protokoll, eller andra kriterier) allt efter eget huvud, eller ska staten reglera området och sätta ramar för hur näten hanteras?

Även om det i grunden är en fråga om statlig inblandning eller företagsfrihet (och därmed har en komplex ekonomisk/juridisk karaktär) är den faktiska nätverkstekniken viktig. Det är talande att många mycket tekniskt insatta personer, som vanligtvis tenderar att vara skeptiska till statlig inblandning, är för nätverksneutralitetslagstiftning (från ett immaterialrättsperspektiv är Lessigs liknelse mellan Fair use och nätverksneutralitet också intressant).

Därför är det bra att Ed Felten (igen!) samlat sina bloggpostningar i ämnet från det senaste halvåret i ett tiosidigt, relativt lättläst paper som inte tar ställning i den politiska frågan (åtminstone inte direkt) utan bara reder ut vad nätverkspriotering/diskriminering innebär och vad det kan få för effekter i olika sammanhang. Om rätt personer läser det kanske vi slipper höra någon svensk politiker stå i riksdagen och förklara att Internet, det är en serie tuber.