GPL, CC och skillnadens betydelse för Remix

Som jag nämnde tidigare idag har jag konverterat en bok till epub-format. Det krävde några kvällars arbete, och gav stoff till åtminstone tre blogginlägg. Jag slår ihop dem till ett genom att fuska mig igenom de första två i förbigående.

1: Epub är inget bra format för eböcker. Jag skaffade nyligen en Sony PRS-300, vilken jag är riktigt nöjd med (åtminstone nöjdare än Jocke). Den läser, i likhet med en lite mer hajpad läsplatta, epub-formatet. Som flera andra moderna format är det i princip en zippad hög med XHTML-filer, samt övriga resurser (bilder, stylesheets osv). Det är en bra början att bygga på standardiserade format som dessutom kan undersökas med enkla verktyg (vilket kan jämföras med betydelsen av ”view source”-konceptet för webben), men det finns ett par problem:

  • I böcker används fotnoter. Det finns inget bra och etablerat sätt att med XHTML/CSS2.1, och därmed i ePub, representera fotnoter (det finns i CSS3, men det stöds inte av epub-standarden).
  • I böcker används sidnummer. Det finns inget standardiserat och väletablerat system för att koppla sidnummer till textavsnitt (det finns däremot ett standardiserat, och ett helt annat, väletablerat, system). Vilket är trist för den som vill hänvisa till ett visst ställe i en epub-bok.
  • Epub-formatet har inte annammat ”convention over configuration”-principen, vilket leder till en rad filer vars innehåll är statiskt eller upprepningar av information som redan finns någon annanstans. Varje enskild del av en bok hänvisas två gånger i content.opf, och ytterligare en gång i toc.ncx.

Kanske hade det varit bättre att bygga på DocBook eller TEI?

2: Att konvertera PDF till epub på ett bra sätt är icketrivialt. Epub är, genom att det bygger på XHTML, ett format som låter oss uttrycka semantiken i en text (eller åtminstone textens yttre form). Vi kan tala om att en rubrik är just det, och inte bara en textsnutt som råkar ha ett visst typsnitt, i en viss storlek, placerad på ett visst ställe på en sida (vilket är allt PDF låter oss göra). I Remix används kapitel (samt ett antal andra typer av textsektioner), fyra rubriknivåer, blockcitat, fotnoter, slutnoter, kapitäler, anfanger, index, sidhuvuden, sidfötter samt på ett ställe dialog.

All information om att en viss textsnutt representerar någon av dessa konstruktioner är borttagna i en PDF. Allt som återstår är information om var på en sida varje enskild textsnutt ska placeras, och med vilket typsnitt det ska visas. Om man i löpande text  exempelvis fetstilar något representeras detta som en separat textsträng. Att avgöra vilka textsträngar som tillsammans utgör ett stycke är ganska svårt.

Man får en bild av hur svårt det är om man tar en PDF-fil och använder Adobe Readers inbyggda ”Save as text”-funktion. Det var så jag började konvertera hela texten. Genom lite sök-och-ersätt samt dess kusin-på-stereoider, tangentbordsmakron i emacs, kunde jag steg för steg återskapa den semantik som ursprungligen fanns i Lessigs text, innan den konverterades till PDF. Det var detta arbete som tog några kvällar.

3: Allt remixarbete förutsätter tillgång till råformat. Den remixare som inte har råformat måste först ägna tid åt att konvertera vad han/hon nu har tillgång till, till ett format som duger för att bygga vidare på.

Råformatet är det format man använder för att skapa eller vidareutveckla ett verk. Det är sällan det slutformat som man faktiskt vill använda för att uppleva verket. Råformatet kan vara ett gäng wav-filer (ett för varje inspelat instrument), och slutformatet en mp3-fil. Råformatet kan vara en LaTeX-fil, några EPS-filer samt en Bibtex-databas, och slutformatet en PDF. Råformatet kan vara en filstruktur fylld med källkod och slutformatet en exekverbar binär. Ni fattar.

Lessig har tillgängliggjort verket som PDF-fil under en CC-licens, vilket förstås är generöst (även om det tog tid), men jag som  remixare av innehållet hade hellre velat ha tillgång till de ursprungliga .doc/.odt-filerna. Istället fick jag ägna mycket tid åt att rekonstruera ett råformat genom att ta den textfil som Adobe Reader konstruerat och sedan manuellt märka upp de semantiska element som gått förlorade i PDF-konverteringen.

Det här är relativt vanligt bland Creative Commons-licensierat material, att man enbart slutformatet, inte råformatet, tillgängliggörs. I öppen källkod-världen skulle ingen drömma om att släppa en kompilerad binär utan att samtidigt den källkod som använts för att bygga densamma (och de som prövar blir förstås utskällda).

På FSCONS 2008 höll Mike Linksvayer från Creative Commons ett föredrag om skillnaden mellan ”Free Software”-rörelsen (dvs öppen källkod) och ”Free Culture”-rörelsen (dvs Creative commons), eller kanske snarare hur långt efter den senare ligger efter den förra (Det finns sammanfattat i hans text i boken som gjordes från den konferensen). Bland annat berördes att skillnaden mellan råformat och slutformat för programkod är knivskarp, medans den är betydligt suddigare för exempelvis en bok eller en musikinspelning.

Kanske är det anledniningen till att favoritlicensen inom öppen källkod-rörelsen (GPL) redan i sin andra klausul sätter en viktig definition:

The “source code” for a work means the preferred form of the work for making modifications to it.

Creative commons-licenserna innehåller inget liknande.

En kompilerad binär är relativt hopplös att bygga vidare på, även om man har juridisk tillåtelse. En färdigställd PDF kan man faktiskt bygga något från, även om det tar tid. Kanske är det anledningen till att Lessig nöjer sig med att släppa sina verk enbart i slutformat. Men om man stannar där tror jag att man missar något viktigt. Nämligen:

4: Ju enklare det är att skapa ett nytt slutformat, ju enklare är det att göra en remix. Om det första man måste göra är att konvertera en excelfil med ett inbäddat epostmeddelande med en digitalkamerabild av en utskrift av en skärmdump av en accessdatabas så kommer färre personer att göra något kul med informationen. Och om man har skapat det ursprungliga verket med verktyg som gör det svårt eller dyrt att bygga en slutversion så får det samma effekt. När Lawrence Lessig skrev ”Remix” gissar jag att han använde Microsoft Word eller OpenOffice Writer, för att skapa en eller flera .doc eller .odt-filer, som sedan en typograf laddade in i InDesign och skapade en .indd-fil utav. Efter en hel del typografiskt finlir skapades slutligen en tryckfärdig PDF. Slutformatet blev mycket grafiskt tilltalande, men krävde säkerligen en hel del manuellt arbete. Om författaren, efter att ha lämnat textmaterialet till typografen, velat göra en omstrukturering, krävs förmodligen att detta manuella arbete till stor del görs om. Nu är jag ingen expert på InDesign, men jag gissar att det är svårt till omöjligt att bara med ett knapptryck (eller hellre en kommandorad) gå från råformat till slutformat. Om inte annat så krävs det tillgång till Adobe InDesign, en proprietär programvara som definitivt är utanför min budget.

I ”Free Culture” skriver Lessig i sitt förord:

I realize that all of the theoretical insights I develop here are insights Stallman described decades ago. One could thus well argue that this work is “merely” derivative.

I  accept that criticism, if indeed it is a criticism. The work of a lawyer is always derivative, and I mean to do nothing more in this book than to remind a culture about a tradition that has always been its own.

Jag menar att det finns mer att lära av Richard Stallman. Exempelvis kan man uppmärksamma att en av de första program han skrev för sitt helt fria operativsystem var en implementation av make, ett fritt system för att helt automatiskt från råformat (källkod) skapa ett slutformat (körbart program). Hade Lessig använt det (tillsammans med exempelvis LaTeX) för att skriva Remix hade han säkert fått se flera remixer av det.

Lawrence Lessig’s ”Remix” in epub format

Just what the headline says — I’ve converted Lessig’s excellent book ”Remix: Making art and commerce thrive in the hybrid economy” to epub format from the original PDF source. You can download it here.

The file is tested with FBReader, Adobe Digital Editions, and Sony PRS-300, and works reasonably well in all of them. Comments from readers using iBooks or Stanza would be welcome. The conversion was done by hand (and emacs), which was an educational experience. More about that to come in a separate posting.

(Which will be in Swedish, by the way. This post is in english for the benefit of people searching for an epub version of Remix.)

Sociala medier och olika sorters ansvar

En intressant nyhet som drunknat i veckans Almedalsflod är att Datainspektionen avslutat ett inledande projekt om sociala medier genom att meddela beslut i tre tillsynsärenden avseende vilket ansvar en myndighet, ett företag respektive en kommun har för sådant som andra skriver på deras facebooksidor.

Det hela sammanfattas i rubriken ”Myndigheter och företag på Facebook ansvarar för andras inlägg”, vilket kanske låter lite märkligt om man tänker straffansvar och den grundläggande principen att man enbart har ett straffrättsligt ansvarar för sina egna handlingar. Men det finns många sorters ansvar, och Datainspektionen siktar in sig på ett av dem, nämligen personuppgiftsansvaret. En liten terminologilektion är kanske på sin plats:

Datainspektionens tillsyn tar sikte på sådana handlingar som på något sätt involverar personuppgiftsbehandling (1), och som kränker den personliga integriteten (2). För sådana handlingar har den personuppgiftsansvarige (3) ett skadeståndsansvar (4), medan straffansvaret (5) ligger på den som utför (6) själva handlingen.

Många kursiva uttryck i det föregående stycket. Vi tar dem ett efter ett:

  1. Personuppgiftsbehandling är i princip vad som helst man gör med en dator som rör information som har det allra minsta att göra med en nu levande människa. Något så trivialt som lagring räknas som behandling, och något så personavlägset som ett fotografi av en registreringsskylt räknas som personuppgift.
  2. Vad som är en kränkning av den personliga integriteten är inte möjligt att generellt slå fast, men gränsen bestäms ytterst av domstolspraxis.
  3. Den personuppgiftsansvarige är den som bestämmer varför och på vilket sätt personuppgiftsbehandlingen ska gå till.
  4. Skadeståndsansvar betyder att man, vid skada, ska ersätta den som drabbats med en mängd pengar som, så långt det är möjligt, är tänkta att reparera den inträffade skadan. Det är ganska lätt att räkna ut den mängden när man ska ersätta ett nedbrunnet hus, men lite knepigare när någons integritet kränkts. Men det betyder inte att man inte ska försöka! Ett bra sätt att göra bort sig i en juridisk debatt är att förväxla skadestånd med böter.
  5. Straffansvar betyder att man, vid en straffbar handling, får betala böter eller sitta i fängelse (det finns några andra sanktioner också). Böterna går till staten, inte den som drabbats, och är genom dagsbotsystemet anpassade så att det ska svida lika mycket för fattig som för rik. Medan skadestånd kan drabba en juridisk person (exv ett företag) kan straffansvaret bara falla på en fysisk person.
  6. ”Den som utför” är lite svårare att definera, åtminstone för mig. Den som matar in uppgifter, eller direkt får en dator att utföra behandlingen. Med tanke på att även passiv lagring kan anses som behandling måste det finnas många scenarier där det är svårt att bedöma vem som ”utfört” ”behandlingen”.

Ok, vad betyder det i ett facebookscenario? I alla tre ärendena var fråga om juridiska personer som hade en Facebook-sida. Genom att bli ett fan kan varje facebookanvändare skriva meddelanden på sidan. Det datainspektionen i sitt beslut kom fram till var att de juridiska personerna (myndigheten, företaget respektive kommunen) uppfyllde kraven för att vara personuppgiftsansvarig för den personuppgiftsbehandling som förekom på deras respektive sidor:

Arbetsmiljöverket är en myndighet som har valt att finnas på Facebook genom att tillhandahålla Facebook-sidan i sin verksamhet. Arbetsmiljöverket har namngett sidan och kan bestämma vilka möjligheter det ska finnas för andra att behandla personuppgifter (göra inlägg) samt ge anvisningar för vilket innehåll sidan ska ha. Arbetsmiljöverket innehar den faktiska möjligheten att ta bort personuppgifter som publicerats på sidan. […] Arbetsmiljöverket får anses inneha möjlighet att bestämma över såväl ändamål som medel för behandlingen av personuppgifter på Facebook-sidan.

Med detta inte sagt att (i det här fallet) Arbetsmiljöverket var den enda personuppgiftsansvarige i sammanhanget:

Inspektionen omfattar således inte det eventuella personuppgiftsansvar som enskilda användare eller företagen Facebook, Twitter m.fl. kan ha för behandlingen av personuppgifter

Det ligger i sakens natur att Datainspektionen, med sitt begränsade tillsynsområde, inte kan belysa alla övriga ansvarsaspekter som finns. Men låt mig ändå räkna upp de andra jag kommer på. För att bli konkret kan vi ta exemplet att ett företag sätter upp en facebooksida, och en privatperson på denna sida skriver ett meddelande som dels kränker en enskild (namngiven) individs integritet genom att förtala denne, dels utgör hets mot folkgrupp.

  1. Straffansvar enligt PUL 49 §. Tillkommer, som vi konstaterat enligt ovan, den som utför handlingen. Det borde i första hand vara privatpersonen, men kanske kan även ansvar inträda för någon person på företaget (den som har möjlighet att ta bort publicerade meddelanden) efter att denne blivit uppmärksammad på meddelandets innehåll (krävs för att uppfylla brottets subjektiva rekvisit)? Ytterligare en fråga är om någon, och i så fall vem, på Facebook som kan bli straffrättsligt ansvarig (men i praktiken lär något sådant straff aldrig dömas ut)
  2. Straffansvar enligt BrB 5:1 för förtal och BrB 16:8 för hets mot folkgrupp. Tillkommer privatpersonen enbart.
  3. Straffansvar enligt BBS-lagen 5 och 7 §§ för den som tillhandahåller tjänsten. Enligt förarbetenas definition av ”tillhandahållande” ska detta vara den ”som kan bestämma över tjänstens användning, inklusive de tekniska och administrativa rutinerna”. Det borde i första hand träffa företaget (och där den eller de personer som har ansvar för och möjlighet att ta bort meddelanden).
  4. Om det har gjorts en databasanmälan eller ansökts om utgivningsbevis enligt YGL så blir den ansvarige utgivaren exklusivt straffrättsligt ansvarig för allt ovanstående. Det ska inte gå, eftersom databasen kan ändras av andra än den som driver verksamheten (särskilt om vem som helst kan skriva på sidan), men det har inte hindrat folk från att försöka liknande saker.
  5. Sedan kan kanske även privatpersonen bli skadeståndsskyldig, antingen genom PUL 48 § (om man anser att denne har ett delat personuppgiftsansvar tillsammans med företaget) eller genom SkL 2:1 (om man menar att kränkningen är en ren förmögenhetsskada). De här frågorna prövar datainspektionen inte, och jag vågar mig inte heller på en gissning. Kommentarsfältet är öppet för spekulationer.

En sak som man kanske kan tycka är konstig är att man som företag, myndighet eller privatperson är ansvarig för vad folk skriver till en på en facebooksida, men inte för @-omnämnanden på twitter (enligt det tredje beslutet). Men det är ändå två helt olika kommunikationsmodeller, och i Twitterfallet kan man inte ha någon kontroll över @-omnämnanden. Därför vore det orimligt att utkräva något ansvar för detta.

Man kan kanske tycka att det är orimligt att utkräva ansvar från den som startat en facebooksida, med hänvisning just till den grundläggande principen att alla svarar endast för sina egna handlingar. Poängen är dock att detta ansvar inte försvinner — i exemplet ovan är det fortfarande så att privatpersonen svarar för sina handlingar.  Men när man startar och driver en facebooksida får man nya, sekundära ansvar (personuppgiftsansvar enligt PuL, tillsynsansvar enligt BBS-lagen). Detta ansvar sammanfaller med förmågan att ta bort kränkande meddelanden — en inte helt orimlig konstruktion.

Om något är orimligt i sammanhanget är det kanske snarare PULs breda definitioner av ”personuppgift” och ”behandling”, och smala definition av ”privat behandling” som gör att i princip allt som är intressant i sociala medier (dvs sådant som på ett eller annat sätt anknyter till levande människor, dvs det sociala) är föremål för lagreglering på ett sätt som det offentliga samtalet aldrig någonsin var på papperstidning-och-torgmöte-tiden.

Piratpartiet och åtalsimmuniteten

Dagens mest spännande utspel står Piratpartiet för när de utfäster sig att driva The Pirate Bay inifrån riksdagen om de kommer in i densamma. Det väcker många frågor (där den kanske viktigaste är hur de ska få OK från IT-avdelningen), men eftersom de i debattartikeln menar att de kommer vara immuna mot eventuella åtal:

Där [i regeringsformen] står att riksdagsledamöter inte kan stämmas eller åtalas för någonting som görs som en del av det politiska uppdraget.

I praktiken total immunitet för allt politiskt som görs på arbetsplatsen.

Jag tror att de drastiskt har överskattat omfånget av RF 4:8, som reglerar denna immunitet (min fetstil):

8 § Ingen får väcka talan mot den som utövar eller har utövat uppdrag som riksdagsledamot eller beröva honom friheten eller hindra honom att resa inom riket på grund av hans yttranden eller gärningar under utövandet av uppdraget, utan att riksdagen har medgivit det genom beslut om vilket minst fem sjättedelar av de röstande har förenat sig.

Misstänkes riksdagsledamot för brott i annat fall, skall bestämmelser i lag om gripande, anhållande eller häktning tillämpas endast om han erkänner brottet eller har tagits på bar gärning eller fråga är om brott för vilket ej är föreskrivet lindrigare straff än fängelse i två år.

Så om TPB-driftandet anses vara en gärning under utövandet av uppdraget behöver riksdagen stå nästan enig mot handlandet. Om PP kommer in och får den vågmästarposition de eftersträvar verkar det osannolikt (men kanske inte fullständigt otänkbart).

Är det inte under utövandet av uppdraget så krävs för att någon ska häktas att han/hon exempelvis erkänner brottet. Det verkar mycket sannolikt att det ska ske (erkänner handlingen, inte nödvändigtvis att det är ett brott).

Så frågan om åtalsimmunitet står och väger på om drift av TPB kan anses vara under utövande av uppdraget. Enligt förarbetena ska detta begrepp tolkas snävt och är begränsat till sådant som sker i riksdagens kammare, utskott, valberedning, krigsdelegation, riksdagsstyrelse eller utrikesnämd. I de två fall jag känner till där frågan varit uppe (1993/94:KU49 respektive 1999/2000:KU21) fann konstitutionsutskottet (som gör dessa bedömningar, såvida talmannen inte direkt avvisar frågan om åtalsmedgivande) att handlingarna hade utförts under utövandet.

Om PP skulle komma in verkar det alltså svårt att få immunitet för dess riksdagsledamöter om de uppfyller sitt vallöfte. Som utspel betraktat har det väckt viss uppmärksamhet, men jag undrar om man övertygar några andra än de redan frälsta. Den starka position man har som tillskyndare av rättsstatliga principer riskeras att urholkas. Även om jag inte är piratpartist så tycker jag en sådan utveckling vore synd.

PSI-lagen har trätt i kraft – spelar det någon roll?

Dagens stora informationspolitiksnackis är otvivelaktigen att Lag (2010:566) om vidareutnyttjande av handlingar från den offentliga förvaltningen (aka PSI-lagen) har trätt ikraft. Lagen är, tillsammans med slopad värnplikt och kårobligatorium, en ljuspunkt i ett övrigt ganska trist paket av lagar som trätt ikraft idag (sammanfattning, sammanfattning av sammanfattningen). Många i bloggosfären har uppmärksammat och firat detta; Joakim Jardenberg har Hela Listan. Jag tycker också att lagen är ett steg i rätt riktning, och den inledande texten blir man alldeles varm i hjärtat av:

1 § Syftet med denna lag är att främja utvecklingen av en informationsmarknad genom att underlätta enskildas användning av handlingar som tillhandahålls av myndigheter.

Men vackra syften i all ära — jag måste ändå fråga mig: vad spelar PSI-lagen för praktisk roll? Vad kan vi som vill återanvända offentlig data lagligen kräva, som vi inte kunde kräva igår?

En del av svaret får man redan i nästnästa stycke:

Bestämmelser om tillhandahållande av handlingar finns i annan författning.

Ett förtydligande finns i departementspromemorian (Ds 2009:44 s. 106):

Lagen innebär endast begränsade åligganden för myndigheterna. Lagen i sig förändrar inte rätten till tillgång till handlingar eller sättet att tillhandahålla handlingar. Lagen kräver därför inte några nya arrangemang för att tillhandahålla handlingar och förorsakar därmed inte några nya kostnader i detta avseende.

Glada förhoppningar om att det här skulle innebära att myndigheter är tvugna att tillgängliggöra mer än de gör idag är alltså dessvärre grundlösa. PSI-lagen handlar inte om vad myndigheter ska göra tillgängligt, bara hur de ska göra det. Jag är inte så säker på att Magnus Betnér skulle ha det lättare idag att få ut siffror från SCB än vad han hade förra månaden (se även Jonas Lejons kommentar om sekretess för statistikuppgifter), åtminstone inte direkt. Det är nog mer korrekt att se det som en inledande spark i baken, som förhoppningsvis leder till att de goda krafter som faktiskt finns inom myndigheterna får lättare att driva igenom projekt som gör data mer proaktivt tillgängligt via API:er.

Med det sagt är lagen inte enbart en signallagstiftning. Även om lagen inte ålägger myndigheterna att göra något nytt tillgängligt, och dessutom inte gäller stora delar av myndigheternas data (se 3-5 §§, särskilt begränsningen att den inte omfattar myndigheters affärsverksamhet) så innehåller den en mycket viktig princip för kostnadsberäkning i 7 §, hinder mot begränsning av vidareutnyttjande i 8 §, och ett förbud mot exklusiva avtal i 10 §. Det är bra grejer som absolut kan förbättra konkurrensen på informationsmarknaden.

PSI-lagens tillkomst har varit en smärtsam process för den svenska lagstiftaren. Det EG-direktiv (2003/98/EG, allmänt kallat PSI-direktivet) som ålade Sverige att införa dagens lag kom redan 2003, med ett krav på att lagstiftningen skulle vara på plats den 1 juni 2005. Den svenska lagstiftaren ansåg först att befintlig lagstiftning uppfyllde direktivets krav, för att sedan göra en halvhjärtad implemention genom en förordning och först nu åstadkomma en lag som förhoppningsvis passerar Europeiska kommissionens nålsöga (läs Prop 2009/10:175, avsnitt 14.2.2 för mer bakgrund kring de olika turerna). Vi är alltså exakt fem år sena med att implementera direktivet.

Vilket leder mig till nästa aspekt av att dagens ikraftträdande kanske inte spelar någon roll, i betydelsen att den skulle förändra rättsläget. Säg att en privatperson eller ett företag för fem år sedan ville vidareutnyttja handlingar från en svensk myndighet, men fått svaret att det skulle kosta hutlösa mängder pengar eller att myndigheten hade ett exklusivt avtal om återanvändning med ett annat företag.  Även om det då inte fanns stöd i svensk lag, undrar jag om man inte kunnat överklaga myndighetens beslut med hänvisning till direktivet.

Det finns nämligen en EU-rättslig princip om vertikal direkt effekt, dvs att EU-rättens innehåll ska tillämpas vid nationella domstolar, och att den ska ha företräde framför nationell rätt. Principen grundlades för snart 50 år sedan i målet Van Gend en Loos. I senare rättspraxis, framförallt Van Duyn, har principens betydelse för direktiv utmejslats. Om det är fråga om ett direktiv som rör den enskildes ställning mot staten (check), direktivets bestämmelse är tillräckligt precisa och ovillkorliga (check), och implementationsfristen gått ut (check), så ska den enskilde kunna åberopa direktivet direkt, även fast det inte finns någon nationell lagstiftning. Poängen är att ingen medlemsstat ska kunna dra nytta av sin egen försummelse.

Nu är det ju lite mer uppförsbacke att som enskild argumentera för att en myndighet (eller i förlängningen förvaltningsdomstol) ska ge sig utanför nationell lagstiftning, särskilt när lagstiftaren vid två tidigare tillfällen deklarerat att den då befintliga lagstiftningen uppfyllde direktivets krav. Om vår tänkta privatperson, med start den 1 juli 2005, försökt dra processen till EU-domstolen hade frågan säkert fortfarande inte varit avgjord. Men i teorin hade han/hon haft rätten på sin sida.

(Sen har jag personligen en pet peeve med PSI-direktivet: Det gäller bara medlemsländerna, inte EU:s egna institutioner. Vilket leder till att publikationskontoret kan begära fullständigt hutlösa priser för XML-versioner av EU:s egen lagstiftning…)