”Efter The Pirate Bay” i epub-format (och en lång diskussion om ND-klausulen)

I fredags släpptes, via Rasmus Fleischer och ett antal nättjänster, antologin ”Efter The Pirate Bay” i PDF-format. Eftersom den är licensierad under en Creative Commons-licens så får vem som helst sprida den vidare hur som helst. Vackert så.

Men jag är ju, som kanske tidigare framgått, väldigt förtjust i min Sony PRS-300, och även om den kan läsa PDF-filer så gör den bäst ifrån sig på epub-filer. Eftersom jag redan provat att konvertera en annan PDF-fil till epub så tänkte jag göra det även för denna fil.

Här är resultatet: Efter The Pirate Bay (epub). Lång utläggning om de tekniska och juridiska problem jag hade med att göra denna version följer.

Den första juridiska frågan är: Får jag sprida en epub-version av verket? Den licens som anges i PDF-filen är Creative Commons Erkännande, Icke-kommersiell, Inga bearbetningar 3.0 (eller, som kidsen säger, BY-NC-ND), och denna licens har ett antal villkor (lustigt nog verkar utgivarna av boken själva bryta mot ett av dessa, nämligen 4(a) som säger ”You may Distribute or Publicly Perform the Work only under the terms of this License. You must include a copy of, or the Uniform Resource Identifier (URI) for, this License with every copy of the Work You Distribute or Publicly Perform.” – varken licenstext eller URI tycks finnas i PDF-filen).

Det villkor som är mest intressant är ND, dvs ”no derivatives” eller på svenska ”inga bearbetningar”. När jag såg detta klagade jag högljutt vilket väckte en diskussion där kontentan var att ND-klausulen skiljer på rena formatkonverteringar och ”adaptions” (eller på svenska ”bearbetat verk”). Man får, även med en ND-licens göra konverteringar av ett verk till ett annat format (artikel 3, sista stycket):

The above rights include the right to make such modifications as are technically necessary to exercise the rights in other media and formats, but otherwise you have no rights to make Adaptations.

Så frågan är om en PDF -> epub-konvertering är en formatkonvertering eller ett bearbetat verk. Det tycks åtminstone klart för mig att en konvertering från PDF till epub måste anses vara ett bearbetat verk under vissa förutsättningar, nämligen när jag tillför saker som inte fanns i ursprungsverket, exv egna kommentarer om innehållet. Och det verkar rimligt att en epub-version av ett verk som till allt innehåller samma text, samma utseende och samma funktionalitet som PDF-filen borde klassas som en formatkonvertering, tillåten enligt artikel 3.

Men ingen av dessa ytterligheter verkar särskilt realistisk att nå. Jag beslöt mig för att använda det eminenta programmet calibre (ett open source-itunes för eböcker) och dess inbyggda formatkonverterare. Resultatet blev… nästan läsbart, men inte bra:

Ni ser själva. Fotnoter och sidnummer dyker upp som om det vore text, styckeindelningen är kaotisk, och formen är inte i närheten av Jens Anderssons original. Att göra en bra konvertering från PDF till epub är helt enkelt inget som låter sig göras med automatik, eftersom man i princip måste omtolka all formgivning till de förutsättningar som gäller för ett CSS-baserat, omflödningsbart format. För att det ska gå måste innehållet vara rimligt semantiskt uppmärkt. Och som vi alla vet är processen att konvertera PDF till något strukturerat är som att konvertera hamburgare till kor.

Men det är ändå denna kackiga version jag gjort tillgänglig. Anledningen (förutom tidsbrist) är att varje manuell handpåläggning medför en bedömning eller, rättare sagt, ett utrymme för mig att ge uttryck för min individuella skaparförmåga. Det låter högtravande, men om man gör femtio sådana handpåläggningar (och min Lessig-konvertering innebar fler än så) får man ett resultat och ett uttryck som är unikt för mig som epub-hantverkare. Allt sådant gör att avvägningen mellan formatkonvertering och bearbetat verk förskjuts åt det senare.

Jag har skrivit om det här förut. Inget nytt under solen. ND-klausulens kompis NC (”icke-kommersiell”-klausulen) har traditionellt orsakat minst lika mycket huvudbry, men efter mycket arbete presenterade Creative Commons för ett år sedan en omfångsrik rapport om hur det begreppet kan tolkas. Kanske det är läge att göra samma sak för ND?

En annan fråga är varför man i detta fall valde att använda ND-klausulen. Kanske är det en liknade motivering som Spelbloggen använt? Några författare eller redaktörer till antologin som kan sprida ljus över detta?

GPL, CC och skillnadens betydelse för Remix

Som jag nämnde tidigare idag har jag konverterat en bok till epub-format. Det krävde några kvällars arbete, och gav stoff till åtminstone tre blogginlägg. Jag slår ihop dem till ett genom att fuska mig igenom de första två i förbigående.

1: Epub är inget bra format för eböcker. Jag skaffade nyligen en Sony PRS-300, vilken jag är riktigt nöjd med (åtminstone nöjdare än Jocke). Den läser, i likhet med en lite mer hajpad läsplatta, epub-formatet. Som flera andra moderna format är det i princip en zippad hög med XHTML-filer, samt övriga resurser (bilder, stylesheets osv). Det är en bra början att bygga på standardiserade format som dessutom kan undersökas med enkla verktyg (vilket kan jämföras med betydelsen av ”view source”-konceptet för webben), men det finns ett par problem:

  • I böcker används fotnoter. Det finns inget bra och etablerat sätt att med XHTML/CSS2.1, och därmed i ePub, representera fotnoter (det finns i CSS3, men det stöds inte av epub-standarden).
  • I böcker används sidnummer. Det finns inget standardiserat och väletablerat system för att koppla sidnummer till textavsnitt (det finns däremot ett standardiserat, och ett helt annat, väletablerat, system). Vilket är trist för den som vill hänvisa till ett visst ställe i en epub-bok.
  • Epub-formatet har inte annammat ”convention over configuration”-principen, vilket leder till en rad filer vars innehåll är statiskt eller upprepningar av information som redan finns någon annanstans. Varje enskild del av en bok hänvisas två gånger i content.opf, och ytterligare en gång i toc.ncx.

Kanske hade det varit bättre att bygga på DocBook eller TEI?

2: Att konvertera PDF till epub på ett bra sätt är icketrivialt. Epub är, genom att det bygger på XHTML, ett format som låter oss uttrycka semantiken i en text (eller åtminstone textens yttre form). Vi kan tala om att en rubrik är just det, och inte bara en textsnutt som råkar ha ett visst typsnitt, i en viss storlek, placerad på ett visst ställe på en sida (vilket är allt PDF låter oss göra). I Remix används kapitel (samt ett antal andra typer av textsektioner), fyra rubriknivåer, blockcitat, fotnoter, slutnoter, kapitäler, anfanger, index, sidhuvuden, sidfötter samt på ett ställe dialog.

All information om att en viss textsnutt representerar någon av dessa konstruktioner är borttagna i en PDF. Allt som återstår är information om var på en sida varje enskild textsnutt ska placeras, och med vilket typsnitt det ska visas. Om man i löpande text  exempelvis fetstilar något representeras detta som en separat textsträng. Att avgöra vilka textsträngar som tillsammans utgör ett stycke är ganska svårt.

Man får en bild av hur svårt det är om man tar en PDF-fil och använder Adobe Readers inbyggda ”Save as text”-funktion. Det var så jag började konvertera hela texten. Genom lite sök-och-ersätt samt dess kusin-på-stereoider, tangentbordsmakron i emacs, kunde jag steg för steg återskapa den semantik som ursprungligen fanns i Lessigs text, innan den konverterades till PDF. Det var detta arbete som tog några kvällar.

3: Allt remixarbete förutsätter tillgång till råformat. Den remixare som inte har råformat måste först ägna tid åt att konvertera vad han/hon nu har tillgång till, till ett format som duger för att bygga vidare på.

Råformatet är det format man använder för att skapa eller vidareutveckla ett verk. Det är sällan det slutformat som man faktiskt vill använda för att uppleva verket. Råformatet kan vara ett gäng wav-filer (ett för varje inspelat instrument), och slutformatet en mp3-fil. Råformatet kan vara en LaTeX-fil, några EPS-filer samt en Bibtex-databas, och slutformatet en PDF. Råformatet kan vara en filstruktur fylld med källkod och slutformatet en exekverbar binär. Ni fattar.

Lessig har tillgängliggjort verket som PDF-fil under en CC-licens, vilket förstås är generöst (även om det tog tid), men jag som  remixare av innehållet hade hellre velat ha tillgång till de ursprungliga .doc/.odt-filerna. Istället fick jag ägna mycket tid åt att rekonstruera ett råformat genom att ta den textfil som Adobe Reader konstruerat och sedan manuellt märka upp de semantiska element som gått förlorade i PDF-konverteringen.

Det här är relativt vanligt bland Creative Commons-licensierat material, att man enbart slutformatet, inte råformatet, tillgängliggörs. I öppen källkod-världen skulle ingen drömma om att släppa en kompilerad binär utan att samtidigt den källkod som använts för att bygga densamma (och de som prövar blir förstås utskällda).

På FSCONS 2008 höll Mike Linksvayer från Creative Commons ett föredrag om skillnaden mellan ”Free Software”-rörelsen (dvs öppen källkod) och ”Free Culture”-rörelsen (dvs Creative commons), eller kanske snarare hur långt efter den senare ligger efter den förra (Det finns sammanfattat i hans text i boken som gjordes från den konferensen). Bland annat berördes att skillnaden mellan råformat och slutformat för programkod är knivskarp, medans den är betydligt suddigare för exempelvis en bok eller en musikinspelning.

Kanske är det anledniningen till att favoritlicensen inom öppen källkod-rörelsen (GPL) redan i sin andra klausul sätter en viktig definition:

The “source code” for a work means the preferred form of the work for making modifications to it.

Creative commons-licenserna innehåller inget liknande.

En kompilerad binär är relativt hopplös att bygga vidare på, även om man har juridisk tillåtelse. En färdigställd PDF kan man faktiskt bygga något från, även om det tar tid. Kanske är det anledningen till att Lessig nöjer sig med att släppa sina verk enbart i slutformat. Men om man stannar där tror jag att man missar något viktigt. Nämligen:

4: Ju enklare det är att skapa ett nytt slutformat, ju enklare är det att göra en remix. Om det första man måste göra är att konvertera en excelfil med ett inbäddat epostmeddelande med en digitalkamerabild av en utskrift av en skärmdump av en accessdatabas så kommer färre personer att göra något kul med informationen. Och om man har skapat det ursprungliga verket med verktyg som gör det svårt eller dyrt att bygga en slutversion så får det samma effekt. När Lawrence Lessig skrev ”Remix” gissar jag att han använde Microsoft Word eller OpenOffice Writer, för att skapa en eller flera .doc eller .odt-filer, som sedan en typograf laddade in i InDesign och skapade en .indd-fil utav. Efter en hel del typografiskt finlir skapades slutligen en tryckfärdig PDF. Slutformatet blev mycket grafiskt tilltalande, men krävde säkerligen en hel del manuellt arbete. Om författaren, efter att ha lämnat textmaterialet till typografen, velat göra en omstrukturering, krävs förmodligen att detta manuella arbete till stor del görs om. Nu är jag ingen expert på InDesign, men jag gissar att det är svårt till omöjligt att bara med ett knapptryck (eller hellre en kommandorad) gå från råformat till slutformat. Om inte annat så krävs det tillgång till Adobe InDesign, en proprietär programvara som definitivt är utanför min budget.

I ”Free Culture” skriver Lessig i sitt förord:

I realize that all of the theoretical insights I develop here are insights Stallman described decades ago. One could thus well argue that this work is “merely” derivative.

I  accept that criticism, if indeed it is a criticism. The work of a lawyer is always derivative, and I mean to do nothing more in this book than to remind a culture about a tradition that has always been its own.

Jag menar att det finns mer att lära av Richard Stallman. Exempelvis kan man uppmärksamma att en av de första program han skrev för sitt helt fria operativsystem var en implementation av make, ett fritt system för att helt automatiskt från råformat (källkod) skapa ett slutformat (körbart program). Hade Lessig använt det (tillsammans med exempelvis LaTeX) för att skriva Remix hade han säkert fått se flera remixer av det.

Lagen, nu med kommentatorsspår

Det har redan omnämnts på lagen.nu, i mitt twitterflöde och på Moonhouse, men självklart ska jag även här meddela sommarens stora begivenhet i rättsinformationsvärlden: Nu förklarar vi lagen, med wikiteknik! Jag och ca tio-femton andra jurister kommer ägna oss åt att kommentera och förklara Sveriges viktigaste lagar – systematik, begrepp, tolkningar och allt annat som är svårt att se när man bara läser lagtexten. Det hela blir förstås fritt innehåll under CC-BY-SA-2.5-se.

Är du jurist(student) och tycker det här verkar vara ett lovvärt initiativ att ägna sig åt under regnperioden, skicka iväg en intresseanmälan senast på fredag! Kolla in hur vi tänker oss gå tillväga på deltagarportalen, följ aktiviteten på mailinglistan och gå med i fanklubben på facebook! Inledande workshop i Stockholm i början av juli, sedan distribuerat arbete under sommaren och hösten. Viss ersättning utgår.

Det hela sker med stöd av IIS, som genom Internetfonden finansierar det hela. Stort tack till dem! Registrera en .se-domän, så de kan fortsätta med sådant här stöd.

Spotify, avtalsfrihet och kreativt skapande

Dagens stora snackis i mitt bloggflöde har varit Spotifys planer på att ta bort låtar och införa GRM (man hade kunnat hoppas på att kommissionens blatanta ministerstyre fått större rubriker, men jag följer kanske fel flöden — cred för detta pressmeddelande dock). Folk är förstås förbannade.

Jag har använt spotify sen jag fick en invite av bredbandsbolaget, och är väl en sådär-nöjd kund. Jag har lite för mycket kontrollbehov för att vara nöjd med andras metadata, gillar att lyssna på musik i min ipod och är inte begeistrad över utbudet. För min del är emusic, trots att det är dubbelt så dyrt och har mindre mainstreammusik, fortfarande en bättre deal. Inte minst för att de filer jag gjort till mina är mina för tid och evighet.

Hur som helst, det hela fick mig att fundera kring det här med avtal, licenser och upphovsrätt. Upprördheten kring spotifys begränsning är ett uttryck för det allmäna missnöjet med det monopol som upphovsrätten de facto är (eller kanske snarare upphovsrättsindustrins missbruk av detta monopol), men också ett underkännande av avtalsfriheten. För faktum är att upphovsmännen och artisterna har träffat frivilliga avtal med skivbolag, musikförläggare m.fl. och i detta överlåtit sin rätt. Dessa har i sin tur rätt att träffa avtal på de villkor de vill, vilket spotify nu märker.

Och det får mig att undra: Varför ska jag investera tid i låtskrivare och band som inte värderat makten över sitt eget uttryck? Varför ska jag med min tid och uppmärksamhet stödja företag som varken är bra för sina kunder eller för samhället i stort? Visst, jag kan piratkopiera de verk som kommer från det hållet, och på det viset stödjer jag inte verksamheten direkt finansiellt. Men spelar det någon roll i en värld där uppmärksamhet är minst lika värdefullt som exemplarförsäljning (eftersom uppmärksamhet, till skillnad från exemplar, är en begränsad resurs)?

Är det inte bättre att ge uppmärksamhet till de upphovsmän som vill dela med sig av sina verk? Programmerare har sedan länge fattat att piratkopiering inte är något vidare substitut för fri programvara, och utifrån den insikten sett till att inte göra sig beroende av stängda verk. Och när man väl anammat det blir det lättare att acceptera att andra upphovsmän kanske inte använder sin avtalsfrihet på ett för samhället optimalt sätt. ”He who writes the code gets to choose the license, and nobody else gets to complain.”

Creative Commons och NoDerivs

För några dagar sedan, provocerad av Lessigs inlägg om den internationella
spridningen
av Creative Commons-organsationer, postade Shelley
”Burningbird” Powers en uppföljare
till en tidigare fråga
om hur man skulle tolka en specifik klausul i en Creative
Commons-licens.

Shelley ville bygga vidare på det stylesheet och den layout som
gruppbloggen Between
Lawyers
använder sig av. Men eftersom materialet på den bloggen
var licensierat under Attribution-NonCommercial-NoDerivs
2.0
så uppstod frågan ”Vad innebär det att skapa en bearbetning
(”derivative work”) till skillnad från att skapa en kopia, i kontexten
av ett stylesheet”. Shelley återanvände stylesheetfilen utan att
modifiera den, men kan man säga att hon i ett större skeende
modifierade Between Lawyers-materialet?

(Shelley har sedermera övergett den layouten, men man kan se ett
exempel på hur det såg ut här)

Det visade sig att inte ens Dennis M Kennedy, en av personerna bakom
Between Laywers, kunde
svara på det
. Han efterlyste också mer analys av hur CC-licenserna
skall tolkas:

One of my biggest concerns about the Creative Commons license has been
the lack of guidance from CC on practical interpretation and
enforcement issues. I’ve held off commenting on the issue Shelley
raised because I expected to see something from CC on the
topic. Unfortunately, my daily check of the Creative Commons blog has
shown mainly the usual victory laps being taken when a high visibility
site or celebrity uses or mentions the CC licenses, although I’ll note
that news of a tweak to one of the licenses has been mentioned.

Det är två saker jag tycker är synd med Creative Commons-licenserna så
som de används idag. Det första är att distinktionen mellan de olika
licenserna sällan lyfts fram i ”marknadsföringen” av densamma — det
är en stor skillnad mellan Attribution och
Attribution-NonCommercial-NoDerivs,
tillexempel. Men när Lessig använder uttryck som ”The green are countries where the project has launched. The yellow are close. The red is yet to be liberated.” känns det mer som om det handlar om att ha en CC-licens, vilken som helst, för att visa att man är en bra människa.

Det andra är att folk är allt för pigga på att begränsa
rättigheter
— i snitt 30 % av allt CC-licenserat material
tillåter inte bearbetningar (”derivative works”), och hela 73 %
tillåter inte kommersiell användning. Man ska förvisso inte skåda
given häst i munnen, men med Free
culture
i färskt minne tycker jag att det är trist att så många
som ändå tar ett medvetet beslut att inte låta andra bygga vidare på
det de skapat. Att många är skeptiska till att låta sitt innehåll
användas i kommersiella sammanhang är något mer förståeligt, men även
om det (juridiskt) hindrar parasiter som Superfeed Systems (läs mer här
eller här)
att tjäna pengar på andras innehåll, hindrar det också coola tjänster
som bloglines att (juridiskt)
fungera.

Men själv har jag ingen licens alls för varken innehållet på den här
bloggen, eller på lagen.nu, så jag ska
väl egentligen hålla tyst… Jag måste dock understryka att jag tycker att idén med CC-licenserna är jättebra.

När vi ändå är inne på ämnet bör nämnas att den svenska
översättningen/anpassningen av CC-licenserna (än så länge bara Attribution-NonCommercial-ShareAlike
2.0
) sedan några dagar finns ute för
kommentarer
. Big up för Mathias Klang
och Karl Jonsson för det!

Fri kultur

När jag cyklade
land och rike runt
i helgen passade jag på att lyssna på
ljudboksversionen av Lessigs ”Free
Culture
”. Långa cykelpass är perfekt för ljudböcker, de är
tillräckligt engagerande för att man inte ska ha tråkigt, men
samtidigt inte så engagerande att man blir en trafikfara. Det går
också bra att bara lyssna i endast en hörlur, så att man har det andra
örat till att höra bilar på väg att köra om och liknande. Det var
också kul att ”läsa” något som inte är kurslitteratur eller rättsfall,
men ändå tillräckligt studienära för att jag ska känna mig nyttig.

Ljudboksversionen är ett intressant projekt i sig; eftersom boken är
släppt under en CC-licens som tillåter bearbetningar (under
förutsättning att den inte används i kommersiella sammanhang) är det
tillåtet för vem som helst att läsa in en ljudversion av boken och
lägga upp den i MP3-format. En bloggare som går under pseudonymen AKMA
uppmanade
folk att läsa in ett kapitel var. Resultatet går att ladda ner härifrån (eller via
Bittorrent i en bättre sammanställd version här. Tekniskt sett är det inget
perfekt resultat, ljudnivåerna varierar vilt mellan kapitlena, några
av uppläsarna har ingen vidare inspelningsutrustning, de delar av
boken som innehåller mycket diagram blir lite svårförståeliga, och
alla medverkande har inte riktigt perfekta berättarröster… Men
slutresultatet är klart användbart, och ett exempel på vad som kan
göras med friare licenser och lite ideellt arbete.

Boken var mycket bra. Dess största problem är att huvudpoängerna
repeteras lite för mycket, vilket blir tjatigt, speciellt i en
ljudboksversion. Diskussionen om mediaindustrins framväxande och de
upphovsrättsintrång som skedde i samband därmed (kapitel 4, ”Pirates”)
och Lessigs rannsakande av sin egen insats i samband med Eldred-fallet
(kapitel 13, ”Eldred”) var särskilt intressanta, och man önskar att
fler av de som är inblandade i den svenska upphovsrättsdebatten hade
läst boken. Debatten skulle tåla att höjas några nivåer, om man så
säger.

Det jag mest funderade över under lyssningen var hur stora likheter
det finns mellan svensk och amerikansk upphovsrätt, särskilt när det
gäller ”derivatives”/bearbetningar. Ett coolt projekt vore att
översätta Free Culture till svenska, särskilt om man kunde lägga till
kommentarer för de passager där svensk och amerikansk rätt skiljer sig
åt. Som synes på remixes-sidan har boken
redan översatts till många språk. Tyvärr var flera, bland annat den
danska översättningen, hostad på en server som sedermera verkar ha
tappat bort det mesta av innehållet.