GPL, CC och skillnadens betydelse för Remix

Som jag nämnde tidigare idag har jag konverterat en bok till epub-format. Det krävde några kvällars arbete, och gav stoff till åtminstone tre blogginlägg. Jag slår ihop dem till ett genom att fuska mig igenom de första två i förbigående.

1: Epub är inget bra format för eböcker. Jag skaffade nyligen en Sony PRS-300, vilken jag är riktigt nöjd med (åtminstone nöjdare än Jocke). Den läser, i likhet med en lite mer hajpad läsplatta, epub-formatet. Som flera andra moderna format är det i princip en zippad hög med XHTML-filer, samt övriga resurser (bilder, stylesheets osv). Det är en bra början att bygga på standardiserade format som dessutom kan undersökas med enkla verktyg (vilket kan jämföras med betydelsen av ”view source”-konceptet för webben), men det finns ett par problem:

  • I böcker används fotnoter. Det finns inget bra och etablerat sätt att med XHTML/CSS2.1, och därmed i ePub, representera fotnoter (det finns i CSS3, men det stöds inte av epub-standarden).
  • I böcker används sidnummer. Det finns inget standardiserat och väletablerat system för att koppla sidnummer till textavsnitt (det finns däremot ett standardiserat, och ett helt annat, väletablerat, system). Vilket är trist för den som vill hänvisa till ett visst ställe i en epub-bok.
  • Epub-formatet har inte annammat ”convention over configuration”-principen, vilket leder till en rad filer vars innehåll är statiskt eller upprepningar av information som redan finns någon annanstans. Varje enskild del av en bok hänvisas två gånger i content.opf, och ytterligare en gång i toc.ncx.

Kanske hade det varit bättre att bygga på DocBook eller TEI?

2: Att konvertera PDF till epub på ett bra sätt är icketrivialt. Epub är, genom att det bygger på XHTML, ett format som låter oss uttrycka semantiken i en text (eller åtminstone textens yttre form). Vi kan tala om att en rubrik är just det, och inte bara en textsnutt som råkar ha ett visst typsnitt, i en viss storlek, placerad på ett visst ställe på en sida (vilket är allt PDF låter oss göra). I Remix används kapitel (samt ett antal andra typer av textsektioner), fyra rubriknivåer, blockcitat, fotnoter, slutnoter, kapitäler, anfanger, index, sidhuvuden, sidfötter samt på ett ställe dialog.

All information om att en viss textsnutt representerar någon av dessa konstruktioner är borttagna i en PDF. Allt som återstår är information om var på en sida varje enskild textsnutt ska placeras, och med vilket typsnitt det ska visas. Om man i löpande text  exempelvis fetstilar något representeras detta som en separat textsträng. Att avgöra vilka textsträngar som tillsammans utgör ett stycke är ganska svårt.

Man får en bild av hur svårt det är om man tar en PDF-fil och använder Adobe Readers inbyggda ”Save as text”-funktion. Det var så jag började konvertera hela texten. Genom lite sök-och-ersätt samt dess kusin-på-stereoider, tangentbordsmakron i emacs, kunde jag steg för steg återskapa den semantik som ursprungligen fanns i Lessigs text, innan den konverterades till PDF. Det var detta arbete som tog några kvällar.

3: Allt remixarbete förutsätter tillgång till råformat. Den remixare som inte har råformat måste först ägna tid åt att konvertera vad han/hon nu har tillgång till, till ett format som duger för att bygga vidare på.

Råformatet är det format man använder för att skapa eller vidareutveckla ett verk. Det är sällan det slutformat som man faktiskt vill använda för att uppleva verket. Råformatet kan vara ett gäng wav-filer (ett för varje inspelat instrument), och slutformatet en mp3-fil. Råformatet kan vara en LaTeX-fil, några EPS-filer samt en Bibtex-databas, och slutformatet en PDF. Råformatet kan vara en filstruktur fylld med källkod och slutformatet en exekverbar binär. Ni fattar.

Lessig har tillgängliggjort verket som PDF-fil under en CC-licens, vilket förstås är generöst (även om det tog tid), men jag som  remixare av innehållet hade hellre velat ha tillgång till de ursprungliga .doc/.odt-filerna. Istället fick jag ägna mycket tid åt att rekonstruera ett råformat genom att ta den textfil som Adobe Reader konstruerat och sedan manuellt märka upp de semantiska element som gått förlorade i PDF-konverteringen.

Det här är relativt vanligt bland Creative Commons-licensierat material, att man enbart slutformatet, inte råformatet, tillgängliggörs. I öppen källkod-världen skulle ingen drömma om att släppa en kompilerad binär utan att samtidigt den källkod som använts för att bygga densamma (och de som prövar blir förstås utskällda).

På FSCONS 2008 höll Mike Linksvayer från Creative Commons ett föredrag om skillnaden mellan ”Free Software”-rörelsen (dvs öppen källkod) och ”Free Culture”-rörelsen (dvs Creative commons), eller kanske snarare hur långt efter den senare ligger efter den förra (Det finns sammanfattat i hans text i boken som gjordes från den konferensen). Bland annat berördes att skillnaden mellan råformat och slutformat för programkod är knivskarp, medans den är betydligt suddigare för exempelvis en bok eller en musikinspelning.

Kanske är det anledniningen till att favoritlicensen inom öppen källkod-rörelsen (GPL) redan i sin andra klausul sätter en viktig definition:

The “source code” for a work means the preferred form of the work for making modifications to it.

Creative commons-licenserna innehåller inget liknande.

En kompilerad binär är relativt hopplös att bygga vidare på, även om man har juridisk tillåtelse. En färdigställd PDF kan man faktiskt bygga något från, även om det tar tid. Kanske är det anledningen till att Lessig nöjer sig med att släppa sina verk enbart i slutformat. Men om man stannar där tror jag att man missar något viktigt. Nämligen:

4: Ju enklare det är att skapa ett nytt slutformat, ju enklare är det att göra en remix. Om det första man måste göra är att konvertera en excelfil med ett inbäddat epostmeddelande med en digitalkamerabild av en utskrift av en skärmdump av en accessdatabas så kommer färre personer att göra något kul med informationen. Och om man har skapat det ursprungliga verket med verktyg som gör det svårt eller dyrt att bygga en slutversion så får det samma effekt. När Lawrence Lessig skrev ”Remix” gissar jag att han använde Microsoft Word eller OpenOffice Writer, för att skapa en eller flera .doc eller .odt-filer, som sedan en typograf laddade in i InDesign och skapade en .indd-fil utav. Efter en hel del typografiskt finlir skapades slutligen en tryckfärdig PDF. Slutformatet blev mycket grafiskt tilltalande, men krävde säkerligen en hel del manuellt arbete. Om författaren, efter att ha lämnat textmaterialet till typografen, velat göra en omstrukturering, krävs förmodligen att detta manuella arbete till stor del görs om. Nu är jag ingen expert på InDesign, men jag gissar att det är svårt till omöjligt att bara med ett knapptryck (eller hellre en kommandorad) gå från råformat till slutformat. Om inte annat så krävs det tillgång till Adobe InDesign, en proprietär programvara som definitivt är utanför min budget.

I ”Free Culture” skriver Lessig i sitt förord:

I realize that all of the theoretical insights I develop here are insights Stallman described decades ago. One could thus well argue that this work is “merely” derivative.

I  accept that criticism, if indeed it is a criticism. The work of a lawyer is always derivative, and I mean to do nothing more in this book than to remind a culture about a tradition that has always been its own.

Jag menar att det finns mer att lära av Richard Stallman. Exempelvis kan man uppmärksamma att en av de första program han skrev för sitt helt fria operativsystem var en implementation av make, ett fritt system för att helt automatiskt från råformat (källkod) skapa ett slutformat (körbart program). Hade Lessig använt det (tillsammans med exempelvis LaTeX) för att skriva Remix hade han säkert fått se flera remixer av det.

Lawrence Lessig’s ”Remix” in epub format

Just what the headline says — I’ve converted Lessig’s excellent book ”Remix: Making art and commerce thrive in the hybrid economy” to epub format from the original PDF source. You can download it here.

The file is tested with FBReader, Adobe Digital Editions, and Sony PRS-300, and works reasonably well in all of them. Comments from readers using iBooks or Stanza would be welcome. The conversion was done by hand (and emacs), which was an educational experience. More about that to come in a separate posting.

(Which will be in Swedish, by the way. This post is in english for the benefit of people searching for an epub version of Remix.)

Om remixande och Lessigs ”Remix”

Conan the Librarian tipsar om den här fantastiska Star Wars på svenska-remixen:

Ernst-Hugo Järegård som Darth Vader funkar riktigt bra, men Björne som Chewbacca är ren genialitet.

Videon är ett utmärkt exempel på remixkultur, hur man utifrån andras kreativa skapelser kan skapa något nytt. Enligt amerikansk upphovsrätt är detta i många fall tillåtet under fair use-systemet. Enligt detta system inskränks den ursprungliga upphovsmannens ensamrätt till sitt verk vad gäller sådant användande av verket som anses som ”fair”. För att avgöra om så är fallet gör man en serie avvägningar. Detta leder till att det är rätt svårt för en remixare att veta om dennes tänkta användning är tillåtet.

Det svenska systemet är mer förutsägbart. Vi har en har en katalog med detaljerade inskränkningar i upphovsmannens ensamrätt. Faller ett användande in under något av dessa inskränkningar är det OK, annars inte. Problemet med det svenska systemet är istället att det blir knutet till vissa specifika användningsfall – det mest kända är kanske citaträtten: ”Var och en får citera ur offentliggjorda verk i överensstämmelse med god sed och i den omfattning som motiveras av ändamålet”.

Vilka verkstyper citaträtten omfattar är lite oklart – enligt Henry Olsson omfattas litterära verk, dvs text samt även teckningar och liknande ”av beskrivande art”, musik, video men inte konstnärliga verk (Olsson, Copyright, 7 u, s 237). Levin är av samma åsikt och tillägger att sampling av musik inte kan kan räknas som citat (Levin, Lärobok i immaterialrätt, supplement 2006, s 142). Enligt Bernitz m.fl kan dock även konstverk omfattas (Bernitz, Karnell, Pehrsson, Sandgren, Immaterialrätt, 9 u, s 82). För mig framstår det som konstigt att konstverk (underförstått målningar och annat stillastående) skulle vara särskilt fredade, om video inte är det.

Ytterligare ett krav för att citaträtten ska vara tillämplig är att citerandet sker i enlighet med ”god sed”. Frågan, vad gäller ovanstående video, är om citaträtten över huvud taget kan bli tillämplig (den ”citerar” närmare tio minuter ur Star Wars, och ett antal repliker ur ett flera svenska filmer), och om det i så fall är i enlighet med god sed.

En av mina husgudar, Lawrence Lessig, släppte en ny bok för ett par månader sedan: ”Remix: Making Art and Commerce Thrive in the Hybrid Economy”. I nedanstående TED-föreläsning presenterar han bokens centrala teman:

Lessigs tidigare böcker har gjorts tillgängliga under en Creative Commons-licens, och jag tog för givet att även denna skulle göra det. Tydligen är planen att den ska göras tillgänglig senare, men just nu är texten ”All rights reserved” — ett ganska oväntat drag från en person som tidigare utlovat att aldrig publicera något (i en akademisk tidskrift) under villkor som omöjliggör en CC-licensiering.

Jag har i och för sig inget emot att betala för mitt exemplar av Remix. Den är säkerligen värd pengarna. Jag skulle helst köpa den som ebok, dock — jag läser gärna på skärm, och slipper gärna vänta på posten och betala frakt. På förlagets hemsida går det att köpa boken i olika elektroniska format. Första överraskningen är att eboken kostar exakt lika mycket som den fysiska boken, trots att den har en marginalkostnad på exakt noll. Den andra överraskningen är att eboken är DRM-skyddad:

Och det här är alltså det enda sättet som man idag kan få tag på en elektronisk version av texten. Vafan?

Fri kultur

När jag cyklade
land och rike runt
i helgen passade jag på att lyssna på
ljudboksversionen av Lessigs ”Free
Culture
”. Långa cykelpass är perfekt för ljudböcker, de är
tillräckligt engagerande för att man inte ska ha tråkigt, men
samtidigt inte så engagerande att man blir en trafikfara. Det går
också bra att bara lyssna i endast en hörlur, så att man har det andra
örat till att höra bilar på väg att köra om och liknande. Det var
också kul att ”läsa” något som inte är kurslitteratur eller rättsfall,
men ändå tillräckligt studienära för att jag ska känna mig nyttig.

Ljudboksversionen är ett intressant projekt i sig; eftersom boken är
släppt under en CC-licens som tillåter bearbetningar (under
förutsättning att den inte används i kommersiella sammanhang) är det
tillåtet för vem som helst att läsa in en ljudversion av boken och
lägga upp den i MP3-format. En bloggare som går under pseudonymen AKMA
uppmanade
folk att läsa in ett kapitel var. Resultatet går att ladda ner härifrån (eller via
Bittorrent i en bättre sammanställd version här. Tekniskt sett är det inget
perfekt resultat, ljudnivåerna varierar vilt mellan kapitlena, några
av uppläsarna har ingen vidare inspelningsutrustning, de delar av
boken som innehåller mycket diagram blir lite svårförståeliga, och
alla medverkande har inte riktigt perfekta berättarröster… Men
slutresultatet är klart användbart, och ett exempel på vad som kan
göras med friare licenser och lite ideellt arbete.

Boken var mycket bra. Dess största problem är att huvudpoängerna
repeteras lite för mycket, vilket blir tjatigt, speciellt i en
ljudboksversion. Diskussionen om mediaindustrins framväxande och de
upphovsrättsintrång som skedde i samband därmed (kapitel 4, ”Pirates”)
och Lessigs rannsakande av sin egen insats i samband med Eldred-fallet
(kapitel 13, ”Eldred”) var särskilt intressanta, och man önskar att
fler av de som är inblandade i den svenska upphovsrättsdebatten hade
läst boken. Debatten skulle tåla att höjas några nivåer, om man så
säger.

Det jag mest funderade över under lyssningen var hur stora likheter
det finns mellan svensk och amerikansk upphovsrätt, särskilt när det
gäller ”derivatives”/bearbetningar. Ett coolt projekt vore att
översätta Free Culture till svenska, särskilt om man kunde lägga till
kommentarer för de passager där svensk och amerikansk rätt skiljer sig
åt. Som synes på remixes-sidan har boken
redan översatts till många språk. Tyvärr var flera, bland annat den
danska översättningen, hostad på en server som sedermera verkar ha
tappat bort det mesta av innehållet.