About Christopher Kullenberg | CV and publications

Archive

#SOUhack

På väg hem från #SOUhack, ett mycket lyckat seminarium/workshop kring vad man kan göra med Statens offentliga utredningar medelst digitala metoder.

Jag tänkte bara passa på att posta ett par länkar samt ge en uppdaterad instruktion för ett litet sökskript som jag använde mig av i min presentation. Först länkarna:

      - Här är [slides](http://scientometrics.flov.gu.se/files/kullenberg.pdf) till min presentation med titeln "Statens röst digitaliserad?" - Här är en direktlänk till en uppdaterad datamängd som innehåller alla SOUer 1922–2015 (förutom år 1996) som en [zip-fil](http://scientometrics.flov.gu.se/files/SOU19222015.zip) (1.2 Gb). Sammanställningen av SOUer från 1997-2015 har gjorts av min kollega [Sverker Lundin](https://twitter.com/lundinsverker) på [Centrum för Digital Humaniora](http://cdh.hum.gu.se/), GU. Så nu kan man nästan söka på ALLT!

Om någon vill använda (eller återanvända) det lilla python-skriptet med det tråkiga namnet SOUsearchplot som jag skrev i somras kan man göra så här.

        1. Ladda ned skriptet [SOUsearchplot](https://github.com/intensifier/SOUscripts/blob/master/SOUsearchplot.py). 2. Om du kör Windows måste du ha Python installerat. 3. Installera modulen "progress bar" med `pip install progress`. 4. Ladda ned SOU-datamängden (länkad ovan). 5. Ändra på TVÅ ställen i skriptet till exakt den katalog som filerna ligger i. 6. Kör skriptet från kommandoraden med `python SOUsearchplot.py`. 7. Om allt går rätt till ska det börja laddas massa data till din dators minne. OBS. Detta kommer att kräva ca. 3,7 Gb av datorns minne. Jag har bara testat på en dator med 8 Gb i totalt RAM-minne. (Av vad som framgår av kommentarerna nedan är det en dålig idé att testa med bara 4Gb i minne). 8. Kommentera om det ändå inte funkar!

Inom kort kommer det troligtvis att lanseras aningen mera moderna gränssnitt. Under seminariet diskuterade vi många intressanta ingångar till att göra SOUerna inte bara sökbara, utan även begripbara bortom söktermernas begränsningar.

Men mer om det i framtiden.