easy_install-2.7 lxml
ikke
easy_install lxml
Dette er mest et notat til megselv, kanskje jeg husker det til neste gang selv nå.
easy_install-2.7 lxml
ikke
easy_install lxml
Dette er mest et notat til megselv, kanskje jeg husker det til neste gang selv nå.
Webscraping anser jeg som et metodisk verktøy som burde brukes mer. Ikke fordi det er den beste måten å gjøre ting på, lagt der i fra, men fordi det er enkelt, nyttig og relativt raskt. Et verktøy for scraping jeg har lekt med er scraperwiki.
Ikke bare kan du lage scrapers (skrapere?) med scraperwiki, du kan også lage views (presentasjonslag). Etter litt leking kom jeg fram til dette:
NRK P3s spillanmeldelser bruker 3 av 6 terningsider til 75% av sine anmeldelser. De har kun brukt terningkast 1 én eneste gang, og da til å feilkategorisere en film. Hva betyr det?
Betyr det at spill, som en relativt ny kulturform, trenger evangelister og entusiaster til å pushe spillets utmerkede egenskaper på oss? Anmelder de ikke de dårlige spillene? (jeg har selv spilt flere spill jeg kunne gitt terningkast 1 og 2 de siste årene, skriver ikke P3 om disse?) Har spillanmeldere noen insentiv for å vurdere "snilt"? Eller har de lave forventninger?
Tja, jeg som gjorde dette av metodisk interesse får vel innse at kvantitative mål ikke besvarer disse spørsmålene, men; det viser at terningkast ikke hverken er normalfordelt eller jevnt distribuert.
.. kanskje jeg får en jevn distribusjon hvis jeg gjør dette på popmusikk eller amerikanske filmer?
Uansett hvilke forskningsmetoder du måtte foretrekke, så er det mange metoder innen samfunnsfagene som før eller siden er innom ideen om intervjuer. Det er rett og slett ikke så dumt å prate med folk. Intervjuer i forskningssammenheng tas typisk opp på bånd (eller mp3 som det heter i dag). Videre transkriberes dette om til tekst, noe som er en langsom og overraskende kjedelig affære. Resultatet er tekst, som så skal analyseres.
Også hvordan og hva en analyse av intervjuer er, kan diskuteres og strides om. Jeg skal ikke gjøre det nå, men stille meg et spørsmål jeg har stille meg selv før:
Finnes det ikke noen enkle verktøy for å annotere spørsmål og svar i transkriberte intervjuer for enkel sammenlikning av resultater?
Da jeg skreiv masteroppgave brukte jeg fargestifter, saks og papir. Det fungerte bra en stund, men etter en del intervjuer begynner det å bli mye papirstrimler over alt, og en lett vind kan lage kaos i harmonien fortere en du kan si "kvalitativ analyse".
Et alternativ er nvivo, jeg vet folk gjør det. Men; nvivo funker bare på Windows og koster flesk. Blir jeg fortalt. Så hva gjør man da? Lager et verktøy selv? Klippe/lime inn i Excel eller en database?
Vell, Joakim Karlsen tipset om et alternativ: TAMS Analyzer. At det er noe overveldende og forvirrende ved første øyekast kan jeg godt si meg enig i, men ved en litt nærmere titt kan det se om som TAMS Analyzer er just det jeg (vi?) er på jakt etter?
Det finnes et par videoer på youtube som gir en introduksjon:
Det finnes også en blog.
Ok, jeg gjør et forsøk.
PS: hvordan gjør du denne jobben? Hva gjør du etter at intervjuene har blitt til tekst?
Hvordan skattelistene i Norge har blitt brukt har rettvis blir kritisert. Det betyr ikke at offentlige skattelister er noen dårlig idé, det betyr bare at de ideene som ble tatt i bruk i liten grad fulgte intensjonene om et åpent samfunn. Even Westvang i Bengler har en helt annen idé, og viser oss noe du neppe har sett før på denne måten: ved å se sjekkeskattelistene mellom to år viser prosjektet hvordan folk flytter rundt i Norge. Det må da sies å både værer vakrere og nyttigere enn å vite hvilken kjendis som har høyest inntekt?
Har du noengang forsøkt å kopiere hele bilde- eller musikkmappa di, og oppdaget at det var en feil med én fil, som gjør at kopieringen stopper opp og kun en del av mappen blir kopiert?
Jeg har det, og jeg hater det. Hvem designet dette slik?! Vell, nerden i meg vet råd: ved å kopiere via terminalen skjer dette ikke, så dette er verdt å merke seg:
cp -Rp source destination
cp er kommandoen for å kopiere. Parameteret -R gjør kopieringen rekursiv (underfoldere tas også med) og p sørger for at metadata som sist endret og eierskap beholdes.
Slenger du på en -v i tillegg kan du se hva som kopieres i øyeblikket (v for verbose, "pratsom").
Et eksempel blir da:
cp -Rp -v Pictures Volumes/ekstern500gig/
Det tar fortsatt litt tid å kopiere store foldere, men de blir ikke plutselig avbrutt av tøysete feilmeldinger som hittil ikke har vært nyttige for meg.
Sånn, håper jeg kan huske dette nå da.
cp -Rp -v Pictures Volumes/ekstern500gig/