liste

Hent og rens data – på den helt lette måde

Hvis vi vil hente data ud af hjemmesider, bruger vi ofte web scraping i en eller anden form. Normalt betyder det, at vi automatiserer vores data-udtræk, og vi bruger ofte robotter, som vi programmerer, eller vi bruger andet specialværktøj. Nogle gange kan vi  dog nøjes med “håndværktøj” og lade det komplicerede grej ligge. Her følger et skridt-for-skridt-eksempel […]

Læs mere 0
3529385629_58ef316f40_o

Da vi blev hacket af kineserne

Først blev der smuglet spamlinks ind i vores site. Så forsvandt det helt. Måske opdagede du det ikke, men vores website, www.kaasogmulvad.dk var nede i nogle timer lørdag den 16. maj. Ja, det var ikke bare nede. Det var pist væk – slettet fra vores server. Formentlig var det en kinesisk hacker, der havde fjernet det. […]

Læs mere 3
Sådan så skats billedfil ud i pdf-format. Ocr-behandling gav mange fejl.

Banebrydende afgørelser om dataindsigt

Skat har forsøgt at blokere for data-adgang på tre måder, men alt er nu løst. Sagsakter og argumentation kan bruges af andre, der støder ind i samme besvær med myndighederne. De tre problemer var: Skat ville ikke lave dataudtræk af virksomhedernes skattelister med argumentation om, at man ikke havde kompetencen til det. Skat afleverede et […]

Læs mere 0
amning

Mødre ammer alt for lidt

Sundhedsstyrelsen råder kvinder til fuld amning i 180 dage. Der er dog store forskelle på, hvor længe kvinder ammer. Ingen steder er  gennemsnittet oppe på 180 dage. I langt de fleste kommuner falder ammetiden. Lavest gennemsnit er der i Aalborg, hvor kvinder kun ammer i 47 dage, tæt fulgt af Herning og Odense. Længst ammeperiode […]

Læs mere 3
olesen

Jydenavne og sjællændernavne

En række analyser, visualiseringer og kort, Kaas & Mulvad har lavet, viser på en meget konkret måde, at der er store forskelle på, hvad vi hedder i forhold til, hvor vi bor. Tag fx vores Navnekort. Selvfølgelig er der fx masser af steder folk, der hedder Olsen til efternavn. Men ser vi på, hvor mange […]

Læs mere 0
Benny

Sådan trækker vi alle skattedata ud

Skat har nu for tredje år lagt oplysninger ud om virksomheders skatteforhold. Men data er vanskelige at bruge, fordi de indeholder mange fejl og løbende ændres uden forklaring fra Skats side. Kaas & Mulvads systematiske udtræk dokumenterer en række problemer med indholdet af de åbne skattelister.             De åbne skattelister […]

Læs mere 1
data_path_without_glow_by_roos_skywalker-d5ju49u

5 data-tendenser for 2015

Fagbladet Journalisten bad mig pege på medieproduktioner/historier i 2014, der metodisk eller indholdsmæssigt er en forsmag på, hvad vi kommer til at opleve i 2015. Her er mit umiddelbare bud. Robotter på fremmarch Vi vil se flere artikler og tekster – store og små – der ikke er skrevet af journalister, men af robotter eller computerprogrammer. […]

Læs mere 0