Skrab nettet med Python

web scraping med python

Kurset foregår 29. november – 1. december 2021 i København.

Vil man som journalist kunne lave historier på baggrund af data, er det smart at kunne programmere. Mange data er tilgængelige, men det er mere reglen end undtagelsen, at de ligger spredt. Et skrabe-program kan hente data fra tusindvis af hjemmesider og samle det i én tabel, som du så kan analysere og bruge i dine historier. 

På den måde samler vi fx selv data fra Tinglysningen, cvr-registeret og alle landets retslister. Men mulighederne er utallige. Du kan fx skrabe data sammen om præsternes email-adresser, transfer-værdien af fodboldspillere, praktiserende lægers alder eller andet, som ligger spredt ud på mange sider.

Programmering kan journalister også bruge til mange andre formål, men det kan være svært at lære sig at programmere på egen hånd. Kurset hjælper dig over startproblemerne, og du lærer så meget, at du bagefter selv kan bygge simple programmer til at samle data fra nettet. Vil du senere programmere i andre sammenhænge, vil det være langt lettere for dig.

Efter et tilsvarende kursus foråret 2019 skrev en kursist til os:

“Jeg har i lang tid gerne ville lære Python – og har forsøgt via apps og hjemmesider, men opgav flere gange, fordi det var svært at læse ind i mit arbejde. Kurset her gjorde netop det – at bruge konkrete eksempler, som ligner de, jeg sidder med. Med det klare formål blev det langt lettere både at forstå logikken bag Python, og hvad jeg kan bruge det til.”

Vi har valgt programmeringssproget Python af flere årsager:

  • Python er et populært programmeringssprog.
  • Python anses for at være et af de nemmeste sprog at lære.
  • Python er gratis og har et meget stort community verden over, så det er nemt at finde hjælp.
  • I udlandet – især USA – benytter journalister i stor stil Python til mange redaktionelle formål.
  • Vi har taget vores egen medicin – vi koder de fleste af vores egne skrabere i Python.

Selv om midlet er programmering, betragter vi dette kursus som et journalistisk kursus: Målet er at kunne researche bedre og indsamle oplysninger. I Danmark kan kun få journalister programmere i dag, og dem, der kan er stærkt eftertragtede.

Gratis – og let at lære

Al software, vi skal bruge på kurset, er gratis. Vi arbejder med Jupyter Notebook, der letter indlæringen ganske betragteligt. Jupyter notebook gør det til en leg at skrive og teste Python-kode.

I forvejen kommer Python med en hel række indbyggede moduler, som letter kode-arbejdet meget. Hertil kommer, at der er en masse gratis moduler, som man let kan hente, og som gør mange opgaver meget nemmere.

Efter kurset vil du kunne bygge web scraper-programmer. Men du vil også have fået en generel forståelse af, hvad programmering er, og hvad man ellers kan bruge Python og andre programmer til i journalistikken. Du vil desuden have vores eget skriftlige og digitale undervisningsmateriale, du kan støtte dig til.

Deltagerne skal inden kurset sammen med os have fundet en realistisk opgave, de vil løse med den nye viden fra kurset. Efter kurset har alle deltagere mulighed for at vende tilbage med spørgsmål, hvis de kører fast. Der er to timers support pr. deltager inkluderet i kursets pris. Vi stiller også en server til rådighed i en periode efter kurset, så kursisterne kan prøve scraping af uden først at skulle argumentere over for en evt. it-afdeling.

Det kan du efter kurset:

  • Du kender grundbegreber i programmering
  • Du forstår de basale begreber i Python
  • Du kan bruge Python og de nødvendige moduler for webscraping
  • Du ved, hvor du kan hente hjælp til Python
  • Du kan nemmere gå i dialog med softwareudviklere
  • Du vil have en hel stribe af scrapere og anden kode, du kan justere til nye opgaver
  • Du ved, hvordan du skal fortsætte efter kurset

Undervisningsformen er en blanding af oplæg fra underviserne og en masse hands-on-opgaver, som kursisterne løser – fortrinsvist på deres computere.

Målgruppen er fortrinsvis journalister/kommunikationsmedarbejdere, der ønsker at lære at programmere/opbygge egne databaser gennem web scraping. Der er ingen krav om specifikke forkundskaber. Kursisterne skal selv medbringe en computer – pc eller mac.

Yderligere udgifter:  Al software er gratis, så der er ingen yderligere udgifter forbundet med kurset. Vi kontakter kursisterne forud for kurset og sørger for, at det relevante software bliver installeret, så alt er klar, når vi mødes. På den måde udnytter vi tiden bedst muligt.

Kursusleder: Tommy Kaas og Jan Lauridtsen
Varighed: 3 dage
Sted: København.
Tidspunkt: 29. november – 1. december 2021
Pris: 10.185 kr. (+ moms)

Tilmeld dig hos Mediernes Efteruddannelse 31. maj 2021

Er din arbejdsplads ikke medlem af PU, kan du tilmelde dig ved at sende os en mail.

TILMELDING ER BINDENDE

Din tilmelding er bindende, når du har modtaget besked om, at du er optaget, men selvfølgelig kan du komme i en situation, hvor du må melde fra. Hvis det sker mere end fire uger før kursets start, koster det en administrationsafgift på kr. 1000. Ved afbud mindre end fire uger før forløbets start opkræver vi – uanset grunden – den fulde pris.
Hvis du har tilmeldt dig privat – dvs. at du selv og ikke din arbejdsplads skal betale – har du dog 14 dages fortrydelsesret, jf. Forbrugeraftaleloven. Herefter er din tilmelding bindende.