Skrab nettet med Python

web scraping med python

Kurset foregår 20.-22. april 2020 i København.

Vil man som journalist have fat i nettets data, kan det være rigtigt smart at kunne programmere. Det er mere reglen end undtagelsen, at data ligger spredt. Et skrabe-program kan hente data fra tusindvis af hjemmesider og samle det i én tabel, som man så kan bruge til sine historier. På dette kursus hjælper vi dig i gang.

På den måde samler vi fx selv data fra tinglysningen, cvr-registeret og alle landets retslister. Men mulighederne er utallige. Du kan fx skrabe data sammen om transfer-værdien af fodboldspillere, praktiserende lægers alder eller andet, som ligger spredt ud på mange sider.

Programmering kan journalister også bruge til mange andre formål, men programmering kan være svært at komme i gang med på egen hånd. Kurset hjælper dig over startproblemerne, og du lærer så meget, at du bagefter selv kan bygge simple programmer til at samle data fra nettet.

Efter et tilsvarende kursus foråret 2019 skrev en kursist til os:

“Jeg har i lang tid gerne ville lære Python – og har forsøgt via apps og hjemmesider, men opgav flere gange, fordi det var svært at læse ind i mit arbejde. Kurset her gjorde netop det – ved at bruge konkrete eksempler, som ligner de, jeg sidder med. Med det klare formål blev det langt lettere både at forstå logikken bag Python, og hvad jeg kan bruge det til.”

Mange gode grunde

Vi har valgt programmeringssproget Python af flere årsager:

  • Python er et populært programmeringssprog.
  • Python anses for at være et af de nemmeste sprog at lære.
  • Python er gratis og har et meget stort community verden over, så det er nemt at finde hjælp.
  • I udlandet – især USA – benytter journalister i stor stil Python til mange redaktionelle formål.

Selv om midlet er programmering, ser vi dette kursus som et journalistisk kursus: Målet er at kunne researche bedre og indsamle oplysninger. I Danmark kan kun få journalister programmere. Kurset giver flere chancen for at komme i gang.

Gratis – og let at lære

Al software, vi skal bruge på kurset, er gratis. Vi arbejder med Jupyter Notebook, der gør det til en leg at skrive og teste Python-kode. Når man først er i gang, går det op for mange, at det er utroligt sjovt at programmere.

Python kommer med en hel række indbyggede moduler, som letter kode-arbejdet meget. Desuden findes en masse gratis moduler, som man let kan hente, og som gør mange opgaver meget nemmere.

Efter kurset vil du kunne bygge web scraper-programmer. Men du vil også have fået en generel forståelse af, hvad programmering er, og hvad man ellers kan bruge Python og andre programmer til i journalistikken. Du vil desuden have vores eget skriftlige og digitale undervisningsmateriale, du kan støtte dig til.

Deltagerne skal inden kurset sammen med os have fundet en opgave, de vil løse med den nye viden fra kurset. Efter kurset har alle deltagere mulighed for at vende tilbage med spørgsmål, hvis de kører fast. Der er to timers support pr. deltager inkluderet i kursets pris.

Det kan du efter kurset:

  • Du kender grundbegreber i programmering.
  • Du forstår de basale begreber i Python.
  • Du kan bruge Python og de nødvendige moduler for webscraping.
  • Du ved, hvor du kan hente hjælp til Python.
  • Du kan nemmere gå i dialog med programmører, softwareudviklere etc.
  • Du vil have en hel stribe af scrapere og anden kode, du kan justere til nye opgaver.
  • Du ved, hvordan du skal fortsætte efter kurset.

Undervisningsformen er en blanding af oplæg fra underviserne og mange små hands-on-opgaver, som kursisterne løser på deres computere.

Målgruppen er især journalister/kommunikationsmedarbejdere, der ønsker at lære at programmere/opbygge egne databaser gennem webscraping. Der er ingen krav om specifikke forkundskaber. Kursisterne skal selv medbringe en computer – pc eller mac.

Yderligere udgifter:  Al software er gratis, så der er ingen yderligere udgifter forbundet med kurset. Vi vil via kommunikation til kursisterne forud for kurset sørge for, at det relevante software bliver installeret, så alt er klar, når vi mødes. På den måde udnytter vi tiden bedre.

Kursusleder: Jan Lauridtsen og Tommy Kaas
Varighed: 3 dage
Sted: MBK, Pilestræde 61, København K.
Tidspunkt: 20. – 22. april 2020
Pris: 10.185 kr. (+ moms)

Tilmeld dig hos Mediernes Efteruddannelse

Er din arbejdsplads ikke medlem af PU, kan du tilmelde dig ved at sende os en mail.

TILMELDING ER BINDENDE

Din tilmelding er bindende, når du har modtaget besked om, at du er optaget, men selvfølgelig kan du komme i en situation, hvor du må melde fra. Hvis det sker mere end fire uger før kursets start, koster det en administrationsafgift på kr. 1000. Ved afbud mindre end fire uger før forløbets start opkræver vi – uanset grunden – den fulde pris.
Hvis du har tilmeldt dig privat – dvs. at du selv og ikke din arbejdsplads skal betale – har du dog 14 dages fortrydelsesret, jf. Forbrugeraftaleloven. Herefter er din tilmelding bindende.