Skrab nettet med Python

web scraping med python

UDSOLGT! Kurset foregår 28. – 30. november 2022 i København.

Vil man som journalist have fat i nettets data, kan det være rigtigt smart at kunne skrive et lille program, der løses opgaven. Det er mere reglen end undtagelsen, at data ligger spredt. Med et skrabe-program kan man hente data fra tusindvis af hjemmesider og samle det i én tabel, som man så kan analysere og bruge til historier. 

På den måde samler vi fx selv data fra Tinglysningen, cvr-registeret og alle landets retslister. Men mulighederne er utallige. Du kan fx skrabe data sammen om priser, ventelister, kontaktoplysninger, praktiserende lægers alder eller andet, som ligger spredt ud på mange sider.

Programmering kan journalister også bruge til mange andre formål, men det kan være svært at lære sig at programmere på egen hånd. Kurset hjælper dig over startproblemerne, og du lærer så meget, at du bagefter selv kan bygge simple programmer til at samle data fra nettet. Vil du senere programmere i andre sammenhænge, vil det være langt lettere for dig.

Efter et tilsvarende kursus foråret 2019 skrev en kursist til os:

“Jeg har i lang tid gerne ville lære Python – og har forsøgt via apps og hjemmesider, men opgav flere gange, fordi det var svært at læse ind i mit arbejde. Kurset her gjorde netop det – at bruge konkrete eksempler, som ligner de, jeg sidder med. Med det klare formål blev det langt lettere både at forstå logikken bag Python, og hvad jeg kan bruge det til.”

Vi har valgt programmeringssproget Python af flere årsager:

  • Python er et populært programmeringssprog.
  • Python anses for at være et af de nemmeste sprog at lære.
  • Python er gratis og har et meget stort community verden over, så det er nemt at finde hjælp.
  • I udlandet – især USA – benytter journalister i stor stil Python til mange redaktionelle formål.
  • Vi har taget vores egen medicin – vi koder vores egne skrabere i Python.

Selv om midlet er programmering, betragter vi dette kursus som et journalistisk kursus: Målet er at kunne researche bedre og indsamle oplysninger. I Danmark kan kun få journalister programmere i dag. Kurset giver flere muligheden for at komme i gang.

Næste skridt

Siden sidst i 90’erne har Kaas & Mulvad undervist danske mediefolk i, hvordan man får styr på tallene i et regneark, og hvordan man søger i og trækker data ud af databaser.

Vi var  også tidligt i gang med at undervise i Python og har også undervist i flere andre værktøjer til web scraping. Vi har sideløbende stået for Python-undervisning på internationale konferencer.

Efter en pause genoptog vi i 2019 undervisning af danske journalister i Python-programmering. Der findes ganske vist brugervenlige web scraping-programmer, men enten udvikles de ikke tilstrækkeligt, eller også er de for dyre. I udlandet har man ret entydigt valgt Python som vejen frem. Og vi går samme vej i vores firma og i vores undervisning.

At Python er brugervenligt og robust, er også en af forklaringerne på, at store sites som Google, YouTube, Instagram og Pinterest blev bygget ved hjælp af Python.

Gratis – og let at lære

Al software, vi skal bruge på kurset, er gratis. Vi arbejder med Jupyter Notebook, der letter indlæringen ganske betragteligt. Jupyter notebook gør det let at skrive og teste Python-kode.

I forvejen kommer Python med en hel række indbyggede moduler, som letter kode-arbejdet meget. Hertil kommer, at der er en masse gratis moduler, som man let kan hente, og som gør mange opgaver meget nemmere.

Efter kurset vil du kunne bygge web scraper-programmer. Men du vil også have fået en generel forståelse af, hvad programmering er, og hvad man ellers kan bruge Python og andre programmer til i journalistikken. Du vil desuden have vores eget skriftlige og digitale undervisningsmateriale, du kan støtte dig til. Kursets notebooks har du liggende på din computer og kan arbejde i dem, som du vil.

Efter kurset har alle deltagere mulighed for at vende tilbage med spørgsmål, hvis de kører fast. Der er to timers support pr. deltager inkluderet i kursets pris. Vi stiller også en server til rådighed i en periode efter kurset, så kursisterne kan prøve scraping af uden først at skulle argumentere over for en evt. it-afdeling.

Al software er gratis, så der er ingen yderligere udgifter forbundet med kurset. Vi kontakter kursisterne forud for kurset og sørger for, at det relevante software bliver installeret, så alt er klar, når vi mødes. På den måde udnytter vi tiden bedst muligt.

Det kan du efter kurset:

  • Du kender grundbegreber i programmering
  • Du forstår de basale begreber i Python
  • Du kan bruge Python og de nødvendige moduler for webscraping
  • Du ved, hvor du kan hente hjælp til Python
  • Du kan nemmere gå i dialog med softwareudviklere
  • Du vil have scrapere og anden kode, du kan justere til nye opgaver
  • Du ved, hvordan du skal fortsætte efter kurset

Undervisere er Tommy Kaas og Jan Lauridtsen. Jan Lauridtsen er datajournalist og Python-programmør med bl.a. en fortid i TV2’s gravegruppe.

Undervisningsformen er en blanding af oplæg fra underviserne og en masse hands-on-opgaver, som kursisterne løser – fortrinsvist på deres computere.

Målgruppen er fortrinsvis journalister/kommunikationsmedarbejdere, der ønsker at lære at programmere/opbygge egne databaser gennem web scraping. Der er ingen krav om specifikke forkundskaber. Kursisterne skal selv medbringe en computer – pc eller mac.

Prisen omfatter undervisning, undervisningsmaterialer og frokost, kaffe, te og vand i løbet af kurset.

Kursusleder: Tommy Kaas og Jan Lauridtsen
Varighed: 3 dage
Sted: København.
Tidspunkt: 28, 29. og 30. november 2022
Pris: 10.185 kr. (+ moms)

Tilmeld dig hos Mediernes Efteruddannelse

Er din arbejdsplads ikke medlem af PU, kan du tilmelde dig ved at sende os en mail.

TILMELDING ER BINDENDE

Din tilmelding er bindende, når du har modtaget besked om, at du er optaget, men selvfølgelig kan du komme i en situation, hvor du må melde fra. Hvis det sker mere end fire uger før kursets start, koster det en administrationsafgift på kr. 1000. Ved afbud mindre end fire uger før forløbets start opkræver vi – uanset grunden – den fulde pris.https://mediernesefteruddannelse.dk/kurser/python-e22/Hvis du har tilmeldt dig privat – dvs. at du selv og ikke din arbejdsplads skal betale – har du dog 14 dages fortrydelsesret, jf. Forbrugeraftaleloven. Herefter er din tilmelding bindende.