Big Clean je jednodenní workshop zaměřený na čištění dat veřejné správy, který se v sobotu 19.3. 2011 odehraje současně v Česku (Praha) a Finsku (Jyväskylä).

Cílem workshopu je dojít od nestrukturovaných dat (např. HTML), se kterými se lze setkat na webových stránkách institucí veřejné správy, k datům ve strukturované podobě (např. CSV). Účastníci budou pod vedením odborníků data převádět, čistit, dále zpracovávat a nakonec publikovat na webu.

Data se tak stanou lépe zpracovatelná a umožní nové způsoby využití, ať už půjde o vytváření užitečných služeb pracujících s těmito daty nebo jejich propojování s dalšími daty (např. v mash-upech).

Big Clean nebude jen o převádění dat a jejich zveřejňování na webu, ale stejnou měrou také o jejich použití pro analýzy, vizualizace a žurnalistiku založenou na datech. Kromě toho budou během dne probíhat skupinové diskuse o otevřených datech ve veřejné správě a jejich hodnotě pro společnost.

Datum a čas: 19.3. 2011, 10:00 – 17:00 (GMT+1)

Místo: Národní technická knihovna, Technická 6, Praha 6 – Dejvice (http://bit.ly/techlib)

Big Clean najdete na webové adrese http://www.bigclean.cz, pak taky na Twitteru jako @BigCleanCZ nebo s tagem #bigcleancz.

» Zaregistrujte se

Účast zdarma. Laptop s sebou. Maximální počet účastníků: 50 Kapacita navýšena na 200!

Pro koho je workshop určen?

  • Vývojáře, kteří se chtějí naučit lépe pracovat s daty
  • Novináře, kteří se chtějí naučit čerpat z dostupných dat
  • Zastánce otevřeného přístupu k datům veřejného sektoru

Program

Dopoledne, 10:00 – 12:30
10:00 – 10:15 Registrace
10:15 – 10:30 Zahájení workshopu
Získávání a čištění dat Otevřená data ve veřejné správě
10:30 – 11:00 Screen-scraping 10:30 – 12:30 Diskuse
11:00 – 12:30 Čištění dat
Přestávka na oběd, 12:30 – 13:30
Odpoledne, 13:30 – 16:30
Využití dat Odpolední hackování
13:30 – 14:45 Analýza dat 13:30 – 16:30 Scrapování a čištění dat
14:45 – 15:00 Přestávka
15:00 – 16:30 Využití dat v žurnalistice
Shrnutí workshopu, 16:30 – 17:00

Screen-scrapery

Účast přislíbili

  • Jan Boček (@chlebovo) - žurnalistika založená na datech (slidy)
  • Adam Javůrek (@adbar) – žurnalistika založená na datech (slidy)
  • Jindřich Mynarz (@jindrichmynarz) – screen-scraping se ScraperWiki (slidy)
  • Martin Nečaský (MFF UK) – diskuse o otevřených datech ve veřejné správě
  • Jakub Nešetřil (@jakubnesetril) – Google Refine
  • Josef Šlerka (@josefslerka) – Google Fusion Tables (slidy)
  • Štefan Urbánek (@Stiivi) – workshop o čištění dat (slidy)

Pořadatelé

Logo NTK

Národní technická knihovna (Jindřich Mynarz, jindrich.mynarz(at)techlib.cz, @jindrichmynarz)

Logo SNM

Studia nových médií FF UK (Josef Šlerka, josef.slerka(at)gmail.cz, @josefslerka)

Workshop sponzoruje

Česká informační společnost, o.s.

19 Comments

  1. korel says:

    Milý BigCleane, jak zjistím, jestli jsem se vešel do 50 volných míst? Mohu předpokládat, že když mi prošla registrace, tak jsem vyhrál? Díky

  2. Martin says:

    Budou z workshopu nějaké záznamy a materiály dostupné online? Prosím o zaslání reakce na můj e-mail.

    • Video záznamy neplánujeme, protože půjde spíše o workshop než klasické přednášky. Pro některé části budou k dispozici sdílené Google Docs s výstupy např. z diskusí.

  3. SteamFlow says:

    Zdravim, v programu jsou dva bloky v jeden cas. Znamena to, ze bude na vyber? Veci co mne zajimaji se nekdy prekryvaji :-(

    Diky

  4. SteamFlow says:

    Odpoledni hackovani bude rozsireni dopoledniho cisteni dat? Nebo to bude to same znovu?

  5. SteamFlow says:

    Super, diky. Uz mam jasno.

  6. bzzzwa says:

    Technicka pripominka, opravdu jen pro jistotu: Nespolehat na wifi NTK (pro navstevniky knihovny), porad se odhlasuje a chce stale znovu zadavat autentizacni udaje… (ale treba se to uz zlepsilo, dlouho jsem tu wifi nepouzival)…

    • Vaclav jansa says:

      Dobrý den, s wifi jsou problémy stále. Spočívají hlavně v kombinaci různých karet, firmwarů a logiky sítě. Často pomůže zaktualizovat ovladače WiFi, případně zakázat v ovladačích roaming. V některých kombinacích si zařízení vyjednají roaming na jiné AP a pak se místo přepnutí odpojí. Jinak v Ballingově sále byla cca před půl rokem rozšířena infrastruktura na 4 AP, z nichž dva jedou na ABGN. Wifi je duchařina, a čert nám jí byl dlužen ;-) .

  7. SteamFlow says:

    Zdravim, takze jak je to s konektivitou? Je zajistena?

  8. [...] the announcement in english Lauantaina 19.3. 2011, klo 12 alkaen (sisartapahtuma Prahassa alkaa tuntia aikaisemmin) Jyväskylä, Hub Jyväskylän tilat, Hannikaisenkatu 18 (Matkakeskuksen vieressä) Tapahtuman [...]

  9. tengu53 says:

    Registroval jsem se minulý týden, ale na mail mi nedošlo žádné potvrzení. Doufám, že je vše v pohodě, nerad bych zjistil, že je plno a nejsem na seznamu…

  10. Avatar of Jiri Suchan Jiri Suchan says:

    “registrace” spociva v pouziti linku “Register” v pravem menu zde na webu bigclean nebo uz je workshop plny a kyzeny registracni formular uz zmizel? Diky za odpoved.

Leave a Comment

*