•  

ScraperWiki

A session at Hacks/Hackers Media Party

  • thomas levine

Friday 31st August, 2012

2:00pm to 7:00pm (CMT)

Taller 17: De la web al spreadsheet ¿Para qué sirve Scraper Wiki?
Tiene problemas extrayendo y limpiando información de fuentes sucias como la web. Esta sesión te mostrará cómo acercarte a estos procesos de limpieza de datos. Este workshop responderá estas preguntas sobre scraping desde la web y proyectos de limpieza de datos en general. * Qué hace a un proyecto fácil o difícil. Cómo manejo la complejidad. Qué parte hago primero. Dónde debo guardar la información que extraigo. Si tengo tiempo discusiremos otras curiosidades. Qué otra información puedo extraer de documentos. Cómo encuentro gente que me ayude a escrapear documentos. Por qué una API es diferente de otros proyectos. Este workshop es para “todos” incluyendo gente que le tiene miedo a las computadoras. Thomas Levine, de Nueva York, es un científico de datos de ScraperWiki y socio de Whitby Group. Tiene conocimientos en ergonomía, con particular interés en el uso de computadoras y baños. Es autor de DumpTruck y Urchin. Su color favorito es el rosa.

Hosted by Thomas Levine Scraper Wiki
https://scraperwiki.com/

Workshop 17: Web-scrapers and other data-cleaning projects
Do you have trouble extracting and cleaning data from messy sources like the web? This workshop will answer questions about web-scraping and data-cleaning projects such as: What makes a data-cleaning project easy or hard? How do I manage complexity? What do I do first? Where should I store data that I extract? If we have time, we'll also discuss other curiosities, such as: What sorts of information can we derive from text documents? How do I find people to help with web-scraping and other data-cleaning projects? How is an API different from other projects? What organizational processes can we automate with a computer? This workshop is for **everyone**, including people who are afraid of computers. The presenter, Thomas Levine, is a New York-based data scientist at ScraperWiki and a partner at Whitby Group. He has a background in ergonomics, with particular interests in computers and toilets. He authored DumpTruck and Urchin. His favorite color is pink.
Hosted by Thomas Levine Scraper Wiki
https://scraperwiki.com/

About the speaker

This person is speaking at this event.
thomas levine

Sign in to add slides, notes or videos to this session

Tell your friends!

When

Time 2:00pm7:00pm CMT

Date Fri 31st August 2012

Where

Antesala, Ciudad Cultural Konex

Short URL

lanyrd.com/sxwyf

Official session page

scraperwiki.com

View the schedule

Share

See something wrong?

Report an issue with this session