informatica:programacion:python:web_scraping
Diferencias
Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
| informatica:programacion:python:web_scraping [2021/05/22 12:16] – [Descargar ficheros] tempwin | informatica:programacion:python:web_scraping [2022/01/15 16:26] (actual) – [Recursos] tempwin | ||
|---|---|---|---|
| Línea 138: | Línea 138: | ||
| * [[https:// | * [[https:// | ||
| * [[https:// | * [[https:// | ||
| + | |||
| + | Hay una tercera posibilidad que es **Scrapy**, que es ya todo un framework para navegar por páginas, extraer información y moverse por las diferentes páginas de un mismo sitio. | ||
| + | |||
| + | La ventaja de Beautiful Soup frente a lxml es poder movernos por elementos sin conocer su id o clase, solo con tener un punto de partida. Ejemplos de esto es el método '' | ||
| Es necesario instalar BeautifulSoup: | Es necesario instalar BeautifulSoup: | ||
| Línea 259: | Línea 263: | ||
| * [[https:// | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
informatica/programacion/python/web_scraping.1621678591.txt.gz · Última modificación: por tempwin
