Herramientas de usuario

Herramientas del sitio


informatica:programacion:python:modulos:beautiful_soup

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
informatica:programacion:python:modulos:beautiful_soup [2024/06/14 16:26] – [Ejemplo 2: leyendo HTML de una web] tempwininformatica:programacion:python:modulos:beautiful_soup [2024/06/14 17:24] (actual) – [Recursos] tempwin
Línea 181: Línea 181:
 # Buscar un signo de dólar y lo que venga después # Buscar un signo de dólar y lo que venga después
 tags = doc.find_all(text=re.compile("\$.*")) tags = doc.find_all(text=re.compile("\$.*"))
 +</code>
 +
 +Limitar los resultados de búsqueda:
 +
 +<code python>
 +import re
 +
 +# Buscar un signo de dólar y lo que venga después
 +tags = doc.find_all(text=re.compile("\$.*"), limit=1)
 +</code>
 +
 +Búsqueda por proximidad en la estructura de árbol, por ejemplo, nodos hermanos, padre y descendientes:
 +
 +<code python>
 +from bs4 import BeautifulSoup
 +import requests
 +
 +url = "https://coinmarketcap.com/"
 +result = requests.get(url).text
 +doc = BeautifulSoup(result, "html.parser")
 +
 +tbody = doc.tbody
 +trs = tbody.contents
 +
 +print(trs[1].next_sibling)
 +
 +# Nodo padre:
 +print(trs[0].parent)
 +
 +# Descendientes
 +print(trs[0].descendants)
 +#print(trs[0].children)
 +#print(trs[0].contents)
 +</code>
 +
 +Recorrer una tabla buscando precios:
 +
 +<code python>
 +from bs4 import BeautifulSoup
 +import requests
 +
 +url = "https://coinmarketcap.com/"
 +result = requests.get(url).text
 +doc = BeautifulSoup(result, "html.parser")
 +
 +tbody = doc.tbody
 +trs = tbody.contents
 +
 +prices = {}
 +
 +for tr in trs[:10]:
 +    for td in tr.contents:
 +        name, price = tr.contents[2:4]
 +        fixed_name = name.p.string
 +        fixed_price = price.a.string
 +        
 +        prices[fixed_name] = fixed_price
 +        
 +print(prices)  
 </code> </code>
 ===== Recursos ===== ===== Recursos =====
  
   * [[https://towardsdatascience.com/top-5-beautiful-soup-functions-7bfe5a693482|Top 5 Beautiful Soup Functions That Will Make Your Life Easier]]   * [[https://towardsdatascience.com/top-5-beautiful-soup-functions-7bfe5a693482|Top 5 Beautiful Soup Functions That Will Make Your Life Easier]]
 +  * [[https://www.youtube.com/watch?v=gRLHr664tXA| Beautiful Soup 4 Tutorial #1 - Web Scraping With Python ]]
informatica/programacion/python/modulos/beautiful_soup.1718375173.txt.gz · Última modificación: por tempwin