informatica:programacion:python:web_scraping:drae
¡Esta es una revisión vieja del documento!
Web Scraping: DRAE
Ejercicio de Web Scraping utilizando Python para obtener definiciones de la web del diccionario de la Real Academia Española.
La URL destino tiene la forma https://dle.rae.es/PALABRA, donde PALABRA es la palabra a definir.
from bs4 import BeautifulSoup import requests palabra = "conticinio" url = "https://dle.rae.es/" res = requests.get(url + palabra) # Nos aseguramos de que no ha habido errores al descargar la web anterior res.raise_for_status() soup = BeautifulSoup(res.text, "html.parser") # Se crea un objeto 'BeautifulSoup' donde se podrán hacer búsquedas # utilizando selectores CSS, por ejemplo: elementos = soup.select('.j') len(elementos) # Eliminamos el HTML quedándonos solo con el texto: # elementos[0].text # Quitamos también saltos de línea y espacios: # elementos[0].text.strip()
informatica/programacion/python/web_scraping/drae.1621620381.txt.gz · Última modificación: por tempwin
