Herramientas de usuario

Herramientas del sitio


informatica:programacion:python:web_scraping:drae

Web Scraping: DRAE

Ejercicio de Web Scraping utilizando Python para obtener definiciones de la web del diccionario de la Real Academia Española.

Módulos de Python necesarios:

La URL destino tiene la forma https://dle.rae.es/PALABRA, donde PALABRA es la palabra a definir.

from bs4 import BeautifulSoup
import requests
 
palabra = "cálculo"
url = "https://dle.rae.es/"
 
res = requests.get(url + palabra)
 
# Nos aseguramos de que no ha habido errores al descargar la web anterior
res.raise_for_status()
 
soup = BeautifulSoup(res.text, "html.parser")
 
# Se crea un objeto 'BeautifulSoup' donde se podrán hacer búsquedas
# utilizando selectores CSS, por ejemplo:
elementos = soup.select('.j')
 
elementos = soup.find_all("p", attrs={"class": "j"})
 
for i in elementos:
    print(i.text)

Ejemplo de salida:

1. m. Cómputo que se hace de algo por medio de operaciones matemáticas.
2. m. conjetura.
3. m. Concreción anormal que se forma en la vejiga de la orina y también en la de la bilis, en los riñones y en las glándulas salivales, y cuya expulsión ocasiona accesos de cólicos nefríticos o hepáticos, según los casos.
informatica/programacion/python/web_scraping/drae.txt · Última modificación: por tempwin