Herramientas de usuario

Herramientas del sitio


informatica:programacion:python:web_scraping:drae

¡Esta es una revisión vieja del documento!


Web Scraping: DRAE

Ejercicio de Web Scraping utilizando Python para obtener definiciones de la web del diccionario de la Real Academia Española.

Módulos de Python necesarios:

La URL destino tiene la forma https://dle.rae.es/PALABRA, donde PALABRA es la palabra a definir.

from bs4 import BeautifulSoup
import requests
 
palabra = "programación"
url = "https://dle.rae.es/"
 
res = requests.get(url + palabra)
 
# Nos aseguramos de que no ha habido errores al descargar la web anterior
res.raise_for_status()
 
soup = BeautifulSoup(res.text, "html.parser")
 
# Se crea un objeto 'BeautifulSoup' donde se podrán hacer búsquedas
# utilizando selectores CSS, por ejemplo:
elementos = soup.select('.j')
 
elementos = soup.find_all("p", attrs={"class": "j"})
 
for i in elementos:
    print(i.text)

Ejemplo de salida:

1. f. Unidad lingüística, dotada generalmente de significado, que se separa de las demás mediante pausas potenciales en la pronunciación y blancos en la escritura.
2. f. Representación gráfica de la palabra hablada.
3. f. Facultad de hablar.
4. f. Aptitud oratoria.
5. f. Empeño que hace alguien de su fe y probidad en testimonio de lo que afirma.
6. f. Promesa u oferta.
7. f. Derecho, turno para hablar en las asambleas políticas y otras corporaciones. Pedir, conceder, tener, retirar la palabra; hacer uso de la palabra.
8. f. Ninguna cosa. U. en construcciones negativas. No logré entender palabra. Se fue sin decir palabra.
9. f. signo (‖ configuración ejecutada con las manos).
10. f. desus. Dicho, razón, sentencia, parábola.
11. f. desus. Timbre de la voz.
14. interj. desus. Era u. para llamar a alguien a conversación.
informatica/programacion/python/web_scraping/drae.1621621147.txt.gz · Última modificación: por tempwin