Mysql
 sql >> Base de Dados >  >> RDS >> Mysql

Acesso a uma tabela específica na tag html


Parece que o problema com o código do alecxe é que ele retorna uma tabela que é irmã direta de h2, mas a que você quer está dentro de uma div (que é irmã de h2). Isso funcionou para mim:
import requests
from bs4 import BeautifulSoup

urls = [
    'https://www.hl7.org/fhir/valueset-account-status.html',
    'https://www.hl7.org/fhir/valueset-activity-reason.html',
    'https://www.hl7.org/fhir/valueset-age-units.html'
]


def extract_table(url):
    r = requests.get(url)
    soup = BeautifulSoup(r.content, 'lxml')

    h2 = soup.find(lambda elm: elm.name == 'h2' and 'Content Logical Definition' in elm.text)
    div = h2.find_next_sibling('div')
    return div.find('table')


for url in urls:
    print extract_table(url)