BeautifulSoup 模块

项目选择

通过id选择,方法与使用jQuery类似,但是因为id是唯一的,可以直接使用。如:

items = soup.select('#message')[0]
print str(items)

通过label选择;

items = soup.select('h1')
print str(items)

通过class选择;

items = soup.select('.message')
print str(items)

取出属性值:

items = soup.select('.headline h1 a')[0]['href']
print str(items)

组合选择器:即以上三种,按父子关系,按顺序选择。如:

items = soup.select('#message p .level')
print str(items)

获取内容

通过.text方法获取标签内容。

for v in items:
    print v.text.strip()

results matching ""

    No results matching ""