BeautifulSoup 模块
项目选择
通过id选择,方法与使用jQuery类似,但是因为id是唯一的,可以直接使用。如:
items = soup.select('#message')[0]
print str(items)
通过label选择;
items = soup.select('h1')
print str(items)
通过class选择;
items = soup.select('.message')
print str(items)
取出属性值:
items = soup.select('.headline h1 a')[0]['href']
print str(items)
组合选择器:即以上三种,按父子关系,按顺序选择。如:
items = soup.select('#message p .level')
print str(items)
获取内容
通过.text方法获取标签内容。
for v in items:
print v.text.strip()