BeautifulSoup 模块
项目选择
通过id
选择,方法与使用jQuery
类似,但是因为id
是唯一的,可以直接使用。如:
items = soup.select('#message')[0]
print str(items)
通过label
选择;
items = soup.select('h1')
print str(items)
通过class
选择;
items = soup.select('.message')
print str(items)
取出属性值:
items = soup.select('.headline h1 a')[0]['href']
print str(items)
组合选择器:即以上三种,按父子关系,按顺序选择。如:
items = soup.select('#message p .level')
print str(items)
获取内容
通过.text
方法获取标签内容。
for v in items:
print v.text.strip()