抓取豆瓣主页的所有超链接

from urllib.request import urlopen#用于获取网页

from bs4 import BeautifulSoup#用于解析网页

 

html = urlopen('https://www.douban.com/')

bsObj = BeautifulSoup(html, 'html.parser')

t1 = bsObj.find_all('a')

for t2 in t1:

    t3 = t2.get('href')

    print(t3)

=======================================

 

抓取图片连接

from urllib.request import urlopen#用于获取网页

from bs4 import BeautifulSoup#用于解析网页

 

html = urlopen('https://www.douban.com/')

bsObj = BeautifulSoup(html, 'html.parser')

t1 = bsObj.find_all('img')

for t2 in t1:

    t3 = t2.get('src')

    print(t3)

 

大陸python 論壇 https://so.csdn.net/so/search/s.do?q=python&t=blog

創作者介紹

不會的就放這邊

阿倫 發表在 痞客邦 留言(0) 人氣()