.header和.content, soup.findAll('h1'), soup.findAll('h1')[0],大概是什麼意思?
David HaJul 27, 2019header 是目前webdriver 的http response 的字串,就是你目前去的網站回覆你的瀏覽的一些meta data,對web scraping 的影響不大因爲他並非我們要抓的東西甚至寫網頁的人也很少會特意改這個東西,所以他很多時候都只是default 我http response 字串 。至於content就是實際的html source code,也就是要用tag 去拆取有用的資料的來源。例如findall(‘h1’)大概意思就是要在content裡找出所有h1 tag部分的意思
header 是目前webdriver 的http response 的字串,就是你目前去的網站回覆你的瀏覽的一些meta data,對web scraping 的影響不大因爲他並非我們要抓的東西甚至寫網頁的人也很少會特意改這個東西,所以他很多時候都只是default 我http response 字串 。至於content就是實際的html source code,也就是要用tag 去拆取有用的資料的來源。例如findall(‘h1’)大概意思就是要在content裡找出所有h1 tag部分的意思