[Python] 使用 Selenium 進行 Google 搜尋引擎的爬蟲

Last Updated on 2021-06-22 by Clay

一直以來，我都想要寫一篇爬蟲的心得文，描述下 Regular Expression、IP 設置、User-Agent ...... 等等經常會用到的各種工具或小知識。一方面是因為當初寫 Blog 的初衷便是想要紀錄下自己學習的過程、一方面則是因為現在花了很多時間進行爬蟲的工作，怕將來若是比較少做，就會慢慢淡忘現在比較熟練的爬蟲技能。

今天的心得筆記以 Google 搜尋引擎為主，使用 Python + Selenium 為主。我可以設定要查詢的關鍵字以及想要爬取的頁數，然後將抓到的標題以及網址印出來。

Selenium 的準備工作

首先，我們自然是要先安裝 "selenium" 這個套件以及 "webdriver_manager"：

pip3 install selenium
pip3 install webdriver_manager

然後我們需要安裝 Chromium 的 Driver：

sudo apt-get install chromium-driver

安裝好了以後，再多裝個 "BeautifulSoup4"。其實在我爬蟲的過程中並不是一定需要使用到 "BeautifulSoup4"，但是我這次仰賴 "BeatifulSoup4" 的 "prettify()" 印出清楚的版面再進行 Regular Expression 的處理。

pip3 install beautifulsoup4

匯入會用到的套件

首先，先把所有會使用到的套件匯入專案中。

# coding: utf-8
"""
Post the query to Google　Search and get the return results
"""
import re
import time
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

# coding: utf-8
"""
Post the query to Google　Search and get the return results
"""
import re
import time
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

設定參數

# Browser settings
chrome_options = Options()
chrome_options.add_argument('--incognito')
chrome_options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:65.0) Gecko/20100101 Firefox/65.0')
browser = webdriver.Chrome(chrome_options=chrome_options)


# Query settings
query = 'US Stock'
browser.get('https://www.google.com/search?q={}'.format(query))
next_page_times = 10

# Browser settings
chrome_options = Options()
chrome_options.add_argument('--incognito')
chrome_options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:65.0) Gecko/20100101 Firefox/65.0')
browser = webdriver.Chrome(chrome_options=chrome_options)


# Query settings
query = 'US Stock'
browser.get('https://www.google.com/search?q={}'.format(query))
next_page_times = 10

在這裡我分別進行了瀏覽器的設定、以及查詢 Query 的關鍵字設定、還有翻頁次數的設定。

chrome_options.add_argument('--incognito')

chrome_options.add_argument('--incognito')

這行指令是在使用『無痕模式』。

chrome_options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:65.0) Gecko/20100101 Firefox/65.0')

chrome_options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:65.0) Gecko/20100101 Firefox/65.0')

這行指令是在填入 User-Agent。基本上，Google Chrome 回傳的 HTML 資訊會隨著我們的 User-Agent 而改變。我後續擷取標題及網址的指令是針對我準備的這個 User-Agent 調整的。

進行爬蟲

# Crawler
for _page in range(next_page_times):
    soup = BeautifulSoup(browser.page_source, 'html.parser')
    content = soup.prettify()

    # Get titles and urls
    titles = re.findall('<h3 class="[\w\d]{6} [\w\d]{6}">\n\ +(.+)', content)
    urls = re.findall('<div class="r">\ *\n\ *<a href="(.+)" onmousedown', soup.prettify())

    for n in range(min(len(titles), len(urls))):
        print(titles[n], urls[n])

    # Wait
    time.sleep(5)

    # Turn to the next page
    try:
        browser.find_element_by_link_text('下一頁').click()
    except:
        print('Search Early Stopping.')
        browser.close()
        exit()


# Close the browser
browser.close()

# Crawler
for _page in range(next_page_times):
    soup = BeautifulSoup(browser.page_source, 'html.parser')
    content = soup.prettify()

    # Get titles and urls
    titles = re.findall('<h3 class="[\w\d]{6} [\w\d]{6}">\n\ +(.+)', content)
    urls = re.findall('<div class="r">\ *\n\ *<a href="(.+)">
    <button type="button" data-amp-original-style="float: right" class="amp-wp-e559266">COPY</button>





<p><br><br>這邊比較沒有特別需要解說的部份。基本上我使用 soup.prettify() 整理了 HTML，再透過 Regular Expression 擷取了標題以及網址。</p>



<p>重要的是，在我換頁前，我特意等待了 5 秒。根據實測，若不稍微等待一下，有時候換頁會出現問題。</p>



<p>最下面的 try-except 是在預防查詢到的頁面數量不夠的情況。比如說我指定我要翻頁 10 次、然而我搜尋引擎返回的結果一共只有 7 頁。</p>



<p>這裡展示一下回傳的結果 (一部分)。</p>



<figure class="wp-block-image size-large"><a href="https://i2.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?fit=640%2C203&ssl=1"><amp-img width="1749" height="554" src="https://i2.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?fit=640%2C203&ssl=1" alt="" class="wp-image-2976 amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" srcset="https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?w=1749&ssl=1 1749w, https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?resize=300%2C95&ssl=1 300w, https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?resize=1024%2C324&ssl=1 1024w, https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?resize=768%2C243&ssl=1 768w, https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?resize=1536%2C487&ssl=1 1536w" sizes="(max-width: 1200px) 100vw, 1200px" layout="intrinsic" disable-inline-width="" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjU1NCIgd2lkdGg9IjE3NDkiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img decoding="async" width="1749" height="554" src="https://i2.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?fit=640%2C203&ssl=1" alt="" srcset="https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?w=1749&ssl=1 1749w, https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?resize=300%2C95&ssl=1 300w, https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?resize=1024%2C324&ssl=1 1024w, https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?resize=768%2C243&ssl=1 768w, https://i0.wp.com/clay-atlas.com/wp-content/uploads/2020/04/image-28.png?resize=1536%2C487&ssl=1 1536w" sizes="(max-width: 1200px) 100vw, 1200px"></noscript></amp-img></a></figure>



<hr class="wp-block-separator has-text-color has-background has-very-dark-gray-background-color has-very-dark-gray-color is-style-wide">



<h2 class="has-text-align-center wp-block-heading">完整程式碼</h2>




<div data-amp-original-style="background: #f8f8f8; overflow:auto; width:auto; border:solid gray; border-width:.1em .1em .1em .8em; padding:.2em .5em;" class="amp-wp-460fbd1">
    <pre class="ccode amp-wp-2520aea" data-amp-original-style="margin: 0; line-height: 110%; font-size:15px;"><span></span><span data-amp-original-style="color: #408080; font-style: italic" class="amp-wp-864631f"># coding: utf-8</span>
<span data-amp-original-style="color: #BA2121; font-style: italic" class="amp-wp-aa4219f">"""</span>
<span data-amp-original-style="color: #BA2121; font-style: italic" class="amp-wp-aa4219f">Post the query to Google　Search and get the return results</span>
<span data-amp-original-style="color: #BA2121; font-style: italic" class="amp-wp-aa4219f">"""</span>
<span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">import</span> <span data-amp-original-style="color: #0000FF; font-weight: bold" class="amp-wp-4e0a5e0">re</span>
<span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">import</span> <span data-amp-original-style="color: #0000FF; font-weight: bold" class="amp-wp-4e0a5e0">time</span>
<span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">from</span> <span data-amp-original-style="color: #0000FF; font-weight: bold" class="amp-wp-4e0a5e0">bs4</span> <span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">import</span> <span class="n">BeautifulSoup</span>
<span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">from</span> <span data-amp-original-style="color: #0000FF; font-weight: bold" class="amp-wp-4e0a5e0">selenium</span> <span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">import</span> <span class="n">webdriver</span>
<span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">from</span> <span data-amp-original-style="color: #0000FF; font-weight: bold" class="amp-wp-4e0a5e0">selenium.webdriver.chrome.options</span> <span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">import</span> <span class="n">Options</span>


<span data-amp-original-style="color: #408080; font-style: italic" class="amp-wp-864631f"># Browser settings</span>
<span class="n">chrome_options</span> <span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">=</span> <span class="n">Options</span><span class="p">()</span>
<span class="n">chrome_options</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">add_argument</span><span class="p">(</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'--incognito'</span><span class="p">)</span>
<span class="n">chrome_options</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">add_argument</span><span class="p">(</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:65.0) Gecko/20100101 Firefox/65.0'</span><span class="p">)</span>
<span class="n">browser</span> <span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">=</span> <span class="n">webdriver</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">Chrome</span><span class="p">(</span><span class="n">chrome_options</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">=</span><span class="n">chrome_options</span><span class="p">)</span>


<span data-amp-original-style="color: #408080; font-style: italic" class="amp-wp-864631f"># Query settings</span>
<span class="n">query</span> <span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">=</span> <span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'US Stock'</span>
<span class="n">browser</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">get</span><span class="p">(</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'https://www.google.com/search?q=</span><span data-amp-original-style="color: #BB6688; font-weight: bold" class="amp-wp-2bd4453">{}</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">format</span><span class="p">(</span><span class="n">query</span><span class="p">))</span>
<span class="n">next_page_times</span> <span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">=</span> <span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">10</span>


<span data-amp-original-style="color: #408080; font-style: italic" class="amp-wp-864631f"># Crawler</span>
<span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">for</span> <span class="n">_page</span> <span data-amp-original-style="color: #AA22FF; font-weight: bold" class="amp-wp-511ff1e">in</span> <span data-amp-original-style="color: #008000" class="amp-wp-c449ea8">range</span><span class="p">(</span><span class="n">next_page_times</span><span class="p">):</span>
    <span class="n">soup</span> <span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">=</span> <span class="n">BeautifulSoup</span><span class="p">(</span><span class="n">browser</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">page_source</span><span class="p">,</span> <span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'html.parser'</span><span class="p">)</span>
    <span class="n">content</span> <span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">=</span> <span class="n">soup</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">prettify</span><span class="p">()</span>

    <span data-amp-original-style="color: #408080; font-style: italic" class="amp-wp-864631f"># Get titles and urls</span>
    <span class="n">titles</span> <span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">=</span> <span class="n">re</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">findall</span><span class="p">(</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'<h3 class="[\w\d]</span><span data-amp-original-style="color: #BB6688; font-weight: bold" class="amp-wp-2bd4453">{6}</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4"> [\w\d]</span><span data-amp-original-style="color: #BB6688; font-weight: bold" class="amp-wp-2bd4453">{6}</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">"></span><span data-amp-original-style="color: #BB6622; font-weight: bold" class="amp-wp-b9304d1">\n</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">\ +(.+)'</span><span class="p">,</span> <span class="n">content</span><span class="p">)</span>
    <span class="n">urls</span> <span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">=</span> <span class="n">re</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">findall</span><span class="p">(</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'<div class="r">\ *</span><span data-amp-original-style="color: #BB6622; font-weight: bold" class="amp-wp-b9304d1">\n</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">\ *<a href="(.+)" onmousedown'</span><span class="p">,</span> <span class="n">soup</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">prettify</span><span class="p">())</span>

    <span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">for</span> <span class="n">n</span> <span data-amp-original-style="color: #AA22FF; font-weight: bold" class="amp-wp-511ff1e">in</span> <span data-amp-original-style="color: #008000" class="amp-wp-c449ea8">range</span><span class="p">(</span><span data-amp-original-style="color: #008000" class="amp-wp-c449ea8">min</span><span class="p">(</span><span data-amp-original-style="color: #008000" class="amp-wp-c449ea8">len</span><span class="p">(</span><span class="n">titles</span><span class="p">),</span> <span data-amp-original-style="color: #008000" class="amp-wp-c449ea8">len</span><span class="p">(</span><span class="n">urls</span><span class="p">))):</span>
        <span data-amp-original-style="color: #008000" class="amp-wp-c449ea8">print</span><span class="p">(</span><span class="n">titles</span><span class="p">[</span><span class="n">n</span><span class="p">],</span> <span class="n">urls</span><span class="p">[</span><span class="n">n</span><span class="p">])</span>

    <span data-amp-original-style="color: #408080; font-style: italic" class="amp-wp-864631f"># Wait</span>
    <span class="n">time</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">sleep</span><span class="p">(</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">5</span><span class="p">)</span>

    <span data-amp-original-style="color: #408080; font-style: italic" class="amp-wp-864631f"># Turn to the next page</span>
    <span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">try</span><span class="p">:</span>
        <span class="n">browser</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">find_element_by_link_text</span><span class="p">(</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'下一頁'</span><span class="p">)</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">click</span><span class="p">()</span>
    <span data-amp-original-style="color: #008000; font-weight: bold" class="amp-wp-c3a47d5">except</span><span class="p">:</span>
        <span data-amp-original-style="color: #008000" class="amp-wp-c449ea8">print</span><span class="p">(</span><span data-amp-original-style="color: #BA2121" class="amp-wp-d2d15d4">'Search Early Stopping.'</span><span class="p">)</span>
        <span class="n">browser</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">close</span><span class="p">()</span>
        <span class="n">exit</span><span class="p">()</span>


<span data-amp-original-style="color: #408080; font-style: italic" class="amp-wp-864631f"># Close the browser</span>
<span class="n">browser</span><span data-amp-original-style="color: #666666" class="amp-wp-d6044fb">.</span><span class="n">close</span><span class="p">()</span>
</pre></div>
<textarea readonly id="81724708" data-amp-original-style="position:absolute;left:-9999px" class="amp-wp-a36be49"># coding: utf-8
"""
Post the query to Google　Search and get the return results
"""
import re
import time
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options


# Browser settings
chrome_options = Options()
chrome_options.add_argument('--incognito')
chrome_options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:65.0) Gecko/20100101 Firefox/65.0')
browser = webdriver.Chrome(chrome_options=chrome_options)


# Query settings
query = 'US Stock'
browser.get('https://www.google.com/search?q={}'.format(query))
next_page_times = 10


# Crawler
for _page in range(next_page_times):
    soup = BeautifulSoup(browser.page_source, 'html.parser')
    content = soup.prettify()

    # Get titles and urls
    titles = re.findall('<h3 class="[\w\d]{6} [\w\d]{6}">\n\ +(.+)', content)
    urls = re.findall('<div class="r">\ *\n\ *<a href="(.+)">
    <button type="button" data-amp-original-style="float: right" class="amp-wp-e559266">COPY</button>





<p><br><br></p>



<hr class="wp-block-separator has-text-color has-background has-very-dark-gray-background-color has-very-dark-gray-color is-style-wide">



<h2 class="has-text-align-center wp-block-heading">References</h2>



<ul class="wp-block-list"><li><a href="https://pypi.org/project/selenium/">https://pypi.org/project/selenium/</a></li><li><a href="https://pypi.org/project/beautifulsoup4/">https://pypi.org/project/beautifulsoup4/</a></li></ul>



<hr class="wp-block-separator has-text-color has-background has-very-dark-gray-background-color has-very-dark-gray-color is-style-wide">



<h2 class="has-text-align-center wp-block-heading">Read More</h2>



<ul class="wp-block-list"><li><a href="https://clay-atlas.com/blog/2020/02/11/python-chinese-tutorial-package-pytrends-goolge-trends/?amp=1">在 Python 中使用 pytrends 獲取 Google 搜尋趨勢的結果</a></li><li><a href="https://clay-atlas.com/blog/2019/10/22/%e4%bd%bf%e7%94%a8-google_images_download-%e6%89%b9%e9%87%8f%e4%b8%8b%e8%bc%89-google-%e5%9c%96%e7%89%87/?amp=1">使用 google_images_download 批量下載 Google 圖片</a></li><li><a href="https://clay-atlas.com/blog/2019/10/14/python-chinese-tutorial-googlenews-package/?amp=1">GoogleNews —— 輕鬆拿到 Google News 新聞的 Python 套件</a></li></ul>
<div class="sharedaddy sd-sharing-enabled"><div class="robots-nocontent sd-block sd-social sd-social-icon sd-sharing"><h3 class="sd-title">分享此文：</h3><div class="sd-content"><ul><li class="share-twitter"><a rel="nofollow noopener noreferrer" data-shared="sharing-twitter-2975" class="share-twitter sd-button share-icon no-text" href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?share=twitter&amp=1" target="_blank" aria-labelledby="sharing-twitter-2975">
				<span id="sharing-twitter-2975" hidden>按一下即可分享至 X(在新視窗中開啟)</span>
				<span>X</span>
			</a></li><li class="share-facebook"><a rel="nofollow noopener noreferrer" data-shared="sharing-facebook-2975" class="share-facebook sd-button share-icon no-text" href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?share=facebook&amp=1" target="_blank" aria-labelledby="sharing-facebook-2975">
				<span id="sharing-facebook-2975" hidden>按一下以分享至 Facebook(在新視窗中開啟)</span>
				<span>Facebook</span>
			</a></li><li class="share-linkedin"><a rel="nofollow noopener noreferrer" data-shared="sharing-linkedin-2975" class="share-linkedin sd-button share-icon no-text" href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?share=linkedin&amp=1" target="_blank" aria-labelledby="sharing-linkedin-2975">
				<span id="sharing-linkedin-2975" hidden>分享到 LinkedIn(在新視窗中開啟)</span>
				<span>LinkedIn</span>
			</a></li><li class="share-reddit"><a rel="nofollow noopener noreferrer" data-shared="sharing-reddit-2975" class="share-reddit sd-button share-icon no-text" href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?share=reddit&amp=1" target="_blank" aria-labelledby="sharing-reddit-2975">
				<span id="sharing-reddit-2975" hidden>分享到 Reddit(在新視窗中開啟)</span>
				<span>Reddit</span>
			</a></li></ul></div></div></div>
</a></div><div class="nv-tags-list"><span>Tags:</span><a href="https://clay-atlas.com/blog/tag/python/?amp=1" title="Python" class="python" rel="tag">Python</a><a href="https://clay-atlas.com/blog/tag/python-packages/?amp=1" title="Python Packages" class="python-packages" rel="tag">Python Packages</a> </div> 
<div id="comments" class="comments-area">
				<div class="nv-comments-wrap">

				<div class="nv-comments-title-wrap">
					<h2 class="comments-title">6 thoughts on “[Python] 使用 Selenium 進行 Google 搜尋引擎的爬蟲”</h2>				</div>

				<ol class="nv-comments-list">
									<li class="comment even thread-even depth-1" id="comment-item-844">
					<article id="comment-844" class="nv-comment-article">
						<div class="nv-comment-avatar">
					<figure data-amp-lightbox="true">
						<amp-img alt="" src="https://secure.gravatar.com/avatar/4c6ed1a0d447d2caab250571c1da3fd6e72368752ddd1f4078797fa544b90d65?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/4c6ed1a0d447d2caab250571c1da3fd6e72368752ddd1f4078797fa544b90d65?s=100&d=retro&r=g 2x" class="avatar avatar-50 photo amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" height="50" width="50" data-amp-lightbox="" lightbox="" layout="intrinsic" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjUwIiB3aWR0aD0iNTAiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img alt="" src="https://secure.gravatar.com/avatar/4c6ed1a0d447d2caab250571c1da3fd6e72368752ddd1f4078797fa544b90d65?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/4c6ed1a0d447d2caab250571c1da3fd6e72368752ddd1f4078797fa544b90d65?s=100&d=retro&r=g 2x" height="50" width="50" loading="lazy" decoding="async"></noscript></amp-img>
						<figcaption>
							
						</figcaption>
					</figure>
				</div><div class="comment-content">						<div class="nv-comment-header">
							<div class="comment-author vcard">
								<span class="fn author"><a href="#!" class="url" rel="ugc external nofollow">Stan</a></span>
								<a href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?amp=1#comment-844">
									<time class="entry-date published" datetime="2020-10-06T08:29:55+00:00" content="2020-10-06">
										2020-10-06 at 08:29									</time>
								</a>
							</div>
									<div class="edit-reply">
						<span class="nv-reply-link"><a rel="nofollow" class="comment-reply-link" href="#comment-844" data-commentid="844" data-postid="2975" data-belowelement="comment-844" data-respondelement="respond" data-replyto="回覆給「Stan」" aria-label="回覆給「Stan」">Reply</a></span>		</div>
								</div>
						<div class="nv-comment-content comment nv-content-wrap">
							<p>想請教一下版主我有試跑您的程式碼但沒有產出像您一樣的output （應該是說沒有outpu出現），問題會是是我需要自己改成我goole裡網頁 class的位置嗎？ 還是有哪邊我沒注意到，謝謝。(最近剛接觸python 自學爬蟲，很多不懂有問到白癡問題請見諒）</p>
													</div>
						</div>					</article>
				</li>
				<li class="children" role="listitem"><ol>				<li class="comment byuser comment-author-ccs96307 bypostauthor odd alt depth-2" id="comment-item-847">
					<article id="comment-847" class="nv-comment-article">
						<div class="nv-comment-avatar">
					<figure data-amp-lightbox="true">
						<amp-img alt="" src="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=100&d=retro&r=g 2x" class="avatar avatar-50 photo amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" height="50" width="50" data-amp-lightbox="" lightbox="" layout="intrinsic" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjUwIiB3aWR0aD0iNTAiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img alt="" src="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=100&d=retro&r=g 2x" height="50" width="50" loading="lazy" decoding="async"></noscript></amp-img>
						<figcaption>
							ccs96307
						</figcaption>
					</figure>
				</div><div class="comment-content">						<div class="nv-comment-header">
							<div class="comment-author vcard">
								<span class="fn author"><a href="#!" class="url" rel="ugc external nofollow">ccs96307</a></span>
								<a href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?amp=1#comment-847">
									<time class="entry-date published" datetime="2020-10-06T13:57:57+00:00" content="2020-10-06">
										2020-10-06 at 13:57									</time>
								</a>
							</div>
									<div class="edit-reply">
						<span class="nv-reply-link"><a rel="nofollow" class="comment-reply-link" href="#comment-847" data-commentid="847" data-postid="2975" data-belowelement="comment-847" data-respondelement="respond" data-replyto="回覆給「ccs96307」" aria-label="回覆給「ccs96307」">Reply</a></span>		</div>
								</div>
						<div class="nv-comment-content comment nv-content-wrap">
							<p>您好，很高興認識您。<br>
剛開始爬蟲遇到問題是很正常的，不如說您肯主動詢問，我真該多多向您學習。</p>
<p>如果程式能跑、沒有報錯訊息，只是沒有任何返回結果的話，那應該是因為 Google Chrome 網頁經過改版，網頁原始碼已經與當初寫下這篇文章時不同了。<br>
最重要的就是我查找『網頁名稱』與『網址』那裡的正規表示式（Regular Expression）已經不適用於這個網頁。<br>
您可能需要自己改寫匹配的規則，才能返回當前瀏覽器版本的查詢結果。</p>
<p>在我的裝置上，我將以下程式碼：</p>
<p><amp-img src="https://clay-atlas.com/wp-content/uploads/2020/10/1.png" alt="before" width="1470" height="161" class="amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" layout="intrinsic" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjE2MSIgd2lkdGg9IjE0NzAiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img src="https://clay-atlas.com/wp-content/uploads/2020/10/1.png" alt="before" width="1470" height="161"></noscript></amp-img></p>
<p>更改為：</p>
<p><amp-img src="https://clay-atlas.com/wp-content/uploads/2020/10/2.png" alt="after" width="1489" height="169" class="amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" layout="intrinsic" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjE2OSIgd2lkdGg9IjE0ODkiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img src="https://clay-atlas.com/wp-content/uploads/2020/10/2.png" alt="after" width="1489" height="169"></noscript></amp-img></p>
<p>之後，我的程式就又能返回查詢結果了。</p>
<p><amp-img src="https://clay-atlas.com/wp-content/uploads/2020/10/DeepinScreenshot_select-area_20201006215429.png" alt="chrome search results" width="1115" height="244" class="amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" layout="intrinsic" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjI0NCIgd2lkdGg9IjExMTUiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img src="https://clay-atlas.com/wp-content/uploads/2020/10/DeepinScreenshot_select-area_20201006215429.png" alt="chrome search results" width="1115" height="244"></noscript></amp-img></p>
<p>所以我推測是瀏覽器更新造成，也需要隨時更新匹配程式碼。</p>
													</div>
						</div>					</article>
				</li>
				</ol></li>				<li class="comment even thread-odd thread-alt depth-1" id="comment-item-1273">
					<article id="comment-1273" class="nv-comment-article">
						<div class="nv-comment-avatar">
					<figure data-amp-lightbox="true">
						<amp-img alt="" src="https://secure.gravatar.com/avatar/e27587c10ad7819c0b61e02bb56f2ed9b8ade3cbdd0d4460a54180d4db89ffca?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/e27587c10ad7819c0b61e02bb56f2ed9b8ade3cbdd0d4460a54180d4db89ffca?s=100&d=retro&r=g 2x" class="avatar avatar-50 photo amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" height="50" width="50" data-amp-lightbox="" lightbox="" layout="intrinsic" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjUwIiB3aWR0aD0iNTAiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img alt="" src="https://secure.gravatar.com/avatar/e27587c10ad7819c0b61e02bb56f2ed9b8ade3cbdd0d4460a54180d4db89ffca?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/e27587c10ad7819c0b61e02bb56f2ed9b8ade3cbdd0d4460a54180d4db89ffca?s=100&d=retro&r=g 2x" height="50" width="50" loading="lazy" decoding="async"></noscript></amp-img>
						<figcaption>
							
						</figcaption>
					</figure>
				</div><div class="comment-content">						<div class="nv-comment-header">
							<div class="comment-author vcard">
								<span class="fn author"><a href="#!" class="url" rel="ugc external nofollow">菜雞</a></span>
								<a href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?amp=1#comment-1273">
									<time class="entry-date published" datetime="2020-12-09T01:56:50+00:00" content="2020-12-09">
										2020-12-09 at 01:56									</time>
								</a>
							</div>
									<div class="edit-reply">
						<span class="nv-reply-link"><a rel="nofollow" class="comment-reply-link" href="#comment-1273" data-commentid="1273" data-postid="2975" data-belowelement="comment-1273" data-respondelement="respond" data-replyto="回覆給「菜雞」" aria-label="回覆給「菜雞」">Reply</a></span>		</div>
								</div>
						<div class="nv-comment-content comment nv-content-wrap">
							<p>今天2020/12/9，chrome好像前幾天又改版了，<br>
這次是url那段<a>多了一段data-ved=…..，修改後就可以get到了，因為小弟是菜雞，所以不敢把code貼上來，<br>
若c大有空再麻煩幫我驗證一下我說的是否正確^^</a></p>
													</div>
						</div>					</article>
				</li>
				<li class="children" role="listitem"><ol>				<li class="comment byuser comment-author-ccs96307 bypostauthor odd alt depth-2" id="comment-item-1279">
					<article id="comment-1279" class="nv-comment-article">
						<div class="nv-comment-avatar">
					<figure data-amp-lightbox="true">
						<amp-img alt="" src="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=100&d=retro&r=g 2x" class="avatar avatar-50 photo amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" height="50" width="50" data-amp-lightbox="" lightbox="" layout="intrinsic" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjUwIiB3aWR0aD0iNTAiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img alt="" src="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=100&d=retro&r=g 2x" height="50" width="50" loading="lazy" decoding="async"></noscript></amp-img>
						<figcaption>
							ccs96307
						</figcaption>
					</figure>
				</div><div class="comment-content">						<div class="nv-comment-header">
							<div class="comment-author vcard">
								<span class="fn author"><a href="#!" class="url" rel="ugc external nofollow">ccs96307</a></span>
								<a href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?amp=1#comment-1279">
									<time class="entry-date published" datetime="2020-12-09T13:47:48+00:00" content="2020-12-09">
										2020-12-09 at 13:47									</time>
								</a>
							</div>
									<div class="edit-reply">
						<span class="nv-reply-link"><a rel="nofollow" class="comment-reply-link" href="#comment-1279" data-commentid="1279" data-postid="2975" data-belowelement="comment-1279" data-respondelement="respond" data-replyto="回覆給「ccs96307」" aria-label="回覆給「ccs96307」">Reply</a></span>		</div>
								</div>
						<div class="nv-comment-content comment nv-content-wrap">
							<p>哦哦，感謝告知！<br>
最近比較忙，可能比較少時間測試這方面的東西。</p>
<p>不過上方我回覆說可能是 Chrome 更新導致網頁原始碼不同，其實 Google 搜尋引擎每年也會經歷過大大小小好幾次的改版，只是不一定會通知我們使用者。</p>
<p>這或許也是導致時常網頁原始碼不同的緣故，這方面就希望有高手大神能幫忙解說了 =D</p>
													</div>
						</div>					</article>
				</li>
				<li class="children" role="listitem"><ol>				<li class="comment even depth-3" id="comment-item-1308">
					<article id="comment-1308" class="nv-comment-article">
						<div class="nv-comment-avatar">
					<figure data-amp-lightbox="true">
						<amp-img alt="" src="https://secure.gravatar.com/avatar/e27587c10ad7819c0b61e02bb56f2ed9b8ade3cbdd0d4460a54180d4db89ffca?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/e27587c10ad7819c0b61e02bb56f2ed9b8ade3cbdd0d4460a54180d4db89ffca?s=100&d=retro&r=g 2x" class="avatar avatar-50 photo amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" height="50" width="50" data-amp-lightbox="" lightbox="" layout="intrinsic" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjUwIiB3aWR0aD0iNTAiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img alt="" src="https://secure.gravatar.com/avatar/e27587c10ad7819c0b61e02bb56f2ed9b8ade3cbdd0d4460a54180d4db89ffca?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/e27587c10ad7819c0b61e02bb56f2ed9b8ade3cbdd0d4460a54180d4db89ffca?s=100&d=retro&r=g 2x" height="50" width="50" loading="lazy" decoding="async"></noscript></amp-img>
						<figcaption>
							
						</figcaption>
					</figure>
				</div><div class="comment-content">						<div class="nv-comment-header">
							<div class="comment-author vcard">
								<span class="fn author"><a href="#!" class="url" rel="ugc external nofollow">菜雞</a></span>
								<a href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?amp=1#comment-1308">
									<time class="entry-date published" datetime="2020-12-11T07:25:23+00:00" content="2020-12-11">
										2020-12-11 at 07:25									</time>
								</a>
							</div>
									<div class="edit-reply">
						<span class="nv-reply-link"><a rel="nofollow" class="comment-reply-link" href="#comment-1308" data-commentid="1308" data-postid="2975" data-belowelement="comment-1308" data-respondelement="respond" data-replyto="回覆給「菜雞」" aria-label="回覆給「菜雞」">Reply</a></span>		</div>
								</div>
						<div class="nv-comment-content comment nv-content-wrap">
							<p>想請教c大或其他高手要如何取得搜尋結果完整的”摘要”，因為當摘要匹配到關鍵字會多一個<em>，用findall我只能抓到部分摘要，沒法抓到完整摘要，不知有沒有高手有試過…謝謝</em></p>
													</div>
						</div>					</article>
				</li>
				</ol></li></ol></li>				<li class="comment byuser comment-author-ccs96307 bypostauthor odd alt thread-even depth-1" id="comment-item-1310">
					<article id="comment-1310" class="nv-comment-article">
						<div class="nv-comment-avatar">
					<figure data-amp-lightbox="true">
						<amp-img alt="" src="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=100&d=retro&r=g 2x" class="avatar avatar-50 photo amp-wp-enforced-sizes i-amphtml-layout-intrinsic i-amphtml-layout-size-defined" height="50" width="50" data-amp-lightbox="" lightbox="" layout="intrinsic" i-amphtml-layout="intrinsic"><i-amphtml-sizer slot="i-amphtml-svc" class="i-amphtml-sizer"><img alt="" aria-hidden="true" class="i-amphtml-intrinsic-sizer" role="presentation" src="data:image/svg+xml;base64,PHN2ZyBoZWlnaHQ9IjUwIiB3aWR0aD0iNTAiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgdmVyc2lvbj0iMS4xIi8+"></i-amphtml-sizer><noscript><img alt="" src="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=50&d=retro&r=g" srcset="https://secure.gravatar.com/avatar/018d9e77da1e605813e70dba4b9b9a1f8eae8462a8cad76dbfd86b5f5b04163a?s=100&d=retro&r=g 2x" height="50" width="50" loading="lazy" decoding="async"></noscript></amp-img>
						<figcaption>
							ccs96307
						</figcaption>
					</figure>
				</div><div class="comment-content">						<div class="nv-comment-header">
							<div class="comment-author vcard">
								<span class="fn author"><a href="#!" class="url" rel="ugc external nofollow">ccs96307</a></span>
								<a href="https://clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?amp=1#comment-1310">
									<time class="entry-date published" datetime="2020-12-11T08:18:12+00:00" content="2020-12-11">
										2020-12-11 at 08:18									</time>
								</a>
							</div>
									<div class="edit-reply">
						<span class="nv-reply-link"><a rel="nofollow" class="comment-reply-link" href="#comment-1310" data-commentid="1310" data-postid="2975" data-belowelement="comment-1310" data-respondelement="respond" data-replyto="回覆給「ccs96307」" aria-label="回覆給「ccs96307」">Reply</a></span>		</div>
								</div>
						<div class="nv-comment-content comment nv-content-wrap">
							<p>抱歉，我有點沒看明白匹配到關鍵字多一個的意思@@<br>
不知道有沒有什麼範例呢？</p>
													</div>
						</div>					</article>
				</li>
								</ol>

			</div>

			
		<div id="respond" class="comment-respond">
			<h3 id="reply-title" class="comment-reply-title">Leave a Reply<small><a rel="nofollow" id="cancel-comment-reply-link" href="/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?amp=1#respond" data-amp-original-style="display:none;" class="amp-wp-93b8ea5">取消回覆</a></small></h3>			<form id="commentform" class="comment-form" method="get" action="//clay-atlas.com/blog/2020/04/21/python-cn-packages-selenium-beautifulsoup4/?amp=1" target="_top">
				<amp-iframe title="留言表單" src="https://jetpack.wordpress.com/jetpack-comment/?blogid=164929906&postid=2975&comment_registration=0&require_name_email=0&stc_enabled=0&stb_enabled=0&show_avatars=1&avatar_default=retro&greeting=Leave+a+Reply&jetpack_comments_nonce=ef359e8714&greeting_reply=%E5%B0%8D+%25s+%E7%99%BC%E8%A1%A8%E8%BF%B4%E9%9F%BF&color_scheme=light&lang=zh_TW&jetpack_version=14.6&iframe_unique_id=1&show_cookie_consent=10&has_cookie_consent=0&is_current_user_subscribed=0&token_key=%3Bnormal%3B&sig=2f203ab0d017a34f0cc167316c001f4df0298fe9#parent=https%3A%2F%2Fclay-atlas.com%2Fblog%2F2020%2F04%2F21%2Fpython-cn-packages-selenium-beautifulsoup4%2F%3Famp%3D1" resizable="" layout="fixed-height" height="430" class="jetpack_remote_comment i-amphtml-layout-fixed-height i-amphtml-layout-size-defined" id="jetpack_remote_comment" sandbox="allow-same-origin allow-top-navigation allow-scripts allow-forms allow-popups" style="height:430px" i-amphtml-layout="fixed-height"><span placeholder="" class="amp-wp-iframe-placeholder"></span><button overflow>顯示更多</button><noscript><iframe title="留言表單" src="https://jetpack.wordpress.com/jetpack-comment/?blogid=164929906&postid=2975&comment_registration=0&require_name_email=0&stc_enabled=0&stb_enabled=0&show_avatars=1&avatar_default=retro&greeting=Leave+a+Reply&jetpack_comments_nonce=ef359e8714&greeting_reply=%E5%B0%8D+%25s+%E7%99%BC%E8%A1%A8%E8%BF%B4%E9%9F%BF&color_scheme=light&lang=zh_TW&jetpack_version=14.6&iframe_unique_id=1&show_cookie_consent=10&has_cookie_consent=0&is_current_user_subscribed=0&token_key=%3Bnormal%3B&sig=2f203ab0d017a34f0cc167316c001f4df0298fe9#parent=https%3A%2F%2Fclay-atlas.com%2Fblog%2F2020%2F04%2F21%2Fpython-cn-packages-selenium-beautifulsoup4%2F%3Famp%3D1" resizable height="430" sandbox="allow-same-origin allow-top-navigation allow-scripts allow-forms allow-popups">
											
									</iframe></noscript></amp-iframe>
							</form>
		</div>

		
		<input type="hidden" name="comment_parent" id="comment_parent" value="">

		</div>
			
					</h3>