fix:ptt debug

d7796167 · liyang · ad694283 · d7796167 · d7796167
Commit d7796167 authored Jul 27, 2023 by liyang
Hide whitespace changes
Inline Side-by-side

Showing with 20 additions and 14 deletions

pc_ptt.py pc_ptt.py +3 -2

test.py test.py +17 -12

No files found.
--- a/pc_ptt.py
+++ b/pc_ptt.py
@@ -39,8 +39,9 @@ def reptile(browser=None, search_word=""):
    # 打开网页
    browser.get(url)
    # log.debug("已打开浏览器")
-    classify_item_list = browser.find_elements('xpath', "//div[@class='board-class']")
+    item_list = browser.find_elements('xpath', "//div[@class='board-class']")
    # log.debug(classify_item_list)
+    classify_item_list = item_list.copy()
    length = len(classify_item_list)
    for index in range(length):
        # 暂时先爬取 第2个 分类
@@ -209,7 +210,7 @@ def reptile(browser=None, search_word=""):
                browser.back()
            time.sleep(0.1)
            # 重新获取
-            classify_item_list = browser.find_elements('xpath', "//div[@class='board-class']")
+            # classify_item_list = browser.find_elements('xpath', "//div[@class='board-class']")
    # 发送爬取数据到java服务
    # print('----------------------')

--- a/test.py
+++ b/test.py
-# set options to be headless, ..
+classify_item_list = browser.find_elements('xpath', "//div[@class='board-class']")
-from selenium import webdriver
+# log.debug(classify_item_list)
-options = webdriver.ChromeOptions()
+length = len(classify_item_list)
-options.add_argument('--headless')
+for index in range(length):
-options.add_argument('--no-sandbox')
+    # 暂时先爬取 第2个 分类
-options.add_argument('--disable-dev-shm-usage')
+    if 0 <= index < 4:
+        type_title = classify_item_list[index].text
-# open it, go to a website, and get results
+        classify_item_list[index].click()
-wd = webdriver.Chrome(options=options)
+        time.sleep(0.1)
-wd.get("https://www.youtube.com/results?search_query=俄乌战争")
+        for index_two in range(length_two):
+            print(element_list[index_two].text)
-print(wd.page_source)  # results
+        # 浏览器返回上一页
\ No newline at end of file
+        browser.back()
+        if index == 0:
+            browser.back()
+        time.sleep(0.1)
+        classify_item_list = browser.find_elements('xpath', "//div[@class='board-class']")
\ No newline at end of file