diff --git a/proxypool/getter.py b/proxypool/getter.py index cb99766..b9906c6 100644 --- a/proxypool/getter.py +++ b/proxypool/getter.py @@ -35,7 +35,7 @@ def crawl_ip181(self): html = get_page(start_url) ip_adress = re.compile('\s*(.*?)\s*(.*?)') # \s* 匹配空格,起到换行作用 - re_ip_adress = ip_adress.findall(html) + re_ip_adress = ip_adress.findall(str(html)) for adress, port in re_ip_adress: result = adress + ':' + port yield result.replace(' ', '') @@ -48,7 +48,7 @@ def crawl_kuaidaili(self): ip_adress = re.compile( '(.*)\s*(\w+)' ) - re_ip_adress = ip_adress.findall(html) + re_ip_adress = ip_adress.findall(str(html)) for adress, port in re_ip_adress: result = adress + ':' + port yield result.replace(' ', '') @@ -61,7 +61,7 @@ def crawl_xicidaili(self): 'Cn\s*(.*?)\s*(.*?)' ) # \s* 匹配空格,起到换行作用 - re_ip_adress = ip_adress.findall(html) + re_ip_adress = ip_adress.findall(str(html)) for adress, port in re_ip_adress: result = adress + ':' + port yield result.replace(' ', '') @@ -88,7 +88,7 @@ def crawl_data5u(self): '