前几天有文章说30万玖融网用户数据被挂暗网,今天看到暗网上又出了个标题为“某大型贷款公司数据,信息丰富!”的出售贴。感觉每次都比别人慢一拍,于是决定写个爬虫定时把暗网数据交易的动向发到自己邮箱。

安装好tor与ss后,创建torrc文件,内容为

1
SOCKS5Proxy 127.0.0.1:1080

然后使用命令运行tor服务。

1
tor -f torrc

这样tor就可以通过ss访问了。
使用tor browser可以正常访问onion网站。但用代码却提示

1
Failed to establish a new connection: [Errno -2] Name or service not known

原来要解析onion域名,需要让request不使用系统的dns,转而使用tor的域名解析服务。使用如下代码即可。

1
2
3
sess = requests.session()
sess.proxies={'http': 'socks5h://localhost:9150', 'https': 'socks5h://localhost:9150'}
resp = sess.get('https://api.ipify.org?format=json')

参考自https://stackoverflow.com/a/43823166/3065174