小弟我正在做小专案 一开始想透过selenium模拟使用者 开启104人力银行 搜寻"各种行业"(看使用者输入甚么行业) 将前30笔资料的职位 薪水等等 抓取下来但后来发现104网站是动态生成 就不知道要怎么操作了 不太了解怎么从Network找到我要的网址 如果找到了,那么金融业的网址 是不是又跟科技业的网址不一样呢?我该怎么样处理呢!希望有大佬能教教我! 如果哪边叙述的不够清楚 我可以再补充!!
2 个回答
1
zivzhong
iT邦研究生 4 级 ‧ 2024-12-17 18:00:54
感觉可以参考这个:
https://hoxtonhsu.com/p/selenium%E5%AD%B8%E7%BF%92%E7%AD%86%E8%A8%98-%E4%BB%A5104%E4%BA%BA%E5%8A%9B%E9%8A%80%E8%A1%8C%E7%82%BA%E4%BE%8B/
不明
【**此则讯息已被站方移除**】
1
echochio
iT邦高手 1 级 ‧ 2024-12-24 10:07:00
用 playwright 比较快
python -m playwright install
playwright install
python -m playwright codegen --target python -o my.py -b chromium https://www.google.com
您可在 google 页面,网页操作一下,网页关闭,这样就录製 成 my.py
那个104 您可试试。