小弟我正在做小专案 一开始想透过selenium模拟使用者 开启104人力银行 搜寻"各种行业"(看使用者输入甚么行业) 将前30笔资料的职位 薪水等等 抓取下来但后来发现104网站是动态生成 就不知道要怎么操作了 不太了解怎么从Network找到我要的网址 如果找到了,那么金融业的网址 是不是又跟科技业的网址不一样呢?我该怎么样处理呢!希望有大佬能教教我! 如果哪边叙述的不够清楚 我可以再补充!!

2 个回答

1

zivzhong

iT邦研究生 4 级 ‧ 2024-12-17 18:00:54

感觉可以参考这个:
https://hoxtonhsu.com/p/selenium%E5%AD%B8%E7%BF%92%E7%AD%86%E8%A8%98-%E4%BB%A5104%E4%BA%BA%E5%8A%9B%E9%8A%80%E8%A1%8C%E7%82%BA%E4%BE%8B/

不明

【**此则讯息已被站方移除**】

1

echochio

iT邦高手 1 级 ‧ 2024-12-24 10:07:00

用 playwright 比较快

python -m playwright install

playwright install

python -m playwright codegen --target python -o my.py -b chromium https://www.google.com

您可在 google 页面,网页操作一下,网页关闭,这样就录製 成 my.py

那个104 您可试试。