如何在使用 selenium 检查网站时从 Linkedin 的帖子中获取准确的日期?

问题描述 投票:0回答:3

我正在使用 selenium chrome 驱动程序来抓取 Linkedin 的个人资料。我正在为我的帖子进行分析。 这是从 Linkedin 的帖子中获取准确日期的方法,格式为“dd.mm.yyyy”而不是“1 个月前”、“2 周前”?

请帮忙, 雅采克

selenium web-scraping linkedin-api
3个回答
28
投票

我解码了帖子 ID 以找到时间戳。方法和(js)代码在这里:https://github.com/Ollie-Boyd/Linkedin-post-timestamp-extractor.

从 19 位 Linkedin 帖子 ID(经过一番试验和错误)我发现我们可以将帖子 ID 转换为二进制,然后将前 41 位二进制位转换为十进制,以给出以毫秒为单位的 UNIX 时间戳。


0
投票

不是真的,如果你检查 html,你会发现你有一个基本字符串:

解决您问题的唯一方法是创建一个方法:

  1. 提取当前日期(根据需要设置格式)
  2. 从 LI 中摘录过去了多少时间
  3. 根据提取的数据(小时、天、周、月、年)创建逻辑,并使用提取的当前日期进行数学计算。这应该不会太困难,因为任何编程语言都有可以帮助您的库。

0
投票

我也需要这个,但是是批量的,所以我改编了上面 @ollie-boyd 的精彩作品,并将此页面放在一起: https://josh.be/linkedinpostdatesfromurl.html

© www.soinside.com 2019 - 2024. All rights reserved.