首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >如何使用socid_extractor从多个网站提取用户账号信息

如何使用socid_extractor从多个网站提取用户账号信息

作者头像
FB客服
发布2022-06-08 13:10:57
发布2022-06-08 13:10:57
2.6K0
举报
文章被收录于专栏:FreeBufFreeBuf

关于socid_extractor

socid_extractor是一款功能强大的OSINT公开资源情报收集工具,在该工具的帮助下,广大研究人员可以轻松从多个不同网站的用户个人页面收集账号信息。值得一提的是,socid_extractor能够通过账号Web页面或API响应来收集用户的相关信息,并将其存储为机器可读的格式。

使用的组件

Maigret:强大的名称检查工具,支持从目标账号生成所有可用的信息; TheScrapper:支持从网站爬取电子邮件、手机号码和社交媒体账号; YaSeeker:可通过邮件和登录信息收集Yandex账号所有可用的信息; Marple:针对给定用户名爬取搜索引擎结果;

工具下载

该工具基于Python开发,因此我们首先需要在本地设备上安装并配置好Python环境。

广大研究人员可以使用下列命令将该项目源码克隆至本地:

代码语言:javascript
复制
git clone https://github.com/soxoj/socid-extractor.git

除此之外,我们还可以使用pip3命令来安装socid_extractor:

代码语言:javascript
复制
$ pip3 install socid-extractor

如果你需要安装该工具的最新开发版本,可以使用下列命令直接从该项目的GitHub库获取:

代码语言:javascript
复制
$ pip3 install -U git+https://github.com/soxoj/socid_extractor.git

工具测试

代码语言:javascript
复制
python3 -m pytest tests/test_e2e.py -n 10  -k 'not cookies' -m 'not github_failed and not rate_limited'

工具使用

以命令行工具的形式使用:

代码语言:javascript
复制
$ socid_extractor --url https://www.deviantart.com/muse1908

country: France

created_at: 2005-06-16 18:17:41

gender: female

username: Muse1908

website: www.patreon.com/musemercier

links: ['https://www.facebook.com/musemercier', 'https://www.instagram.com/muse.mercier/', 'https://www.patreon.com/musemercier']

tagline: Nothing worth having is easy...

如果没有执行工具的安装脚本,没关系,我们还可以直接使用下列命令来直接运行socid_extractor:

代码语言:javascript
复制
$ ./run.py --url https://www.deviantart.com/muse1908

除此之外,我们还可以将该工具以Python库的形式来使用:

代码语言:javascript
复制
>>> import socid_extractor, requests

>>> r = requests.get('https://www.patreon.com/annetlovart')

>>> socid_extractor.extract(r.text)

{'patreon_id': '33913189', 'patreon_username': 'annetlovart', 'fullname': 'Annet Lovart', 'links': "['https://www.facebook.com/322598031832479', 'https://www.instagram.com/annet_lovart', 'https://twitter.com/annet_lovart', 'https://you*tube.com/channel/UClDg4ntlOW_1j73zqSJxHHQ']"}

支持的网站和方法

该工具针对多种不同的站点和平台提供了超过100种数据收集技术方法,其中包括但不限于:

Google(所有的文档页面和地图点贡献信息),需要Cookie; Yandex(磁盘、相册、znatoki、音乐、集合等),需要Cookie来防止验证码屏蔽; Mail.ru(my.mail.ru用户主页、照片、视频、游戏、圈子) Facebook(用户 & 组页面) VK.com(用户页面) OK.ru(用户页面) Instagram Reddit Medium Flickr Tumblr TikTok GitHub ...

我们还可以查看该项目提供的【测试文件】来获取数据样例,或查看【scheme文件】来了解该工具支持的所有数据收集技术方法。

项目地址

https://github.com/soxoj/socid-extractor

参考资料

https://github.com/soxoj/maigret

https://github.com/champmq/TheScrapper

https://github.com/HowToFind-bot/YaSeeker

https://github.com/soxoj/marple

https://medium.com/week-in-osint/getting-a-grasp-on-googleids-77a8ab707e43

https://osintcurio.us/2019/10/01/searching-instagram-part-2/

https://www.aware-online.com/en/importance-of-user-ids-in-social-media-investigations/

https://www.eff.org/wp/behind-the-one-way-mirror

https://www.nytimes.com/interactive/2019/12/19/opinion/location-tracking-cell-phone.html

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 FreeBuf 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 关于socid_extractor
  • 使用的组件
  • 工具下载
  • 工具测试
  • 工具使用
  • 支持的网站和方法
  • 项目地址
  • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档