前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于人工智能的网络爬虫:让数据唾手可得 | 开源日报 No.274

基于人工智能的网络爬虫:让数据唾手可得 | 开源日报 No.274

作者头像
小柒
发布2024-06-11 18:33:27
1090
发布2024-06-11 18:33:27
举报
文章被收录于专栏:开源服务指南开源服务指南

VinciGit00/Scrapegraph-aihttps://github.com/VinciGit00/Scrapegraph-ai

Stars: 9.3k License: MIT

Scrapegraph-ai 是一个基于人工智能的 Python 网络爬虫库。它使用 LLM 和直接图逻辑来创建用于网站、文档和 XML 文件的爬取流水线。只需指定要提取的信息,该库就会为您完成!

  • 可以从网站上提取信息
  • 支持 Ollama 模型
  • 支持 Docker 容器模型
  • 支持 OpenAI 模型
  • 支持 Groq 查询

通过 ScrapeGraphAI 类可以方便地从网站中提取信息,并且支持多种不同类型的模型和配置。

microsoft/vscodehttps://github.com/microsoft/vscode

Stars: 159.5k License: MIT

vscode 是一个开源的代码编辑器。该项目主要功能和核心优势包括:

  • 提供全面的代码编辑、导航和理解支持
  • 轻量级调试
  • 丰富的可扩展性模型
  • 与现有工具轻量级集成

delta-io/deltahttps://github.com/delta-io/delta

Stars: 7.0k License: Apache-2.0

delta 是一个开源存储框架,可以构建具有包括 Spark、PrestoDB、Flink、Trino 和 Hive 在内的计算引擎以及 Scala、Java、Rust、Ruby 和 Python 的 API 的 Lakehouse 架构。主要功能和优势包括:

  • 支持多种计算引擎
  • 提供多种编程语言的 API
  • 兼容性强,保证向后兼容性
  • 有详细的文档和快速入门指南

OpenBMB/MiniCPM-Vhttps://github.com/OpenBMB/MiniCPM-V

Stars: 4.7k License: Apache-2.0

MiniCPM-V 是一个高效的端侧多模态大模型,具有强大的 OCR 和理解能力。

  • 提供领先性能和高效部署
  • 接受图像和文本输入,并输出高质量文本
  • 支持 180 万像素任意长宽比图像输入
  • 实现了领先的 OCR 能力,接近 Gemini Pro 水平
  • 通过 RLHF 对齐解决幻觉问题

KenneyNL/Adobe-Alternativeshttps://github.com/KenneyNL/Adobe-Alternatives

Stars: 2.1k License: NOASSERTION

Adobe Alternatives,提供 Adobe 软件的替代方案列表,由社区收集并完善。该项目包含了多个免费或开源软件,并标注了其是否需要付费、单次购买还是订阅等信息。

  • 提供 Photoshop、Illustrator、Animate 等多种 Adobe 软件的替代品
  • 包括摄影处理、绘画创作和像素艺术等领域
  • 收录大量免费或开源软件以及部分商业产品
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源服务指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • VinciGit00/Scrapegraph-aihttps://github.com/VinciGit00/Scrapegraph-ai
  • microsoft/vscodehttps://github.com/microsoft/vscode
  • delta-io/deltahttps://github.com/delta-io/delta
  • OpenBMB/MiniCPM-Vhttps://github.com/OpenBMB/MiniCPM-V
  • KenneyNL/Adobe-Alternativeshttps://github.com/KenneyNL/Adobe-Alternatives
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档