我是一个实时分布式搜索引擎elasticsearch的新手,但我想问一个技术问题。
我已经编写了一个python模块爬虫,它可以解析网页并使用本机信息创建JSON对象。我的模块爬虫的下一步是使用elasticsearch存储本机信息。
真正的问题如下所示。哪种技术更适合我的场合?elasticsearch python API还是用于弹性搜索的RESTful API (elasticsearch-py)?
发布于 2015-12-01 12:16:13
如果您已经有了Python代码,那么对您来说最自然的方法就是使用elasticsearch-py
client。
通过pip install elatsicsearch
安装elasticsearch-py
库后,您可以找到一个简单的代码示例:
# import the elasticsearch library
from elasticsearch import Elasticsearch
# get your JSON data
json_page = {...}
# create a new client to connect to ES running on localhost:9200
es = Elasticsearch()
# index your JSON data
es.index(index="webpages", doc_type="webpage", id=1, body=json_page)
发布于 2017-08-09 11:18:36
你也可以试试elasticsearch_dsl
,它是elasticsearch
的高级包装器。
https://stackoverflow.com/questions/34010978
复制相似问题