我计划创建一个应用程序来存储特定主题的数据库中的twitter情绪。我不需要存储tweet,只需要存储话题的情绪。我可以使用SQL或noSQL DB。该应用程序将摄取大量数据,因此它需要高效。
我在想,如果摄取推文,将它们存储在noSQL DB中,然后作为一个单独的进程,从DB读取推文并分析情绪并将其存储,是否会更有效率。或者,从API中单独读取tweet,即时确定情绪,并将情绪存储在DB中是更有效的吗?谢谢你的帮助。
发布于 2012-06-22 11:01:13
我认为更好的解决方案是在tweet进入时分析它们,并使用您的逻辑来创建情感并存储在您选择的DB中。在分析之前存储所有传入的tweet可能会在您的应用程序中造成不必要的瓶颈。此外,您并不真的需要存储所有原始数据。
https://stackoverflow.com/questions/11149392
复制相似问题