我想在scikit中创建一个贝叶斯模型-学习预测电影的票房。
我从scikit learn开始,我找到了许多关于如何加载CSV和其他表数据的示例,但我还没有找到关于如何加载具有值集合的属性的示例,例如:
Movie 1: Actors: [Actor 1, Actor 2, Actor 3...], etc.
有人能给我个提示吗?
对于电影评论数据集,我正在创建一个朴素的bayes多项式模型。现在,在培训数据集中,每种类型都有评论。因此,与其为电影评论数据集创建一个通用模型--忽略了类型特征,我还应该如何训练一个模型,同时考虑到电影评论数据集的体裁特征--还包括与评论中出现的单词相关的tf。我是否需要为每一种类型创建一个模型,还是可以将其合并到一个模型中?
Training Dataset Sample:
genre, review, classification
Romantic, The movie was really emotional and touched my heart!, Positive
Action
我有一个电影数据库网站,我有一个小问题的搜索。让我们假设保存在数据库中的电影名是
走向清晰:山达基与信仰之狱
如您所见,标题中有一个:。
当我的用户搜索Going Clear Scientology and the Prison of Belief时,他们没有得到任何结果,如果电影标题有',下面是我的搜索查询:
SELECT * FROM movie WHERE title LIKE '%$search%'
我怎么才能解决呢?