腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
黑泽君的专栏
专栏作者
举报
708
文章
1665504
阅读量
102
订阅数
订阅专栏
申请加入专栏
全部文章
其他
java
linux
http
编程算法
windows
eclipse
数据库
存储
大数据
xml
html
面向对象编程
sql
安全
ide
git
云数据库 SQL Server
tomcat
python
jar
servlet
jsp
scala
spark
hadoop
api
spring
开源
jdk
云数据库 Redis
容器
jvm
gui
go
node.js
jquery
ajax
oracle
maven
mapreduce
hive
数据结构
bash
腾讯云测试服务
mongodb
hbase
svn
struts
unix
ubuntu
apache
游戏
分布式
缓存
ftp
ios
单片机
mvc
bash 指令
云数据库 MongoDB
shell
jdbc
asp
tcp/ip
dubbo
udp
kafka
bootstrap
json
android
qt
全文检索
centos
网络安全
hashmap
监督学习
zookeeper
kotlin
单元测试
gcc
nat
虚拟化
NLP 服务
数据挖掘
机器学习
php
javascript
ecmascript
arm
打包
搜索引擎
lucene/solr
nginx
神经网络
深度学习
TDSQL MySQL 版
海外加速
腾讯git代码托管(工蜂)
图像处理
电商
express
yarn
自动化
ssh
mybatis
dns
线性回归
grep
aop
rpc
socket编程
数据分析
数据处理
https
云计算
Elasticsearch Service
测试
模型
数据
算法
负载均衡
c 语言
c++
actionscript
汇编语言
嵌入式
github
analyzer
专用宿主机
访问管理
企业邮箱
大数据处理套件 TBDS
人工智能
网站
数据备份
混合云存储
日志数据
出行
reactnative
压力测试
html5
正则表达式
erp
yum
unity
自动化测试
ntp
小程序
notepad ++
es
数据库管理
cmd
editor
exe
file
input
list
readline
settings
show
二进制
面试
异常
搜索文章
搜索
搜索
关闭
大数据技术之_24_电影推荐系统项目_06_项目体系架构设计 + 工具环境搭建 + 创建项目并初始化业务数据 + 离线推荐服务建设 + 实时推荐服务建设 + 基于内容的推荐服务建设
云数据库 MongoDB
mongodb
云计算
ide
数据挖掘
用户可视化:主要负责实现和用户的交互以及业务数据的展示, 主体采用 AngularJS2 进行实现,部署在 Apache 服务上。(或者可以部署在 Nginx 上) 综合业务服务:主要实现 JavaEE 层面整体的业务逻辑,通过 Spring 进行构建,对接业务需求。部署在 Tomcat 上。 【数据存储部分】 业务数据库:项目采用广泛应用的文档数据库 MongDB 作为主数据库,主要负责平台业务逻辑数据的存储。 搜索服务器:项目采用 ElasticSearch 作为模糊检索服务器,通过利用 ES 强大的匹配查询能力实现基于内容的推荐服务。 缓存数据库:项目采用 Redis 作为缓存数据库,主要用来支撑实时推荐系统部分对于数据的高速获取需求。 【离线推荐部分】 离线统计服务:批处理统计性业务采用 Spark Core + Spark SQL 进行实现,实现对指标类数据的统计任务。 离线推荐服务:离线推荐业务采用 Spark Core + Spark MLlib 进行实现,采用 ALS 算法进行实现。 工作调度服务:对于离线推荐部分需要以一定的时间频率对算法进行调度,采用 Azkaban 进行任务的调度。 【实时推荐部分】 日志采集服务:通过利用 Flume-ng 对业务平台中用户对于电影的一次评分行为进行采集,实时发送到 Kafka 集群。 消息缓冲服务:项目采用 Kafka 作为流式数据的缓存组件,接受来自 Flume 的数据采集请求。并将数据推送到项目的实时推荐系统部分。 实时推荐服务:项目采用 Spark Streaming 作为实时推荐系统,通过接收 Kafka 中缓存的数据,通过设计的推荐算法实现对实时推荐的数据处理,并将结果合并更新到 MongoDB 数据库。
黑泽君
2019-05-23
4.6K
0
06_TF-IDF算法代码示例
数据挖掘
TF-IDF算法代码示例 0.引入依赖 import numpy as np # 数值计算、矩阵运算、向量运算 import pandas as pd # 数值分析、科学计算 1.定义数据和预处理 # 定义文档 docA = 'The cat sat on my bed' docB = 'The dog sat on my knees' # 切割文档 bowA = docA.split(' ') bowB = docB.split(' ') # bowA # ['The', 'cat', 'sat', '
黑泽君
2019-05-19
741
0
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
点击查看
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
立即参加
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档