进击的程序猿

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

我们猜下，上面会输出什么。
 ===============================留你思考=================================

c++奇淫技巧之完美转发

作为一个程序猿，对造轮子这事情可以说是情有独钟，几乎程序猿内心都存在一个梦想是去将开源的技术都实现一遍，所有从本篇开始，我会开一个造轮子系列。

造轮子系列之Protobuf

之前写过一篇文章EM 算法的 9 重境界之前两重，里面讲述了em算法的过程，本文是对前一篇文章的补充。

EM 算法的 9 重境界之第3重三个硬币GMM模型参考

本文 github 地址：1-1 基本模型调用. ipynb，里面会记录自己kaggle大赛中的内容，欢迎start关注。

xgboost 库使用入门

前面一篇文章贝叶斯统计：初学指南介绍了最简单的 Metropolis 采样方法，本文将介绍另一种采样 Metropolis-Hastings ，并且会对前文介绍的例子给出证明，为什么 Metropolis 采样work。

贝叶斯推断：Metropolis-Hastings 采样

各种文本编辑器的 "查找" 功能（Ctrl+F），大多采用 Boyer-Moore 算法。

进击算法：字符串匹配的 BM 算法

bm25 是一种用来评价搜索词和文档之间相关性的算法，它是一种基于概率检索模型提出的算法，再用简单的话来描述下bm25算法：我们有一个query和一批文档Ds，现在要计算query和每篇文档D之间的相关性分数，我们的做法是，先对query进行切分，得到单词$q_i$，然后单词的分数由3部分组成：

经典检索算法：BM25原理

上一篇介绍了协同过滤，其重点就是在人-物品矩阵上，其中心思想是去对人或者物品进行聚类，从而找到相似人或者相似物品，用群体的智慧为个人进行推荐，但是，这种近邻模型也存在好多问题：

基于隐变量的推荐模型基于隐变量的推荐模型

在statistical inference上，主要有两派：频率学派和贝叶斯学派。

贝叶斯统计：初学指南

Hadoop的master和slave分别运行在不同的Docker容器中，其中hadoop-master容器中运行NameNode和ResourceManager，hadoop-slave容器中运行DataNode和NodeManager。NameNode和DataNode是Hadoop分布式文件系统HDFS的组件，负责储存输入以及输出数据，而ResourceManager和NodeManager是Hadoop集群资源管理系统YARN的组件，负责CPU和内存资源的调度。

实战：基于 docker 的 HA-hadoop 集群搭建

传统的机器学习大多数都需要我们手工去建立feature，这种方法建立出来的feature，大多都是有物理意义的，所以算法最终好不好，就看你特征工程做的怎么样！

卷积神经网络基础知识

基于用户行为的推荐，在学术界名为协同过滤算法。
 协同过滤就是指用户可以齐心协力，通过不断地和网站互动，使 自己的推荐列表能够不断过滤掉自己不感兴趣的物品，从而越来越满足自己的需求。

神经网络基础知识

首先我想说下为什么会去学习cs224d，原先我一直是做工程的，做了大概3年，产品做了好多，但是大多不幸夭折了，上线没多久就下线，最后实在是经受不住心灵的折磨，转行想做大数据，机器学习的，前不久自己学习完了Udacity的深度学习，课程挺好，但是在实际工作中，发现课程中的数据都是给你准备好的，实践中哪来这么多好的数据，只能自己去通过各种手段搞数据，苦不堪言。在找数据的过程中，发现做多的数据还是文本数据，不懂个nlp怎么处理呢，于是就来学习cs224d这门课程，希望在学习过程中能快速将课程所学应用到工作中，fighting！

cs224d-第二课-word2vec

另外在声明具体的值上，我们可以是 Straight values（primitives, Strings），也可以使idref元素，或者是对其他bean的指向，下面分别举例子：

第2章：spring 依赖第2章：spring 依赖

为了体验spring，所以建立的是一个 maven quick start 的项目，建立后的 pom.xml 配置如下：

第1章： Spring 基础第1章：Spring 基础

本文数据来源kaggle的House Prices: Advanced Regression Techniques大赛。

Kaggle初探--房价预测案例之数据分析

Kaggle初探--房价预测案例之模型建立

假设现在我们有3个node，6个shard，则每个node上分配2个shard，此时最多容忍1台机器挂了，因为2台机器有4个shard，能存放下3个primary shard。此时如果我们进行水平扩容，将node变为6个，则每个node有1个shard，每个shard能使用的IO/CPU/Memory资源更多，性能会更好。
 另外假设我们现在还是3个node，但是将shard变为9个，则每个node有3个shard，此时虽然每个shard使用的资源少了，但是容错性提高了，最多能容忍2个node故障，因为剩余的1个node还有3个shard，能包含所有数据。

ElasticSearch学习笔记2

先看第一个问题，如果我们用数据来实现搜索功能，可能的语句就是对 string 建立索引，或者直接 like 关键字。带来的问题是什么？

ElasticSearch学习笔记1

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了进击的程序猿专栏，为你提供了进击的程序猿的相关文章，致力于帮助开发者快速成长与发展。

进击的程序猿

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐