腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
祝威廉
专栏作者
举报
308
文章
202419
阅读量
44
订阅数
订阅专栏
申请加入专栏
全部文章(308)
sql(105)
spark(71)
其他(68)
编程算法(42)
python(30)
api(25)
大数据(24)
机器学习(19)
数据库(17)
java(16)
存储(16)
scala(15)
深度学习(14)
开源(14)
人工智能(13)
json(12)
分布式(11)
html(10)
云数据库 SQL Server(10)
神经网络(9)
容器(9)
hbase(9)
网站(8)
http(8)
数据处理(8)
数据湖(8)
容器镜像服务(7)
yarn(7)
运维(7)
apache(6)
es 2(6)
hive(6)
jdbc(6)
https(6)
kafka(6)
对象存储(5)
负载均衡(5)
ide(5)
缓存(5)
网络安全(5)
微信(5)
tensorflow(4)
jar(4)
文件存储(4)
TDSQL MySQL 版(4)
推荐系统(4)
react(3)
node.js(3)
xml(3)
git(3)
github(3)
linux(3)
负载均衡缓存(3)
zookeeper(3)
markdown(3)
rpc(3)
数据分析(3)
commit(3)
javascript(2)
bash(2)
云数据库 Redis(2)
打包(2)
nginx(2)
bash 指令(2)
访问管理(2)
kubernetes(2)
shell(2)
jvm(2)
sql server(2)
数据结构(2)
系统架构(2)
parquet(2)
upsert(2)
部署(2)
官方文档(1)
自动驾驶(1)
c++(1)
php(1)
ruby(1)
硬件开发(1)
maven(1)
spring(1)
mapreduce(1)
mongodb(1)
电商(1)
企业(1)
云数据仓库 PostgreSQL(1)
自动化(1)
无人驾驶(1)
jdk(1)
面向对象编程(1)
线性回归(1)
keras(1)
cdn(1)
安全(1)
机器人(1)
openapi(1)
腾讯云开发者社区(1)
云计算(1)
任务调度(1)
特征工程(1)
sdk(1)
es(1)
allocation(1)
csv(1)
curl(1)
join(1)
mysql(1)
overwrite(1)
package(1)
pool(1)
rename(1)
tar(1)
工作(1)
模型(1)
数据(1)
索引(1)
研发(1)
搜索文章
搜索
搜索
关闭
从图像标注开始,用 Byzer 加 Xtreme1 完成图像实例分割训练
数据湖
对象存储
存储
python
json
要完整的支持深度学习,需要一个很长的 Pipeline,通常我们的工作起步于标注平台, 尽管Byzer 也可以作为标注平台的上游,比如对图片和视频做一个统一的处理(诸如缩放成统一大小等),然后再放到标注平台里。
用户2936994
2022-11-12
629
0
Byzer-yaml-visualiaztion 插件介绍
python
编程算法
html
Byzer-yaml-visualization 是一款 Byzer 可视化插件。通过该插件,用户可以通过 YAML 配置文件描述图表。
用户2936994
2022-07-21
372
0
如何将Python算法模型注册成Spark UDF函数实现全景模型部署
sql
python
深度学习
java
> 本文作者来自MLSQL社区 & Kyligence 机器学习平台工程师 Andie Huang
用户2936994
2022-07-21
718
0
可编程的SQL是什么样的?
sql
python
机器学习
神经网络
如果你使用传统编程语言,比如Python,那么恭喜你,你可能需要解决大部分你不需要解决的问题,用Python你相当于拿到了零部件,而不是一辆能跑的汽车。你花了大量时间去组装汽车,而不是去操控汽车去抵达自己的目的地。大部分非计算机专业的同学核心要解决的是数据操作问题,无论你是摆地摊,开餐馆,或者在办公室做个小职员,在政府机构做工作,你都需要基本的数据处理能力,这本质上是信息处理能力。 但是在操作数据前,你必须要学习诸如变量,函数,线程,分布式等等各种仅仅和语言自身相关的特性,这就变得很没有必要了。操作数据我们也可以使用 Excel(以及类似的软件),但是Excel有Excel的限制,譬如你各种点点点,还是有点低效的,有很多较为复杂的逻辑也不太好做,数据规模也有限。那什么交互最快,可扩展性最好?语言。你和计算机系统约定好的一个语言,有了语言交流,总是比点点点更高效的。这个语言是啥呢?就是SQL。
用户2936994
2022-07-21
635
0
MLSQL: 可编程的SQL
sql
python
SQL简单易用,但是现在大家用的多了,也慢慢发现它还是存在诸多问题的。我们认为良好的编程应该是创建小型、可理解、可重用的逻辑片段,并且这些逻辑片段还要被测试、被命名、被组织成包,而这些包之后可以用来构造更多有用的逻辑片段,这样的工作流程才是合理又便捷的。更进一步的,这些“高阶”能力应该是可选的,我们总是希望用户一开始能用最简单的方式来完成手头的工作。尽管如此,现在的SQL并不能很好的支持我们前面提到的这些。
用户2936994
2022-07-21
662
0
MLSQL与JuiceFS在AI方向的整合畅享
sql
python
对象存储
存储
RespectM同学在文章[MLSQL集成JuiceFs](16 - MLSQL集成JuiceFs)中,已经详细的讲解了如何整合两者。丢一个配置文件到SPARK_HOME/conf以及启动时带上SDK Jar就可以完美在MLSQL访问各种对象存储和HDFS了,这非常酷。
用户2936994
2022-07-21
413
0
SQL 劝学篇
sql
python
网站
c++
乘着AI这波东风,大部分媒体和机构,包括教育界都开始推Python了。不过值得欣慰的是,相比之前让非计算机专业科班的同学学C还是一个巨大的进步。我编程十多年,依然觉得C/C++好难,你让一个非计算机的同学学C/C++这不是扯淡么,严重阻碍了编程的普及。
用户2936994
2022-07-21
278
0
大数据平台和AI平台应该如何整合
sql
大数据
数据处理
python
java
大数据和AI两者最核心的部分都是数据。大数据的主要工作是对数据进行各种转换和存储。而AI的主要工作是学习数据并且得出模型。 AI天然需要大数据的基础,因为AI需要各种形态的数据,而我们得到这些形态的数据,必然离不开大数据。就此而言,他们两个合在一起,才是一个完整的工作流。
用户2936994
2022-07-21
1K
0
在Java应用中写Python提供预测服务实战
python
数据库
sql
访问管理
基础软件: JDK8,Conda(Python 3.6+),MySQL (5.6)
用户2936994
2022-07-21
534
0
用Python写Rest Action -- ar-python插件介绍
python
数据库
sql
网站
我们知道web-platform 可以主要是以Java/Scala开发的。我们很希望能够支持用Python开发,所以,我们开发了ar-python插件。这个插件很早就开发了,这次完善之后,让他可以和user-system 插件配合,从而可以做精细化权限控制。
用户2936994
2022-07-21
435
0
一个开发效率快到变态的插件based的Web框架
数据库
python
容器
sql
思考这两个问题让自己一宿没睡,凌晨2点多起来开始代码实现。因为以前其实已经有非常多的积累了,比如我很早很早就有开发web框架的经验(serviceframework),所以这个系统也快速的被开发出来。
用户2936994
2022-07-21
276
0
MLSQL Stack 1.5.0 版本发布
https
网络安全
数据湖
python
hive
1.5.0好像是MLSQL历时最长的一个版本。从九月初份到一月初,四个多月时间。这四个月搞出了很多大事情。这个版本,经过很多的用户实际的使用反馈(包括一些金融公司也有在使用),已经很稳定了,可以进入生产环境中使用。
用户2936994
2022-07-21
221
0
Ray进程布局一览
云数据库 Redis
python
spark
yarn
java
可能标题有点让人困惑,其实我是想知道,在一个标准的ray集群,到底都有哪些进程存在。比如spark运行在yarn上,那么整个物理集群上会有如下几类进程:
用户2936994
2022-07-21
492
0
Spark整合Ray思路漫谈(2)
编程算法
spark
python
yarn
首先,大家可以理解为k8s已经解决一切了,我们spark,ray都跑在K8s上。但是,如果我们希望一个spark 是实例多进程跑的时候,我们并不希望是像传统的那种方式,所有的节点都跑在K8s上,而是将executor部分放到yarn cluster. 在我们的架构里,spark driver 是一个应用,我们可以启动多个pod从而获得多个spark driver实例,对外提供负载均衡,roll upgrade/restart 等功能。也就是k8s应该是面向应用的。但是复杂的计算,我们依然希望留给Yarn,尤其是还涉及到数据本地性,然计算和存储放到一起(yarn和HDFS通常是在一起的),避免k8s和HDFS有大量数据交换。
用户2936994
2022-07-21
790
0
SQL思维 VS 编程思维
sql
python
第一个是,用SQL里的In查询,但是因为受限于SQL自身的长度,我们不可能把十万个ID都放到一条SQL里,所以我们将ID集合切分,然后并发去访问得到结果。
用户2936994
2022-07-21
257
0
为什么特征工程要用 SQL 而不是 Python
sql
python
编程算法
特征工程
我们常说机器学习是一门实验科学。所以相比较传统工程而言,机器学习分成两个大的阶段:
用户2936994
2022-05-18
713
0
Meta(Facebook) 第三代 Notebook Daiquery 与 Byzer Notebook 对比
sql
python
html
开源
今天无意看到一篇文章,叫做SQL Notebooks: Combining the power of Jupyter and SQL editors for data analytics,在这篇文章里, Meta 介绍了自己的第三代 notebook 产品 Daiquery, 正如标题大家看到的,它的核心理念从一个以 Python 为主的 Notebook 转化成了一个以 SQL 为主, Python 为辅的 Notebook。 我觉得这是一个正确的进化路线。
用户2936994
2022-05-08
733
0
写给【算法同学】的MLSQL机器学习教程
sql
python
html
http
http://qwone.com/~jason/20Newsgroups/20news-19997.tar.gz
用户2936994
2022-04-25
601
0
Byzer UDF 函数开发指南
jar
scala
python
java
动态 UDF的使用最简单,用户可以使用 Byzer 的 register 语句将一段 Scala/Java 代码注册成 UDF.
用户2936994
2022-04-07
991
0
为什么说MLSQL是一个面向大数据和AI的语言
sql
分布式
大数据
python
机器学习
经过几个月的折腾,MLSQL 1.4.0版终于发布了。然后呢,我们也在这个版本正式对MLSQL做了新的定位,从原来的 "Unify BigData and Machine Learning" 转成了 "The Programming Language Designed For Big Data and AI"。 更多介绍可以参看 A Programming Language Designed For Big Data and AI
用户2936994
2022-04-02
436
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档