首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Data Warehouse in Cloud

数据,对一个企业的重要性不言而喻。如何利用好企业内部数据,发挥数据的更大价值,对于企业管理者而言尤为重要。作为最传统的数据应用之一,数据仓库在企业内部扮演着重要的角色。构建并正确配置好数据仓库,对于数据分析工作至关重要。一个设计良好的数据仓库,可以让数据分析师们如鱼得水;否则是可能使企业陷入无休止的问题之后,并在未来的企业竞争中处于劣势。随着越来越多的基础设施往云端迁移,那么数据仓库是否也需要上云?上云后能解决常见的性能、成本、易用性、弹性等诸多问题嘛?如果考虑上云,都需要注意哪些方面?目前主流云厂商产品又有何特点呢?面对上述问题,本文尝试给出一些答案,供各位参考。本文部分内容参考了MIT大学教授David J.DeWitt的演讲材料。

04

【项目设计】网络对战五子棋(上)

1. a. http协议在Linux的学习部分我们就已经学习过了,当时http和https是一块学的,我们当时其实已经了解了http的大部分知识内容,比如http请求和响应的格式,各自的报头字段都有哪些,cookie和session机制,http1.1的长连接策略keep-alive,还有请求方法GET和POST等等知识内容,这么看来http感觉已经很优秀了,为什么还要有websocket协议呢? b. 其实http有一个致命的缺点,就是无法支持服务器向客户端主动推送消息,传统的CS通信方式都是一问一答的,即客户端向服务器发送一个请求,服务器向客户端反馈一个响应,而在最传统的http1.0版本协议中,客户端每和服务器进行一次通信都需要建立一条TCP连接,当浏览器访问了服务器上的某个html网页时,此时就会在应用层协议http的基础上建立一条短连接,而http短连接其实就是tcp短链接,如果浏览器此时想要访问web网页中的其他资源,那就需要重新再向服务器发起一次http请求,以获取到服务器上的对应资源,此时原来的http连接就会自动被断开,然后重新建立一条短连接,这样的方式非常的难受啊,因为用户访问某web资源时,肯定不可能只访问一个资源啊,他一定会向服务器发起多个http请求,获取访问多个web资源,那如果在传统的http1.0协议下,就会频繁的建立和断开连接,这会很浪费服务器的时间和网络带宽,因为http短连接其实就是tcp短连接,本来tcp是一个可靠的,高效的,有链接的协议,但结果http不会用,双方通信一次就关闭掉了,这也太浪费了! c. 所以在http1.0之后,又推出了http1.1协议,也就是在请求报头中添加了一个字段Connection:keep-alive,也就是http长连接,当上层http连接建立成功后,下层的tcp连接不会在一次通信之后就断开了,而是会在一段时间之后才断开,在这段时间里面,双方都可以使用该连接进行资源的请求和获取,或者是业务的请求和处理,确实是比以前要高效的多了,但http1.1依旧还存在一个问题,就是他的通信模式还是没有变化的,也就是一问一答的通信模式,不过他已经比原来的http1.0要高效很多了,省去了很多不必要的tcp连接建立和断开,也减少浪费带宽。

03

空间转录组识别恶性-边界-非恶性轴肿瘤空间微环境解析

ST结合单细胞RNA测序(scRNA-seq)的优势使基因表达谱能够直接在组织内与二维空间信息相结合。与scRNA-seq分析中的聚类方法相比,ST在评估基因表达、空间定位和组织学信息时需要更全面和综合的考虑。许多原位捕获技术,如10X Genomics Visium,利用5000个直径为55-100µm的SPOT来记录6.5 × 6.5 mm捕获区域内的mRNA位置。这种方法容易在一个SPOT中包含多个同质或异质细胞(每个斑点1-10个细胞),这使得在混合SPOT中区分细胞身份变得困难。用于ST分析的传统生物信息学工具通常考虑图像分析、细胞类型鉴定、反卷积、空间分布、细胞-细胞通信、空间表达模式、调节因子在空间位置的相互作用和亚细胞分辨率。大多数用于ST数据中细胞类型鉴定的工具要么基于细胞类型映射,要么基于细胞类型反卷积。细胞类型定位方法通常根据基因表达或结合成像数据或邻近点推断出最可能的细胞类型,而失去了实际的细胞组成。细胞型反卷积方法一般依靠scRNA-seq数据作为参考来推断每个SPOT或位置的细胞组成,但不考虑SPOT的位置和形态特征,可能忽略了空间结构对细胞组成的影响。此外,目前还没有有效的方法来高分辨率重建同一点不同细胞类型的表达矩阵,这限制了对同一点不同细胞类型之间相互作用的研究以及空间建筑中特定细胞类型标记物潜在靶标的识别。在这里,文章开发了Cottrazm,一个集成的工具框架,能够基于10x Genomics Visium平台的空间转录组学构建肿瘤边界周围的微环境。Cottrazm确定连接恶性和非恶性细胞SPOT的肿瘤边界(Cottrazm- boundarydefine)。根据形态学调整后的表达矩阵的聚类和肿瘤的高CNV特征确定肿瘤核心的SPOT。其次,利用六边形系统连续外推肿瘤核心spot的相邻spot,并计算相邻点到肿瘤质心的UMAP距离。该方法能够确定相邻点是肿瘤还是边界(Bdy)。

01

MongoDB——基本使用及集群搭建

MongoDB是一种支持多语言面向文档的NOSql数据库,它不支持事务操作(4.2版本开始支持跨文档分布式事务)。什么是面向文档?简单说就是使用类JSON的数据结构——BSON(Binary JSON)来存储数据。使用这种数据结构的好处显而易见,关联信息可以直接内嵌在同一个文档中,不必像关系型数据库那样还需要建立多张表,并建立外键关联,因此大大提升了我们写入数据的效率(前端传回的JSON数据可以直接存入,不必转换为对象),也能灵活的增减字段。如论坛文章,如果用关系型数据库存储,我们需要建立文章表和评论表等,而MongoDB直接存到一个文档里去就可以了,查询也非常方便。

01
领券