首页
学习
活动
专区
工具
TVP
发布

数据科学(冷冻工厂)

专栏成员
419
文章
267407
阅读量
31
订阅数
空间单细胞|Slide-seq分析、可视化与整合(2)
在本文中,我们将对利用Slide-seq v2技术获得的小鼠海马区数据集进行深入分析。
数据科学工厂
2024-07-26
850
这7个矢量数据库你应该知道!
在人工智能(AI)、机器学习(ML)和数据工程这些日新月异的领域里,高效地存储和检索数据的能力极为关键。向量数据库因其在处理这些技术所依赖的复杂和高维数据方面的能力而成为一项至关重要的解决方案。本文[1]介绍了七种AI/ML/数据工程师必须了解的向量数据库,重点介绍了它们各自的特色以及它们是如何满足现代以数据为中心的应用需求的。
数据科学工厂
2024-07-26
1470
高阶Python|返回类型提示技巧 (2)
Python提供了一种可选的特性——类型提示,它有助于提高代码的可读性、可推理性和可调试性。通过类型提示,开发者能够清楚地了解变量、函数参数和返回值应具备的数据类型。在开发那些需要高度灵活性的应用程序时,您可能会需要为代码指定多种可能的返回类型,这样做可以使您的程序更加健壮,更能适应多变的运行环境。
数据科学工厂
2024-07-26
820
Linux 如何快速查找文件?
从终端搜索或查找 Linux 系统上的文件可能有点挑战,尤其是对于新手来说。然而,有几个命令行工具/实用程序可用于在 Linux 中查找文件。在本文[1]中,我们将回顾 5 个在 Linux 系统上快速查找、定位和搜索文件的命令行工具。
数据科学工厂
2024-07-26
3120
8个特征工程技巧提升机器学习预测准确性
对于机器学习从业者来说,掌握各种特征工程技巧是非常有帮助的。毕竟,特征是影响机器学习和深度学习模型实时表现的关键因素。在机器学习领域,提升模型预测准确性的关键之一是选择合适的特征,并剔除那些对模型性能影响不大的特征。对于数据科学家或机器学习工程师来说,这通常是他们工作中的重要一环,尤其是在构建能够良好泛化到测试数据集的复杂模型时。
数据科学工厂
2024-07-26
980
高阶Python|返回类型提示技巧 (1)
Python提供了一种可选的特性——类型提示,它有助于提高代码的可读性、可推理性和可调试性。通过类型提示,开发者能够清楚地了解变量、函数参数和返回值应具备的数据类型。在开发那些需要高度灵活性的应用程序时,您可能会需要为代码指定多种可能的返回类型,这样做可以使您的程序更加健壮,更能适应多变的运行环境。
数据科学工厂
2024-07-26
880
空间单细胞|Slide-seq分析、可视化与整合(1)
在本文中,我们将对利用Slide-seq v2技术获得的小鼠海马区数据集进行深入分析。
数据科学工厂
2024-07-16
690
Python中 __pycache__文件夹是什么?
当你编写一个独立的Python脚本时,目录结构看起来可能没什么特别。但随着项目逐渐变得复杂,你可能会倾向于将一些功能分离到其他模块或包中。这时,你可能会发现在源文件旁边,似乎毫无规律地,突然冒出一个__pycache__文件夹。
数据科学工厂
2024-07-16
960
从头构建和训练 GPT-2 |实战
该项目[1]将引导您完成构建简单 GPT-2 模型的所有步骤,并使用 Taylor Swift 和 Ed Sheeran 的一堆歌曲进行训练。本文的数据集和源代码将在 Github[2] 上提供。
数据科学工厂
2024-07-16
1120
空间单细胞|10x Visium数据分析、可视化与整合(2)
本文[1]介绍了使用Seurat分析具有空间分辨率的RNA测序数据的方法,重点在于将空间信息与分子数据相结合。将包括以下常见于空间数据分析的任务:
数据科学工厂
2024-07-16
1850
PyTorch | 加速模型训练的妙招
提升机器学习模型的训练速度是每位机器学习工程师的共同追求。训练速度的提升意味着实验周期的缩短,进而加速产品的迭代过程。同时,这也表示在进行单一模型训练时,所需的资源将会减少。简而言之,我们追求的是效率。
数据科学工厂
2024-07-16
1100
Linux|创建和使用 Bash 别名
bash 中的别名可以简单地称为命令或将运行另一个命令/程序的快捷方式。当我们的命令很长并且对于经常使用的命令时,别名非常有用。在本文[1]中,我们将了解别名的强大功能以及设置和使用别名的不同方法。
数据科学工厂
2024-07-16
1060
空间单细胞|10x Visium数据分析、可视化与整合(1)
本文[1]介绍了使用Seurat分析具有空间分辨率的RNA测序数据的方法,重点在于将空间信息与分子数据相结合。将包括以下常见于空间数据分析的任务:
数据科学工厂
2024-07-16
1630
Python 数据抓取教程:完结篇
Socket是一种工具,用于将多个设备连接起来,实现它们之间的数据交流。在这个过程中,会用到一个中介服务器,它负责在设备之间传递信息,但不允许设备之间直接建立联系。
数据科学工厂
2024-07-16
1090
Linux |使用“at”命令在指定时间运行任务
作为 cron 作业调度程序的替代方案,at 命令允许您安排命令在给定时间运行一次,而无需编辑配置文件。
数据科学工厂
2024-07-05
1190
大型语言模型如何工作?
第一个模型是文档补全器,只会根据最有可能成为下一个字符的内容来补全提示。这是我们用一部分互联网数据训练的基础模型。
数据科学工厂
2024-07-05
760
Linux|如何查找和删除重复文件
整理您的个人文件夹甚至整个操作系统可能会相当棘手,特别是当您习惯于使用下载管理器从网上下载各种资料时。
数据科学工厂
2024-07-05
1140
Python 爬虫数据抓取(10):LXML
它是一个第三方库,专门用于操作XML文件。我们在上一节中已经对XML有了深入的了解。
数据科学工厂
2024-07-05
960
Python|玩转 Asyncio 任务处理(2)
Python 的 Asyncio 模块在处理 I/O 密集型任务时表现出色,并且在最近的 Python 版本迭代中获得了诸多增强。不过,由于处理异步任务的途径多样,选择在特定情境下最合适的方法可能会让人感到迷惑。在这篇文章[1]中,我会先从任务对象的基本概念讲起,接着探讨各种处理异步任务的方法,并分析它们各自的优势和劣势。
数据科学工厂
2024-07-05
1170
空间单细胞|在Seurat中对空间数据进行分析(4)
在这篇指南[1]中,我们介绍了Seurat的一个新扩展功能,用以分析新型的空间解析数据,将重点介绍由不同成像技术生成的三个公开数据集。
数据科学工厂
2024-07-05
1720
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档