java logp - 腾讯云开发者社区

文章/答案/技术大牛

发布

RDKit：基于支持向量回归（SVR）预测logP

使用支持向量回归（SVR）来预测logP。分子的输入结构特征是摩根指纹，输出是logP。...= logP_total[0:num_train] fps_test = fps_total[num_train:] logP_test = logP_total[num_train:] 将SVR模型用于回归模型...logP_pred = clf.predict(fps_test) r2 = r2_score(logP_test, logP_pred) mse = mean_squared_error(logP_test..., logP_pred) yy = slope*logP_test+intercept plt.scatter(logP_test, logP_pred, color='black', s=1) plt.plot...(logP_test, yy, label='Predicted logP = '+str(round(slope,2))+'*True logP + '+str(round(intercept,2))

1.3K2 0

RDKit | 基于不同描述符和指纹的机器学习模型预测logP

"]print("Shape:", data_logp.shape)data_logp.head() ?...将SMILES转换为RDKit的Mol对象 data_logp['molecules'] = data_logp.SMILES.apply(Chem.MolFromSmiles)data_logp.head...与实验记录P的性能 r2 = r2_score(data_logP.logPexp, data_logP.MolLogP)mse = mean_squared_error(data_logP.logPexp..., data_logP.MolLogP)plt.scatter(data_logP.logPexp, data_logP.MolLogP, label = "MSE: {:.2f}...的性能 r2 = r2_score(data_logP.logPexp, data_logP.MolLogP)mse = mean_squared_error(data_logP.logPexp, data_logP.MolLogP

5.2K3 0

您找到你想要的搜索结果了吗？

是的

没有找到

ICML 2022 | LIMO: 一种快速生成靶向分子的新方法

4.2 评价指标利用QED和最大化penalized logP（p-logP）、针对性的logP、最大化相似性约束p-logP、子结构约束的logP极端化，以及单一和多目标结合亲和力最大化进行综合评估...4.5 实验结果 4.5.1 QED和p-logP最大化表1 QED和p-logP最大化方法的比较表1显示了LIMO和基线模型在生成具有高惩罚性logP和QED分数的分子方面的结果。...4.5.2 目标性的logP 表2 生成目标范围logP的结果表2展示了LIMO生成logP目标范围为-2.5logPlogP 表3最大化相似性约束 p-logP结果表3总结了相似性约束的p-logP最大化任务的结果。...4.5.4 子结构约束的logP极端化图2子结构约束的logP极端化任务的结果图2显示了子结构约束的logP极端化任务的结果。

5153 0

并行计算模型

在这里，我们先介绍一些常用的并行计算模型：PRAM模型，异步PRAM模型，BSP模型和LogP模型。 PRAM模型基本概念由Fortune和Wyllie 1978年提出，又称SIMD-SM模型。...Arbitrary PRAM-CRCW)：允许任意处理器自由写入 PRAM-CREW并发读互斥写 PRAM-EREW互斥读互斥写计算能力比较 PRAM-CRCW是最强的计算模型，PRAM-EREW可logp...LogP模型基本概念由Culler(1993)年提出的，是一种分布存储的、点到点通讯的多处理机模型，其中通讯由一组参数描述，实行隐式同步。...BSP模型 vs LogP模型 BSP -> LogP：BSP块同步BSP子集同步BSP进程对同步＝LogP BSP可以常数因子模拟LogP，LogP可以对数因子模拟BSP BSP＝LogP+Barriers－Overhead...BSP提供了更方便的程设环境，LogP更好地利用了机器资源 BSP似乎更简单、方便和符合结构化编程参考 [并行计算——结构·算法·编程].陈国良

1.7K4 0

Policy Gradient - 策略梯度

pθ(τ)[R(τ)∇logpθ(τ)]\nabla \overline{R}_\theta = \sum R(\tau)p_\theta(\tau)\nabla logp_\theta(\tau)=E..._{\tau\sim p_\theta(\tau)}[R(\tau)\nabla logp_\theta(\tau)] ∇Rθ=∑R(τ)pθ(τ)∇logpθ(τ)=Eτ∼pθ(τ)[R(τ...)∇logpθ(τ)]≈1N∑n=1NR(τn)∇logpθ(τn)=1N∑n=1N∑t=1TnR(τn)∇logpθ(atn∣stn)\approx \frac{1}{N}\sum_{n=1}^{N...}R(\tau^n)\nabla logp_\theta(\tau^n)=\frac{1}{N}\sum_{n=1}^N\sum_{t=1}^{T_n}R(\tau^n)\nabla logp_\theta...(a_t^n|s_t^n)≈N1n=1∑NR(τn)∇logpθ(τn)=N1n=1∑Nt=1∑TnR(τn)∇logpθ(atn∣stn) 也就是说，我们是以采样求和的方式来逼近概率分布

7552 0

画出优雅的气泡图

range and FPKM range quantile(m5$`-logP`,probs = c(0:10)/10) m5[m5$`-logP`>500,]$`-logP` <- 500 quantile...(m5$`-logP`,probs = c(0:10)/10) m5[m5$`-logP`logP` <- 10 quantile(m5$`-logP`,probs = c(0:10)/...FPKM,probs = c(0:10)/10) #filtered_motifs.pdf，按照paper的描述筛选出来的motif p1logP...`>500,]$`-logP`<-500 pm5[pm5$`-logP`logP`<-10 pm5[pm5$FPKM>20,]$FPKM<-20 #paper_motifs.pdf...，paper的图里出现的转录因子对应的motif p3logP`))+ geom_point(shape=21,aes(fill=FPKM

8726 0

Nat Commun｜语言模型可以学习复杂的分子分布

a 惩罚性LogP任务中训练数据的惩罚性LogP与SA得分的分布。b 多分布任务的训练数据中不同权重分子的四种模式。c 大规模任务的分子量训练分布。d-f 每个生成式建模任务的训练数据中的分子示例。...惩罚性LogP任务对于第一项任务，我们考虑了最广泛使用的搜索化学空间的基准评估之一，即惩罚性LogP任务，寻找具有高LogP的分子，并以可合成性和不切实际的环作为惩罚。...图2：惩罚性的LogP任务I a 使用在SMILES上训练的SM-RNN、在SELFIES上训练的SF-RNN和图形模型：CGVAE和JTVAE的训练数据 (TRAIN) 中分子的惩罚LogP分数的绘图分布...图3：惩罚性LogP任务II a-d 所有模型生成的分子或训练数据中惩罚性LogP≥6.0的分子的惩罚性LogP、原子数、环数和最大碳链长度 (均为每个分子) 的直方图。...此外，训练分子似乎分为两种模式，即LogP值较低和较高的分子 (图5b)：生物大分子定义较低的模式，而具有更多环和更长碳链的分子定义较高的LogP模式（更多的例子分子可以在补充图8中看到)。

4934 0

J. Cheminform.| Mol-CycleGAN:基于Graph的分子生成优化模型

logP使用在JT-VAE模型中的惩罚公式，即对于分子m而言，惩罚logP表示为logP（m）-SA（m），训练数据从ZINC数据集上提取，而DRD2任务使用随机森林分类算法在ECFP分子指纹上训练，活性数据从...（2）任务二：约束分子优化优化惩罚logP，同时约束与起始分子的偏离程度。分子之间的相似性是用Morgan Fingerprints上的Tanimoto相似性来衡量的。...X和Y集ZINC-250K的随机样本，其中化合物的惩罚logP值分别低于中位数和高于中位数。（3）任务三：不受约束的分子优化对惩罚logP执行不受约束的优化。...X是来自ZINC-250K的随机样本，Y是来自ZINC-250K中具有最高logP的前20％分子的随机样本。...（2）受约束分子优化在优化类药分子的惩罚logP任务中，该模型在性能平均改善方面明显优于以前的结果（请参见表6）。在受约束的情况下（对于δ> 0），它获得了可比的平均相似度。

7895 0

生成Python函数一半没问题，当前最「正统」的代码生成是什么样的？

也就是说，logP(x) + logP(y|x) 需要等于 logP(y) + logP(x|y)，这是代码生成与总结的内在联系。如果两项差别很大，那么至少可以判定代码生成与总结都没有达到最优。...在这篇论文中，北大研究者在 Java 与 Python 两个数据集，测试了代码生成与总结的效果。...其中 Java 数据集是从 GitHub Java 项目中抽取的 Java 方法，以及对应的自然语言注释，该自然语言了这个方法的用途。...与 Java 类似，Python 数据集也是从 GitHub 中抽取的。两种数据集的统计信息如下所示： ?...值得注意的是，在代码生成中，Java 和 Python 的 PoV 分别只有 27.4 与 51.9%。

4702 0

交叉熵

X的熵定义为： H(X) = Eplogp(x) = −∑p(x)logp(x) 如果p(x)是连续型随机变量的pdf，则熵定义为： H(X)=−∫p(x)logp(x)dx 为了保证有效性，这里约定当...p(x)→0时,有p(x)logp(x)→0 当X为0-1分布时，熵与概率p的关系如下图：可以看出，当两种取值的可能性相等时，不确定度最大（此时没有任何先验知识），这个结论可以推广到多种取值的情况。...DKL(p||q)=Ep[logp(x)q(x)]=∑p(x)logp(x)q(x) =∑[p(x)logp(x)−p(x)logq(x)] =∑p(x)logp(x)−∑p(x)logq(x) =−H

5691 0

AIGC之VAE详解与代码实战

,x(N)))=i=1∑Nlogpθ(x(i)) 我们知道pθ(x)=∫pθ(z)pθ(x∣z)dzpθ(x)=∫pθ(z)pθ(x∣z)dz很难求解，上面的释然函数自然没法求解。...(z∣x)]=Eqϕ(z∣x)[logqϕ(z∣x)−log(pθ(x∣z)pθ(z)/pθ(x))]=Eqϕ(z∣x)[logqϕ(z∣x)−log(pθ(x∣z)−logpθ(z)+logpθ(x)...)]=Eqϕ(z∣x)[logqϕ(z∣x)−logpθ(z)]−Eqϕ(z∣x)[log(pθ(x∣z)]+logpθ(x)=KL(qϕ(z∣x)∣∣pθ(z))−Eqϕ(z∣x)[log(pθ(x∣...z)]+logpθ(x)KL(qϕ(z∣x)∣∣pθ(z∣x))=Eqϕ(z∣x)[log(qϕ(z∣x)/pθ(z∣x))]=Eqϕ(z∣x)[logqϕ(z∣x)−logpθ(z...+logpθ(x))]=Eqϕ(z∣x)[logqϕ(z∣x)−logpθ(z)]−Eqϕ(z∣x)[log(pθ(x∣z)]+logpθ(x)=KL(qϕ(z∣x)∣∣pθ(z)

3791 0

Nat. Comm. | 语言模型可以学习复杂的分子分布

语言模型可以准确生成：ZINC15数据集中惩罚 LogP得分最高分子的分布、PubChem数据集中多模态分子及最大分子的分布。...惩罚 LogP 任务该任务目标是学习具有高惩罚LogP分数的分子的分布。作者在ZINC数据库中筛选惩罚LogP值超过 4.0 的分子构建训练数据集。结果如图2所示。...表2 Wasserstein距离指标的结果作者进一步研究了训练数据的最高惩罚LogP区域，即值超过6.0的训练分布的尾部。...此外，训练数据中惩罚LogP得分最高的分子通常包含非常长的碳链和更少的环（图 3b，d），RNN能够学习到这一点。...总体而言，语言模型比图模型可以更好地学习具有高惩罚LogP的分子分布。

5742 0

JCIM｜用Transformer-decoder模型进行分子生成

图6取决于(A)TPSA+logP、(B)SAS+logP、(C)SAS+TPSA和(D)TPSA+logP+SAS 的生成分子的性质分布。...生成的分子的骨架和用于调节(B)logP、(D)SAS、(F)TPSA和(H)QED的骨架的骨本相似性的分布。...图9 在MOSES数据集上训练以支架+(A)TPSA+logP、(B)SAS+TPSA、(C)SAS+logP和(D)TPSA+logP+SAS为条件的生成分子的性质分布。...图10 在MOSES数据集上训练的(A)TPSA+logP，(B)SAS+TPSA，(C)SAS+logP，和(D)TPSA+logP+SAS的生成分子的骨架和用于调节的骨架的骨本相似性的分布。...在图12中，作者展示了其他样本例子，其中TPSA、LogP和支架结构保持不变，SAS被改进到更理想的值。

4.2K1 0

Text to image论文精读CogView: Mastering Text-to-Image Generation via Transformers

xi∣zi;ψ)]⏟reconstruction loss +KL⁡(q(z∣xi;ϕ)∥p(z∣ti;θ))⏟KL between q and (text conditional) prior ).logp...(X,T;θ,ψ)=∑i=1Nlogp(ti;θ)+∑i=1Nlogp(xi∣ti;θ,ψ)≥−∑i=1N(NLL loss for text −logp(ti;θ)+reconstruction... loss zi∼q(z∣xi;ϕ)E[−logp(xi∣zi;ψ)]+KL between q and (text conditional) prior KL(q(z∣xi;ϕ)∥p(...(X,T;θ,ψ)=∑i=1Nlogp(ti;θ)+∑i=1Nlogp(xi∣ti;θ,ψ)≥−∑i=1N(reconstruction loss zi∼q(z∣xi;ϕ)E[−logp...(xi∣zi;ψ)]NLL loss for text −logp(ti;θ)NLL loss for z −logp(zi∣ti;θ)).

3070 0

AC GAN

那么对于输入数据有L_S = E[logP(S=real|X_{real})]+E[logP(S=fake|X_{fake})] 第一项：当输入数据是真数据，判定为真的结果的期望。...对于输入标签有： L_C = E[logP(C=c|X_{real})]+E[logP(C=c|X_{fake})] 第一项：当输入真数据的label被判定确切属于某类c的期望。

1.6K0 0

5分钟NLP：Python文本生成的Beam Search解码

所以我们需要定义一个函数来完成整句的概率计算： import torch.nn.functional as Fdef log_probability_single(logits, labels): logp...= F.log_softmax(logits, dim=-1) logp_label = torch.gather(logp, 2, labels.unsqueeze(2)).squeeze(-1)...return logp_labeldef sentence_logprob(model, labels, input_len=0): with torch.no_grad(): result

3281 0

seq2seq通俗理解----编码器和解码器(TensorFlow实现)

,yt′−1,c) 并得到该输出序列的损失： −logP(y1,...,yt′−1∣x1,...,xT)=−∑t′=1T′logP(yt′∣y1,...,yt′−1,c)-logP(y_1,......,x_T)=-\sum_{t^{′}=1}^{T^{′}}logP(y_{t^{′}}|y_1,...,y_{t^{′}-1},c)−logP(y1,...,yt′−1∣x1,......在最终候选输出序列的集合中，我们取以下分数最⾼的序列作为输出序列： 1LαlogP(y1,...,yL)=1Lα∑t′=1T′logP(yt′∣y1,......,yt′−1,c)\frac{1}{L^{\alpha}}logP(y_1,......,y_{t^{′}-1},c)Lα1logP(y1,...,yL)=Lα1t′=1∑T′logP(yt′∣y1,...

1.1K4 0

focal loss理解及实现要点

这时cross entropy loss可写为：CE(p,y)=CE(p_t)=-logp_t focal loss 公式：FL(p_t)=-\alpha(1-p_t)^\gamma logp_t 调节正负样本不均衡的传统手段...解释：最后一层的输出loss = wx + b， wx = -logp_t, loss = -logp_t-log((1-\pi)/\pi)=-log(p_t*(1-\pi)/\pi)。

2K0 0

5分钟NLP：Python文本生成的Beam Search解码

所以我们需要定义一个函数来完成整句的概率计算： import torch.nn.functional as F def log_probability_single(logits, labels): logp...= F.log_softmax(logits, dim=-1) logp_label = torch.gather(logp, 2, labels.unsqueeze(2)).squeeze(...-1) return logp_label def sentence_logprob(model, labels, input_len=0): with torch.no_grad():

3293 0

交叉熵 KL散度

信息量假设 X 是一个离散随机变量，则概率分布可表示为 $P(X=x)$ ，其中所含的信息量可表示为$$I(x)=-logP(x)\tag{1}$$信息熵当一个事件发生的概率为 P(x) ，那么根据公式...(1)可以得知其信息量为 -logP(x) ，那么如果我们把这个事件的所有可能性罗列出来，就可以求得该事件信息量的期望。...假设事件 X 有 n 种可能性，其中 $x{i}$ 的发生概率为 $P(x{i})$，那么该事件的熵 H(X) 为：$$H(X)=-\sum{i=1}^{n}P(x{i})logP(x_{i})\tag...散度的公式，我们可以进行以下的变形：$$D{KL}(P||Q)=\sum{i=1}^{n}P(x{i})log(\frac {P(x{i})}{Q(x{i})})\= \sum{i=1}^{n}P(x{i})logP

2610 0

点击加载更多

RDKit：基于支持向量回归（SVR）预测logP

RDKit | 基于不同描述符和指纹的机器学习模型预测logP

ICML 2022 | LIMO: 一种快速生成靶向分子的新方法

并行计算模型

Policy Gradient - 策略梯度

画出优雅的气泡图

Nat Commun｜语言模型可以学习复杂的分子分布

J. Cheminform.| Mol-CycleGAN:基于Graph的分子生成优化模型

生成Python函数一半没问题，当前最「正统」的代码生成是什么样的？

交叉熵

AIGC之VAE详解与代码实战

Nat. Comm. | 语言模型可以学习复杂的分子分布

JCIM｜用Transformer-decoder模型进行分子生成

Text to image论文精读CogView: Mastering Text-to-Image Generation via Transformers

AC GAN

5分钟NLP：Python文本生成的Beam Search解码

seq2seq通俗理解----编码器和解码器(TensorFlow实现)

focal loss理解及实现要点

5分钟NLP：Python文本生成的Beam Search解码

交叉熵 KL散度

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐