首页
学习
活动
专区
工具
TVP
发布

NLP算法工程师之路

专栏作者
72
文章
83628
阅读量
17
订阅数
TensorFlow 2.0 Question Answering
GPT-2 and BERT Pretrained Weights (pytorch) You can find weights for BERT and GPT-2 models (pytorch), ready to be used with HuggingFace’s Transformers or your own models: https://www.kaggle.com/abhishek/bert-pytorch https://www.kaggle.com/abhishek/gpt2-p
故事尾音
2019-12-18
5060
服务器环境配置命令
conda检查和clone环境 codna info -e conda create -n tf20 --clone tf13 #创建tf20环境 pip 使用阿里云的源 Linux、Mac下 修改~/.pip/pip.conf(不存在就创建一个),加入如下配置: [global] index-url = http://mirrors.aliyun.com/pypi/simple/ [install] trusted-host=mirrors.aliyun.com windows下,在当前用户目
故事尾音
2019-12-18
1.3K0
《Retrieve-and-Read,Multi-task Learning of Information Retrieval and Reading Comprehension》的Reference
Text Span的评估指标: For text-span questions whose answer is string(s), we need to compare the predicted string(s) with the ground truth answer string(s) (i.e., the correct answer). RCstyle QA task generally uses evaluation metrics Exact Match (EM) and F1 score (F1) proposed by Rajpurkar et al. [94] for text-span questions [104, 116]. EM assigns credit 1.0 to questions whose predicted answer is exactly the same as the ground truth answer and 0.0 otherwise, so the computation of EM is the same as the metric Accuracy but for different categories of RC-style QA. F1 measures the average word overlap between the predicted answer and the ground truth answer. These two answers are both considered as bag of words with lower cases and ignored the punctuation and articles “a”, “an” and “the”. For example, the answer “The Question Answering System” is treated as a set of words {question, answering, system}. Therefore, F1 of each text-span question can be computed at word-level by Equation 2.2
故事尾音
2019-12-18
7780
日常bug
这是因为脚本文件可能在window弄过,有window下的空行,把他转换成unix格式的就行。
故事尾音
2019-12-18
5730
最近调代码两个的bug
这是因为脚本文件可能在window弄过,有window下的空行,把他转换成unix格式的就行。
故事尾音
2019-12-18
3670
Dureader数据集
Dureader数据集 数据示例 {"documents": [{ "is_selected": true, "title": "iOS里,把一个页面链接分享给好友,好友在微信里打开这个链接,怎么跳", "most_related_para": 0, "segmented_title": ["iOS", "里", ",", "把", "一", "个", "页面", "链接", "分享", "给", "好友", ",", "好友", "在", "微信", "里", "打开", "这个", "链
故事尾音
2019-12-18
1.9K0
Tqdm实时显示Loss和Acc
代码示例 from random import random from time import sleep from tqdm import tqdm epochs = 2 train_data_num = 10 for i in range(epochs): with tqdm(total=train_data_num) as t: for j in range(10): # Description will be displayed on the lef
故事尾音
2019-12-18
6.2K0
如何配置深度学习系统
Anacodna相关操作 下载安装以及切换镜像 #下载和安装anaconda wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.sh bash Anaconda3-5.2.0-Linux-x86_64.sh #切换到清华源,加快下载速度 wget https://tuna.moe/oh-my-tuna/oh-my-tuna.py python oh-my-tuna.py conda
故事尾音
2019-12-18
1.4K0
nohup详解
如果后台同时运行多个程序,它们的输出全都在nohup.out中,阅读起来很不方便。可通过重定向到不同文件中来解决这个问题;也可以通过在不同的文件下,运行nohup来避免这种情况。 linux启动后,会默认打开3个文件描述符,0表示标准输入,1表示正确输出,2表示错误输出。
故事尾音
2019-12-18
1.2K0
HEXO博客迁移的步骤
最近买了新电脑,但是博客是今天才迁移过来。本以为很麻烦,实际上操作非常简单,只需要三个步骤。
故事尾音
2019-12-18
9960
基于文档的限定领域对话式问答系统设计说明
为了从整体上描述基于文档的限定领域对话式问答系统要实现的功能,使用户能够对本系统有一个全面正确的认识,同时给程序开发者一个关于系统的使用,系统的功能模块,以及系统的各种技术解决方案一个详细的说明。
故事尾音
2019-12-18
1.9K0
cdqa使用方法
文档:Closed Domain Question Answering 使用CSV文件数据 import os import pandas as pd from ast import literal_eval from cdqa.utils.filters import filter_paragraphs from cdqa.pipeline import QAPipeline #Download pre-trained reader model and example dataset from cdq
故事尾音
2019-12-18
1.4K0
kashgari学习
文本分类 训练和保存模型代码 import kashgari from kashgari.corpus import SMP2018ECDTCorpus from kashgari.tasks.classification import BiLSTM_Model from kashgari.embeddings import BERTEmbedding from kashgari.callbacks import EvalCallBack from tensorflow.python import kera
故事尾音
2019-12-18
1.7K1
论文阅读-20190928
《 3R: Reading - Ranking - Recognizing for Multi-Passage Reading Comprehension》
故事尾音
2019-12-18
1K0
Docker部署深度学习模型
参考链接:https://docs.docker.com/install/linux/docker-ce/centos/ 运行到sudo docker run hello-world正常输出即可
故事尾音
2019-12-18
8290
CS231N学习笔记
CS231n的全称是CS231n: Convolutional Neural Networks for Visual Recognition,即面向视觉识别的卷积神经网络。该课程是斯坦福大学计算机视觉实验室推出的课程。 课程官网:http://cs231n.stanford.edu/ 官方笔记:http://cs231n.github.io/ B站视频:https://www.bilibili.com/video/av58778425 课程作业:https://github.com/Burton2000/CS231n-2017
故事尾音
2019-12-18
8970
THU深圳研究院:大数据机器学习
B站视频:https://www.bilibili.com/video/av67224054
故事尾音
2019-12-18
5730
论文阅读-20190924
《SANVis: Visual Analytics for Understanding Self-Attention Networks》
故事尾音
2019-12-18
9200
Python音频信号处理
音频信号是模拟信号,我们需要将其保存为数字信号,才能对语音进行算法操作,WAV是Microsoft开发的一种声音文件格式,通常被用来保存未压缩的声音数据。
故事尾音
2019-12-18
4.7K0
概率图模型理论与应用
概率图模型
故事尾音
2019-12-18
7110
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档