首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何又快又好地搜索代码?Facebook 提出基于机器学习新工具!

Facebook 官网博客对这项新成果进行了介绍,AI 科技评论编译如下。 当工程师能够很容易地找到代码示例来指导他们完成特定编码任务时,他们工作状态最佳。...高层次,模型生成过程每个代码片段都以方法级粒度嵌入到向量空间中。一旦模型建立完成,给定查询将映射到相同向量空间,并使用向量距离来评估代码片段与查询相关性。...创建一个训练数据集 通过 GitHub 挑选 26,109 个最受欢迎 Android 项目,我们直接在搜索语料库训练我们无监督模型 NCS。这也成为 NCS 返回代码片段搜索语料库。...Aroma 给出搜索结果与真值代码片段之间相似性评分,以评估得分超过阈值情形下查询是否被正确回答。有了这个管道,我们可以用一种可重现方式对模型进行评估。...NCS 和 UNIF 是代码搜索模型例子,它们可以自然语言查询和查找相关代码片段之间架起桥梁。

1.4K20
您找到你想要的搜索结果了吗?
是的
没有找到

GitHub.com那些东西你都知道什么意思吗?

Search(搜索) 在这里输入想要找用户或代码片段,就可以搜索到与之相关信息 Pull Request(请求) 显示用户已经进行过Pull Request。...当用户同时进行多个项目时,可以在这里一并查看Issue。 Gist(代码片段) Gist功能主要时用于管理及发布一些没必要保存在仓库代码,比如小代码片段等。...Gist添加代码示例可以嵌入博客,当然,如果选择了语言,还会自动添加语法高亮。 Notifications(通知) 这一图标用于提示用户是否有更新通知。...这样一来,这个人在GitHub活动都会显示News Feed(新闻提要)。...同时可以将标签加入时文件以归档形式(ZIP、tar.gz)下载到本地。软件版本升级时一般都会打标签,如果需要特定版本文件可以从这里寻找。

1.4K20

谷歌云工程师亲自示范:新发布 Video Intelligence API 究竟怎么用

近日,Sara Robinson GitHub 公开了该样例代码,并对 API 本身和样例实现做了简要说明。现AI研习社编译如下,希望对各位开发者有所帮助。...目前样例源码已经上传到了 GitHub,感兴趣朋友可以文末点击阅读原文,雷锋网原文中来查看详情。...通过这个样例,我们将看到 Video Intelligence API 两个重要功能: ● 识别目标视频每一帧内容; ● 庞大视频库搜索当前视频元数据。...关于后端:本样例将待处理视频存储谷歌云 Bucket ,这里我实现了一个函数,每当用户添加一个新视频到该 Bucket 时,该函数会被触发,一方面检查文件合法性(例如是否是视频文件文件是否完整等...前端是我跟另一个同事 Alex Wolfe 共同完成,其中用到了 ES6,Sass,Gulp,CanvasJS 等各种客户端 JS 工具(具体可以参考 GitHub 代码),实际实现了一个基于谷歌

1K70

GitHub不为人知小秘密…让你工作更高效

只要我发现 GitHub 某个特定功能可以为开发者提供帮助,我就会将它记录在这篇文章。也就是说,它绝不是一个详尽列表。...打开任意一个代码库并按下「t」键,你就可以根据名称搜索代码任何文件,你还可以用键盘上导航键操作箭头搜索结果中移动。按下回车键就可以打开想要查找文件。 ?...GitHub 让你能够查看代码合并请求文件时,通过按下「t」键跳转到某个特定标志。 ?...如果你 GitHub 上传了一个文件代码目录链接,而并没有把这个链接变成一个永久链接,那这些文件可能会在第二天消失,链接会被破坏!...如果你搜索包含多个单词,并且想要进行特定搜索查询,请给查询内容加上引号。你还可以通过其它方式过滤搜索,比如文件大小、扩展名、文件所在路径等等。

60810

揭开周获 18k star 开源项目的神秘面纱「GitHub 热点速览 v.22.28」

最后,还有前端同学不可错过代码片段管理器 massCode,像快速复用某段代码吗?不妨用 massCode。...GitHub 地址→https://github.com/searxng/searxng 2.3 代码片段管理:massCode 本周 star 增长数 1,150+ massCode 允许你使用多级文件夹以及标签来组织代码片段...每个代码片段都有片段-标签,这提供了更高层次组织,也更方便你来复用代码。...eBPF 技术实现了 3snake 功能,它会跟踪 PAM(Pluggable Authentication Modules)库特定用户域函数,而像 sudo、sshd、passwd、gnome...GitHub Trending 如果你 Pick 其他好玩、实用 GitHub 项目,记得来 HelloGitHub issue 区和我们分享下哟 最后,记得你本文留言区留下你想看主题 Repo

64620

GitHub不为人知小秘密…让你工作更高效

只要我发现 GitHub 某个特定功能可以为开发者提供帮助,我就会将它记录在这篇文章。也就是说,它绝不是一个详尽列表。...打开任意一个代码库并按下「t」键,你就可以根据名称搜索代码任何文件,你还可以用键盘上导航键操作箭头搜索结果中移动。按下回车键就可以打开想要查找文件。 ?...GitHub 让你能够查看代码合并请求文件时,通过按下「t」键跳转到某个特定标志。 ?...如果你 GitHub 上传了一个文件代码目录链接,而并没有把这个链接变成一个永久链接,那这些文件可能会在第二天消失,链接会被破坏!...如果你搜索包含多个单词,并且想要进行特定搜索查询,请给查询内容加上引号。你还可以通过其它方式过滤搜索,比如文件大小、扩展名、文件所在路径等等。

49530

对Copilot进行逆向工程之后,我发现它可能只用了参数量12B小模型

例如,一个元素可以类似于「比较这个来自 片段」,或本地导入上下文,或每个文件语言 ID 及和 / 或路径。...我很好奇他们是如何测出这个数字,所以想在 telemetry 代码插入一些内容。 我还想知道它收集了哪些 telemetry 数据,尤其是是否收集了代码片段。...注意,GitHub 会让你选择是否同意用你代码片段「改进产品」,如果你不同意,包含这些片段 telemetry 就不会被发送到服务器(至少我检查 v1.57 是这样,但我也验证了 v1.65...启用 verbose logging 如果你想启用 verbose logging,你可以通过修改扩展代码来实现: 搜索扩展文件。...搜索字符串 shouldLog (e,t,n){ ,如果找不到,也可以尝试 shouldLog ( 。几个搜索匹配,其中一个将是非空函数定义。 函数体开头,添加 return true。

1.4K30

LyScript 自实现汇编搜索功能

通过对LyScript自动化插件进行二次封装,实现从内存读入目标进程解码后机器码,并通过Python代码在这些机器码寻找特定十六进制字符数组,或直接检索是否存在连续反汇编指令片段等功能。...插件地址:https://github.com/lyshark/LyScript 搜索内存机器码: 内存机器码需要配合LyScript32插件,从内存寻找指令片段。...from LyScript32 import MyDebug # 将可执行文件单数转换为 0x00 格式 def ReadHexCode(code): hex_code = []...read_bytes) dbg.close() return ref_code except Exception: return False # 字节数组匹配是否与特征码一致...from LyScript32 import MyDebug # 检索指定序列是否存在一段特定指令集 def SearchOpCode(OpCodeList,SearchCode,ReadByte

21710

GitHub不为人知小秘密…让你工作更高效

只要我发现 GitHub 某个特定功能可以为开发者提供帮助,我就会将它记录在这篇文章。也就是说,它绝不是一个详尽列表。...打开任意一个代码库并按下「t」键,你就可以根据名称搜索代码任何文件,你还可以用键盘上导航键操作箭头搜索结果中移动。按下回车键就可以打开想要查找文件。 ?...GitHub 让你能够查看代码合并请求文件时,通过按下「t」键跳转到某个特定标志。 ?...如果你 GitHub 上传了一个文件代码目录链接,而并没有把这个链接变成一个永久链接,那这些文件可能会在第二天消失,链接会被破坏!...如果你搜索包含多个单词,并且想要进行特定搜索查询,请给查询内容加上引号。你还可以通过其它方式过滤搜索,比如文件大小、扩展名、文件所在路径等等。

65530

有了向量数据库,我们还需 SQL 数据库吗?

%E7%B4%A2-%EF%BC%88semantic-search%EF%BC%89)前先根据某种条件过滤数据,例如: 法律领域,可能只需要从某个特定数据库搜索相关法律条款; 零售业,可能需要搜索某个尺码男鞋...我们将演示如何利用标量过滤来召回只符合某些特定条件文档片段,例如特定来源网址,或者特定文件名称。大家也可以利用类似的思路实现召回带有特定标签文档,例如发表年份、版本号等。...Ingestion Pipeline支持上传您在对象存储文件(例如AWS S3 和 Google Cloud Storage)。本例我们将数据上传至 AWS S3。...代码粘贴Pre-signed URL 并点击运行。这步会将文件进行分片提取向量并导入到向量数据库 Collection 。 9....进入collection页面,检查 Collection 和 Schema 是否正确。此时文档片段向量应该已经显示Data Preview中了。

22310

【硬核干货】如何高效找到优质编程项目?

首先我们要明确什么是好项目。 什么是好项目? 虽说没有最好项目,只有最适合自己项目。但是 GitHub ,通过一些指标和信息,也可以对开源项目进行基本评判。...比如搜索自述文件包含 jquery、star 超过 1000、且上次更新时间几年内仓库: 有很多过滤条件,但是 完全无需记忆!...Githuber.cn 发现优秀 GitHub 开发者网站,可以查看国内仓库语言使用情况统计、GitHub 开发者排名等,还能查看自己排名哦~ searchcode 如果你想搜索代码片段可以使用...LibHunt 汇集了 GitHub 实用开源项目和软件类库,让编程人员快速发现好项目。支持近 20 种不同编程语言项目,以及各种热门标签,可以快速搜索,还能查看项目热度。...Gitee 会自动将代码GitHub 进行同步,然后你就可以 Gitee 以更快速度来下载和管理项目代码

1.1K42

KG4Py:Python代码知识图谱和语义搜索工具包

如何构建Python代码知识图谱,又该如何进行搜索呢?现在项目程序存在着大量重复代码片段,尤其是软件开发时候。...本文中,我们提出了一个工具包(KG4Py),用于GitHub存储库中生成Python文件知识图谱,并使用知识图谱进行语义搜索。...KG4Py,我们删除了31.7万个Python文件所有重复文件,并通过使用具体语法树(CST)构建Python函数代码知识图谱来执行这些文件静态代码分析。...传统代码搜索主要基于关键词,无法挖掘搜索语句深层语义信息。目前,GitHub搜索代码片段仅限于关键字搜索,这是基于用户能够预测他们正在查找代码片段相关关键字来完成。...代码分析阶段,我们 GitHub 中发现了大量重复代码片段,这不仅造成了资源浪费,还增加了软件公司开发成本。

2.1K30

KG4Py:Python代码知识图谱和语义搜索工具包

如何构建Python代码知识图谱,又该如何进行搜索呢?现在项目程序存在着大量重复代码片段,尤其是软件开发时候。...本文中,我们提出了一个工具包(KG4Py),用于GitHub存储库中生成Python文件知识图谱,并使用知识图谱进行语义搜索。...KG4Py,我们删除了31.7万个Python文件所有重复文件,并通过使用具体语法树(CST)构建Python函数代码知识图谱来执行这些文件静态代码分析。...传统代码搜索主要基于关键词,无法挖掘搜索语句深层语义信息。目前,GitHub搜索代码片段仅限于关键字搜索,这是基于用户能够预测他们正在查找代码片段相关关键字来完成。...代码分析阶段,我们 GitHub 中发现了大量重复代码片段,这不仅造成了资源浪费,还增加了软件公司开发成本。

2.2K40

LyScript 自实现汇编搜索功能

通过对LyScript自动化插件进行二次封装,实现从内存读入目标进程解码后机器码,并通过Python代码在这些机器码寻找特定十六进制字符数组,或直接检索是否存在连续反汇编指令片段等功能。...插件地址:https://github.com/lyshark/LyScript搜索内存机器码: 内存机器码需要配合LyScript32插件,从内存寻找指令片段。...from LyScript32 import MyDebug# 将可执行文件单数转换为 0x00 格式def ReadHexCode(code): hex_code = [] for index...ref_code.append(read_bytes) dbg.close() return ref_code except Exception: return False# 字节数组匹配是否与特征码一致...from LyScript32 import MyDebug# 检索指定序列是否存在一段特定指令集def SearchOpCode(OpCodeList,SearchCode,ReadByte):

28920

作为软件工程师,如何进行知识管理

Twitter、Medium、RSS feeds、Hacker News 等专业网站和社区浏览几分钟,就足以从论文、案例研究、教程、代码片段、新应用程序等内容中找到大量有用信息。...收集和整理所有这些信息可能是一项艰巨任务。在这篇文章,我将介绍一些我进行知识管理工具。 我认为对知识管理非常重要一点是避免局限特定平台。...我尽量保持阅读列表足够小,并保存存档我处理过信息。Pocket 允许你标记文章,以便以后能更轻松地搜索特定主题文章。...使用 SnippetStore 进行代码片段管理 从 GitHub 到 Stack Overflow answers,再到博客文章,常常能找到一些你希望稍后保存代码片段。...SnippetStore 与其他产品区别在于它简单性。你可以按语言或标签组织整理代码片段,并且可以有多个文件片段。它不完美但足以完成我需要工作。

1.1K30

如何光明正大地学习KISS?当然是用这个DL接吻检测器了

其实,电影场景类型对于视频编辑、分类和个性化等应用来说,都非常重要。 精确场景探测器可以丰富特定场景类型视频元数据,用户也可以轻松搜索和检索目标片段。...但是,大多数现有系统都只是对静止帧进行分类,或者识别整个视频是否存在某个动作。所以,在这项研究,作者提出了一个检测和提取电影接吻片段系统。...作者 Github 提供了使用代码方法,可以通过提供 API 从视频获得接吻镜头。 调用代码方式如下: ?...从 Youtube 网站视频获取接吻镜头: ? 代码可以 Github examples 文件夹中找到。...ResNet 以 3 通道 224x224 张量形式 1 秒钟视频片段最后一帧运行。作者已经分离了最后一个全连接层,并使用了前一层 512 维输出。

54720

谈谈你不知道gist

当您需要与同事或朋友共享示例代码或技术时,可以使用它。 GitHub 提供了一个平台,可以作为团队(私人仓库)或整个世界(公共仓库)回购共享整个项目。 Gist 就是小型代码片段分享....主页显示,也无法用搜索引擎搜索到,但这个链接是人人都能访问 Gist 可以搜索、下载、嵌入到网页 2.创建新 Gist, 编辑修改 Gist https://gist.github.com/ , 直接填写内容或者自己...搜索可以进行代码搜索(开放 gist), 可能搜出相关代码片段 点 All Gists 可以到 Discover gists 模式, 查看最近发布或被 fork gists(或者别的排序方式)....浏览 Gist 时点击右上 GithubGist 图标或者左上头像选 Your Gists 即可返回 浏览 Gist 文件时, 点 Raw 可以看文字代码. 4.分享 点击一个 gist 进去... gist 代码片段分享 1.首先在 github 创建 Personal access tokens,创建成功将获取到秘钥保存(只会展示一次)。

93120
领券