在这款应用于2016年7月抛弃了按时间顺序的算法之前,Instagram用户在所有帖子和好友的帖子中都有70%的丢失。 Instagram的feed排名标准 Instagram依靠基于你过去行为的机器学习为每个人创建一个独特的feed。 三个主要因素决定了你在Instagram上看到了什么: 兴趣:Instagram预计你会关注一个帖子,对你来说重要的是什么,取决于你过去对类似内容的行为,以及可能的机器视觉分析文章的实际内容。 人际关系:你和分享你的人有多亲密,对于你过去在Instagram上经常与之互动的人来说,你的排名更高,比如评论他们的帖子或者在照片中被贴上标签。 ? Instagram并不会因为频繁发布或其他特定的行为而贬低用户,但它可能会在其他人之间的其他内容中进行交换,如果他们快速地发布不同的帖子的话。
在本文中,我们将深入研究Instagram(一款非常流行的社交网络应用程序)在过去十年来UI和UX的发展和演变。 背景 Instagram最初是一个照片共享社区。 “Reels” “Reels”是一项视频功能,允许用户拍摄并上传最长30秒的视频,这是Instagram试图与TikTok竞争的功能。它的按钮位置取代了中心的“新帖子”按钮。 feed当中,出现了嵌入式的广告帖,将本来流畅的观感和使用体验给破坏掉了。 这个问题其实是因为Instagram Feed算法的变化而产生的。 现在用户没办法像从前一样,按帖子的发布时间顺序来查看,而是根据Instagram上的参与度和覆盖率来显示帖子。 许多用户一直要求恢复到初始状态,但无济于事。 当用户为了查看更新帖子而滚动到feed的底部时,显示的仍然是更多的“猜你喜欢”这类的帖子。而这个功能本来就已经重复了,在“浏览”页下,已经根据用户兴趣推荐了帖子。
Vite学习指南,基于腾讯云Webify部署项目。
周二,Instagram宣布了一系列新功能,以打击有关冠状病毒大流行的错误信息,同时还推出了一个共同观看功能,帮助用户在家中躲避时感觉不那么孤立。 打击虚假信息的努力包括: 将有关新冠病毒的帐户从推荐名单中删除,除非这些帐户由可信的卫生组织公布; 降低第三方检查者标记为false的feed和Stories内容的等级; 从“探索”和“话题标签”页面移除虚假帖子 ,以及可能造成伤害的虚假声明或阴谋论; 禁止对涉及新冠病毒的产品进行误导性广告; 暂时禁止宣传包括口罩在内的某些医疗用品的广告和品牌内容; 添加标签以促进信息的准确性; 以及在Instagram搜索中包含更多教育资源 此外,Instagram还创建了一个分享故事的功能,通过一个“宅在家”的标签,让社交距离变得更容易忍受,并推出了去年开始测试的联合观看功能。 accounts from recommendations unless they are posted by a credible health organization; Downranking feed
该列表中的每个单元包含有关时间轴中特定帖子的信息,包括以下单元: [text] – 标题的文本值保存在帖子下面,包括标签 [likes] – 点赞的数量 [created_at] – 创建帖子的日期 [ 在笔记本中查看图像是非常有用的,我们稍后将使用这些函数来查看我们的结果,正如你将看到的那样。 获得帖子排行榜 我们需要得到我们最喜欢的帖子。 我们可能想把一些过滤器应用到我们的帖子列表中。 例如,我只想要图片,但在帖子中有视频,,我可以这样过滤: myposts_photos= filter(lambda k: k['media_type']==1, myposts) myposts_vids media_type']==2, myposts) print len(myposts) print len(myposts_photos) print len(myposts_vids) 当然,你可以对结果中的任何变量应用过滤器
API和工具简介 Instagram提供了官方API,但是这些API有些过时,并且当前所提供的功能也非常有限。因此在本文中,我使用了LevPasha提供的非Instagram官方API。 我们将请求排在时间线最后的帖子,并在Jupyter Notebook中查看。 函数 函数Get_posts_from_list()和Get_url()在帖子列表上循环,查找每个帖子中的URL,并附加到我们的空列表中。 上述函数完成后,我们将得到一个URL列表,如下所示: ? : image_urls=get_images_from_list(top_posts) display_images_from_url(image_urls) 过滤图片 我们可能想要对我们的帖子做一些过滤 例如,可能有的帖子中是视频,但是我们只想要图片帖子。
在目前Instagram大约10亿用户中,超过一半的人每月都通过Instagram Explore来搜索视频、图片、直播和各种文章。 在为每个用户建立推荐列表之前,会由算法进行检测,过滤垃圾邮件和其他内容。 根据Facebook最新的社区标准执行报告的内容,这套过滤系统非常有效。 在排名阶段的第一阶段,滤过模型以最少的特征数量模拟其他阶段的组合。它从500个最优质和最相关的候选内容中选出1个,然后,具有完全密集特征集的模型(第二阶段)会选择前50个候选内容。 算法会使用值模型公式进行预测,以获取行为的集中程度,然后加权和确定用户行为的重要程度,比如“保存”帖子和“喜欢”帖子的重要性孰高孰低。 为了在新内容和现有内容之间保持“丰富的平衡”,Explore团队制定了一条规则,以促进内容多样性:添加惩罚因子,这一规则降低了来自同一作者或种子帐户的帖子的排名,因此用户不会在资源管理器中看到来自同一个人或同一种子帐户的多个帖子
在本文中,我们将接触其他类型的过滤器,一如既往,有例子予以加深理解。 本系列文章翻译自tutsplus,原作者为Barış Ünver,翻译人:Jeff,转载请注明原始来源及翻译人,谢谢! 过滤搜索查询 在一个WordPress 站点中,搜索是最常用到的功能。借助这个过滤器,你可以非常灵活地处理SQL 查询。 > 过滤feed 中的文本内容 正如过滤文章的文本内容是通过the_content函数,你可以过滤feed的文本内容,相关函数是the_content_feed。 例子:在feed中插入特色图像 在feed中插入特色图像应该有不少人有这个需求,下面就给出这个例子代码: <? > 修改下拉列表的图片尺寸 如果你打算插入张图片在你的文章中,你需要提前确定图片的尺寸。下面的例子的过滤器允许我们添加自定义的图片尺寸(通过函数提前产生)到可选择的下拉列表中。
Telegram Bots推荐 Telegram 在 2015 年 6 月发布了机器人平台,经过几年的发展,基于其丰富的自定义接口和开放的特性,把 Telegram 这样一款IM工具也扩化成了瑞士军刀 ,也已然融入到了个人和社区用户的日常 Telegram 使用中。 5.Feed Reader Bot,除了RSS功能,还可以订阅YouTube、Twitter、Instagram、Netflix等媒体内容。 6.中文 Telegram RSS 机器人。 2.可以浏览获取很多电影和 TV 剧集,直接返回文件下载 媒体类图片 1.发送帖子链接即可下载 Instagram / Pinterest / TikTok,且分别下载成 png 和 jpg 格式。 电子书 1.Free books downloader,搜索和下载 Library Genesis 和 Zlibrary 下的电子书。
当时由于担心人们会错过时间流中最重要的信息,Instagram的领导层要求工程师根据用户的个人偏好将时间顺序的照片转化为帖子列表的形式。 Facebook的应用机器学习主管Joaquin Candela说,三四个工程师在不到五个星期内完成了这项Instagram的改造工作。 同时,该公司宣布正在招聘更多的人员来屏蔽广告和过滤内容,显示出对于仅有AI无法完成的Facebook的功能至关重要。 所产生的系统自动扫描链接,抑制与人类生成的数据相符的链接。 坎德拉先生说,Facebook的主算法现在也可以从我们的帖子和照片中提取更多的意义。 然而,它的措辞是衡量人们与Facebook的应用和网络互动的方式,不管是增加他们喜欢或评论的帖子的数量,或者他们找到机器翻译的帖子有多有用,或者他们多久使用M,坎德拉先生说,Facebook的基于Messenger
Instagram宣布开始使用AI检测其社交网络平台上发布的图片中的网络欺凌行为,突出了科技公司在其审核过程中使用自动化的努力。 Mosseri在新闻稿中说,“虽然在Instagram上分享的大多数照片都是积极的,并且给人们带来欢乐,但偶尔有人会分享不友好或不受欢迎的照片。 我们现在正在使用机器学习技术主动检测照片及其文字中的欺凌行为,并将其发送给我们的社区运营团队进行审核。” Instagram用户已经可以报告违反服务指南的内容,但新工具可以自动检测欺凌行为。 继Facebook领先后,Instagram的欺凌评论过滤器也将用于直播视频。Instagram表示它将能够自动隐藏攻击性评论,用户可以添加手动过滤器来支持该算法。 以前经营Facebook新闻Feed的Mosseri在10月初宣布成为Instagram的负责人。
看点 1 “求赞求转发”帖子影响体验 Facebook将降级处理 12月19日早间消息,Facebook很快就会对主动请求点赞、评论和转发分享的文章进行降级处理,以此进一步改善消息流(News Feed Facebook表示,这种帖子违反该公司的真实性原则,所以,他们从本周开始将会在用户的News Feed信息流中对这类内容进行降级处理。 Facebook最近采取了多项措施来改善News Feed体验。该公司上周表示,他们将对用户观看的视频进行调整,并引入了一项新功能,让某个人或某个主页的帖子“休眠”30天。 总体数据显示,从今年一月到六月,Facebook收到了约377400宗投诉,其中涉及多个帖子,其中约60%与Facebook上涉嫌侵犯版权的内容相关。 “简而言之,如果设计专业人员在编写机器人时碰巧使用了易受攻击的组件,那么黑客很可能会通过这个漏洞来控制机器人。这非常可怕。到目前为止,我们只是在AI的安全方面迈出了一小步。
还有微信的朋友圈,今日头条的信息流,好友发布的美拍等,这些都是Feed。玩过知乎的人应该知道,在知乎Feed中,会显示某某关注了某某话题,某某点赞或者赞同了某个回答。 [这里写图片描述] 用户A发布新的帖子(动态),帖子记录到帖子表(主表)中。 发帖行为塞到队列(Redis List)中。 触发异步操作,消费者会先读取用户的粉丝列表(uid分表),依次写入到用户的动态表(uid分表)中。 前端读取用户动态Feed,使用过滤条件,读取用户的动态表(关联查询帖子表)。 活跃信号塞到队列中,消费者依次读取活跃态uid,得到用户的关注者列表。得到关注者列表后,会去帖子表,查询关注人的发布的帖子。写到用户自己的Feed中。 拉方式优化-分区拉取 分区拉取,是为了避免频繁查询单一帖子表所采用的一种优化手段。通过对帖子按照时间片分表,每次查询都能均摊到不同的表中,以此减轻主表的压力。
我编写的代码可以自动找到图片或视频,制作标题,添加主题标签,标记图片或视频出自哪里,还能过滤垃圾邮件,发帖,关注用户和取消关注,点赞,监控我的收件箱,最重要的是自动向与可能需要促销的餐馆发消息和电子邮件 我最终决定直接从其他Instagram帖子中搜索,因为图片大小符合要求,而且还可以准确知道其来源,这一点在自动化脚本里非常有用。 这两个帖子来自同一个纽约的Instagram帐户。左边帖子发布的是自然风光,我很乐意把它重新分享在我的主页。右边的广告没有任何上下文,标题分两行,这实际上是在给一个纽约的手机应用打广告。 如果我把它放在我的主页上,那会就显得让人困扰,与我的主页显得格格不入。你可以看到点赞数量的差异-8200对1000。我需要脚本能够自动过滤掉右边的帖子,并重新分享左边的帖子。 第二部分——机器学习模型 经过第一部分算法过滤——hard-coded规则,我发现仍然存在一些垃圾帖子。我不打算人工手动剔除它们,我计划将这个过程完全自动化。
具有讽刺意味的是,随着Instagram在Stories中添加越来越多的滤镜和功能,我们看到其中的工作量证明游戏不断升级。今天的许多Instagram Stories比日常帖子更精细、更耗时。 Stories作者采用各种滤镜、贴纸以及GIF和其他工具使常规Instagram帖子的滤镜相形见绌。最初主打“轻内容”的发布形式,居然演化成了最复杂和精致的样子。 ——帖子数量激增,对已发帖子的参与度和关注度大幅提升。 回到那个还比较平静的时代,News Feed无疑开启了一场社交资本积累的淘金热。哇,那个帖子点赞数是我的十倍! 好吧,学习一下,看看有什么可以用到我的下个帖子里!我的哪些内容最受欢迎?现在,我们把机器学习说的神乎其神,但作为社交动物,我们人类在学习、内化,不断自我精进在社交媒体上的表现方面,堪称卓越。 算法推荐信息流的推出给社交媒体的身份游戏提高了难度:即使你有粉丝,他们也可能看不到你的每一个帖子。 在生活中,我们的幸福感是相对的。我们和周围人比起来怎么样有时比我们本身过得怎么样更重要。
Craigslist是美国著名的大型免费分类广告网站,你可以在上面找到东西出售,服务信息,社区帖子等内容。 Craigslist 那时我还从未开发过成熟的应用程序。 经过谷歌搜索后,我在StackOverflow上找到了这篇有用的帖子,上面描述了如何搜索Craiglist 的RSS feed,这是Craigslist免费提供的一种过滤功能。 Craigslist回复链接的截图 继续迭代 经过第一次失败的尝试,我发现Craigslist有我可以进行爬取的RSS feed,每个帖子都指向实际发布的链接。 如果我可以访问实际的帖子,那么也许我能从中爬到邮箱地址?这意味着我需要找到一种方法来从原始帖子中获取邮件地址。 再次,我在谷歌上搜索"解析网站的方法"。 整个过程感觉像是俄罗斯方块。我知道最终目标是什么,真正的挑战是将正确的部分组合在一起,从而实现最终目标。每一步都有不同的挑战,整个过程中我学到了很多新知识。
它有助于以一种有原则的方式组合多个推荐阶段和算法。例如,我们可以在查询中使用组合规则来输出几个子查询输出的加权混合,从而优化候选生成器的集合。通过调整它们的权重,我们可以找到最佳用户体验的组合。 我们使用蒸馏模型中排名最高的帖子作为后期高性能排名模型的候选排名。 建立蒸馏模型的模拟行为可以最大限度地减少调整多个参数和在不同的分级阶段维护多个模型的需要。 使用各种信号,我们在为每个人建立合适的目录之前,过滤掉我们认为不适合推荐的内容。除了阻止可能违反策略的内容和错误信息外,我们还利用 ML 系统来帮助检测和过滤垃圾邮件等内容。 我们通过添加惩罚因子来降低来自同一作者或同一种子账户的帖子的排名,这样你就不会在 Explore 中看到来自同一作者或同一种子账户的多个帖子。 我们一直在不断改进 Instagram 的探索方式,比如在购物帖子和 IGTV 视频等新内容中加入故事和入口点等媒体格式。
我们为这个平台的“重复使用”性能感到兴奋,当一个工程师写了一个AI 工作流(workflow),可以被其它工程师拿过来接着使用。这有一个关于Instagram的例子。 去年6月,Instagram开始对它的feed进行排序,几个工程师共同完成了这个功能,而这其中花费的时间之少令人惊讶。 也就是说,工程师们可以借用前人的工作成果,“站在巨人的肩膀上”建立Instagram的feed功能,而且他们也能很快找到相关同事去请教。 其中有一个数据,我很骄傲。 你希望人们能用母语在上面发布信息,你需要发现他发布的信息中蕴含有销售意向,并且把帖子归类为销售帖,让你能更快完成交易。 ? Deep Text另一个核心应用是在移动聊天工具上。 在这里顺便提一下,作为参考,其他同类可以实时添加滤镜的应用都是在GPU服务器上跑的。这就是我们研究的时候遇到的困难。
Facebook已经开发出了一种引擎,这种引擎能够使我们更好地理解帖子的内容。该引擎被称为DeepText,它通过利用深层神经网络架构去理解那些分享的文章内容。 Facebook的公司表示,这是一项能更好的理解人类想法的技术。 DeepText就是用于检测人为目的和实体的提取,譬如该公司具体在一篇博客文章中解释道: 这项技术如何帮助一个人意识到,我是刚从出租车上出来,而不是我要去骑自行车,通过他或她这样说的话语来判断。 News Feed恰好就是这些众多开展深度学习活动的有效领域之一,因为实现了人们希望看到与他们相关的内容。 在日常生活中,大量的数据不仅在社交网络上被共享,而且也通过Messenger、Instagram、WhatsApp、Oculus平台进行展示。
01Facebook借助AI技术识别广告 Facebook在5月24日开始实施新政策,审查所有新推出的内容,特别是在新闻Feed,Instagram Feed和Facebook Stories中“政治内容 ”帖子和广告,拒绝让不具备必要条件的政治内容披露。 为了按比例评论内容,Facebook创建了一个“机器学习分类器” ,从6月6日开始会投入使用。一个程序将扫描内容中与政治或问题相关的材料的标识符,并做出决定。 Series Prediction(基于多层注意力机制神经网络的地理传感器时间序列预测)》使用深度学习技术,解决了一个通用的地理时间序列预测问题,不仅成功预测了中国东南某城市自来水管网的水质,在空气质量预测上同样得到了验证 ,还可用于交通预测中,且效果超过现有的方法。
云端获取和启用云服务器,并实时扩展或缩减云计算资源。云服务器 支持按实际使用的资源计费,可以为您节约计算成本。 腾讯云服务器(CVM)为您提供安全可靠的弹性云计算服务。只需几分钟,您就可以在云端获取和启用云服务器,并实时扩展或缩减云计算资源。云服务器 支持按实际使用的资源计费,可以为您节约计算成本。
扫码关注云+社区
领取腾讯云代金券