公开课 | 用CNN识别CT影像诊断肺癌结节+从GitHub社交数据中挖掘人才+量化投资中的数据处理,3场直播连击

大家好,文摘菌又来搞事情啦~?

本周四晚,大数据文摘联合六禾创投,三场公开课,一!起!来!?

三位公开课嘉宾分别来自六禾创投被投公司华院数据、简寻、聚宽,公开课主题跨越深度学习医疗影像识别、社交网络数据挖掘、金融数据量化投资。

最近,文摘菌报道过吴恩达团队用CNN识别肺炎影像的论文(戳这里阅读),吴恩达团队用到的是胸部X光片数据,胸片被认为长远看来将被CT取代,那么这次就来听听用CT影像是怎么个玩儿法吧!

社交网络数据挖掘听起来非常有趣,想知道GitHub上有多少中国人吗?答案是70万。怎么通过构建高性能的爬虫框架、Spark用户聚合、构建模型识别出他们?

股票更是有很多群众入坑,作为大数据文摘读者怎么能不懂一点量化呢?可是你知道到哪里找数据吗?又如何取样、清洗、存储呢?

还有2天开讲,抓紧时间扫码进直播间嗨起来吧!公开课收看方式请往下翻?

请注意:每个人都可以在直播间中生成专属邀请函并分享给朋友。邀请人数排名前3的小伙伴,将获赠清华数据科学研究院与大数据文摘联合出品的2017年《顶级数据团队建设全景报告》一份。

1

深度学习在医学影像CAD(计算机辅助诊断)领域中的应用:以肺结节智能检测和诊断技术为例

肺癌是我国死亡率和发病率最高的恶性肿瘤。目前手术是根治肺癌的主要治疗方法。早期肺癌多以肺小结节的形式出现,多数患者没有明显临床症状,早期发现困难。在各种肺癌筛查手段中,CT检查是目前最有效的方法。

早期肺癌结节的尺寸小、对比度低、形状异质化程度高,识别难度大,因此筛查工作是由影像科专家人员人工读片完成,检出率也极度依赖于阅片医生的水平。以一家医院平均每天接待200位左右的肺结节筛查患者为例,每位患者在检查环节会产生200—300张的CT影像,放射科医生每天至少需要阅读4万张影像图像。随着我国老龄化程度不断加深,医学影像服务需求不断增长,这种繁重的人工阅片工作无疑会成为广大医务工作者的沉重负担,也会成为人们追求更优质医疗服务的一大障碍。

因此,对于CT影像阅片工作,急需借助高度自动化技术(例如人工智能自动阅片系统)的辅助,来解决这种庞大工作量的问题。另外,我国医疗资源的严重不平衡,很多医疗条件欠佳地区,由于不能及时确诊,往往导致病人因得不到相应的治疗而死亡。随着基于人工智能技术的远程医学影像诊断平台的普及,将会使此类地区能够享受到国际一线水准的肺癌早期筛查与诊断服务。

本次分享将以深度学习在医学影像CAD领域的进展和成果为铺垫,重点介绍利用3维深度卷积神经网络进行肺小结节检测(识别与定位)和诊断(病灶良恶性分析等等)的相关技术原理与实际应用。内容将涉及肺部CT影像的图像预处理技巧,3维深度卷积网络的运用技巧、网络训练与调优技巧以及利用此类技术开发实际应用中的经验之谈等等。最后,将从其它非影像数据角度来探讨结合多维度健康大数据,有效融合人工智能及大数据技术,推进此领域相关应用更好的开展。

分享人简介

杨晶晶,现任华院数据技术公司医学影像CAD技术负责人,多年来一直从事图像识别、机器学习技术研究和产品开发工作。先后在公安部第三研究所、华院数据技术公司参与并主导基于模式识别、机器学习、深度学习等技术的多种智能产品研发,产品应用领域覆盖安防、视频、医学影像CAD等领域。近年来主持肺小结节智能检测与诊断产品的研发。

时间&如何参与

12月14日(周四)19:00-19:40

扫码进入直播间

▼▼▼

2

社交数据挖掘实战:如何从社交数据中挖掘优质人才

企业在快速发展的过程中,都会面临人才不足的问题。优质人才的招募缓慢严重阻碍了企业的发展速度。而候选人在目前除了投递简历、通过猎头推荐和内推,也很少有其他渠道能接触到优质机会。国内并没有一款像Linkedin一样的产品,能做到对优质人才的高覆盖率,让企业招聘人员有机会快速联系到想招募的人才。优质人才的信息散布在网络之上,企业招聘人员很难高效使用相关信息。

本次公开课将把Github人才数据挖掘为一个主要案例,讲解整套系统的构建方式和其中的算法模型。内容主要涉及大规模分布式爬虫的构建,基于Spark的数据处理系统,候选人潜力值判断、候选人职业方向判断和华人识别等相关算法,为大家分享一些在无法获取大量标注数据的开放数据集上的数据挖掘经验。

分享人简介

李嘉航,高中时期通过信息学竞赛保送华中科技大学。毕业任职简寻,负责大数据平台以及数据挖掘与算法研发。主要负责简寻旗下一款收集优质人才在网络上踪迹的产品,希望能够完成对人才职业相关数据的重构,通过数据的方式重建一份职业数据,让企业招聘人员能更高效地使用网络开放数据寻找优质候选人。

时间&如何参与

12月14日(周四)19:40-20:20

扫码进入直播间

▼▼▼

3

金融量化中的数据处理

随着大数据、机器学习等人工智能技术的兴起,国内的量化投资的发展进入了快车道。国内量化基金的资产管理规模,近年均以每年近40%的速度快速增长。量化行业的快速发展对量化相关联的数据提出了更高要求:从数据的干净程度到数据的tick级颗粒度,都有新要求。精准的数据和快速的回测引擎能够提升整个量化系统的效率,加快对市场的反应速度,提供有效决策依据。

本次公开课将以金融中大量数据处理技术和方法作为主题,并结合聚宽实践的数据处理技术对其中的案例进行分析,同时告诉大家如何在模型中使用一些特定数据。

分享人简介

郭嵩聚宽CTO,全栈工程师,本硕毕业于北京科技大学计算机系,曾任职于百度、腾讯,6年互联网研发经验,熟悉前端、分布式系统、大数据并发。

时间&如何参与

12月14日(周四)20:20-21:00

扫码进入直播间

▼▼▼

致谢

感谢六禾创投对本次活动的大力支持,以上3位公开课嘉宾均来自六禾创投的投资企业。

六禾创投是一家以科技和数据为驱动力的投资机构,也是国内最专业的大数据领域创业投资公司,秉持少而精的投资哲学,在数据服务和数字内容(包括AR/VR领域)进行了深度布局。投资团队拥有深厚的投资、科技和创业经验,投资项目后期融资表现亮眼,包括央数文化(小熊尼奥AR儿童玩教具)、JoinQuant聚宽(量化交易平台)、朋友印象(深度社交和数据)、曼恒数字(VR引擎与行业应用解决方案)、数尊信息(信用金融)、华院数据(行业大数据)、云账房(财税智能化)、美信金融(全球资产交易平台)等。六禾创投希望和更多有理想、接地气的创业者进行深入合作。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2017-12-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

【前沿】中国科学院自动化研究所模式识别与人工智能学科前沿研讨会

来源:中国科学院自动化研究所 ? 11月25日,模式识别与人工智能学科前沿研讨会在自动化所成功召开。中科院前沿教育局副局长王颖、自动化所所长徐波分别致辞。...

47710
来自专栏BestSDK

苹果推出ARKit,国内SDK厂商的好日子到头了?

最近ios11推出ARKit,效果惊艳的slam秒杀市面上已有的第三方SDK。大家纷纷心疼SDK厂商是不是受到了一万点伤害?甚至猜想将来会不会SDK都被操作系统...

3769
来自专栏人工智能头条

2015人工智能图谱:机器人或将改变你的生活

1706
来自专栏AI科技评论

干货 | AI 创业指北:把 AI 真正变成电力还有多远?

AI 科技评论按,在人工智能如此热门的时代,许多人都开始 AI 创业。不过 AI 创业也并不会就有多么简单,想要能走到最后还是需要注意避免踩雷掉坑。Toward...

3399
来自专栏悦思悦读

破解性别歧视,助力职业发展

如果你说“我真的觉得没有、我没经历过、我觉得,从小到大似乎都是男女平等的”。那说明你生活在一个非常友好环境;有非常开明的父母给你营造了一个很好的成长空间;在学校...

1392
来自专栏科技向令说

响铃:2号人事部类小米的生态模式,或是2B产品2C产业化的一个标本

这个认识源于响铃近期走访了十几家大大小小的SaaS企业。从2号人事部创始人焦学宁、订货无忧 CEO蒋波等项目创始人到金蝶、拉勾云人事等市场负责人,他们的共识是S...

1134
来自专栏数据猿

中国计算机学会大数据专家朱扬勇:数据科学家将成热门职业

<数据猿导读> 大数据出现以来就呈现出“井喷式”的发展,人人都说大数据,人人都想掘金大数据,然而行业的崛起就体现出人才的稀缺,中国计算机学会大数据专家朱扬勇教授...

2764
来自专栏大数据文摘

决策科学及大数据在金融行业的应用

2278
来自专栏灯塔大数据

世界顶尖数据科学家看未来十年大数据发展

过去,科学家经过十年的研究才首次破解人类DNA。而13年后的今天,这项工作在24小时之内就能完成。 一直以来,我们都在不断改进数据处理工具。数据数量也在过去十...

3426
来自专栏大数据和云计算技术

"Google X"大起底

“Google X”来源 Google X,是谷歌公司最神秘的一个部门,位于美国旧金山的一处秘密地点,该实验室的机密程度堪比CIA,仅少数几位谷歌高层掌握情况...

2974

扫码关注云+社区

领取腾讯云代金券