29岁的吉恒杉是优酷的一名人工智能数据标注师,2016年毕业于北京航空航天大学计算机视觉专业。
他每天将屏幕上成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”,训练机器识别何为“接吻”镜头,因此也被戏称为“吻戏鉴定师”。
“吻戏鉴定师”吉恒杉,他的工作是教计算机读懂这个世界
10年来,中国网络视频内容消费用户达到近6亿。“身边越来越多的人用手机和电脑看网剧、电影和体育比赛。”吉恒杉发现,大家的需求不再是简单地看剧,还想看更精彩有趣的片段、集锦,更主动地找到自己最想看的明星或者场景。
因此,要想实现搜索和智能编辑,就得训练机器从海量的素材中找出相应的场景,并打上标签,一天要标注几百张接吻的图像,最多时标注上千张。”吉恒杉聊起自己的职业,一脸笑容。
虽然现在人工智能技术已经非常发达,但机器识别还无法准确识别双胞胎、网红脸等。加上,现在明星很多都整容,一些脸长得特别像,因此机器识别会更加困难,需要人工指导。为了让机器识别更加准确,智能,吉恒杉已经标注了上千幅图片。
目前,吉恒杉所在团队有 8 个人。截至目前,他们共为 2 万多条“吻戏”打上了标签。
当然,除了“吻戏”之外,他们还为哭戏、打戏以及体育比赛中的射门、扑球、投篮、庆祝等画面进行标注,以便网站小编能够快速制作精彩视频集锦。
戳视频
领取专属 10元无门槛券
私享最新 技术干货