首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

让他们听见世界:用多模态预训练模型,铺设数字化“盲道”

在普通人直观想象中,以视觉信息和触控交互为核心的智能手机与视障人群之间,必然有着巨大的鸿沟。 但现实并非如此,假如你真的接触过视障群体、去尝试过盲人按摩,你会发现他们同样依赖智能手机:从接听电话到发送消息,从拍照到导航,在手机厂商和软件公司的努力下,这些文字性的内容基本都能够顺利地被读出来,传递给视障用户。 真正的难点是文字之外的图像,手机本身的界面、各种APP中的图像内容很多都没有文字备注、更不具备视障功能。如果在微信跟别人聊天的时候不小心收到一张图,视障群体只能回到求助他人的老解决路线之上。 如果能让

02
领券